文章轉自:http://www.cnblogs.com/CoderTian/p/8138706.html
視頻壓縮編解碼技術就是對數字的視頻信號進行壓縮和解壓縮的過程。
1.數字電視的PCM原理
將輸入的模擬電視信號變成輸出的數字電視信號需經過取樣、量化、編碼三個步驟,由 A/D 變換器完成這三個步驟。
- 取樣:所謂取樣,就是在時間軸上把連續變化的模擬信號變為離散量的過程。
- 量化:取樣后的脈沖信號在時間上是離散的,但在幅值上空間上仍是連續的,即其可能取的值有無限多個,這就需要對它采用四舍五入的方法,將其可能的幅值數由無限多個變為有限個值。這種將信號幅值由連續量變成離散量的過程稱為量化。
- PCM編碼:對於量化后的信號,通常用“0”和“1”表示,即用二進制碼表示。這時的編碼稱為脈沖編碼調制——PCM 編碼。
- A/D與D/A變換:取樣、量化、編碼過程由A/D變換器完成。數字信號的解碼、反量化、恢復成模擬信號的逆過程由D/A變換器完成
模擬電視信號經取樣、量化、編碼(PCM 編碼)后得到的二進制序列,即數字電視信號。
2.電視信號的時間和空間取樣
電視信號的取樣有兩種:空間取樣和時間取樣。
1.時間取樣:運動圖像可由每秒若干幀靜止圖像構成,我國采用的 PAL 制彩色電視規定每秒 25 幀,美日等采用的 NTSC 制彩色電視則為每秒 30 幀。這種取樣方式即時間取樣。
隔行掃描幀圖像由兩場組成,每場由若干行組成,奇數行和偶數行各構成一場,它們分別為頂場和底場。幀場的鄰近行相關性並不相同。幀的鄰近行空間相關性強,時間相關性弱,因為某行的鄰近行(下一行)要一場掃描完才能被掃描,在壓縮靜止圖像或運動量不大的圖像時采用幀編碼方式。場的鄰近行時間相關性強,空間相關性差,因為場的一行掃描完畢,接着對場中下一行掃描。因此對運動量大的圖像常采用場編碼方式。實際的視頻圖像有快有慢,有粗有細,應根據這個標准自適應選擇幀/場編碼方式。
3.彩色空間
黑白圖像的每個像素只需一個幅值表示其亮度即可;而
彩色圖像的每個像素至少需要 3 個值表示表示其亮度和色度。所謂色度空間即表示彩色圖像的亮度與色度的方法。
1.RGB:眾所周知,任何彩色圖像可由不同比例的紅色、綠色和藍色組合而成,即三基色原理。這種表示彩色圖像的方法即 RGB 彩色空間。
彩色顯象管(CRT)和液晶顯示器件(LCD)可顯示彩色圖像,彩色攝像機中的電荷耦合器件(CCD)等傳感器可產生彩色電視圖像,都是根據 RGB 原理獲得的。
2.YC b C r (YUV):人類視覺系統(HDV)對亮度比彩色更敏感,因此可以把亮度信息從彩色信息分離處來,並使之具有更高的清晰度,彩色信息的清晰度較低些,可顯著壓縮帶寬,實現視頻壓縮的一部分,人的感覺卻沒有不同。
3.YUV和RGB轉換:
由大量實驗得出(說明轉換是不精確的):
Y=0.299R+0587G+0.114B Cb=0564(B-Y) Cr=0.713(R-Y)
R=Y+1.402Cr G=Y-0.344Cb-0.714Cr B=Y+1.772Cb
4.彩色電視取樣格式
有三種不同的彩色電視取樣格式
①4:4:4:Y、Cb和Cr具有相同的水平和垂直清晰度,在每一個像素位置,都有Y、Cb和Cr分量,即不論水平方向還是垂直方向,每4個亮度像素相應的4個Cb和4個Cr色度像素。
②4:2:2 :彩色分量和亮度分量具有相同的垂直清晰度,但水平清晰度彩色分量是亮度分量的一半。水平方向上,每5個亮度像素具有兩個Cb和兩個Cr。
③4:2:0:在水平和垂直清晰度方面,Cb和Cr都是Y的一半。
5.數字電視信號的編碼參數
1.量化值Qp:量化值(量化節距)取的太大,視頻圖像顯得粗糙;取的太小,視頻圖像質量好,但帶寬浪費過大。一般認為,每個取樣值采用8個比特表示,即256個灰度級,是比較合理的。
2.取樣頻率:CCIR601 建議的電視國際標准為:對每幅畫面 625/50(625 行,每秒 50 場)的電視系統和 525/60(525 行,每秒 60 場)的電視系統取樣頻率都為:
fs=13.5MHz (亮度信號,即 Y 信號) fs=6.75MHz (色差信號,即 Cb、 Cr 信號)
7.視頻信號的預處理
一個基本的視頻處理和通信系統主要包括采集、預處理、視頻編碼、通信、圖像處理及顯示等幾個方面

圖像采集的功能由圖像傳感器實現,目前圖像傳感器主要有電荷耦合器件(CCD, charge coupled devices)和 CMOS 傳感器
8.視頻質量
對壓縮后的視頻質量估計可分為
主觀視頻質量評定和客觀視頻質量評定兩種估計方法。
1.主觀視頻質量評定:
由於個人的視覺系統(HVS)不盡相同,對視頻內容的熟悉程度也不一樣。為了減少主觀隨意性,在對視頻圖像主觀評定前,選若干名專家和“非專家”作為評分委員,共同利用五項或七項評分法對同一種視頻圖像進行壓縮編碼構圖像評定。最后按加權平均法則對該壓縮后的圖像質量進行主觀評定。
測試方法可用隨機次序請評委觀察比較原始圖像和壓縮編碼的圖像。國際上稱為 DSCOS 的測試系統如圖所示。其中 A 為原始圖像,B 為編碼解碼后的圖像,以任意的 A、B 次序讓評委打分評定。
2.客觀視頻質量評定:
主觀的視頻質量評分更接近人的真實視覺感受,但需耗費人力和時間,成本較高。客觀質量的測定方法速度快、易實行,但往往不會太符合人眼的視覺感受,只能說大體上的質量。客觀質量測定方法應致力於改進其測試標准和測試方法,使其符合人的視覺感受。
最常用的測試標准是峰值信號與噪聲之比(PSNR):

其中 MSE 為原始和編解碼后圖像之間的均方誤差,
(2
n -1)
2為圖像種最大可能的信號值平方,n 為表示每個像素的比特數。

一般而言,PSNR越高視頻質量越高,反之亦然。
紙上得來終覺淺,絕知此事要躬行。