第10章 視頻處理
1.視頻處理
- 在視頻壓縮前后,對視頻圖像質量增強的操作
- 視頻編解碼系統輸出的圖像主觀質量不僅與壓縮算法的性能有關,還受視頻處理的影響
- 壓縮之前對視頻的處理稱作預處理(Pre-processing)
- 壓縮之后對視頻的處理稱作后處理(Post-processing)
2. 預處理
-
預處理的目的
-
為了減少原圖像受到的損害,保持原圖像的重要特征,使原圖像能被高效的壓縮
- 噪聲污染
- 光照差
- 抖動
-
為了進行視頻格式轉換
- 去隔行
- 空間縮放
- 幀率轉換
-
- 去噪聲處理
-
去隔行(Deinterlace)
- 隔行掃描的視頻圖像在逐行掃描播放設備上播放會有隔行效應,降低了主觀質量
3. 去隔行的方法
-
在單場內去隔行
- 用奇數(偶數)行插值出偶數(奇數)行
-
兩場間去隔行
- 用兩場的像素值(包括運動矢量信息)插值出一幀象素值
-
運動補償方法
- 用前后向參考場的運動矢量信息,產生高質量的逐行幀
4. MPEG去隔行處理
- MPEG-2后處理去隔行
5. 空間縮放
-
上采樣(Up sample)方法
-
最近鄰插值(Nearest-neighbor interpolation )
- 用原圖像上每一個象素點值作為上采樣圖像上對應四個相鄰象素點的值
- 會產生階梯形狀的效應
- 線性,雙線性插值
P(x,y)=P(0,0)xy+P(1,0)(1-x)y+P(0,1)x(1-y)+P(1,1)(1-x)(1-y)
-
雙三次插值(Bicubic interpolation)
- 用鄰近的16個象素值插值當前象素
- 有更平滑的插值效果
-
-
下采樣(Down sample)方法
- 縮小原始圖像
5. 超分辨率
- 光流:象素的運動矢量
6. 幀率轉換
-
3:2下拉
- 24幀/秒電影轉換成60場/秒的電視視頻
- 24/30=4/5
- 幀率下采樣(跳幀)
- 幀率上采樣
7. 后處理
-
后處理的目的是為了去除解碼圖像的各種效應,最大程度恢復損失的圖像數據,提高解碼圖像的主觀質量
-
量化方法使變換系數信息損失導致解碼圖像產生失真和塊邊界的不連續性
- 塊效應(Block Artifact),振鈴效應(Ringing Artifact)
- 失真(Distortion)
-
視頻碼流傳輸及解碼導致的解碼圖像質量問題
- 跳幀(Frame Skip)
- 數據丟失(Data Loss)
-
8. 塊效應
-
塊效應產生原因
- 由於塊被獨立的處理
9. 去除塊效應濾波
-
去除塊效應濾波
-
環外濾波(Out loop filter):
- 濾波器在解碼環路外,對顯示緩沖區的圖像進行濾波
- 非標准部分,只有解碼器需要環外濾波
- MPEG-2,MPEG-4 SP
-
環路濾波(In loop filter):
- 濾波器在解碼環路內,濾波后的圖像可以作為參考幀用於運動估計和補償
- 標准的一部分,編解碼器都需要環路濾波
- AVS,H.264/AVC
-
10. 振鈴效應
-
振鈴效應產生原因
- 由於高頻系數的量化嚴重
11. 數據丟失
- 數據丟失
12. H.264的環路濾波
- 濾波邊界
- 適應性濾波
- 濾波強度
- 濾波決策閾值
-
濾波強度
-
濾波強度和量化參數QP有關
- QP越高,量化程度越大,會產生更多的塊效應,需要更強的濾波
- QP越低,量化程度越小,會產生更少的塊效應,用弱一些的濾波來防止邊界變得模糊
-
根據濾波強度(Bs)的不同有兩種濾波器
- 1≤ Bs≤3,基本濾波操作
- Bs=4,強力濾波操作
- 邊界濾波計算
-
- 截斷操作參數C
- Bs=4
- 塊效應更明顯
- 需要更劇烈的濾波,去除塊效應
-
當滿足以下條件對邊界進行強濾波
- 強濾波時修改p0, p1, p2的像素值
- 弱濾波時只修改p0的像素值
第11章 視頻編碼標准
1.國際標准組織
- ITU (International Telecommunications Union):國際電信聯盟
- ISO (International Standardization Organization):國際標准化組織
- IEC (International Electrotechnical Commission):國際電工委員會
2. ITU
- ITU-T (Telecommunication):電信標准化部門
- ITU-R (Radiocommunication):無線電通信部門
- ITU-D (Development):電信發展部門
- VCEG (Video Coding Experts Group):視頻編碼專家組,屬於ITU-T的Study Group 16/Question 6 (ITU-T SG16/Q.6)
3. VCEG
-
VCEG制訂標准:
- H.261:第一個視頻編碼標准,用於ISDN(px64Kbps)傳輸的視頻會議,主要采用了基於整象素的運動補償
- H.262 (MPE-2):與MPEG合作制定的標准
- H.263 (H.263+, H.263++):用於低碼率的視頻編碼,主要用於PSDN低於54Kbps的視頻會議和視頻電話,采用了1/2象素運動補償,考慮了數據損失和錯誤魯棒性的需要
- H.26L: H.264的前身標准
- H.264 (MPEG-4 AVC):目前編碼效率最高的標准
4. ISO/IEC
- JPEG:ISO/IEC JTC1/SC29/WG1
-
MPEG:ISO/IEC JTC1/SC29/WG11
5. MPEG
-
MPEG制訂標准:
- MPEG-1 : H.261+半象素運動補償+雙向預測+條帶結構編碼,用於VCD,LAN視頻(最大1.5Mbps)
- MPE-2: MPEG-1+隔行視頻編碼+縮放功能,用於HDTV(18Mbps) 、SDTV (2-5Mbps)數字信號傳輸和DVD(6-8Mbps)存儲,兼容MPEG-1標准
- MPEG-4 ASP (P-2) :從H.263標准發展而來,基於視頻對象平面編碼,能在解碼端控制視頻對象,合成場景,並有音視頻交互功能
- MPEG-4 AVC (P-10)(H.264/AVC):與VECG合作制定的標准
6. 視頻編碼標准
- 國際標准組織及其制定的編碼標准
7. 標准的應用
8. 其他標准組織
-
AVS (China Audio and Video Standard)
- AVS1.0 :面向高清數字電視廣播
- AVS-M:面向移動視頻
- AVS-S:面向監控視頻
-
SMPTE (The Society of Motion Picture and Television Engineers )
- VC-1
9. 視頻編碼標准發展
10. MPEG-1
- 標准文檔:ISO/IEC 11172-2
-
編碼技術:基於H.261
- B幀編碼:B幀不能被其它幀參考
- 16x16 ½精度運動補償
- 碼率控制:宏塊級的碼率控制,調整宏塊的量化參數控制碼率
- 支持視頻隨機訪問,回放,碼流編輯,音視頻同步
- 參考軟件:Simulation Model 3(SM3)
11. MPEG-2
- 標准文檔:ISO/IEC 13818-2
-
編碼技術:基於MPEG-1
- 幀和場運動補償
-
三種類型的縮放
- 空間縮放
- 時間縮放
- SNR縮放
- 參考軟件:Test Model 5 (TM5)
- Profile:工具集
- Level:參數限制
- 不同的應用使用不同的Profile和Level的組合
12. H.263系列
-
H.263編碼技術:基於H.261
- 半象素精度運動補償
- 可選的數據流層次結構
-
四種高效編碼模式
- D選項—無限制的運動矢量模式
- E選項—基於語法的算術編碼
- F選項—高級預測模式,OBMC
- G選項—PB幀模式
- 支持更多的視頻圖像分辨率
- 參考軟件TMN2.0(Test Model Near-term 2.0)
-
H.263+編碼技術:基於H.263
- 允許自定義視頻圖像格式
-
增加了12個選項提高壓縮效率
- I選項—高級的幀內預測模式
- J選項—去塊效應濾波
- K選項—條帶結構模式
- L選項—補充增強信息,用於解碼器的顯示相關的信息
- M選項—增強的PB幀模式
- N選項—參考幀選擇
- O選項—分級,時間分級,空間分級,SNR分級
- P選項—參考幀重采樣
- Q選項—減少的分辨率更新
- R選項—獨立的片段解碼
- S選項—可替代的inter-VLC
- T選項—改進的量化
-
H.263++編碼技術:基於H.263+
-
增加了三個選項,增強抗誤碼能力
- U選項—增強型參考幀選擇
- V選項—數據分區條帶,變換量化系數和運動矢量數據分離
- W選項—增加的補充增強信息,包括定點IDCT的選項,圖像信息,信息類型,重復的圖像頭,交替場指示,稀疏參考幀識別
-
13. MPEG-4
- 標准文檔:ISO/IEC 14496-2
-
編碼技術:基於H.263
-
增加了基於對象的編碼和操作
- 形狀分割編碼
- 縮放的靜態紋理小波變換
- 網格動畫編碼
- 人臉動畫編碼
- 內容合成,半合成編碼
- 10比特,12比特深度采樣
- 參考軟件VM7(Verification Model 7
-
-
基於對象編碼
- 場景被分成多個對象
- 每個對象用形狀,運動和紋理特征描述
- Video Object Plane(VOP)
-
Sprite編碼
- 在序列開始編碼整個視頻背景和仿射映射,通過仿射映射將部分背景內容放到解碼圖像上顯示
-
網格(Mesh)動畫編碼
- 對象可由初始的網格和節點的運動矢量描述
- Profile
14. H.264/AVC
- 標准文檔:ISO/IEC 14496-10(ITU-T H.264)
- 前身為:H.26L(Long Range),基於MPEG-2/4
- 參考軟件JM(Joint Model)
15. H.264編碼結構
16. H.264-Intra編碼
- 4個亮度16x16的模式
- 9個亮度4x4的模式
- 4個色度8x8的模式
- 編碼復雜度高
- 不利於錯誤恢復
17. H.264-運動補償
- 可變塊運動補償
-
¼象素精度亮度運動補償
- ½像素濾波器(1, -5, 20, 20, -5, 1)
-
1/8象素精度色度運動補償
- 色度采用雙線性濾波
- 圖像外運動矢量
-
多參考幀
- 每個宏塊的四個8x8子塊都可以使用不同的參考幀
18. H.264多參考幀
-
P幀
- 只參考一個list的參考幀,List0
-
B幀
- 參考兩個list的參考幀,List0和List1
-
每個List最大可包含16個參考幀
- List0:以前的參考幀緩沖
- List1:將來的參考幀緩沖
19. H.274-加權預測
20. H.264-切換圖像
-
SP/SI幀實現
- 碼流切換
- 隨機切入
- 錯誤恢復
- 也可以實現快進,快退
-
特點
- 對於不同的參考圖像可以得到完全相同的重構圖像
- SP幀的編碼效率低於P幀但高於I幀
- SI幀的編碼效率低於I幀
21. H.264-FMO
-
靈活宏塊順序(Flexible MB Order,FMO)
- 宏塊有不同的組合構成條帶
- 七種不同的宏塊組合方式
- FMO增強了解碼的錯誤恢復能力
22. H.264-數據分區
- 上層的語法元素的丟失會嚴重影響壓縮碼流的解碼
-
將碼流按照重要程度分成三部分
- A:頭信息:包括宏塊類型,運動矢量等
- B:Intra系數信息
- C:Inter系數信息
- 用不同的優先級傳輸不同重要程度的分區來實現錯誤恢復
23. H.264-ASO,RP
-
任意條帶順序(Arbitrary Slice Order,ASO)
- 條帶之間獨立解碼
- 條帶可以按任意順序傳輸
- 丟失的條帶可以被解碼的條帶恢復出來
-
冗余圖像(Redundant Picture)
- 在碼流里放入冗余的圖像,如果圖像數據丟失了,可以用冗余圖像代替
24. H.264-視頻編碼層
- 網絡獨立的編碼層
-
VCL層包含:
- 序列參數集:Sequence Parameter Set(SPS),存放序列頭信息
- 圖像參數集:Picture Parameter Set(PPS),存放圖像頭信息
- 條帶以下數據
- 額外的增強信息(Supplemental Enhancement Information,SEI)
25. H.264-網絡提取層
- 提取的VCL數據
- 適合於傳輸層的數據傳輸和媒介的存儲
- NAL單元為數據包和碼流系統定義了一種通用的傳輸格式
- NAL單元連接在一起構成了NAL流
-
面向碼流傳輸的NAL單元
-
面向數據包傳輸的NAL單元
26. H.264-Profiles
- Profile:碼流語法子集
- Fidelity Range Extensions
27. H.264-Levels
- Level:參數限制
28. AVS vs. H.264
29. 性能比較
30. AVS會員