視頻編解碼學習之三：變換，量化與熵編碼

本文轉載自查看原文 2012-07-29 20:09 15560 VideoCodec

第6章變換編碼

1. 變換編碼

變換編碼的目的
- 去除空間信號的相關性
- 將空間信號的能力集中到頻域的一小部分低頻系數上
- 能量小的系數可通過量化去除，而不會嚴重影響重構圖像的質量
塊變換和全局變換
- 塊變換：離散余弦變換(Discrete Cosine Transform，DCT)，4x4，8x8，16x16
- 全局變換：小波變換(Wavelet)
變換的能量集中特性
- DCT編碼

2. 變換類型

K-L變換
傅里葉變換
余弦變換
小波變換

3. KL變換

最優變換
基函數根據具體圖像而確定
沒有快速算法
實際中很少使用
- 復雜度極高

K-L變換非常復雜度很高，不實用
- 需要計算協方差矩陣U
- 需要計算特征向量
- 需要發送到解碼器

4. 離散傅立葉變換

5. 離散傅立葉變換性質

6. 離散余弦變換

比K-L變換，傅里葉變換的復雜度更低
變換性能僅次於K-L變換
有快速算法可以加快變換速度
可以用整數變換進一步降低復雜度

7. DCT與DFT的關系

8. 離散余弦變換的重要性質

9. 快速DCT變換

下圖是一個動態展示：

10. 整數離散余弦變換

離散余弦變換為浮點操作
- 需要64位精度
- 浮點計算復雜度高
- 變換精度高
整數變換：離散余弦變換的整數近似
- 需要更少的位寬
- 整數計算復雜度低
- 好的整數變換的變換精度接近浮點變換
浮點近似方法

11. H.264的4x4整數變換

12. 小波變換

新的變換方法
避免由於塊編碼帶來的塊效應
更適合視頻空間可分級編碼

第7章量化

1. 量化Quantization

用更小的集合表示更大的集合的過程
- 對信號源的有限近似
- 有損過程
- 應用
  - A/D轉換
  - 壓縮
- 量化方法
  - 標量(Scalar)量化
  - 矢量(Vector)量化

2. 量化的基本思想

映射一個輸入間隔到一個整數
減少信源編碼的bit
一般情況重構值與輸入值不同

3. 量化模型

4. 量化的率失真優化

量化器設計問題
- 量化水平的個數，即Bin的個數
- 決策邊界：Bin的邊界
- 重構水平
量化器設計是對率失真的優化
- 為了減少碼率的大小，需要減少Bin的個數
- Bin的個數減少導致重構的誤差增大，失真也就隨着增大

5. 失真測量

6. 量化器設計

量化器設計的兩個方面
- 給定量化水平數目M，找到決策邊界x_i和重構水平使MSE最小
- 給定失真限制D，找到量化水平數目M，決策邊界x_i和重構水平y_i使MSE<=D

7. 均勻量化（Uniform Quantization）

8. 量化與峰值信噪比

9. 中升量化器（Midrise Quantizer）

10. 中平量化器（Midtread Quantizer）

11. 死區量化器（Deadzone Quantizer）

12．非均勻量化（Non-uniform Quantization）

如果信源不是均勻分布的，采用均勻量化不是最優的
對於非均勻量化，為了減少MSE，當概率密度函數f_X(x)高時，使Bin的量化步長減小，當概率密度函數f_X(x)低時，使Bin的量化步長增加。

13. 最優的標量量化

14. 量化編碼

定長編碼量化水平
- 使用等長的碼字編碼每個量化水平，碼字長為：
熵編碼量化水平
- 根據量化水平的概率分布情況，用變長的碼字編碼每個量化水平
- 平均碼字長
- 比定長編碼量化水平效率高
- 廣泛應用在圖像和視頻編碼中

15. 矢量量化

標量量化：對數據一個一個的進行量化，稱為標量量化。
矢量量化：將數據分組，每組K個數據構成K維矢量，再以矢量為處理單元進行量化。
- 矢量量化是標量量化的多維擴展
- 標量量化是矢量量化的特殊情況
矢量量化工作過程

二維矢量量化

矢量量化優點
- 只傳碼字的下標，編碼效率高
- 在相同碼率下，比標量量化失真小
- 在相同失真下，比標量量化碼率低
矢量量化缺點：復雜度隨着維數的增加呈指數增加

第8章熵編碼

1. 熵編碼

熵（Entropy）：信源的平均信息量，更精確的描述為表示信源所有符號包含信息的平均比特數
- 信源編碼要盡可能的減少信源的冗余，使之接近熵
- 用更少的比特傳遞更多的信源信息
熵編碼：數據壓縮中根據信源消息的概率模型使消息的熵最小化
- 無損壓縮
- 變長編碼

2. 熵

信息量：

單位：比特

熵：

單位：比特/符號

3. 定長編碼

4. 變長編碼

變長編碼：用不同的比特數表示每一個符號
- 為頻繁發生的符號分配短碼字
- 為很少發生的符號分配長碼字
- 比定長編碼有更高的效率
常用的變長編碼
- Huffman編碼
- 算術編碼

5. Huffman編碼

前綴碼：任何碼字不是其它碼字的前綴
- 如果011為一個有效碼字，則0，1，01，11必不是有效碼字
- 不會引起解碼歧義
Huffman：
- 二叉樹
- 樹節點:表示符號或符號組合
- 分支:兩個分支一個表示"0"，另一個表示"1"

Huffman的不唯一性
- 每次分支有兩種選擇：0，1
- 相同的概率產生不同的組合
缺點：
- 數據的概率變化難於實時統計
- Huffman樹需要編碼傳輸給解碼器
- 只有在p(x_i)=1/2^ki時是最優編碼
- 最小碼字長度為1比特/符號
如果有二值信源，其兩個符號的概率相差很大
- 例如：p(1)=0.0625，p(0)=0.9375則H=0.3373比特/符號，Huffman編碼平均碼長=1比特/符號
- 兩個符號聯合編碼有更高效率

6. 擴展Huffman編碼

7. 范式Huffman編碼

范式Huffman樹的建立規則
- 節點左支設為0，右支設為1
- 樹的深度從左至右增加
- 每個符號被放在最先滿足的葉子節點

特性
- 第一個碼字是一串0
- 相同長度的碼字的值是連續的
- 如果所有的碼字通過在低位補0的方式，使所有碼字的長度相同則有 0000<0100<1000<1010<1100<1110<1111
- 從碼字長度n到n+1有如下關系
  - C(n+1,1)=(C(n,last)+1)<<1
- 從碼字長度n到n+2有如下關系
  - C(n+2,1)=(C(n,last)+1)<<2

8. 一元碼

編碼一個非負整數n為n個1和一個0
不需要存儲碼表
可以用Huffman樹表示
碼長增長太快：n=100，碼長101

9. 哥倫布編碼

將信源符號等分成幾組，每組有相應的編號
編號小的分配碼字短，編號大分配碼字長
同組的符號有等長的碼字，比一元碼的碼字長度增長慢
碼字分配

10. 指數哥倫布編碼

哥倫布碼對信源符號的分組大小相同
指數哥倫布碼對信源符號的分組大小按照指數增長
指數哥倫布碼依然是一元碼加定長碼的形式
指數哥倫布碼的指數k=0，1，2，…

11. CAVLC（ Context-Based Adaptive Variable Length Code）

當前塊的系數分布和其鄰塊的系數分布情況相關
- N _X為塊X的非零系數個數，當前塊C的第一個系數的編碼碼表由N _C決定， N _C=( N _A+ N _B)/2
當前待編碼系數和前面編碼系數有相關性
- 當前塊C的其它系數的編碼碼表由前一個系數的幅值決定cof_N-1=>GolombTab_x，用GolombTab_x編碼cof_N

12. 算術編碼

信息量=>符號編碼比特數
Huffman編碼為每個符號分配一個碼字，這說明Huffman編碼的壓縮上限是1比特/符號
算術編碼若干個符號可編碼成1bit
算術編碼是把信源表示為實數軸上[0,1]區間，信源中每個符號都用來縮短這個區間
- 輸出[0,1]區間的一個實數表示一串編碼符號
- 比Huffman編碼更有效
編碼思想
- 編碼器用熵編碼算法編碼一串符號產生一個[0,1]區間的實數，將實數的一個二進制表示傳給解碼器
- 解碼器用熵解碼算法解碼得到一串符號
小數的二進制表示
信源符號概率分布
字符串：X2 X2 X3 X3 X6 X5 X7
Huffman編碼，01 01 100 100 00 11 1011，18bit