Quality assessment of deblocked images
這篇文章提出了一個PSNR-B指標,旨在衡量 壓縮圖像的塊效應強度 或 去塊效應后的殘留塊效應強度(比較去塊效應算法的優劣)。
1. 故事
現有的PSNR雖然形式簡單、物理意義清晰,但與主觀質量關系不大;SSIM(同時考慮亮度相似度、對比度相似度和結構相似度)和主觀質量更貼近,但無法反映塊效應強度。
2. 失真變化
首先,我們設無損圖像為\(x\),編解碼后為壓縮圖像\(y\),去壓縮失真后的圖像為\(\tilde{y}\)。我們將像素分為兩類:
-
\(\Vert x_i - \tilde{y}_i \Vert^2 < \Vert x_i - y_i \Vert^2\),即去壓縮失真比較成功的像素點。
-
\(\Vert x_i - \tilde{y}_i \Vert^2 > \Vert x_i - y_i \Vert^2\),即去壓縮失真比較失敗的像素點。
我們求這兩類區域的距離差的均值:\(\bar{\alpha} = ave(\Vert x_i - y_i \Vert^2 - \Vert x_i - \tilde{y}_i \Vert^2), \bar{\beta} = ave(\Vert x_i - \tilde{y}_i \Vert^2 - \Vert x_i - y_i \Vert^2)\)。
所謂失真變化,就是\(\bar{\alpha} - \bar{\beta}\)。該值越大,塊效應抑制越明顯,去塊效應算法越成功。
對於一般的低通濾波器,\(\bar{\alpha}\)雖然很大,但\(\bar{\beta}\)也很大,因此通常是失敗的。對於H264內置的環路濾波器,它會自適應地根據 像素點與塊邊緣的距離 以及 局部灰度梯度信息,選擇濾波位置和濾波器尺寸,從而讓\(\bar{\beta}\)不至於過大,而\(\bar{\alpha}\)與低通濾波器相當大。但是,該環路濾波器的決策非常耗時,通常會占據1/3以上的解碼器復雜度。
3. 方法(PSNR-B)
在本節,作者提出一種對塊效應敏感的圖像質量指標,作者稱之為peak signal-to-noise ratio including blocking effects (PSNR-B)。
我們首先假設圖像由整數個塊(tiling)組成。例如:
圖中每一個塊都是\(8 \times 8\)的塊,一共有64個。定義以下塊類別:
分別代表:縱向接壤塊邊緣的像素對、縱向非接壤塊邊緣的像素對、橫向接壤塊邊緣的像素對 和 橫向非接壤塊邊緣的像素對。看圖就好了,文字賊繞。
定義兩個指標:
前者代表塊邊緣變化強度,后者代表非塊邊緣(塊內)變化強度。隨着量化逐漸粗糙,前者的增大會明顯快於后者。
還考慮一個因素:隨着塊增大,塊效應也會逐漸明顯。【反過來,如果塊很小,那么遠看是看不出塊效應的】因此我們定義一個塊效應因數(blocking effect factor, BEF):
其中的\(\eta\)隨着塊尺寸的增大而增大:
例如在H264壓縮標准下,一張圖像內可以有多種不同尺寸的塊。此時就有:
作者定義MSE-B和PSNR-B如下:
注意了,其中的MSE是有參考的指標,但BEF本身是無參考的指標。
4. 實驗
我們看看對H264環路濾波器的測試情況。
通過四個視頻作者發現:環路濾波器有時可以稍微提升視頻的PSNR,有時沒有太大作用。而低通濾波器會嚴重損失PSNR。
SSIM實驗結果與PSNR接近,但不同點在於:在有些視頻中,低通濾波后的SSIM要比原始壓縮圖像的SSIM更高。這與主觀體驗是基本一致的,說明SSIM更趨近於主觀質量。
這是PSNR-B的實驗結果。可以看到,當量化比較粗糙時,低通濾波器也發揮了作用。