主觀質量評價
視頻主觀質量評價需要選定一批非專家類型的受測者,讓他們在一個受控的環境下連續觀看一系列的測試序列,時長大約10-30分鍾,然后采用各種統計方法讓受測者對視頻序列的質量進行評分,最后得到視頻質量平均分(Mean Opinion Score, MOS)。受控環境包括:觀看距離、觀測環境、測試視頻內容的選擇、測試視頻的顯示時間間隔等。由於視頻的主觀質量評價需要依靠大量的人力,並且為了保證盡可能少的由於人為因素的不確定性對最終視頻的得分產生影響,需要制定詳細的統一的標准,不斷的交流和討論,測試效率比較低而且成本很大,故主觀評估算法不在本文討論的范圍之內。
客觀質量評價
視頻質量客觀評價是利用特定的評估模型來自動計算視頻質量。與主觀評估方法相比,客觀評價方法具有速度快、費用低、易於實現、自動實時監控等優點。
客觀質量評價分類:根據降階視頻與其相對應原始參考視頻的需要程度,可以把客觀質量評價方法分為三類:全參考視頻質量評價方法、部分參考視頻質量評價方法和無參考視頻質量評價方法。
1)全參考(Full-Reference)視頻質量評價方法
全參考視頻評價方法必須完整提供原始參考視頻和在終端屏幕上顯示的降階視頻。評價模型如下所示:
原始視頻-------視頻編碼------信道------視頻解碼------評價結果
這種評價方法適用於對視頻編解碼系統的性能測試、對比已經優化的場景。原始參考視頻可以提供大量的參考信息,有助於建立評估失真視頻質量的客觀模型。
2)部分參考(Partial-Reference)視頻質量評價方法
部分參考視頻評價方法是指在做視頻評價的時候沒有原始參考視頻的完整像素信息,只由原始視頻的特征數據表達信息,因此只能把待評估的視頻加上同樣的特征表達方式得到特征數據並將兩者的特征數據進行 對比來判斷待測視頻的質量。
一般來說,當特征表達數據所容許的數據量越大時,對原始視頻的表達越准確,評分也更准確一些。但事實上,在得不到原始視頻的場合中,能夠允許的特征表達數據量不是很大,因此部分參考的模型受限於特征模型提取的准確度,在測試精確度上差於全參考模型。
3)無參考(Non-Reference)視頻質量評價方法
無參考方法不需要提供任何原始視頻信息,所有的評價都是基於捕獲的降階視頻來處理的。目前大多數的無參考方法是通過對視頻的處理和分析提取視頻序列中出現的某些失真特征,然后根據各類失真特征來判定視頻的質量。由於不需要參考視頻,所以無參考模型更適合對視頻質量做實時評估,如流媒體點播類的業務。
無參考視頻質量評價方法------NIQE視頻算法
全參考度量:
·DMOS:美國著名德克薩斯大學MS-SSIM算法,與人眼主觀評分近似度高達94%
·JND(PQR):美國著名音視頻研究實驗室Sarnoff,與人眼主觀評分近似度達92%
·PSNR:峰值信噪比,視頻質量測試常規算法
無參考度量:
·Spatial:ITU-T P.910空間域測試
·Temporal:ITU-T P.910時間域測試
主觀質量度量:
·PEAQ:遵循ITU-R BS.1387和BS.1116,客觀度量音頻感知質量客觀質量度量
·aFREQ:音頻頻率一致性測試,度量音頻中的誤差,毫秒級唇音同步測試
無參考度量:
·APEAK:基於通道True-Peak音頻測量,遵循ITU-R BS.1770-3標准
·LKFS:節目音頻響度測量,遵循ITU-R BS.1770-3標准
信噪比(SNR)與峰值信噪比(PSNR)的差異。
PSNR是使用最廣泛的客觀視頻質量的度量方法,但由於人類視覺系統的非線性,因此PSNR值與人眼感受到的視頻質量仍有較大出入。
新的評估方法:
UQI、VQM、PEVQ、結構相似性(SSIM)、VQuad-HD與CZD、Netflix 開源評估算法VMAF。
概念:
一個客觀的視頻質量指標的表現由計算客觀分數與主觀(Subjective_video_quality)測試分數之間的相關性得出。
主觀(Subjective_video_quality)測試分數, 平均意見得分(Mean_Opinion_Score,MOS)。
最常用的相關系數有:[相關|線性相關系數]、斯皮爾曼等級相關系數、峰度、Kappa系數與離群率。