白話文理解DCT離散余弦變換


DCT全稱為Discrete Cosine Transform,即離散余弦變換。DCT變換屬於傅里葉變換的一種,常用於對信號和圖像(包括圖片和視頻)進行數據壓縮的基礎。

在視頻壓縮歷史上重要的發明之一就是DCT。沒有DCT,后面的H.26X, JPEG等一系列壓縮標准將無從談起。

DCT有比較復雜的數學公式,我們這里僅做簡單理解:

如下圖,下圖是個一張圖中的一部分(3*3的像素塊)

0
對這個像素矩陣做DCT,相當於將矩陣的能量壓縮到第一個元素中,被稱為直流(DC)系數。其余的系數被稱為交流(AC)系數。這意味着輸出的二維DCT的左上角被稱為DC系數。它是DCT最重要的輸出,包含了很多關於原始圖像的信息。其余的系數被稱為交流系數(AC coefficients)。如果你使用DCT對圖像進行轉換,AC系數包含了圖像的更多細節。同時,如果把這些DCT系數應用於反向的2D-DCT,將得到原始系數。DCT本身並不會壓縮數據,它為隨后的量化之類的操作,提供了一個良好的基礎。
相當於把除了第一個格的部分信息(特征)都抽取了一部分到第一個格

第一個格的像素值就是這個圖像塊的低頻信息,其余格的就是圖像的高頻信息
低頻信息表示的是一張圖的總體樣貌。一般低頻系數的值也比較大。而高頻信息主要表示的是圖像中人物或物體細節。高頻系數的數量多,做完了 DCT 變換之后,低頻和高頻信息就分離開來了。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM