YUV格式詳細解釋與FFMPEG的關系


YUV主要的采樣格式

主要的采樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比較常用,其含義為:每個點保存一個 8bit 的亮度值(也就是Y值), 每 2x2 個點保存一個 Cr 和Cb 值, 圖像在肉眼中的感覺不會起太大的變化。所以, 原來用 RGB(R,G,B 都是 8bit unsigned) 模型, 4 個點需要 8x3=24 bites(如下圖第一個圖). 而現在僅需要 8+(8/4)+(8/4)=12bites, 平均每個點占12bites(如下圖第二個圖)。這樣就把圖像的數據壓縮了一半。

上邊僅給出了理論上的示例,在實際數據存儲中是有可能是不同的,下面給出幾種具體的存儲形式:

(1)YUV 4:4:4

YUV三個信道的抽樣率相同,因此在生成的圖像里,每個象素的三個分量信息完整(每個分量通常8比特),經過8比特量化之后,未經壓縮的每個像素占用3個字節。

下面的四個像素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

存放的碼流為:        Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3

(2)YUV 4:2:2

每個色差信道的抽樣率是亮度信道的一半,所以水平方向的色度抽樣率只是4:4:4的一半。對非壓縮的8比特量化的圖像來說,每個由兩個水平方向相鄰的像素組成的宏像素需要占用4字節內存。

下面的四個像素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

存放的碼流為:       Y0 U0 Y1 V1 Y2 U2 Y3 V3

映射出像素點為:  [Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]

(3)YUV 4:1:1

4:1:1的色度抽樣,是在水平方向上對色度進行4:1抽樣。對於低端用戶和消費類產品這仍然是可以接受的。對非壓縮的8比特量化的視頻來說,每個由4個水平方向相鄰的像素組成的宏像素需要占用6字節內存

下面的四個像素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

存放的碼流為:        Y0 U0 Y1 Y2 V2 Y3

映射出像素點為:  [Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]

(4)YUV4:2:0

4:2:0並不意味着只有Y,Cb而沒有Cr分量。它指得是對每行掃描線來說,只有一種色度分量以2:1的抽樣率存儲。進行隔行掃描,相鄰的掃描行存儲不同的色度分量,也就是說,如果一行是4:2:0的話,下一行就是4:0:2,再下一行是4:2:0...以此類推。對每個色度分量來說,水平方向和豎直方向的抽樣率都是2:1,所以可以說色度的抽樣率是4:1。對非壓縮的8比特量化的視頻來說,每個由2x2個2行2列相鄰的像素組成的宏像素需要占用6字節內存。

下面八個像素為:     [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

                           [Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]

存放的碼流為:        Y0 U0 Y1 Y2 U2 Y3

                           Y5 V5 Y6 Y7 V7 Y8

映射出的像素點為: [Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]

                          [Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]

對應AVPicture里面有data[4]和linesize[4]其中data是一個指向指針的指針(二級、二維指針),也就是指向視頻數據緩沖區的首地址,而data[0]~data[3]是一級指針,可以用如下的圖來表示:

data -->xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
^ ^ ^
| | |
data[0] data[1] data[2]

比如說,當pix_fmt=PIX_FMT_YUV420P時,data中的數據是按照YUV的格式存儲的,也就是:

data -->YYYYYYYYYYYYYYUUUUUUUUUUUUUVVVVVVVVVVVV
^ ^ ^
| | |
data[0] data[1] data[2]
linesize是指對應於每一行的大小,為什么需要這個變量,是因為在YUV格式和RGB格式時,每行的大小不一定等於圖像的寬度,對於RGB格式輸出時,只有一個通道(bgrbgrbgr......)可用,即linesize[0],和data[0],so RGB24 : data[0] = packet rgb//bgrbgrbgr......

linesize[0] = width*3
其他的如data[1][2][3]與linesize[1][2][3]無任何意義.

而對於YUV格式輸出時,有三個通道可用,即data[0][1][2],與linesize[0][1][2],而yuv格式對於運動估計時,需要填充padding(right, bottom),故:

linesize=width+padding size(16+16).
///////////////////////////////////////////////////////////////////////////////////////

 1    case PIX_FMT_YUV420P:
 2    case PIX_FMT_YUVJ420P:
 3    case PIX_FMT_RGB555:
 4         if (PIC_DIRECTION_0 == m_dwFilpPicDirection)
 5         {
 6             m_pYuvFrame->data [0] += m_pYuvFrame->linesize[0] *  m_pVCodecContext->height;
 7             //因為是隔行掃描U與V只有高度的一半
 8             m_pYuvFrame->data [1] += m_pYuvFrame->linesize[1] *  m_pVCodecContext->height/2;
 9             m_pYuvFrame->data [2] += m_pYuvFrame->linesize[2] *  m_pVCodecContext->height/2;
10             m_pYuvFrame->linesize[0] = -m_pYuvFrame->linesize[0];
11             m_pYuvFrame->linesize[1] = -m_pYuvFrame->linesize[1];
12             m_pYuvFrame->linesize[2] = -m_pYuvFrame->linesize[2];
13         }
14         break;
15 
16    case PIX_FMT_YUVJ422P:
17    case PIX_FMT_YUV422P:
18    case PIX_FMT_YUYVJ422:
19    case PIX_FMT_YUV411P:
20    case PIX_FMT_YUYV422:  
21         if (PIC_DIRECTION_0 == m_dwFilpPicDirection)
22         {
23             m_pYuvFrame->data [0] += m_pYuvFrame->linesize[0] *  m_pVCodecContext->height;
24             m_pYuvFrame->data [1] += m_pYuvFrame->linesize[1] *  m_pVCodecContext->height;
25             m_pYuvFrame->data [2] += m_pYuvFrame->linesize[2] *  m_pVCodecContext->height;
26             m_pYuvFrame->linesize[0] = -m_pYuvFrame->linesize[0];
27             m_pYuvFrame->linesize[1] = -m_pYuvFrame->linesize[1];
28             m_pYuvFrame->linesize[2] = -m_pYuvFrame->linesize[2];
29         }
30         break;

在FFMPEG中轉換RGB時順便顛倒圖像的方向算法


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM