AV1 比特流&解碼過程規范-術語和定義


草稿文件

這是一份文件草稿,在正式發布前將會有很大的變化。不要依賴它當前的內容。

1.范圍

本文檔指定開放媒體聯盟AV1編解碼器比特流格式和解碼過程。

2.術語和定義

AC coefficient

任何頻域索引在至少一個維度上為非零的變換系數

Altref

(Alternative reference frame)能在幀間編碼中使用的幀

Base layer

spatial_id和temporal_id都等於0的層

Bitstream

由編碼幀序列產生的比特序列

Bit string

比特數目有限的有序字符串,最左邊的位是MSB,最右邊的位是LSB

Block

由一個亮度和兩個色度矩陣組成的正方形或長方形像素區域

Block scan

量化系數的指定順序

Byte

一個8位比特串

Byte alignment

一個位相較於比特流開始的位置是8的整數倍那么這個位就是字節對齊的

CDEF

(Constrained Directional Enhancement Filter)設計用來基於識別方向的自適應過濾塊

CDF

(Cumulative distribution function)表示一個符號的值小於等於給定水平的概率乘以32768

Chroma

兩個色差信號中的一個樣點值或者一個樣點矩陣,色度符號是U和V

Coded frame

表示進行解碼之前的一個幀

Component

亮度或者兩個色度矩陣中的一個矩陣,也可以表示它的一個樣點值

Compound prediction

通過將兩個參考幀的預測混合在一起來計算樣點值的一種幀間預測類型

DC coefficient

一個變換系數,其頻域索引在兩個維度都為零

Decoded frame

由解碼器在比特流中重建的幀

Decoder

解碼過程的一個具體實現

Decoding process

從句法元素推導解碼幀的過程

Dequantization

通過對量子化系數的縮放來獲得變換系數的過程

Encoder

編碼過程的一個具體實現

Encoding process

生成符合本文檔描述的比特流,但是具體過程沒有在本規范中指定。

Enhancement layer

spatial_id或者temporal_id大於0的層

Flag

一個二值變量,突出顯示句法元素只能等於0或者等於1

Frame

視頻信號在空間域中的表示,由一個亮度矩陣(Y)和兩個色度矩陣(UV)組成

Frame context

用在解碼過程中的一系列概率

Frame buffer

一個存儲已解碼幀和相關信息的區域

Golden frame

在幀間編碼中可以使用的幀,通常情況下,golden frame編碼的質量更高,並被用作多個幀間幀的參考

Inter coding

用幀間預測編碼一個塊或者一個幀

Inter frame

通過參考先前解碼幀壓縮的幀,可以使用幀內預測或者幀間預測

Inter prediction

利用先前的解碼幀,推導出當前幀的預測值的過程

Intra coding

用幀內預測編碼一個塊或者一個幀

Intra frame

一種只使用幀內預測的幀,可以獨立解碼

Intra prediction

在同一解碼幀中,利用先前解碼的樣點值,推導出當前樣點預測值的過程

Inverse transform

將變換系數矩陣轉化為空間樣點值矩陣的過程(得到殘差系數)

Key frame

一個幀內幀,當它出現時重置解碼過程

Layer

一系列具有相同spatial_id和temporal_id的片組OBUs

Level

對句法元素和變量值定義的一組約束

Loop filter

一種用於重建幀的過濾過程,旨在減少塊效應

Luma

一個樣點值矩陣或單個樣點值,表示與主色相關的單色信號,符號用Y表示

Mode info

在解碼過程中,包含指示塊如何被預測的塊的語法元素

Mode info block

一個大小為4x4或者更大的亮度樣點值塊,以及它的兩個相應的色度樣點值塊(如果存在的話)

Motion vector

一個二維矢量,用於將當前幀引用到參考幀,它的值提供了從當前幀的位置到參考幀中位置的坐標偏移量

OBU

所有句法結構封包在“開放比特流單元”中,每個OBU都有一個頭,它為包含的數據(有效負載)提供標識信息

Parse

從比特流中獲取句法元素的過程

Prediction

預測過程的實現,包括幀內預測和幀間預測

Prediction process

用預測器估計解碼樣點值或數據元素的過程

Prediction value

值,即之前解碼的樣點值或數據元素的組合,用於下一個樣點值或數據元素的解碼過程

Profile

部分句法、語義和算法的子集

Quantization parameter

用於在解碼過程中縮放量化系數的變量

Quantized coefficient

反量化之前的變換系數

Raster scan

(光柵掃描)將二維矩形光柵映射為一維光柵,其中一維光柵的入口從二維光柵的第一行開始,然后掃描進入第二行和第三行,以此類推。每個行從左到右掃描

Reconstruction

解碼獲得的殘差和對應的預測值相加

Reference frame

在幀間預測過程中使用的之前已解碼的幀

Reserved

一種特殊的句法元素值,可以用來在將來擴展這個部分

Residual

重建值和對應的預測值的差

Sample

構成幀的基本元素

Sample value

樣點的值,對8位幀來說,這是一個0~255的整數;對於10位幀來說,這是一個0~1023的整數;對於12位幀來說,這是一個0~4095的整數

Segmentation map

一個3bit的數字包含了圖像中每個4x4塊的段關系,每一個參考緩存存儲了一個段映射允許新的幀使用之前的已編碼映射

Sequence

編碼比特流的最高層次句法結構,包括一個或幾個連續編碼的幀

Superblock

一個tile中塊四叉樹的最高層次,一個幀中所有超級塊大小都是一樣的並且都是正方形,超級塊可以是128x128像素或者64x64像素,一個超級塊可以包含1或2個模式信息塊,或者可以在每個方向上平分,創建4個子塊,這些子塊本身可以被進一步細分,形成塊四叉樹

Switch Frame

一個幀間編碼幀可以作為序列切換的點,在不強制使用幀內編碼的情況下,切換幀會覆蓋所有的幀緩沖區。其目的是允許一個流用例,其中視頻可以被編碼成小塊(比如1秒的時間),每一個都以一個切換幀開始。如果可用帶寬下降,服務器可以開始從較低的比特率編碼中發送塊,切換后的解碼圖像可能有點不正確,但是這種方法允許一個切換,而不需要一個完整的關鍵幀的成本

Syntax element

在比特流中表示的數據元素

Temporal delimiter OBU

指示接下來的OBUs相對於時間分隔符之前的最后一幀有不同的顯示/解碼時間戳

Temporal unit

它由一個時間分隔符OBU和所有跟隨的OBUs組成,但不包括下一個時間分隔符

Temporal group

一組幀,其時間預測結構在視頻序列中周期性地使用

Tile

幀的一個矩形區域,可以獨立的解碼和編碼,盡管跨tile邊緣的環路濾波仍然適用

Transform block

一種正方形變換系數矩陣,用於反變換過程的輸入

Transform coefficient

頻域中的一個標量值,包含在一個變換塊中

Uncompressed header

解碼幀的高級描述,編碼的時候沒有用算術編碼


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM