草稿文件
这是一份文件草稿,在正式发布前将会有很大的变化。不要依赖它当前的内容。
1.范围
本文档指定开放媒体联盟AV1编解码器比特流格式和解码过程。
2.术语和定义
AC coefficient
任何频域索引在至少一个维度上为非零的变换系数
Altref
(Alternative reference frame)能在帧间编码中使用的帧
Base layer
spatial_id和temporal_id都等于0的层
Bitstream
由编码帧序列产生的比特序列
Bit string
比特数目有限的有序字符串,最左边的位是MSB,最右边的位是LSB
Block
由一个亮度和两个色度矩阵组成的正方形或长方形像素区域
Block scan
量化系数的指定顺序
Byte
一个8位比特串
Byte alignment
一个位相较于比特流开始的位置是8的整数倍那么这个位就是字节对齐的
CDEF
(Constrained Directional Enhancement Filter)设计用来基于识别方向的自适应过滤块
CDF
(Cumulative distribution function)表示一个符号的值小于等于给定水平的概率乘以32768
Chroma
两个色差信号中的一个样点值或者一个样点矩阵,色度符号是U和V
Coded frame
表示进行解码之前的一个帧
Component
亮度或者两个色度矩阵中的一个矩阵,也可以表示它的一个样点值
Compound prediction
通过将两个参考帧的预测混合在一起来计算样点值的一种帧间预测类型
DC coefficient
一个变换系数,其频域索引在两个维度都为零
Decoded frame
由解码器在比特流中重建的帧
Decoder
解码过程的一个具体实现
Decoding process
从句法元素推导解码帧的过程
Dequantization
通过对量子化系数的缩放来获得变换系数的过程
Encoder
编码过程的一个具体实现
Encoding process
生成符合本文档描述的比特流,但是具体过程没有在本规范中指定。
Enhancement layer
spatial_id或者temporal_id大于0的层
Flag
一个二值变量,突出显示句法元素只能等于0或者等于1
Frame
视频信号在空间域中的表示,由一个亮度矩阵(Y)和两个色度矩阵(UV)组成
Frame context
用在解码过程中的一系列概率
Frame buffer
一个存储已解码帧和相关信息的区域
Golden frame
在帧间编码中可以使用的帧,通常情况下,golden frame编码的质量更高,并被用作多个帧间帧的参考
Inter coding
用帧间预测编码一个块或者一个帧
Inter frame
通过参考先前解码帧压缩的帧,可以使用帧内预测或者帧间预测
Inter prediction
利用先前的解码帧,推导出当前帧的预测值的过程
Intra coding
用帧内预测编码一个块或者一个帧
Intra frame
一种只使用帧内预测的帧,可以独立解码
Intra prediction
在同一解码帧中,利用先前解码的样点值,推导出当前样点预测值的过程
Inverse transform
将变换系数矩阵转化为空间样点值矩阵的过程(得到残差系数)
Key frame
一个帧内帧,当它出现时重置解码过程
Layer
一系列具有相同spatial_id和temporal_id的片组OBUs
Level
对句法元素和变量值定义的一组约束
Loop filter
一种用于重建帧的过滤过程,旨在减少块效应
Luma
一个样点值矩阵或单个样点值,表示与主色相关的单色信号,符号用Y表示
Mode info
在解码过程中,包含指示块如何被预测的块的语法元素
Mode info block
一个大小为4x4或者更大的亮度样点值块,以及它的两个相应的色度样点值块(如果存在的话)
Motion vector
一个二维矢量,用于将当前帧引用到参考帧,它的值提供了从当前帧的位置到参考帧中位置的坐标偏移量
OBU
所有句法结构封包在“开放比特流单元”中,每个OBU都有一个头,它为包含的数据(有效负载)提供标识信息
Parse
从比特流中获取句法元素的过程
Prediction
预测过程的实现,包括帧内预测和帧间预测
Prediction process
用预测器估计解码样点值或数据元素的过程
Prediction value
值,即之前解码的样点值或数据元素的组合,用于下一个样点值或数据元素的解码过程
Profile
部分句法、语义和算法的子集
Quantization parameter
用于在解码过程中缩放量化系数的变量
Quantized coefficient
反量化之前的变换系数
Raster scan
(光栅扫描)将二维矩形光栅映射为一维光栅,其中一维光栅的入口从二维光栅的第一行开始,然后扫描进入第二行和第三行,以此类推。每个行从左到右扫描
Reconstruction
解码获得的残差和对应的预测值相加
Reference frame
在帧间预测过程中使用的之前已解码的帧
Reserved
一种特殊的句法元素值,可以用来在将来扩展这个部分
Residual
重建值和对应的预测值的差
Sample
构成帧的基本元素
Sample value
样点的值,对8位帧来说,这是一个0~255的整数;对于10位帧来说,这是一个0~1023的整数;对于12位帧来说,这是一个0~4095的整数
Segmentation map
一个3bit的数字包含了图像中每个4x4块的段关系,每一个参考缓存存储了一个段映射允许新的帧使用之前的已编码映射
Sequence
编码比特流的最高层次句法结构,包括一个或几个连续编码的帧
Superblock
一个tile中块四叉树的最高层次,一个帧中所有超级块大小都是一样的并且都是正方形,超级块可以是128x128像素或者64x64像素,一个超级块可以包含1或2个模式信息块,或者可以在每个方向上平分,创建4个子块,这些子块本身可以被进一步细分,形成块四叉树
Switch Frame
一个帧间编码帧可以作为序列切换的点,在不强制使用帧内编码的情况下,切换帧会覆盖所有的帧缓冲区。其目的是允许一个流用例,其中视频可以被编码成小块(比如1秒的时间),每一个都以一个切换帧开始。如果可用带宽下降,服务器可以开始从较低的比特率编码中发送块,切换后的解码图像可能有点不正确,但是这种方法允许一个切换,而不需要一个完整的关键帧的成本
Syntax element
在比特流中表示的数据元素
Temporal delimiter OBU
指示接下来的OBUs相对于时间分隔符之前的最后一帧有不同的显示/解码时间戳
Temporal unit
它由一个时间分隔符OBU和所有跟随的OBUs组成,但不包括下一个时间分隔符
Temporal group
一组帧,其时间预测结构在视频序列中周期性地使用
Tile
帧的一个矩形区域,可以独立的解码和编码,尽管跨tile边缘的环路滤波仍然适用
Transform block
一种正方形变换系数矩阵,用于反变换过程的输入
Transform coefficient
频域中的一个标量值,包含在一个变换块中
Uncompressed header
解码帧的高级描述,编码的时候没有用算术编码