h264之路(2)——VCL框架及YCbCr格式

发表于 2017/9/22 上午8:21:46 阅读（4905）

VCL框架

VCL层的功能便是视频编码，其框架如图：

主流程：当前值F_n为输入数据, 该值进入编码器后与预测值P相减，得到残差D_n。D_n经过DCT变换T，量化Q后，得到量化系数X，再经过重排序，熵编码，生成SODB。最后输出到NAL，加上解码所需信息，组成NALU，形成h264码流。

主流程外的其余部分则关乎预测值P的产生。要产生预测值，首先要经过重建步骤——量化系数X经过反量化Q^-1,反变换 T^-1,得到重建的残差D^'_n. D^'_n加上预测值P即得重建像素值uF^’_n。之后便有2种预测模式可选——帧内预测及帧间预测。

帧内预测：uF^’_n经过加权，选择后，即可作为当前块的预测值。

帧间预测：uF^’_n经过去方块滤波后得到重建帧F^’_n，用作参考帧F^’_n-1。然后利用F_n与F^’_n-1计算运动估计(ME), 运动补偿(MC), MC的值即为帧间预测值P。

下面我们将根据流程，一步步研究编码相关操作及算法。

YCbCr格式

编码流程第一步，自然就是视频数据的输入了。h264编码器的输入数据为按宏块输入的YCbCr数据。其中宏块即16*16的像素块，是编码器处理的基本单元。而需要注意的是YcbCr与YUV其实略有不同，计算公式有微小区别。YUV主要应用于图像处理，YcbCr主要应用于数字视频，h264里所使用的应是YCbCr，不过一般也不严格区分两者。下面重点讨论YCbCr格式：

YCbCr优势:

(1)Y,Cb,Cr 3个分量相对独立，方便分通道处理

(2)人对色度信息不那么敏感，可以通过减少色度信息来缩小数据量

采样格式：

采样格式主要有2种(其余在此不讨论)：4:2:2 4:2:0

4:2:2：每2个Y分量共用一个U分量，一个V分量

4:2:0：每4个Y分量共用一个U分量，一个V分量