视频编码技术-AVS3介绍
AVS3
AVS3视频编码标准是中国AVS工作组制定的第三代视频编码标准。适应超高清电视广播、VR、视频监控等多种应用场景。AVS3的发展过程分为两个阶段。第一阶段的目标是开发一个软件/硬件实现友好的配置文件,采用编码工具,显示巨大的编码增益和相对有限的复杂性增量。到目前为止,AVS3的第一阶段已于2019年3月完成,在4K超高分辨率视频方面,它比AVS2节省了大约30%的比特率。此外,AVS3的第二阶段正在开发更有效的编码工具,以改进性能,特别是监视视频和屏幕内容视频。
关键编码工具
- 块分区
AVS3采用了更加灵活的编码树块划分方案,可以很好地支持各种分辨率的视频内容。AVS3中的编码树单元(CTU)的大小可达128x128,并被划分为最少4x4块。
AVS3基于QT方法引入了二叉树(BT)和扩展四叉树(EQT),这些分割方法引入了非方形CU,为块划分提供了足够的灵活性。 - 内部预测
为了有效地预测不同类型的内容,引入了内部预测滤波器(intra prediction filter, IPF)来消除噪声,获得更准确的预测样本。IPF滤波器的权重取决于预测样本的位置和块的大小。对于色度样本,提出了两步交叉分量预测模式(TSCPM),通过对之前解码的亮度样本进行预测,减少色度和亮度之间的交叉分量冗余。
3.帧间预测
对于skip/direct模式,提出了一种运动向量偏移补偿方法,称为终极运动向量表达式(UMVE),该方法可以进一步细化skip/direct模式的MV,以便更好地进行预测。此外,采用基于历史的运动矢量预测(HMVP)方法,利用更多先前编码的块的运动信息进行预测。skip/direct模式的扩展通过从已经解码的块推断所有的运动数据显著地简化了块方向的运动数据信号。为了减少运动矢量差(MVD)的编码位,开发了CU级自适应运动矢量分辨率(AMVR)方案,其中运动矢量分辨率可以从运动分辨率指数表示的{1/ 4,2 / 1,1,2,4}像素集合中选择。通过将AMVR指标用于运动矢量预测,设计了一种增强运动矢量分辨率(EMVR)模式,可以增加更多的候选向量用于MV预测编码。除此之外,我们还采用了一种基于子块的运动向量预测方法,称为仿射预测模型。该方法将一个CU分成大小相等的子块,每个子块的MV由控制点MV推导而来。
4. 变换
在AVS3中引入了DCT-VIII和DST- VII等新型转换核,以获得更好的能量压缩。最大变换块大小扩展到64x64,对于大平面块编码是有效的。
采用了基于位置的变换(PBT)技术,根据四叉树划分中块的位置选择不同的变换核。如图7所示,PBT将CU分成四个子块,每个子块根据其位置使用预先设计的变换集。
5. 熵编码
采用基于扫描区域的系数编码(SRCC)方案对AVS3中的量化系数进行编码。在SRCC中,首先对区域位置进行编码,然后按照反之字形扫描顺序对系数进行编码。该区域由x轴上最右边的非零系数和y轴上最下面的非零系数决定。只有扫描区域内的系数具有非零值,并从扫描区域的右下角按反之字形扫描顺序进行编码。
6. 在循环中过滤
为了减少阻塞和振响等压缩伪影,AVS3中对重构图像依次进行去块滤波、样本自适应偏移(SAO)滤波和自适应环路滤波(ALF)。
去块滤波的目的是消除因块变换和量化而产生的块效应。去块过滤器的基本单元是一个8x8块。对于每个8x8块,只有当边界属于CU边界、PU边界或TU边界中的任何一个时,才使用去块滤波器。在去块滤波后,应用SAO滤波来降低一个区域的平均样本失真,在重构样本中加入偏移量来减少振铃伪影和轮廓伪影。ALF是环内滤波的最后阶段,它是一种基于维纳的自适应滤波器,目的是使原始样本和重构样本之间的均方误差最小,可以应用在帧级或LCU级。
性能比较
AVS3采用了许多新颖的编码工具来提高编码效率。如表所示,第一阶段AVS3相对于AVS2 (RD19.5)和HEVC (HM16.20)平均可以实现23.77%和21.75%的bd-rate降低。

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
