基于多特征信息融合的H.266/VVC帧内编码单元划分快速决策方法思考

论文价格：150
用途：硕士毕业论文 Master Thesis
作者：上海论文网
点击次数：1
论文字数：30233
论文编号：
日期：2024-12-23
来源：上海论文网

TAGS:

计算机论文哪里有？本文针对2D视频的VVC编码标准的CU划分，首先提出基于时空结合的CU最佳深度预测算法，通过收集CU的深度信息，预测编码CU块的深度，同时，进一步提出基于决策树的CU划分模式决策，在第一个算法预测的基础上，在得到的划分深度范围内，对CU划分模式进行决策，进一步减少编码的时间复杂度。

第一章绪论

1.2 国内外研究现状

在视频编解码技术中，VVC引入了一种称为QTMT（Quadtree with Multi-Type Tree）的编码结构，旨在提升视频压缩的效率。然而，这种结构的引入也带来了显著的问题。具体来说，QTMT结构增加了编码块划分的计算复杂性，使得在视频编码过程中需要处理的数据量剧增。更为重要的是，QTMT结构导致了VVC帧内编码复杂度的显著提升，计算负担几乎增加了90%。这一挑战对于VVC的编码效率和实时性能构成了严峻考验，因此需要在未来的研究中深入探讨和优化[9]。针对QTMT结构所带来的编码挑战，国内外众多学者进行了广泛而深入的研究，并提出了多种优化算法。这些优化算法主要聚焦于两大核心方向。其一，是以传统的块划分和预测模式技术为基础，深入探索并优化编码过程中的各个环节。通过精心调整和优化这些关键技术的参数与策略，旨在实现编码效率的显著提升，同时确保图像质量的持续优化。另一方面，从学科交叉的视角出发，研究者们积极结合机器学习、深度学习等前沿技术，提出了一系列高效且智能化的编码优化方案。这些优化算法虽然在实际应用中的效果各有差异，但无疑都为解决VVC帧内编码的复杂难题提供了重要的助力。

第三章基于时空信息结合的快速CU划分模式决策

3.2 基于时空结合的CU划分的最佳深度预测

VTM加入了混合CU划分模式，为了减小CTU划分过程中产生大量复杂情况，设定CU一旦进行了MTT划分，则该CU内部将不再进行四叉树划分。由图1可以看到大小为8×8的CU已不再进行QT划分模式选择，因此本文只考虑大小为128×128至大小为8×8之间的深度。因此，本文决定将128×128大小的CTU划分成8×8大小的子CU块，然后对这些子CU进行最佳深度预测，通过划分，可以得到16×16块大小为8×8尺寸的子CU。

本文需要对CU的划分深度进行预测，因此本文需要提取CU块的深度信息作，同时提取CU块相邻已编码的CU块深度信息作为特征之一。神经网络训练需要足够的特征量和数据量，因为视频相邻帧是连续的，具有很强的相关性，大部分区域都可以认为是背景区域，因此两帧对应的CU块的划分深度相同的概率很高。所以本文考虑将上一帧已编码的对应CU块及其相邻已编码的CU块的深度作为特征加入到本文的模型之中以便提高模型预测的精度。

第四章基于MC-CNN的三维视频快速帧内决策

4.1 引言

3D-HEVC为了提高对三维视频的压缩性能，加入了很多新的编码工具，但如今针对使用VVC对三维视频编码的研究少之又少，并且没有一个成型的编码标准，因此VVC对三维视频编码时，除了最后使用基于深度图的DIBR方法对多个视频序列和深度图进行融合外，其余编码部分仍需采用VVC传统的编码方法，参考3D-HEVC设定的独立视点和非独立视点，本文将所有视点都设定为独立视点，也就是说，对多视点的所有视频序列以及对应的深度图序列，都采用同样的VVC标准编码流程。

VVC沿用HEVC的框架，在此基础上，VTM采用了三阶段快速帧内模式决策，在帧内预测编码过程中，首先将CTU划分成各个深度阶段的CU，接下来根据哈达玛变换损失选出N个模式，由绝对变换差之和衡量67个帧内预测模式，然后根据MPM表中的M个模式与先前选出的N个模式组合起来，组成最可能预测模式列表，最后通过比较父CU的RD损失和子CU的RD损失之和，来对最终的预测模式进行判断，同时通过比较不同划分模式所得到的RD损失比较，选出最优的CU划分模式。本章设计了一种加强型的多通道CNN网络（MC-CNN）的来加速深度图中的CU划分进程，可以大幅度减少冗余的RD损失计算，这将有效减少编码的计算复杂度。

4.2 基于MC-CNN的快速CU划分决策

深度图中的值表示的是视点到物体之间的距离，其中前景和背景内部区域较大，且像素平滑，但边缘锐利，会带来很强的振铃效应。

图一选取了不同分辨率的深度图的单个视点进行CU划分可视化，来验证统计分析的可靠性。可以看出，深度图中大部分为同质区域，同质区域的CU大都不进行划分，划分主要集中在深度图中的细节部分。根据VTM标准的编码流程，这些同质区域的CU仍需进行RMD选择并进行RD计算来判断当前CU是否划分，这将带来很大的冗余计算复杂度。因此提出将深度图中的CU块划分为简单CU和复杂CU，对于判断为简单CU的块，不对其进行进一步的划分，反之，仍按照编码标准流程进行下一步的计算。

第五章总结与展望

5.2 后续工作展望

针对VVC帧内CU划分过程中复杂度高的问题，提出了两种优化算法。虽然这些算法有效地降低了编码时间，但仍存在一些改进的空间。本文认为需要进一步优化算法以提高编解码速度和效率，以及更加细致地探究模式判决和块划分的加速方法，以进一步降低编码复杂度。

本文提出的算法主要针对CU划分过程进行了研究，在加快视频编码进程取得一定的进展，但所提出的方法仍有完善的空间。对于所有CU块，本文采用的是同一个结构模型，但不同尺寸的CU有不同的规律性，这样可能会导致部分细节缺失。并且3D视频本文仅仅做了初步尝试，深度图和纹理视频序列，本文仅通过一部分分析，判断他们的纹理程度是相对独立的，可能会导致本文的一些分析是片面不完整的。理论上来讲，同一视点下的纹理视频序列和其对应的深度图一定有一些关联性，进一步的研究将会深入分析这些联系，并对不同尺寸的CU研究其各自的特点，以便构建出更完善的模型结构。进一步本文也将尝试向帧内模式预测研究，进一步优划视频帧内编码速度，提高编码效率和视频质量。

参考文献（略）

写作参考：计算机控制技术硕士论文研究方法怎么写「精选范例」

123

限时特价，全文150.00元，获取完整文章，请点击立即购买，付款后系统自动下载

立即购买

也可输入商品号自助下载

下载

微信支付

查看订单详情

输入商品号下载

基于CartoonGAN的图像卡通化方法探讨

基于多维度学习数据集和多重特征选择融合驱动的学生成绩预测

返回→计算机论文

论文写作模板

计算机论文范文样本

基于多特征信息融合的H.266/VVC帧内编码单元划分快速决策方法思考

计算机论文

论文写作模板

计算机论文范文样本

计算机论文写作模板