论文辅导网提供毕业论文和发SCI表论文辅导和论文润色服务25年。

基于多特征信息融合的H.266/VVC帧内编码单元划分快速决策方法思考

  • 论文价格:150
  • 用途: 硕士毕业论文 Master Thesis
  • 作者:上海论文网
  • 点击次数:1
  • 论文字数:30233
  • 论文编号:
  • 日期:2024-12-23
  • 来源:上海论文网

计算机论文哪里有?本文针对2D视频的VVC编码标准的CU划分,首先提出基于时空结合的CU最佳深度预测算法,通过收集CU的深度信息,预测编码CU块的深度,同时,进一步提出基于决策树的CU划分模式决策,在第一个算法预测的基础上,在得到的划分深度范围内,对CU划分模式进行决策,进一步减少编码的时间复杂度。

第一章 绪论

1.2 国内外研究现状

在视频编解码技术中,VVC引入了一种称为QTMT(Quadtree with Multi-Type Tree)的编码结构,旨在提升视频压缩的效率。然而,这种结构的引入也带来了显著的问题。具体来说,QTMT结构增加了编码块划分的计算复杂性,使得在视频编码过程中需要处理的数据量剧增。更为重要的是,QTMT结构导致了VVC帧内编码复杂度的显著提升,计算负担几乎增加了90%。这一挑战对于VVC的编码效率和实时性能构成了严峻考验,因此需要在未来的研究中深入探讨和优化[9]。针对QTMT结构所带来的编码挑战,国内外众多学者进行了广泛而深入的研究,并提出了多种优化算法。这些优化算法主要聚焦于两大核心方向。其一,是以传统的块划分和预测模式技术为基础,深入探索并优化编码过程中的各个环节。通过精心调整和优化这些关键技术的参数与策略,旨在实现编码效率的显著提升,同时确保图像质量的持续优化。另一方面,从学科交叉的视角出发,研究者们积极结合机器学习、深度学习等前沿技术,提出了一系列高效且智能化的编码优化方案。这些优化算法虽然在实际应用中的效果各有差异,但无疑都为解决VVC帧内编码的复杂难题提供了重要的助力。

计算机论文怎么写

第三章 基于时空信息结合的快速CU划分模式决策

3.2 基于时空结合的CU划分的最佳深度预测

VTM加入了混合CU划分模式,为了减小CTU划分过程中产生大量复杂情况,设定CU一旦进行了MTT划分,则该CU内部将不再进行四叉树划分。由图1可以看到大小为8×8的CU已不再进行QT划分模式选择,因此本文只考虑大小为128×128至大小为8×8之间的深度。因此,本文决定将128×128大小的CTU划分成8×8大小的子CU块,然后对这些子CU进行最佳深度预测,通过划分,可以得到16×16块大小为8×8尺寸的子CU。

本文需要对CU的划分深度进行预测,因此本文需要提取CU块的深度信息作,同时提取CU块相邻已编码的CU块深度信息作为特征之一。神经网络训练需要足够的特征量和数据量,因为视频相邻帧是连续的,具有很强的相关性,大部分区域都可以认为是背景区域,因此两帧对应的CU块的划分深度相同的概率很高。所以本文考虑将上一帧已编码的对应CU块及其相邻已编码的CU块的深度作为特征加入到本文的模型之中以便提高模型预测的精度。

第四章 基于MC-CNN的三维视频快速帧内决策

4.1 引言

3D-HEVC为了提高对三维视频的压缩性能,加入了很多新的编码工具,但如今针对使用VVC对三维视频编码的研究少之又少,并且没有一个成型的编码标准,因此VVC对三维视频编码时,除了最后使用基于深度图的DIBR方法对多个视频序列和深度图进行融合外,其余编码部分仍需采用VVC传统的编码方法,参考3D-HEVC设定的独立视点和非独立视点,本文将所有视点都设定为独立视点,也就是说,对多视点的所有视频序列以及对应的深度图序列,都采用同样的VVC标准编码流程。

VVC沿用HEVC的框架,在此基础上,VTM采用了三阶段快速帧内模式决策,在帧内预测编码过程中,首先将CTU划分成各个深度阶段的CU,接下来根据哈达玛变换损失选出N个模式,由绝对变换差之和衡量67个帧内预测模式,然后根据MPM表中的M个模式与先前选出的N个模式组合起来,组成最可能预测模式列表,最后通过比较父CU的RD损失和子CU的RD损失之和,来对最终的预测模式进行判断,同时通过比较不同划分模式所得到的RD损失比较,选出最优的CU划分模式。本章设计了一种加强型的多通道CNN网络(MC-CNN)的来加速深度图中的CU划分进程,可以大幅度减少冗余的RD损失计算,这将有效减少编码的计算复杂度。

4.2 基于MC-CNN的快速CU划分决策

深度图中的值表示的是视点到物体之间的距离,其中前景和背景内部区域较大,且像素平滑,但边缘锐利,会带来很强的振铃效应。

计算机论文参考

图一选取了不同分辨率的深度图的单个视点进行CU划分可视化,来验证统计分析的可靠性。可以看出,深度图中大部分为同质区域,同质区域的CU大都不进行划分,划分主要集中在深度图中的细节部分。根据VTM标准的编码流程,这些同质区域的CU仍需进行RMD选择并进行RD计算来判断当前CU是否划分,这将带来很大的冗余计算复杂度。因此提出将深度图中的CU块划分为简单CU和复杂CU,对于判断为简单CU的块,不对其进行进一步的划分,反之,仍按照编码标准流程进行下一步的计算。

第五章 总结与展望

5.2 后续工作展望

针对VVC帧内CU划分过程中复杂度高的问题,提出了两种优化算法。虽然这些算法有效地降低了编码时间,但仍存在一些改进的空间。本文认为需要进一步优化算法以提高编解码速度和效率,以及更加细致地探究模式判决和块划分的加速方法,以进一步降低编码复杂度。

本文提出的算法主要针对CU划分过程进行了研究,在加快视频编码进程取得一定的进展,但所提出的方法仍有完善的空间。对于所有CU块,本文采用的是同一个结构模型,但不同尺寸的CU有不同的规律性,这样可能会导致部分细节缺失。并且3D视频本文仅仅做了初步尝试,深度图和纹理视频序列,本文仅通过一部分分析,判断他们的纹理程度是相对独立的,可能会导致本文的一些分析是片面不完整的。理论上来讲,同一视点下的纹理视频序列和其对应的深度图一定有一些关联性,进一步的研究将会深入分析这些联系,并对不同尺寸的CU研究其各自的特点,以便构建出更完善的模型结构。进一步本文也将尝试向帧内模式预测研究,进一步优划视频帧内编码速度,提高编码效率和视频质量。

参考文献(略)

123
限时特价,全文150.00元,获取完整文章,请点击立即购买,付款后系统自动下载

也可输入商品号自助下载

下载

微信支付

查看订单详情

输入商品号下载

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!