买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于深度神经网络的3D视频深度图帧内快速编码方法_南京理工大学_202011603013.X 

申请/专利权人:南京理工大学

申请日:2020-12-29

公开(公告)日:2021-05-07

公开(公告)号:CN112770120A

主分类号:H04N19/597(20140101)

分类号:H04N19/597(20140101);H04N19/96(20140101);H04N19/593(20140101);H04N19/147(20140101);H04N13/161(20180101);G06N3/04(20060101);G06N3/08(20060101)

优先权:

专利状态码:有效-授权

法律状态:2022.05.20#授权;2021.05.25#实质审查的生效;2021.05.07#公开

摘要:本发明公开了一种基于深度神经网络的3D视频深度图帧内快速编码方法,方法包括:输入大小为64×64的编码树单元CTU和其深度帧内跳过模式DIS率失真值、量化参数QP,预处理后作为卷积神经网络的输入,经过卷积操作后,对最终特征反卷积,并与中间特征叠加起来,最终输出CTU中深度为0、1和2的21个预测结果,对一个CTU中三个深度层级的CU继续四叉树划分或者停止四叉树划分做出预测。本发明有效地降低了深度图编码单元四叉树划分的复杂度,减少了所需的编码时间;并在提高编码速度的同时,保证了最终解码端合成视角的视频质量。

主权项:1.一种基于深度神经网络的3D视频深度图帧内快速编码方法,其特征在于,包括如下步骤:步骤1:数据收集,选取深度图多种细节不同的视频,每隔20帧选取1帧,每个视频共计选取5帧,在不同量化参数QP下用原始3D-HEVC编码器进行编码,将每个编码树单元CTU中三种不同深度等级的编码单元CU是继续四叉树划分或者终止四叉树划分的结果作为标签,并采集深度0的64×64编码单元的DIS率失真值和量化参数QP,与所有划分标签记录在一个CTU中,作为训练数据集;步骤2:数据训练,对于训练集中的CTU,将CTU的亮度值进行去均值预处理,作为卷积神经网络的输入,随后进行五次卷积计算,最终得到1×1的特征;将QP和DIS率失真值作为先验输入全连接层,并将输出的特征与CTU的特征叠加,经过softmax作为深度0的输出;随后对1×1的特征进行反卷积计算得到2×2的特征,并与中间对应大小特征叠加,经过softmax作为深度1的输出;继续进行反卷积,得到4×4的特征,并与中间对应大小特征叠加,经过softmax作为深度2的输出,经过数据训练后得到一个用于3D-HEVC帧内快速编码的网络;步骤3:数据测试,选取8个视频序列作为测试集,每一帧图像每一个CTU,在编码深度0的64×64的CTU后,将CTU亮度值、QP、DIS率失真值输入到训练好的用于3D-HEVC帧内快速编码的网络中,得到每个CTU中不同深度编码单元的划分判断结果,根据判断结果进行后续编码。

全文数据:

权利要求:

百度查询: 南京理工大学 基于深度神经网络的3D视频深度图帧内快速编码方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。