【发明授权】基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置_华侨大学_202311280429.6

导航：龙图腾网> 最新专利技术> 基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置_华侨大学_202311280429.6

申请/专利权人：华侨大学

申请日：2023-10-07

公开（公告）日：2023-12-29

公开（公告）号：CN117014610B

主分类号：H04N19/119

分类号：H04N19/119;H04N19/103;H04N19/96

优先权：

专利状态码：有效-授权

法律状态：2023.12.29#授权;2023.11.24#实质审查的生效;2023.11.07#公开

摘要：本发明公开了一种基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置，涉及视频编码领域，该方法包括：获取屏幕内容视频，将128×128大小的CTU直接划分为64×64大小的CU；构建多任务学习网络模型，多任务学习网络模型包括主干网络、第一子网络和第二子网络，主干网络用于提取CU特征，将CU特征输入第一子网络和第二子网络，得到CU划分类型和编码模式，可结合编码模式及其预测概率和临近CU的划分类型综合确定预测结果；将64×64大小的CU输入经训练的多任务学习网络模型，得到第一预测结果；若第一预测结果为划分，则进一步划分为4个32×32大小的CU，并输入经训练的多任务学习网络模型，得到第二预测结果，解决H.266VVC屏幕内容帧内编码复杂度高的问题。

主权项：1.一种基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法，其特征在于，包括以下步骤：获取屏幕内容视频，采用标准编码器对所述屏幕内容视频进行编码，将128×128大小的编码树单元CTU直接划分为64×64大小的编码单元CU；构建多任务学习网络模型并训练，得到经训练的多任务学习网络模型，所述多任务学习网络模型包括主干网络、第一子网络和第二子网络，所述第一子网络和第二子网络分别与所述主干网络连接，所述主干网络包括依次连接的第一卷积层、第二卷积层、第一池化层、第三卷积层、第四卷积层、第二池化层，所述第一卷积层、第二卷积层、第三卷积层、第四卷积层的卷积核大小均为3×3，步长为1，填充为1，通道数分别为64、64、128、128，所述第一子网络包括依次连接的第五卷积层、第六卷积层和三个第一全连接层，所述第五卷积层和第六卷积层的卷积核大小均为1×1，步长为1，填充为1，通道数分别为256、256，3个第一全连接层的神经元数分别为16384、512、2或者6，dropout比率为0.3，所述第二子网络包括依次连接的第七卷积层、第八卷积层和三个第二全连接层，所述第七卷积层和第八卷积层的卷积核大小均为1×1，步长为1，填充为1，通道数分别为256、256，三个第二全连接层的神经元数分别为16384、512、4，dropout比率为0.25，所述主干网络用于提取CU特征，将所述CU特征输入所述第一子网络，预测得到CU划分类型及其对应的预测概率，将所述CU特征输入所述第二子网络中，预测得到编码模式及其对应的预测概率，将所述CU划分类型作为预测结果或者根据所述CU划分类型及其对应的预测概率、编码模式及其对应的预测概率和临近CU的划分类型综合确定预测结果，具体包括：响应于确定不存在所述CU划分类型和编码模式相矛盾的情况，则将所述CU划分类型作为预测结果；响应于确定存在所述CU划分类型和编码模式相矛盾的情况，则根据所述CU划分类型及其对应的预测概率、编码模式及其对应的预测概率和临近CU的划分类型进行联合判断，确定所述预测结果，具体包括：响应于确定所述CU划分类型为不划分，所述编码模式为不分配模式，则根据所述编码模式对应的预测概率进行判断，判断所述编码模式的预测概率是否大于阈值且大于所述CU划分类型对应的预测概率，并且此CU的左边和上方CU都进行划分，若是则选择预测概率最大的CU划分类型作为预测结果；响应于确定所述CU划分类型为划分，所述编码模式为除不分配模式以外的其他模式，判断所述CU划分类型对应的预测概率是否大于阈值且大于所述编码模式对应的预测概率，若是则所述预测结果中的CU划分类型为划分；所述多任务学习网络模型的训练过程中所采用的损失函数如下式所示：其中，α表示主任务CU划分的权重，β表示辅助任务编码模式的权重，w1表示CU划分类型qCU所占的比例，CU划分类型qCU对应数值为不同尺寸CU的标签0，1或0，1，2，3，4，5，pCU表示CU划分类型qCU对应的预测概率；w2表示编码模式qM所占的比例，编码模式qM对应数值为CU的编码模式标签0，1，2，3，pM表示编码模式qM对应的预测概率，N表示训练样本的批次数；在标准编码器的编码过程中，调用所述经训练的多任务学习网络模型，将所述64×64大小的CU输入经训练的多任务学习网络模型，得到第一预测结果，根据所述第一预测结果进行CU划分；响应于确定第一预测结果的CU划分类型为划分，则将所述64×64大小的CU划分为4个32×32大小的CU；将所述32×32大小的CU输入经训练的多任务学习网络模型，得到第二预测结果，根据所述第二预测结果进行CU划分；所述根据所述第一预测结果进行CU划分，具体包括：响应于确定第一预测结果的CU划分类型为不划分，则终止率失真优化搜索过程；响应于确定第一预测结果的CU划分类型为划分，则将64×64大小的CU划分为4个32×32大小的CU；所述根据所述第二预测结果进行CU划分，具体包括：响应于确定第二预测结果的CU划分类型为不划分，则终止率失真优化搜索过程；响应于确定第二预测结果的CU划分类型为四叉树划分，则得到4个16×16大小的CU；响应于确定第二预测结果的CU划分类型为水平二叉树划分，则得到2个16×32大小的CU；响应于确定第二预测结果的CU划分类型为垂直二叉树划分，则得到2个32×16大小的CU；响应于确定第二预测结果的CU划分类型为水平三叉树划分，则得到2个8×32大小的CU和1个16×32大小的CU；响应于确定第二预测结果的CU划分类型为垂直三叉树划分，则得到2个32×8大小的CU和1个32×16大小的CU；响应于确定所述第一预测结果为划分，则将所述64×64大小的CU划分为4个32×32大小的CU。

全文数据：

权利要求：

百度查询：华侨大学基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种电能表故障数据监测系统及数据存储介质_中电装备山东电子有限公司_202410411878.8

下一篇：用于制造一次性杯状件的机器_MS2责任有限公司_202280065197.X

相关技术

一种电能表故障数据监测系统及数据存储介质_中电装备山东电子有限公司_202410411878.8

用于制造一次性杯状件的机器_MS2责任有限公司_202280065197.X

一种热升华水性油墨及其制备方法_广东睿智环保科技股份有限公司_202410410854.0

一种社团机器人竞赛用综合管理系统_昆山峻优科技培训有限公司_202311812065.1

全氟异丁腈的合成方法_天津市长芦化工新材料有限公司_202410424719.1

一种汽车配件的外圆磨削装置_江苏坦途专用汽车制造有限公司_202410150674.3

为放大器操作进行的平台资源的选择_超威半导体公司_202280065509.7

POCT血细胞分析仪_深圳市帝迈生物技术有限公司_202410426762.1

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

数据标注方法、电子设备和计算机可读存储介质_浙江大华技术股份有限公司_202311671122.9

一种数控龙门铣床_河北大恒重型机械有限公司_202410333473.7

一种脑膜炎球菌发酵培养基及其制备方法和应用_成大生物(本溪)有限公司_202410343870.2

CU相关技术

一种高强耐热Al-Mg-Zn-Cu-Ag-Si合金及其制备方法_北京科技大学_202410088447.2

一种超高强耐高温Cu-Ni-Sn合金线材及其制备方法_有研工程技术研究院有限公司_202410145090.7

以多晶Cu作为基体的复合材料分子动力学模拟方法_昆明理工大学_202410227919.8

一种Ti-Si-Cu-C/DLC纳米复合疏水耐磨涂层_上海电子信息职业技术学院_202410193235.0

一种多元多尺度强化Cu-Cr-Mo复合材料及其制备方法_西安理工大学_202410135924.6

一种基于激光脉冲整形的高致密无裂纹Al-Cu合金的制备方法_南京航空航天大学_202410016039.6

含高价铜Cu（Ⅲ）钙钛矿型复合金属氧化物及其制备方法和应用_武汉理工大学_202410088098.4

一种Cu-MOF改性的陶瓷结合剂金刚石砂轮块的制备方法_杭州芯研科半导体材料有限公司_202410170413.8

一种耐腐蚀重熔添加Cu元素的高碳铬轴承钢及方法_西安工程大学_202410169057.8

一种高超弹性Cu-Ni-Ga形状记忆合金微丝及其制备方法_北京科技大学_202211578513.1

屏幕相关技术

一种屏幕自动装袋机_东莞市圻博智能设备有限公司_201810931274.0

增强现实和屏幕图像渲染协调_杜比实验室特许公司_202280064470.7

一种屏幕旋转调节装置_威数智能科技有限公司_202410348235.3

一种防脱结构、屏幕总成及车辆_北京罗克维尔斯科技有限公司_202322291615.1

一种现场作业用语音提示LED屏幕_上海乾凌工程设备有限公司_202322487737.8

一体化柔性光学投影屏幕_深圳市真屏科技发展有限公司_202322565858.X

商品贩卖柜的触控屏幕固定结构_宁波海格斯机电制造有限公司_202322960587.8

屏幕显示方法、装置、设备及其存储介质_浙江极氪智能科技有限公司_202410328177.8

一种电子墨水屏屏幕全贴合结构_深圳市智慧季节科技有限公司_202322887706.1

屏幕显示方法及相关电子设备_荣耀终端有限公司_202310154007.8

内容相关技术

多平台网络内容的人工智能治理网络内容方法_华南师范大学_202410026596.6

内容质量评分方法及相关装置_深圳希施玛数据科技有限公司_202410413080.7

自动化智能内容生成_微软技术许可有限责任公司_202180091208.7

对内容样本进行聚类的方法和装置_腾讯科技(深圳)有限公司_202010824726.2

基于内容理解的遥感影像统筹推荐方法_北京数慧时空信息技术有限公司_202210992027.8

基于数据内容的用户行为风险分析_上海凯馨信息科技有限公司_202410220983.3

用于预览显示内容的方法及相关产品_楚天龙股份有限公司_202410175167.5

内容分类方法、装置、电子设备及存储介质_腾讯科技(深圳)有限公司_202110687914.X

用于下混合音频内容的响度调整_杜比实验室特许公司_202410171725.0

生成小说内容的方法、装置、设备和存储介质_北京字跳网络技术有限公司_202410218729.X

龙图腾网&IPTOP

【发明授权】基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置_华侨大学_202311280429.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务