华侨大学曾焕强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华侨大学申请的专利基于六自由度信息引导的沉浸式视频质量评价方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119863744B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510346077.2,技术领域涉及:G06V20/40;该发明授权基于六自由度信息引导的沉浸式视频质量评价方法及装置是由曾焕强;赖伊琳;朱建清;陈婧;施一帆;蔡磊;龚鑫荣;林琦;郑惠洁设计研发完成,并于2025-03-24向国家知识产权局提交的专利申请。
本基于六自由度信息引导的沉浸式视频质量评价方法及装置在说明书摘要公布了:本发明一种基于六自由度信息引导的沉浸式视频质量评价方法及装置,涉及计算机视觉领域,方法包括:构建基于六自由度信息引导的沉浸式视频质量评价模型并训练,得到经训练的评价模型;从沉浸式视频提取纹理视频块、纹理关键帧和深度关键帧;将纹理视频块、纹理关键帧和深度关键帧输入经训练的评价模型,通过视觉信息编码模块提取到对应的视觉特征;将视觉特征输入时空映射模块得到时间视觉标记和空间视觉标记;通过语言编码器对指令信息和六自由度视点位置信息进行编码,得到文本指令标记和视点位置标记;将各标记进行组合得到组合标记,将组合标记输入语音解码器中,得到沉浸式视频质量分数。本发明能够准确客观评估沉浸式视频的质量。
本发明授权基于六自由度信息引导的沉浸式视频质量评价方法及装置在权利要求书中公布了:1.一种基于六自由度信息引导的沉浸式视频质量评价方法,其特征在于,包括:构建基于六自由度信息引导的沉浸式视频质量评价模型并训练,得到经训练的沉浸式视频质量评价模型;所述沉浸式视频质量评价模型包括视觉信息编码模块、时空映射模块、语言编码器和大语言模型的语音解码器;获取包含多个视点的纹理视频和深度视频的沉浸式视频,从多个视点的纹理视频中提取若干个纹理视频块及纹理关键帧,以及从多个视点的深度视频中提取若干个深度关键帧;将若干个纹理视频块、纹理关键帧和深度关键帧输入经训练的沉浸式视频质量评价模型,通过视觉信息编码模块对多个视点的纹理视频块、纹理关键帧和深度关键帧分别进行特征提取,得到对应的视觉特征;将视觉特征输入时空映射模块得到时间视觉标记和空间视觉标记;通过语言编码器对指令信息和六自由度视点位置信息进行编码,得到文本指令标记和视点位置标记;将时间视觉标记、空间视觉标记、文本指令标记和视点位置标记进行组合得到组合标记,将组合标记输入语音解码器中,得到沉浸式视频质量分数;将视觉特征输入时空映射模块得到时间视觉标记和空间视觉标记,具体包括:将深度关键帧特征和纹理关键帧特征输入时空映射模块的空间映射单元中得到空间视觉标记,并将纹理视频块特征输入进时间映射单元中得到时间视觉标记,如下式所示: 其中,SP·表示空间映射单元;TP·表示时间映射单元;表示空间视觉标记;表示时间视觉标记;Fti表示纹理关键帧特征;表示深度关键帧特征;Concat表示特征拼接;表示纹理视频块特征;通过语言编码器对指令信息和六自由度视点位置信息进行编码,得到文本指令标记和视点位置标记,具体包括:通过所述语言编码器对指令信息进行编码;所述指令信息包括系统指令、引导指令和响应限制,所述系统指令用于告知大语言模型其职能,所述引导指令用于告知大语言模型其具体任务,所述响应限制用于告知大语言模型其回答问题的具体要求;对指令信息进行编码后得到的文本指令标记,如下式所示:Ftext=LEItext;其中,Itext表示指令信息;LE·表示语言编码器;Ftext表示文本指令标记;通过所述语言编码器对六自由度视点位置信息进行编码,得到视点位置标记,如下式所示: 其中,表示视点i的位置信息;表示视点i的位置标记。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华侨大学,其通讯地址为:362000 福建省泉州市丰泽区城东城华北路269号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。