杭州中科睿鉴科技有限公司龚健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州中科睿鉴科技有限公司申请的专利基于多模态对比学习的深伪视频检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119672616B 。
龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510181090.7,技术领域涉及:G06V20/40;该发明授权基于多模态对比学习的深伪视频检测方法是由龚健;何覃;吕永标设计研发完成,并于2025-02-19向国家知识产权局提交的专利申请。
本基于多模态对比学习的深伪视频检测方法在说明书摘要公布了:本发明涉及一种基于多模态对比学习的深伪视频检测方法,适用于深度伪造检测领域;该方法包括:将待检测视频输入经训练的视频鉴伪模型,输出该待检测视频的检测结果;视频鉴伪模型包括:视觉编码器,取自经训练的音、视频对比学习模型,用于提取待检测视频中人脸序列的视觉特征;音频编码器,取自经训练的音、视频对比学习模型,用于提取待检测视频的音频特征;跨模态特征融合模块,用于融合视觉编码器提取的视觉特征和音频编码器提取的音频特征,得到特征融合结果;时空特征提取模块,用于对特征融合结果提取时空特征;融合特征不仅包含视觉特征,还包括音频特征,特征更丰富;分类器,用于基于时空特征,将待检测视频分类为真实视频或伪造视频。
本发明授权基于多模态对比学习的深伪视频检测方法在权利要求书中公布了:1.一种基于多模态对比学习的深伪视频检测方法,其特征在于,包括: 将待检测视频输入经训练的视频鉴伪模型,输出该待检测视频的检测结果; 所述视频鉴伪模型,包括: 视觉编码器,取自经训练的音、视频对比学习模型,用于提取待检测视频中人脸序列的视觉特征; 音频编码器,取自经训练的音、视频对比学习模型,用于提取待检测视频的音频特征; 跨模态特征融合模块,用于融合所述视觉编码器提取的视觉特征和所述音频编码器提取的音频特征,得到特征融合结果; 时空特征提取模块,用于对特征融合结果提取时空特征; 分类器,用于基于时空特征,将待检测视频分类为真实视频或伪造视频; 所述音、视频对比学习模型的训练,包括: 将真实音视频作为正样本,将真实音视频中音频前或后移动随机时间后为作为负样本; 对将正样本和负样本中音视频分离为音频和视频,对视频进行人脸检测和跟踪提取人脸,得到人脸序列; 通过视觉编码器提取人脸序列的视觉特征,通过音频编码器提取人脸序列对应音频的音频特征; 基于视觉特征和音频特征,计算对比损失,减小正样本对距离,加大负样本对距离。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州中科睿鉴科技有限公司,其通讯地址为:310015 浙江省杭州市拱墅区祥园路108号4幢1011室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。