买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】应用于合成虚拟形象的视频处理方法、装置及存储介质_北京生数科技有限公司_202210764231.4 

申请/专利权人:北京生数科技有限公司

申请日:2022-06-30

公开(公告)日:2024-04-19

公开(公告)号:CN116708920B

主分类号:H04N21/44

分类号:H04N21/44;H04N5/265

优先权:

专利状态码:有效-授权

法律状态:2024.04.19#授权;2023.09.22#实质审查的生效;2023.09.05#公开

摘要:本申请实施例涉及人工智能技术领域,并提供一种应用于合成虚拟形象的视频处理方法、装置及存储介质,该方法包括:获取目标对象在第一场景下的第一动作视频和录制的基础根视频;获取目标对象的历史虚拟形象驱动文本,从历史虚拟形象驱动文本中提取关键词;获取驱动生成虚拟形象的音频文件所对应的文本内容,根据文本内容中出现关键词对应的位置确定第一指定时间节点;根据确定的第一指定时间节点,将第一动作视频插入基础根视频中的第一指定位置,并合成得到合成根视频;采用驱动生成虚拟形象的音频文件驱动合成根视频,得到目标对象的虚拟形象。本方案能够将需要的人物动作有机的融入整体视频中,从而得到自然变化的高质量虚拟形象。

主权项:1.一种应用于合成虚拟形象的视频处理方法,其特征在于,包括:获取针对目标对象在第一场景下录制的基础根视频,所述基础根视频的录制时长包括第一时长,其中,所述基础根视频中所述目标对象的形象姿态保持不变;所述目标对象的形象姿态保持不变包括:嘴唇保持闭合状态且人脸的俯仰角和偏航角均不超过20度;所述目标对象为不同年龄或性别的人;获取所述目标对象在所述第一场景下的第一动作视频,所述第一动作视频的录制时长包括第二时长;其中,所述第一时长大于所述第二时长,所述第一动作视频的起始帧和结束帧均与所述基础根视频中的所述目标对象的形象姿态保持一致;获取所述目标对象的历史虚拟形象驱动文本,从所述历史虚拟形象驱动文本中提取关键词;所述历史虚拟形象驱动文本为所述目标对象习惯性的或者使用过的用于驱动生成虚拟形象的文本;所述关键词包括所述历史虚拟形象驱动文本中与相应动作存在映射的关键词;获取驱动生成虚拟形象的音频文件所对应的文本内容,根据所述文本内容中出现所述关键词对应的位置确定第一指定时间节点,其中所述第一指定时间节点用于指示将所述第一动作视频插入所述基础根视频中的第一指定位置;所述文本内容的时间位置与所述基础根视频的时间位置对应;根据确定的所述第一指定时间节点,将所述第一动作视频插入所述基础根视频中的第一指定位置,并合成得到合成根视频;采用所述驱动生成虚拟形象的音频文件驱动所述合成根视频,得到所述目标对象的虚拟形象。

全文数据:

权利要求:

百度查询: 北京生数科技有限公司 应用于合成虚拟形象的视频处理方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。