买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于照片和短音频快速生成智能陪伴人的方法及系统_江苏号百科技有限公司_202311228650.7 

申请/专利权人:江苏号百科技有限公司

申请日:2023-09-22

公开(公告)日:2024-01-26

公开(公告)号:CN117456064A

主分类号:G06T13/40

分类号:G06T13/40;G10L17/02;G10L15/22;G06V40/16;G06V40/20;G06V40/10

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.02.13#实质审查的生效;2024.01.26#公开

摘要:本发明提供了一种基于照片和短音频快速生成智能陪伴人的方法及系统,涉及数字人视频应用技术领域。本方法采用面部特征映射算法和多分辨率闭合遮罩方法,完成动作引导视频与人物形象图像关键特征匹配及非人像区域的行为预测、缺失区域复原,达到有效的特征融合,智能合成人物形象视频,实现快速、低成本人物形象复刻,节省视频录制、人物动作捕捉等数字人物形象创建成本和时间。利用时间逆向拼接方法,将视频片段按照时间轴倒序处理生成人物形象视频,实现视频衔接部分的平滑过渡。此外,本发明通过接入智能聊天机器人工具,实现结合上下文语境及先前对话历史的答复文字生成,提供更加连贯、准确和有针对性的答复。

主权项:1.基于照片和短音频快速生成智能陪伴人的方法,其特征在于,包括如下步骤:步骤S1、根据用户上传的照片,提取用户人物形象的关键点位特征向量,并根据所述关键点位特征向量生成用户人物形象动态视频;其中,用户人物形象动态视频是用户照片根据预设动作引导视频进行的人物形象动态变化序列;步骤S2、根据用户上传的短音频,提取用户声纹特征并针对所述声纹特征建模,形成用户特有音色转换模型;步骤S3、获取互动者输入的语音流文件,将所述语音流文件导入智能聊天API接口,获取答复文本;步骤S4、将步骤S3获取的所述答复文本导入步骤S2中所述用户特有音色转换模型,生成具有用户音色特征的答复音频;步骤S5、基于步骤S4生成的所述答复音频文件以及步骤S1生成的所述人物形象动态变化序列,合成唇形与发音匹配的答复视频,并输出所述答复视频给互动者。

全文数据:

权利要求:

百度查询: 江苏号百科技有限公司 基于照片和短音频快速生成智能陪伴人的方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术