【发明公布】文本驱动的语音和人脸动作生成方法、装置、设备及介质_清华大学_202410028759.4

导航：龙图腾网> 最新专利技术> 文本驱动的语音和人脸动作生成方法、装置、设备及介质_清华大学_202410028759.4

申请/专利权人：清华大学

申请日：2024-01-08

公开（公告）日：2024-05-17

公开（公告）号：CN118052917A

主分类号：G06T13/40

分类号：G06T13/40;G06N3/045;G06N3/0464;G06N3/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.04#实质审查的生效;2024.05.17#公开

摘要：本申请涉及语音视频生成技术领域，特别涉及一种文本驱动的语音和人脸动作生成方法、装置、设备及介质，其中，方法包括：获取虚拟数字形象的目标文本；将目标文本输入训练完成的扩散模型，基于扩散模型和目标文本的约束，从噪声中恢复对应时序的人脸动作特征序列与语音特征序列；根据人脸动作特征序列与语音特征序列渲染得到虚拟数字形象的文本驱动的人脸动作视频和对应音频。由此，解决了相关技术中数字形象生成中的自然度低、模态单一、音频获取难、灵活性差以及多模态输入输出数据间时序匹配度低等问题。

主权项：1.一种基于扩散模型的文本驱动的语音和人脸动作生成方法，其特征在于，包括以下步骤：获取虚拟数字形象的目标文本；将所述目标文本输入训练完成的扩散模型，基于所述扩散模型和所述目标文本的约束，从噪声中恢复对应时序的人脸动作特征序列与语音特征序列；根据所述人脸动作特征序列与所述语音特征序列渲染得到所述虚拟数字形象的文本驱动的人脸动作视频和对应音频。

全文数据：

权利要求：

百度查询：清华大学文本驱动的语音和人脸动作生成方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种加热机构及硅胶粘接机_苏州港阳科技有限公司_202410283250.4

下一篇：一种矿区开采沉陷水底地表变形监测装置及方法_平安煤炭开采工程技术研究院有限责任公司_202410321509.X

相关技术

一种加热机构及硅胶粘接机_苏州港阳科技有限公司_202410283250.4

一种矿区开采沉陷水底地表变形监测装置及方法_平安煤炭开采工程技术研究院有限责任公司_202410321509.X

一种纯化脱硫导电炭黑及其制备方法和应用_合肥碳艺科技有限公司_202410228566.3

GRP75抑制剂作为用于制备减缓或治疗肿瘤恶病质的药物的用途_北京肿瘤医院(北京大学肿瘤医院)_202211547930.X

一种石化储油罐安装过程防漏检测方法、介质及系统_中建安装集团有限公司_202410282425.X

一种捕获大气中二氧化碳的气肥增施变电吸附组件及其应用_大连理工大学_202410350057.8

一种具有材质区分功能的触压传感检测系统、检测方法及制备方法_大连海事大学_202410274077.1

图像处理方法、图像处理装置、电子设备及存储介质_OPPO广东移动通信有限公司_202211552155.7

一种300MW级压缩空气储能电站压缩系统的电气主接线系统及其运行方法_中国能源建设集团江苏省电力设计院有限公司_202410317284.0

数据传输方法、设备及存储介质_中兴通讯股份有限公司_202211551808.X

用于换电挖掘机的自拆装换电装置及方法_太重集团(上海)装备技术有限公司_202410218497.8

一种薄膜电容器及其制造方法_广东电网有限责任公司_202210540305.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】文本驱动的语音和人脸动作生成方法、装置、设备及介质_清华大学_202410028759.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务