买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】来自音频的照片级逼真说话面部_谷歌有限责任公司_202180011913.1 

申请/专利权人:谷歌有限责任公司

申请日:2021-01-29

公开(公告)日:2022-09-02

公开(公告)号:CN115004236A

主分类号:G06T13/40

分类号:G06T13/40;G10L21/10

优先权:["20200129 US 62/967,335"]

专利状态码:在审-实质审查的生效

法律状态:2022.09.20#实质审查的生效;2022.09.02#公开

摘要:提供了一种用于仅以音频输入为条件生成照片级逼真3D说话面部的框架。另外,本公开提供了用于将所生成的面部插入到现有视频或虚拟环境中的相关联的方法。我们将视频中的面部分解到去耦3D几何形状、头部姿势和纹理的归一化空间中。这允许将预测问题分成3D面部形状和对应的2D纹理图谱的回归。为了稳定时间动态,我们提出了一种自回归方法,该方法根据其先前的视觉状态来调节模型。我们也使用与音频无关的3D纹理归一化来捕获我们的模型中的面部照明。

主权项:1.一种用于从音频信号生成说话面部的计算系统,所述计算系统包括:一个或多个处理器;以及一个或多个非暂时性计算机可读介质,其共同存储:机器学习面部几何形状预测模型,被配置为基于描述包括语音的音频信号的数据来预测面部几何形状;机器学习面部纹理预测模型,被配置为基于描述包括语音的音频信号的数据来预测面部纹理;和指令,当由所述一个或多个处理器执行时,使计算系统执行操作,所述操作包括:获得描述包括语音的音频信号的数据;使用所述机器学习面部几何形状预测模型来至少部分地基于描述音频信号的数据而预测面部几何形状;使用所述机器学习面部纹理预测模型来至少部分地基于描述音频信号的数据而预测所述面部纹理;和组合面部几何形状与面部纹理以生成三维面部网格模型。

全文数据:

权利要求:

百度查询: 谷歌有限责任公司 来自音频的照片级逼真说话面部

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。