买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】使用机器学习模型确定与实时语音相对应的嘴部的运动_奥多比公司_201910179536.7 

申请/专利权人:奥多比公司

申请日:2019-03-07

公开(公告)日:2024-04-30

公开(公告)号:CN110624247B

主分类号:A63F13/822

分类号:A63F13/822;G06V40/16;G06V40/20;G06N3/0442;G06N3/049;G06N3/084

优先权:["20180622 US 16/016,418"]

专利状态码:有效-授权

法律状态:2024.04.30#授权;2020.12.04#实质审查的生效;2019.12.31#公开

摘要:所公开的系统和方法从音频序列预测视位。视位生成应用访问第一训练数据集,该第一训练数据集包括表示由第一讲话者说出的句子的第一音频序列和视位序列。每个视位被映射到第一音频序列的相应音频样本。视位生成应用创建第二训练数据集,以调节由说出该句子的第二讲话者说出的第二音频序列,使得第二序列和第一序列具有相同的长度,并且至少一个音素出现在第一序列和第二序列中的相同时间戳处。视位生成应用将视位序列映射到第二音频序列,并且训练视位预测模型以从音频序列预测视位序列。

主权项:1.一种从音频序列预测视位的方法,所述方法包括:访问第一训练数据集,所述第一训练数据集包括:i表示由第一讲话者说出并且具有第一长度的句子的样本的第一音频序列,其中所述音频序列表示音素序列,以及ii视位序列,其中每个视位被映射到样本的所述第一音频序列的相应音频样本;通过以下创建第二训练数据集:访问表示由第二讲话者说出并且具有第二长度的相同句子的样本的第二音频序列,其中所述第二音频序列包括所述音素序列;调节样本的所述第二音频序列,使得i第二序列长度等于所述第一长度,并且ii至少一个音素出现在样本的所述第一音频序列和样本的所述第二音频序列中的相同时间戳处;将所述视位序列映射到样本的所述第二音频序列;以及训练视位预测模型以从所述第一训练数据集和所述第二训练数据集预测视位序列。

全文数据:

权利要求:

百度查询: 奥多比公司 使用机器学习模型确定与实时语音相对应的嘴部的运动

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。