【发明授权】使用机器学习模型确定与实时语音相对应的嘴部的运动_奥多比公司_201910179536.7

导航：龙图腾网> 最新专利技术> 使用机器学习模型确定与实时语音相对应的嘴部的运动_奥多比公司_201910179536.7

申请/专利权人：奥多比公司

申请日：2019-03-07

公开（公告）日：2024-04-30

公开（公告）号：CN110624247B

主分类号：A63F13/822

分类号：A63F13/822;G06V40/16;G06V40/20;G06N3/0442;G06N3/049;G06N3/084

优先权：["20180622 US 16/016,418"]

专利状态码：有效-授权

法律状态：2024.04.30#授权;2020.12.04#实质审查的生效;2019.12.31#公开

摘要：所公开的系统和方法从音频序列预测视位。视位生成应用访问第一训练数据集，该第一训练数据集包括表示由第一讲话者说出的句子的第一音频序列和视位序列。每个视位被映射到第一音频序列的相应音频样本。视位生成应用创建第二训练数据集，以调节由说出该句子的第二讲话者说出的第二音频序列，使得第二序列和第一序列具有相同的长度，并且至少一个音素出现在第一序列和第二序列中的相同时间戳处。视位生成应用将视位序列映射到第二音频序列，并且训练视位预测模型以从音频序列预测视位序列。

主权项：1.一种从音频序列预测视位的方法，所述方法包括：访问第一训练数据集，所述第一训练数据集包括：i表示由第一讲话者说出并且具有第一长度的句子的样本的第一音频序列，其中所述音频序列表示音素序列，以及ii视位序列，其中每个视位被映射到样本的所述第一音频序列的相应音频样本；通过以下创建第二训练数据集：访问表示由第二讲话者说出并且具有第二长度的相同句子的样本的第二音频序列，其中所述第二音频序列包括所述音素序列；调节样本的所述第二音频序列，使得i第二序列长度等于所述第一长度，并且ii至少一个音素出现在样本的所述第一音频序列和样本的所述第二音频序列中的相同时间戳处；将所述视位序列映射到样本的所述第二音频序列；以及训练视位预测模型以从所述第一训练数据集和所述第二训练数据集预测视位序列。

全文数据：

权利要求：

百度查询：奥多比公司使用机器学习模型确定与实时语音相对应的嘴部的运动

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

下一篇：一种结构紧凑的测斜仪骨架_青岛智腾科技有限公司_201910663221.X

相关技术

用于运行机动车的方法、调节装置和机动车_奥迪股份公司_202110617439.9

一种结构紧凑的测斜仪骨架_青岛智腾科技有限公司_201910663221.X

移动式组合盐水分离系统_大连盐化集团有限公司_202111204431.6

双极化天线阵列测向角度的获取方法、系统、设备及介质_网络通信与安全紫金山实验室_202111062353.0

泌尿道菌群检测在女性泌尿道结石诊断中的应用_广东省科学院微生物研究所(广东省微生物分析检测中心)_202111500822.2

基于数字镜像的变电站自动化设备状态诊断方法和系统_北京四方继保工程技术有限公司_202210022507.1

一种电石渣煅烧氧化钙粉体循环压球系统及工艺_江苏中圣园科技股份有限公司_202011333705.7

一种产丙酸的工程益生菌的构建与应用_天津大学_202310196065.7

基于无监督学习的多视角显著性估计方法_西北工业大学_202011250827.X

一种基于准零刚度原理的空气悬架及其结构设计与优化方法_江苏大学_202111438418.7

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

龙图腾网&IPTOP

【发明授权】使用机器学习模型确定与实时语音相对应的嘴部的运动_奥多比公司_201910179536.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务