【发明授权】多说话者神经文本到语音合成_微软技术许可有限责任公司_201880091361.8

导航：龙图腾网> 最新专利技术> 多说话者神经文本到语音合成_微软技术许可有限责任公司_201880091361.8

申请/专利权人：微软技术许可有限责任公司

申请日：2018-12-11

公开（公告）日：2024-03-15

公开（公告）号：CN111954903B

主分类号：G10L13/08

分类号：G10L13/08;G10L13/033

优先权：

专利状态码：有效-授权

法律状态：2024.03.15#授权;2020.12.04#实质审查的生效;2020.11.17#公开

摘要：提供了用于通过多说话者神经文本到语音TTS合成来生成语音的方法。可以接收文本输入1410。可以通过至少一个说话者模型，提供目标说话者的说话者潜在空间信息1420。可以通过声学特征预测器，基于所述文本输入和所述说话者潜在空间信息来预测至少一个声学特征1430。可以通过神经声码器，基于所述至少一个声学特征和所述说话者潜在空间信息来生成与所述文本输入相对应的语音波形1440。

主权项：1.一种用于通过多说话者神经文本到语音合成来生成语音的方法，包括：接收文本输入；通过至少一个说话者模型，提供目标说话者的说话者潜在空间信息；通过声学特征预测器，基于所述文本输入和所述说话者潜在空间信息来预测至少一个声学特征；通过神经声码器，基于所述至少一个声学特征和所述说话者潜在空间信息来生成与所述文本输入相对应的语音波形；通过第一神经网络，基于所述至少一个声学特征来生成至少一个经变换的声学特征；以及通过第二神经网络，基于所述说话者潜在空间信息来生成经变换的说话者潜在空间信息，并且其中，所述生成语音波形包括：基于所述至少一个经变换的声学特征和所述经变换的说话者潜在空间信息的组合来生成所述语音波形。

全文数据：

权利要求：

百度查询：微软技术许可有限责任公司多说话者神经文本到语音合成

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电子设备_深圳市嘉晋实业有限公司_202322601396.2

下一篇：一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

相关技术

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种防卡管测斜仪探头_中国建筑西南勘察设计研究院有限公司_202420526288.5

磨豆压力咖啡机自动压粉机构_浙江比依电器股份有限公司_202322521989.8

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种方便拆装的瓦楞机用瓦楞辊_浙江永暉瓦楞辊有限公司_202322675014.0

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

龙图腾网&IPTOP

【发明授权】多说话者神经文本到语音合成_微软技术许可有限责任公司_201880091361.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务