【发明授权】基于唤醒语音模型的唤醒语音合成方法及应用唤醒方法_深圳前海微众银行股份有限公司_202110190523.7

申请/专利权人：深圳前海微众银行股份有限公司

申请日：2021-02-18

公开（公告）日：2024-05-17

公开（公告）号：CN113012681B

主分类号：G10L13/047

分类号：G10L13/047;G10L13/04;G10L13/08

优先权：

专利状态码：有效-授权

法律状态：2024.05.17#授权;2021.07.09#实质审查的生效;2021.06.22#公开

摘要：本申请提供了一种基于唤醒语音模型的唤醒语音合成方法、应用唤醒方法、装置、电子设备、计算机可读存储介质及计算机程序产品；唤醒语音模型包括声纹提取层、音素转换层及预测层，基于唤醒语音模型的唤醒语音合成方法包括：通过声纹提取层，对不同用户的语音进行声纹特征提取，得到用户声纹；通过音素转换层，对唤醒文本进行音素转换，得到唤醒音素序列；基于用户声纹和唤醒音素序列，通过预测层，进行语音参数预测，得到相应的预测语音参数；基于预测语音参数进行语音合成，得到相应的唤醒语音；其中，唤醒语音，用于在与待匹配语音匹配成功时，唤醒目标程序。通过本申请，能够高效生成具有拟人效果的唤醒语音，节省了时间和人力成本。

主权项：1.一种基于唤醒语音模型的唤醒语音合成方法，其特征在于，所述唤醒语音模型包括声纹提取层、音素转换层及预测层，所述方法包括：通过所述声纹提取层，对不同用户的语音进行声纹特征提取，得到相应的用户声纹；基于读音参数，通过所述音素转换层，对唤醒文本进行音素转换，得到相应的唤醒音素序列，所述读音参数至少包括重读参数及停顿参数中的一种；基于所述用户声纹和所述唤醒音素序列，通过所述预测层，进行语音参数预测，得到相应的预测语音参数；其中，用户语音的数量包括多个，针对每一个用户语音进行声纹特征的提取，得到相应的多个用户声纹，针对每一个用户声纹，分别结合每一组读音参数对应的唤醒语音序列进行语音参数预测，得到相应的一组预测语音参数；预测语音参数包括时长、音高及韵律；基于所述预测语音参数进行语音合成，得到相应的唤醒语音，所述唤醒语音为针对唤醒文本结合了读音参数的语音；其中，所述唤醒语音，用于在与待匹配语音匹配成功时，唤醒目标程序。

全文数据：

权利要求：

百度查询：深圳前海微众银行股份有限公司基于唤醒语音模型的唤醒语音合成方法及应用唤醒方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于综合能源系统隐私保护的分布式经济调度方法_三峡大学_202410360135.2

下一篇：一种基于SOC的串联电池组充电均衡方法及终端_福建时代星云科技有限公司_202410586420.6

相关技术

基于综合能源系统隐私保护的分布式经济调度方法_三峡大学_202410360135.2

一种基于SOC的串联电池组充电均衡方法及终端_福建时代星云科技有限公司_202410586420.6

焦化废水处理设备_河北协同水处理技术有限公司_202410304587.9

一种新的μ型芋螺毒素肽dH-μ-CnIIIC及其应用_深圳肽盛生物科技有限公司_202410456889.8

一种含氮原子的多环芳烃类化合物及其制备和应用_上海大学_202410338671.2

一种电子元器件封装检测一体机_合肥中航天成电子科技有限公司_202410575548.2

一种透析流量监测装置及方法_四川大学华西医院_202410328519.6

用于高压活塞泵的连杆和活塞以及用于泵送燃料的高压活塞泵_瓦锡兰芬兰有限公司_202180103342.4

一种组合式骨折固定器械_苏鹏_202410429765.0

一种高强度壳聚糖茶多酚肉桂醛抑菌抗氧化膜及制备方法_郑州轻工业大学_202410344788.1

一种代码安全性的智能检测方法及系统_成都派沃特科技股份有限公司_202410586189.0

一种软管材料及其制备方法与在水管中的应用_暨南大学_202410265194.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】基于唤醒语音模型的唤醒语音合成方法及应用唤醒方法_深圳前海微众银行股份有限公司_202110190523.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务