【发明公布】语音合成、语音识别方法、训练方法、装置、电子设备、存储介质_上海稀宇极智科技有限公司_202311873032.8

申请/专利权人：上海稀宇极智科技有限公司

申请日：2023-12-31

公开（公告）日：2024-04-30

公开（公告）号：CN117953857A

主分类号：G10L13/027

分类号：G10L13/027;G10L13/08;G10L15/06;G10L15/07;G10L15/183;G10L25/63;G10L25/18

优先权：

专利状态码：在审-公开

法律状态：2024.04.30#公开

摘要：本申请公开一种语音生成模型训练方法，包括：获取训练数据集；从所述训练数据集选取多条数据条目，生成多个批处理数据条目集，其中，每个批处理数据条目集中有纯文本数据条目、纯音频数据条目和文本音频对数据条目；对所述批处理数据条目集中的数据条目进行离散编码处理，生成多条数据条目离散编码；根据所述多个批处理数据条目集中的多条数据条目离散编码对自回归模型进行训练，生成目标语音合成模型。还包括语音识别模型训练方法、语音合成方法、语音识别方法。本申请能够利用大量的无监督数据和有监督数据混合的方式进行训练，提高了数据的利用率，避免了模型的多阶段训练。

主权项：1.一种语音合成模型训练方法，其特征在于，包括如下步骤：获取训练数据集，所述训练数据集包括多条数据条目，所述数据条目的类型包括纯文本数据条目、纯音频数据条目和文本音频对数据条目；从所述训练数据集选取多条数据条目，生成多个批处理数据条目集，其中，每个批处理数据条目集中有纯文本数据条目、纯音频数据条目和文本音频对数据条目，所述批处理数据条目集中的所述纯文本数据条目、纯音频数据条目和文本音频对数据条目之间的比例满足设定比例条件；对所述批处理数据条目集中的数据条目进行离散编码处理，生成多条数据条目离散编码，其中每条数据条目离散编码中包括文本离散编码和语音离散编码，所述数据条目离散编码中文本离散编码位于所述语音离散编码前；根据所述多个批处理数据条目集中的多条数据条目离散编码对自回归模型进行训练，生成目标语音合成模型。

全文数据：

权利要求：

百度查询：上海稀宇极智科技有限公司语音合成、语音识别方法、训练方法、装置、电子设备、存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种结构紧凑的测斜仪骨架_青岛智腾科技有限公司_201910663221.X

下一篇：一种农产品供应链信息管理系统_河南建设产业投资有限公司_202311393351.9

相关技术

一种结构紧凑的测斜仪骨架_青岛智腾科技有限公司_201910663221.X

一种农产品供应链信息管理系统_河南建设产业投资有限公司_202311393351.9

用于控制空调的方法及装置、空调_青岛海尔空调电子有限公司_202210048335.5

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

一种处理DMS红外光反射导致亮斑的系统_钧捷智能(深圳)有限公司_202310101483.3

微电网的控制方法及装置_北京天诚同创电气有限公司_202111653363.1

一种风机通风量检测方法及装置_北京农业信息技术研究中心_202110665511.5

高速公路隧道边墙二次衬砌模板支座、结构及使用方法_中铁十四局集团建筑工程有限公司_202111210321.0

一种富氦气藏区带的评价方法、装置、设备及介质_中国石油天然气股份有限公司_202311208279.8

一种带角度弹性垫圈的热处理方法及热处理装置_贵州航天精工制造有限公司_202111464284.6

验证转化回传数据方法、装置、计算机设备和存储介质_上海数禾信息科技有限公司_202311042515.3

虹吸定量加药装置及加药方法_江西华兴四海机械设备有限公司_202111502512.4

龙图腾网&IPTOP

【发明公布】语音合成、语音识别方法、训练方法、装置、电子设备、存储介质_上海稀宇极智科技有限公司_202311873032.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务