买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】声音合成模型训练方法、装置及计算机设备_深圳市木愚科技有限公司_202410083746.7 

申请/专利权人:深圳市木愚科技有限公司

申请日:2024-01-19

公开(公告)日:2024-04-09

公开(公告)号:CN117854476A

主分类号:G10L13/08

分类号:G10L13/08;G10L13/04;G10L25/51

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明提供了一种声音合成模型训练方法、装置及计算机设备,方法包括:用户通过终端上传录音文本和录音音频文件并选择对应的语言种类,根据是否是第一次执行训练任务来选择是否使用增量检测,使用增量检测排除上一轮检测通过的数据,对剩下在上一轮未通过的数据和本轮新增数据进行检测,当本轮数据所有都通过检测,判断本次检测是否在训练服务器上执行,若不在训练服务器上执行,则需要进行一次全量检测,从而排除在前面使用了增量检测有不合格数据被漏检,从而保证训练数据质量。自动检测训练数据可以减少人工校验,增量全量混合检测可以减少数据数量从而节省时间。

主权项:1.一种声音合成模型训练方法,其特征在于,包括以下步骤:S1、在当前系统下,新建声音合成模型训练任务,在终端界面上选择与录音文本对应训练声音模型的语言种类、录音文本文件和录音音频文件压缩包确认提交进行检测,或选择任务状态为文件检测失败的任务,选择本次是否进行全量检测、录音文本文件和录音音频文件压缩包确认提交进行检测;S2、判断本次任务是否是第一次执行检测,若是第一次进行检测,则进行全量检测;若不是第一次进行检测,则根据用户终端界面上选择是否进行全量检测,若选择不进行全量检测,则为增量检测;S3、对录音文本内容和录音音频文件分别进行检测,并将本次检测的结果进行记录;S4、当所有文件检测完毕,根据记录下来的检测结果,判断本次检测是否所有数据都通过检测,若存在检测不通过的记录,则将本次检测信息写入数据库,用户可以在终端上下载到本次检测失败的相关信息;若所有数据检测通过,进入下一步;S5、判断本次检测是否是在训练服务器进行的全量检测,若是在训练服务器上运行的,则进行声音合成模型的训练,若不是在训练服务器上运行的,则将任务提交到训练服务器,在训练服务器上进行全量检测;S6、当本次检测音频数据和录音文本在训练服务器全部检测通过,则进行声音合成模型训练。

全文数据:

权利要求:

百度查询: 深圳市木愚科技有限公司 声音合成模型训练方法、装置及计算机设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。