买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】模型训练方法、模仿音检测方法、装置、设备及存储介质_合肥讯飞数码科技有限公司_202010624032.4 

申请/专利权人:合肥讯飞数码科技有限公司

申请日:2020-06-30

公开(公告)日:2024-04-16

公开(公告)号:CN111785303B

主分类号:G10L25/78

分类号:G10L25/78;G10L25/51;G10L25/03

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2020.11.03#实质审查的生效;2020.10.16#公开

摘要:本申请实施例公开了一种模型训练方法、模仿音检测方法、装置、设备及存储介质,通过模仿音检测模型对样本语音进行特征提取,得到样本语音的初始特征序列;对初始特征序列中的部分初始特征进行修改;利用修改后的初始特征序列,确定样本语音的模仿音检测结果;以样本语音的模仿音检测结果趋近于样本语音的标签为目标,对模仿音检测模型的参数进行更新。本申请公开的方案,在模型训练过程中对初始特征序列进行修改,相当于对样本语音增加了噪声或样本语音丢失了一部分有用信息,保证模型的准确性和鲁棒性。

主权项:1.一种模仿音检测模型训练方法,其特征在于,包括:对样本语音的各个语音帧分别进行特征提取,得到所述样本语音的初始特征序列;对所述初始特征序列中的部分初始特征进行修改,得到修改后的特征序列;利用所述修改后的特征序列,确定所述样本语音的各个语音帧的模仿音检测结果;以所述样本语音的各个语音帧的模仿音检测结果趋近于所述样本语音的标签为目标,对所述模仿音检测模型的参数进行更新;所述标签表征所述样本语音中的各个语音帧是否为模仿音;所述对样本语音的各个语音帧分别进行特征提取,得到所述样本语音的初始特征序列,包括:获取样本语音的各个语音帧的声学特征;对各个语音帧的声学特征分别进行编码,得到各个语音帧的初始编码特征,作为所述样本语音的初始特征序列;所述对各个语音帧的声学特征分别进行编码,得到各个语音帧的初始编码特征,包括:对于每一语音帧,通过所述模仿音检测模型的第一编码模块获取该语音帧的声学特征的初始编码特征;所述第一编码模块是基于预先训练好的语音分类模型中的第二编码模块获得的;所述语音分类模型通过如下方式训练得到:通过所述第二编码模块对样本语音对中的样本模仿音的各个模仿语音帧的声学特征和样本自然人语音的各个自然人语音帧的声学特征分别进行编码,得到各个模仿语音帧的编码特征和各个自然人语音帧的编码特征;通过所述语音分类模型的特征处理模块将各个模仿语音帧的编码特征和各个自然人语音帧的编码特征融合,得到所述样本语音对的融合特征;利用所述融合特征,确定所述样本语音对中各语音的语音分类结果。

全文数据:

权利要求:

百度查询: 合肥讯飞数码科技有限公司 模型训练方法、模仿音检测方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。