【发明授权】模型训练方法、模仿音检测方法、装置、设备及存储介质_合肥讯飞数码科技有限公司_202010624032.4

申请/专利权人：合肥讯飞数码科技有限公司

申请日：2020-06-30

公开（公告）日：2024-04-16

公开（公告）号：CN111785303B

主分类号：G10L25/78

分类号：G10L25/78;G10L25/51;G10L25/03

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2020.11.03#实质审查的生效;2020.10.16#公开

摘要：本申请实施例公开了一种模型训练方法、模仿音检测方法、装置、设备及存储介质，通过模仿音检测模型对样本语音进行特征提取，得到样本语音的初始特征序列；对初始特征序列中的部分初始特征进行修改；利用修改后的初始特征序列，确定样本语音的模仿音检测结果；以样本语音的模仿音检测结果趋近于样本语音的标签为目标，对模仿音检测模型的参数进行更新。本申请公开的方案，在模型训练过程中对初始特征序列进行修改，相当于对样本语音增加了噪声或样本语音丢失了一部分有用信息，保证模型的准确性和鲁棒性。

主权项：1.一种模仿音检测模型训练方法，其特征在于，包括：对样本语音的各个语音帧分别进行特征提取，得到所述样本语音的初始特征序列；对所述初始特征序列中的部分初始特征进行修改，得到修改后的特征序列；利用所述修改后的特征序列，确定所述样本语音的各个语音帧的模仿音检测结果；以所述样本语音的各个语音帧的模仿音检测结果趋近于所述样本语音的标签为目标，对所述模仿音检测模型的参数进行更新；所述标签表征所述样本语音中的各个语音帧是否为模仿音；所述对样本语音的各个语音帧分别进行特征提取，得到所述样本语音的初始特征序列，包括：获取样本语音的各个语音帧的声学特征；对各个语音帧的声学特征分别进行编码，得到各个语音帧的初始编码特征，作为所述样本语音的初始特征序列；所述对各个语音帧的声学特征分别进行编码，得到各个语音帧的初始编码特征，包括：对于每一语音帧，通过所述模仿音检测模型的第一编码模块获取该语音帧的声学特征的初始编码特征；所述第一编码模块是基于预先训练好的语音分类模型中的第二编码模块获得的；所述语音分类模型通过如下方式训练得到：通过所述第二编码模块对样本语音对中的样本模仿音的各个模仿语音帧的声学特征和样本自然人语音的各个自然人语音帧的声学特征分别进行编码，得到各个模仿语音帧的编码特征和各个自然人语音帧的编码特征；通过所述语音分类模型的特征处理模块将各个模仿语音帧的编码特征和各个自然人语音帧的编码特征融合，得到所述样本语音对的融合特征；利用所述融合特征，确定所述样本语音对中各语音的语音分类结果。

全文数据：

权利要求：

百度查询：合肥讯飞数码科技有限公司模型训练方法、模仿音检测方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于循环生成对抗网络的灰度图像彩色化方法_南京工程学院_202410205919.8

下一篇：一种毫米波雷达干扰抑制方法、装置、雷达设备及车辆_福思(杭州)智能科技有限公司_202410422447.1

相关技术

一种基于循环生成对抗网络的灰度图像彩色化方法_南京工程学院_202410205919.8

一种毫米波雷达干扰抑制方法、装置、雷达设备及车辆_福思(杭州)智能科技有限公司_202410422447.1

工程车_广东交通职业技术学院_202410198199.7

一种旋盖机旋盖打孔用辅助定位设备_亨特酒店用品(汕头)有限公司_202410422209.0

一种以高能量密度超级电容电池为电能存储器的动力装置_龙牌汽车股份有限公司_202410235381.5

基于AI视觉技术的急诊主动分诊方法及系统_深圳鼎文昇科技有限公司_202410231853.X

基于边缘先验与注意力机制相结合的图像修复方法、装置、设备以及可读存储介质_西藏民族大学_202311365706.3

抗开裂双组分环氧树脂组合物_SIKA技术股份公司_202280064843.0

一种脊柱植入液压弹性撑开内固定钉棒系统_首都医科大学附属北京儿童医院_202410281032.7

一种打磨姿态可调节的打磨装置_广东启新模具有限公司_202410424286.X

一种基于太阳能驱动的温室干燥系统_常州大学_202410312031.4

用于超高吞吐量增材制造的系统、方法及材料_沃尔特·沃伊特_202410278997.0

龙图腾网&IPTOP

【发明授权】模型训练方法、模仿音检测方法、装置、设备及存储介质_合肥讯飞数码科技有限公司_202010624032.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务