首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种模型训练方法、装置和用于模型训练的装置_北京搜狗科技发展有限公司_202110942719.7 

申请/专利权人:北京搜狗科技发展有限公司

申请日:2021-08-17

公开(公告)日:2024-05-17

公开(公告)号:CN113707134B

主分类号:G10L15/06

分类号:G10L15/06;G10L15/02;G10L15/20;G10L15/22;G10L21/0208;G10L21/0216;G10L25/03

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2021.12.14#实质审查的生效;2021.11.26#公开

摘要:本发明实施例提供了一种模型训练方法、装置和用于模型训练的装置。所述方法包括:获取语音训练样本,所述语音训练样本包括带噪语音样本以及所述带噪语音样本对应的干净语音样本;基于所述语音训练样本,对串联的语音增强模型和语音识别模型进行迭代联合训练,在每轮训练中根据所述语音增强模型和所述语音识别模型的联合损失值调整所述语音增强模型,和或,所述语音识别模型的模型参数,当所述联合损失值满足收敛条件得到训练完成的语音增强模型和语音识别模型。本发明实施例能够提升语音识别模型的训练效率,并能够在不降低干净场景下语音识别模型的识别性能的情况下,提高语音识别模型在带噪场景下的识别性能。

主权项:1.一种模型训练方法,其特征在于,所述方法包括:获取语音训练样本,所述语音训练样本包括带噪语音样本以及所述带噪语音样本对应的干净语音样本;基于所述语音训练样本,对串联的语音增强模型和语音识别模型进行迭代联合训练,在每轮训练中根据所述语音增强模型和所述语音识别模型的联合损失值调整所述语音增强模型和所述语音识别模型的模型参数,当所述联合损失值满足收敛条件得到训练完成的语音增强模型和语音识别模型;所述基于所述语音训练样本,对串联的语音增强模型和语音识别模型进行迭代联合训练,包括:在每轮训练中,在所述语音训练样本中选取带噪语音样本输入所述语音增强模型进行语音增强处理,得到所述带噪语音样本对应的语音增强结果;对所述语音增强结果逐帧进行特征提取,得到每一帧的特征信息;对所述语音增强结果中的当前帧,将所述当前帧的前一帧与后一帧的特征信息增加到所述当前帧的特征信息中,得到所述语音增强结果对应的目标特征数据;将所述目标特征数据输入所述语音识别模型进行语音识别处理,得到所述带噪语音样本的语音识别结果;根据所述带噪语音样本的语音增强结果和所述带噪语音样本的语音识别结果,确定所述语音增强模型和所述语音识别模型的联合损失值,并根据所述联合损失值调整所述语音增强模型和所述语音识别模型的模型参数;所述语音训练样本还包括所述带噪语音样本对应的文本信息,所述根据所述带噪语音样本的语音增强结果和所述带噪语音样本的语音识别结果,确定所述语音增强模型和所述语音识别模型的联合损失值,包括:根据所述带噪语音样本的语音增强结果和所述干净语音样本确定所述语音增强模型的第一损失值;根据所述带噪语音样本的语音识别结果和所述文本信息确定所述语音识别模型的第二损失值;对所述第一损失值和所述第二损失值进行加权求和,得到所述语音增强模型和所述语音识别模型的联合损失值。

全文数据:

权利要求:

百度查询: 北京搜狗科技发展有限公司 一种模型训练方法、装置和用于模型训练的装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。