买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】语音处理模型训练方法、语音识别方法及装置_马上消费金融股份有限公司_202211267527.1 

申请/专利权人:马上消费金融股份有限公司

申请日:2022-10-17

公开(公告)日:2024-04-26

公开(公告)号:CN117935784A

主分类号:G10L15/06

分类号:G10L15/06

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本申请提供一种语音处理模型训练方法、语音识别方法及装置,语音处理模型训练方法包括:获取多条语音训练数据、多个关键词文本和待训练的语音处理模型;针对每条语音训练数据,通过语音编码模块对语音训练数据进行编码处理,得到语音编码向量;计算语音编码向量和其对应的文本标签之间的第一损失值;获取多个关键词文本对应的关键词编码向量序列,并通过融合模块得到融合特征向量序列;通过解码模块对融合特征向量序列进行解码,得到解码向量序列,计算解码向量序列和语音编码向量对应的文本标签之间的第二损失值;根据第一损失值、第二损失值和预设训练条件,对待训练的语音处理模型进行迭代训练,有利于提高语音处理模型识别关键词的准确性。

主权项:1.一种语音处理模型训练方法,其特征在于,包括:获取多条语音训练数据、多个关键词文本和待训练的语音处理模型,其中,每条所述语音训练数据均标注有对应的文本标签,所述待训练的语音处理模型包括语音编码模块、融合模块和解码模块;针对每条语音训练数据,通过所述语音编码模块对所述语音训练数据进行编码处理,得到语音编码向量;基于第一预设损失函数计算所述语音编码向量和所述语音编码向量对应的所述语音训练数据的文本标签之间的损失值,得到第一损失值;获取所述多个关键词文本对应的关键词编码向量序列,并通过所述融合模块分别将所述语音编码向量和所述关键词编码向量序列中每个关键词编码向量进行融合,得到融合特征向量序列;通过所述解码模块对所述融合特征向量序列中每个融合特征向量进行解码,得到解码向量序列,并基于第二预设损失函数计算所述解码向量序列和所述语音编码向量对应的所述语音训练数据的文本标签之间的损失值,得到第二损失值;根据所述第一损失值、所述第二损失值和预设训练条件,对所述待训练的语音处理模型进行迭代训练。

全文数据:

权利要求:

百度查询: 马上消费金融股份有限公司 语音处理模型训练方法、语音识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。