一种模型训练方法、装置和用于模型训练的装置

导航：龙图腾网> 最新专利技术> 一种模型训练方法、装置和用于模型训练的装置

申请/专利权人：北京搜狗科技发展有限公司

申请日：2021-08-17

公开（公告）日：2024-05-17

公开（公告）号：CN113707134B

主分类号：G10L15/06

分类号：G10L15/06;G10L15/02;G10L15/20;G10L15/22;G10L21/0208;G10L21/0216;G10L25/03

优先权：

专利状态码：有效-授权

法律状态：2024.05.17#授权;2021.12.14#实质审查的生效;2021.11.26#公开

摘要：本发明实施例提供了一种模型训练方法、装置和用于模型训练的装置。所述方法包括：获取语音训练样本，所述语音训练样本包括带噪语音样本以及所述带噪语音样本对应的干净语音样本；基于所述语音训练样本，对串联的语音增强模型和语音识别模型进行迭代联合训练，在每轮训练中根据所述语音增强模型和所述语音识别模型的联合损失值调整所述语音增强模型，和或，所述语音识别模型的模型参数，当所述联合损失值满足收敛条件得到训练完成的语音增强模型和语音识别模型。本发明实施例能够提升语音识别模型的训练效率，并能够在不降低干净场景下语音识别模型的识别性能的情况下，提高语音识别模型在带噪场景下的识别性能。

主权项：1.一种模型训练方法，其特征在于，所述方法包括：获取语音训练样本，所述语音训练样本包括带噪语音样本以及所述带噪语音样本对应的干净语音样本；基于所述语音训练样本，对串联的语音增强模型和语音识别模型进行迭代联合训练，在每轮训练中根据所述语音增强模型和所述语音识别模型的联合损失值调整所述语音增强模型和所述语音识别模型的模型参数，当所述联合损失值满足收敛条件得到训练完成的语音增强模型和语音识别模型；所述基于所述语音训练样本，对串联的语音增强模型和语音识别模型进行迭代联合训练，包括：在每轮训练中，在所述语音训练样本中选取带噪语音样本输入所述语音增强模型进行语音增强处理，得到所述带噪语音样本对应的语音增强结果；对所述语音增强结果逐帧进行特征提取，得到每一帧的特征信息；对所述语音增强结果中的当前帧，将所述当前帧的前一帧与后一帧的特征信息增加到所述当前帧的特征信息中，得到所述语音增强结果对应的目标特征数据；将所述目标特征数据输入所述语音识别模型进行语音识别处理，得到所述带噪语音样本的语音识别结果；根据所述带噪语音样本的语音增强结果和所述带噪语音样本的语音识别结果，确定所述语音增强模型和所述语音识别模型的联合损失值，并根据所述联合损失值调整所述语音增强模型和所述语音识别模型的模型参数；所述语音训练样本还包括所述带噪语音样本对应的文本信息，所述根据所述带噪语音样本的语音增强结果和所述带噪语音样本的语音识别结果，确定所述语音增强模型和所述语音识别模型的联合损失值，包括：根据所述带噪语音样本的语音增强结果和所述干净语音样本确定所述语音增强模型的第一损失值；根据所述带噪语音样本的语音识别结果和所述文本信息确定所述语音识别模型的第二损失值；对所述第一损失值和所述第二损失值进行加权求和，得到所述语音增强模型和所述语音识别模型的联合损失值。

全文数据：

权利要求：

百度查询：北京搜狗科技发展有限公司一种模型训练方法、装置和用于模型训练的装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种无血清培养基间充质干细胞接种装置

下一篇：一种基于深度展开的图像超分辨率方法

相关技术

一种无血清培养基间充质干细胞接种装置

一种基于深度展开的图像超分辨率方法

一种可逆热致变色微胶囊相变材料及其制备方法和应用

一种铁尾矿渣制备硫酸亚铁的方法

一种缓冲气泡袋及其制备工艺

含马里苷组合物、皮肤外用护理物及用途

用户意图识别方法、装置、设备及存储介质

人机交互方法、装置、相关设备及计算机程序产品

一种短肽SP1及其在制备治疗卵巢癌药物中的应用

一种用于出租车计价器防作弊的里程传感器

一种建筑工程材料抗压强度检测设备

一种用于水果分选的果杯装置

模型相关技术

模型训练、模型应用方法、装置、设备及介质_新奥新智科技有限公司_202410535953.1

一种益智模型_盘锦职业技术学院_202323190086.2

一种虹桥模型_刘妍_202420213583.5

人体耳蜗鼓阶模型_上海微创天籁医疗科技有限公司_202322773886.0

音乐推荐方法和生成式大语言模型的模型训练方法_腾讯音乐娱乐科技(深圳)有限公司_202410435040.2

基于ASR声学模型的嘴部动作驱动模型训练方法及组件_深圳追一科技有限公司_202110424520.5

大模型的数据token化方法、装置及大模型训练方法_易中华_202410603776.6

一种产品模型的增维形态和模型定义方法_上海数设科技有限公司_202011442515.9

滚削力波动特性预测模型的构建方法及预测模型_湖北工业大学_202311320278.2

轴承振动模型构建方法、振动模型及振动信号生成方法_蔚来汽车科技(安徽)有限公司_202410473749.1

训练相关技术

呼吸训练器_中国人民解放军总医院第二医学中心_202323125216.4

水下逃生训练装置_中海油安全技术服务有限公司_202323132725.X

一种逻辑回归模型的训练方法、联邦训练方法_蓝象智联(杭州)科技有限公司_202410792252.6

一种心理训练用震动平台及训练设备_中国人民解放军空军工程大学_202323017001.0

一种训练座椅及机动报务员训练方舱_中国人民解放军海军士官学校_202322464144.X

训练样本生成、模型训练和图像处理方法及装置_北京沃东天骏信息技术有限公司_202010309634.0

多智能体训练与训练控制方法、装置、环境判断器、系统_第四范式(北京)技术有限公司_202310078365.5

一种用于篮球科学训练的智能传球训练装置_西安医学院_202211631913.4

一种康复训练用手功能组合训练箱_华北医疗健康集团邢台总医院_202322440721.1

一种康复训练用下肢康复训练用助行器_江苏恒毅运控智能设备科技有限公司_202321868898.5

方法相关技术

图像处理方法、图像处理模型的训练方法及图像生成方法_阿里巴巴达摩院(杭州)科技有限公司_202410797391.8

一种无人机发射系统、运输方法、组装方法以及发射方法_成都航天万欣科技有限公司_202410671011.6

交互系统及其控制方法、换电站及其控制方法_蔚来汽车科技(安徽)有限公司_202210273466.3

半导体结构及其制作方法、控制方法_长鑫存储技术有限公司_202010921763.5

加密方法、解密方法、装置及电子设备_百度在线网络技术(北京)有限公司_202111313805.8

直播界面显示方法、数据上传方法和数据下发方法_广州繁星互娱信息科技有限公司_202110586123.8

发送方法、接收方法、发送装置以及接收装置_松下电器(美国)知识产权公司_202010079470.7

基板处理装置、基板处理方法以及接合方法_东京毅力科创株式会社_202010105262.X

跑步机及其唤醒方法与跌倒检测方法_原相科技股份有限公司_202311541221.5

图像优化方法、图像处理方法和图像传感设备_上海为旌科技有限公司_202410796654.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种模型训练方法、装置和用于模型训练的装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务