【发明授权】语音识别模型的训练方法、语音识别方法和装置_北京百度网讯科技有限公司_202110675836.1

申请/专利权人：北京百度网讯科技有限公司

申请日：2021-06-17

公开（公告）日：2023-01-24

公开（公告）号：CN113327596B

主分类号：G10L15/06

分类号：G10L15/06;G10L15/16

优先权：

专利状态码：有效-授权

法律状态：2023.01.24#授权;2021.09.17#实质审查的生效;2021.08.31#公开

摘要：本公开提供了一种语音识别模型的训练方法、语音识别方法和装置，涉及深度学习和自然语音处理领域，具体涉及基于深度学习的语音识别技术。具体实现方案为：语音识别模型包括提取子模型和识别子模型。训练方法包括：将第一训练音频样本的音频特征输入所述语音识别模型，其中识别子模型从提取子模型接收发言人特征，并基于发言人特征和识别子模型的参数来识别所接收的音频特征，以获得识别结果；基于所述识别子模型的损失函数和与所述第一训练音频样本相对应的标注信息，计算针对所述识别结果的第一损失值；以及根据第一损失值调整模型参数，直至所述第一损失值收敛为止。

主权项：1.一种训练语音识别模型的方法，所述语音识别模型包括用于提取发言人特征的提取子模型和用于识别音频的识别子模型，所述方法包括：将第一训练音频样本的音频特征并行输入所述语音识别模型的提取子模型和识别子模型，其中所述识别子模型从所述提取子模型接收通过对所述音频特征分析而得到的发言人特征和发言人识别结果，并基于接收到的发言人特征、发言人识别结果和所述识别子模型的参数来识别所述音频特征，以获得不同发言人的语音识别结果，其中，所述第一训练音频样本为混叠音频，所述发言人识别结果包括所述音频特征属于不同说话人的概率；基于所述识别子模型的损失函数和与所述第一训练音频样本相对应的标注信息，计算针对所述语音识别结果的第一损失值；以及根据所述第一损失值调整所述识别子模型的参数，直至所述第一损失值收敛为止。

全文数据：

权利要求：

百度查询：北京百度网讯科技有限公司语音识别模型的训练方法、语音识别方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种建筑外墙热湿物性气候模拟实验方法_北京东方雨虹防水技术股份有限公司_202311842636.6

下一篇：一种量程可变的逐次逼近型ADC_成都蜀郡微电子有限公司_202311777124.6

相关技术

一种建筑外墙热湿物性气候模拟实验方法_北京东方雨虹防水技术股份有限公司_202311842636.6

一种量程可变的逐次逼近型ADC_成都蜀郡微电子有限公司_202311777124.6

一种埋地金属管道杂散电流检测设备_江苏晟尔检测仪器有限公司_202211579025.2

一种基于多源数据融合的大尺度植被覆盖度的评估方法_上海建工五建集团有限公司_202311726158.2

一种可实时数据传输万用表及检定系统_华能湖北新能源有限责任公司_202311591789.8

基于硬件增强的芯片安全管理方法、装置、终端及介质_芯云晟(杭州)电子科技有限公司_202310732719.3

主机装置处的错误检测及分类_美光科技公司_202311125873.0

一种用于测量斜视合并屈光不正患者的三棱镜装置及方法_深圳爱尔眼科医院_202311604419.3

一种角蛋白YK93-2、制法和其药物组合物与用途_中国医学科学院药物研究所_202211217433.3

无压风门连杆装置_淮北矿业股份有限公司_202311796920.4

主动侧倾车辆安全冗余机制及侧倾运动断电锁止装置_北京坐骑科技有限公司_202310030092.7

一种凹凸棒土负载硫化纳米双金属材料、制备方法及应用_安徽国祯环境修复股份有限公司_202311464026.7

龙图腾网&IPTOP

【发明授权】语音识别模型的训练方法、语音识别方法和装置_北京百度网讯科技有限公司_202110675836.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务