【发明授权】语音识别模型生成方法、语音识别方法、设备和介质_北京安声科技有限公司_202410119020.4

申请/专利权人：北京安声科技有限公司

申请日：2024-01-29

公开（公告）日：2024-04-30

公开（公告）号：CN117649846B

主分类号：G10L15/06

分类号：G10L15/06;G10L15/26;G06F18/25;G06F40/268;G06F40/284;G06F40/295;G06F16/35

优先权：

专利状态码：有效-授权

法律状态：2024.04.30#授权;2024.03.22#实质审查的生效;2024.03.05#公开

摘要：本公开的实施例公开了语音识别模型生成方法、语音识别方法、设备和介质。该方法的一具体实施方式包括：通过初始音频编码子模型对样本音频信息进行编码处理，得到音频编码信息；通过初始关键文本子模型对各个关键文本信息进行特征提取处理，得到至少一个关键文本特征信息；通过初始融合解码子模型对音频编码信息和至少一个关键文本特征信息进行融合解码处理，得到文本信息；根据样本文本信息和文本信息，确定初始模型是否训练完成；响应于确定初始模型训练完成，将初始模型确定为语音识别模型。通过本公开的一些实施例的语音识别模型生成方法得到的语音识别模型可以提高特定词汇的识别准确率，进而提高语音识别的准确率和召回率，提高识别效果。

主权项：1.一种语音识别模型生成方法，包括：通过初始模型包括的初始音频编码子模型对样本音频信息进行编码处理，得到音频编码信息；通过初始模型包括的初始关键文本子模型对至少一个关键文本信息中的各个关键文本信息进行特征提取处理，得到至少一个关键文本特征信息，其中，关键文本信息是根据样本音频信息对应的样本文本信息生成的，关键文本信息是从样本音频信息对应的样本文本信息中截取的；通过初始模型包括的初始融合解码子模型对音频编码信息和至少一个关键文本特征信息进行融合解码处理，得到文本信息；根据对应样本音频信息的样本文本信息和得到的文本信息，确定初始模型是否训练完成；响应于确定初始模型训练完成，将初始模型确定为语音识别模型。

全文数据：

权利要求：

百度查询：北京安声科技有限公司语音识别模型生成方法、语音识别方法、设备和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一体集成微同轴气密封装结构及其制造方法_中国电子科技集团公司第十三研究所_202410148673.5

下一篇：一种转向管柱固定工装_芜湖普威技研有限公司_202311573386.0

相关技术

一体集成微同轴气密封装结构及其制造方法_中国电子科技集团公司第十三研究所_202410148673.5

一种转向管柱固定工装_芜湖普威技研有限公司_202311573386.0

设备控制方法、装置、配电设备及存储介质_深圳市正浩创新科技股份有限公司_202410171534.4

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

一种炮孔自动填塞机_新疆天河爆破工程有限公司_202410337157.7

一种物品投递方法、装置、设备及介质和物品投递系统_何永安_202410173109.9

一种吊具点测方法、装置、系统和存储介质_一汽丰田汽车有限公司_202410173152.5

一种数控龙门铣床_河北大恒重型机械有限公司_202410333473.7

供电系统、功率变换器以及功率变换电路的控制方法_华为数字能源技术有限公司_202410139301.6

一种异性粘结磁粉制备用原料筛选设备_天长市中德电子有限公司_202410411084.1

一种基于氟硼荧的离子型多孔有机聚合物及其制备方法和光催化应用_常州大学_202311787384.1

一种果树吊枝方法_上海市农业科学院_202410367417.5

龙图腾网&IPTOP

【发明授权】语音识别模型生成方法、语音识别方法、设备和介质_北京安声科技有限公司_202410119020.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务