申请/专利权人:北京华宇信息技术有限公司
申请日:2020-11-18
公开(公告)日:2024-04-02
公开(公告)号:CN112489646B
主分类号:G10L15/22
分类号:G10L15/22;G10L15/06;G10L15/08;G10L25/12
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2021.03.30#实质审查的生效;2021.03.12#公开
摘要:本申请公开了一种语音识别方法及其装置。其中,所述方法包括:获取输入的语音数据;通过解码模型解码所述语音数据,生成语音识别中间结果;基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;根据所述拼音于声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。通过语音识别中间结果与核心词数据库中核心词拼音与声调序列的匹配,可以解决语音识别结果偏离正常语境的问题。
主权项:1.一种语音识别方法,其特征在于,包括:获取输入的语音数据;通过解码模型解码所述语音数据,生成语音识别中间结果;基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;根据所述拼音与声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果;其中,所述核心词数据库基于文本预处理语料进行分词及统计词频,并根据词频生成对应分词权重而建立;对应分词权重通过每个词的词频除以最大词频与一个常量的和的方式来计算,所述常量取所有词频的中值。
全文数据:
权利要求:
百度查询: 北京华宇信息技术有限公司 语音识别方法及其装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。