首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】语音识别方法、装置和系统及存储介质_标贝(青岛)科技有限公司_202011212947.0 

申请/专利权人:标贝(青岛)科技有限公司

申请日:2020-11-02

公开(公告)日:2024-05-17

公开(公告)号:CN112133294B

主分类号:G10L15/06

分类号:G10L15/06;G10L15/14;G10L15/26

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.05.07#著录事项变更;2021.01.12#实质审查的生效;2020.12.25#公开

摘要:本发明提供一种语音识别方法、装置和系统及存储介质。方法包括:获取待识别语音;提取待识别语音的声学特征;将声学特征输入转换器模型,以在第i个时间步获得转换器模型输出的与第i个语音段相对应的模型分数集合,i=1,2,……,n,模型分数集合包括与转换器模型所建模的文字集合中的所有文字一一对应的模型分数,每个模型分数表示第i个语音段属于该模型分数所对应的文字的概率;结合模型分数集合以及加权有限状态机模块,计算从第1个语音段至第i个语音段中的所有语音段所对应的至少一个转移路径各自的路径分数;基于至少一个转移路径各自的路径分数,获得与第i个语音段相对应的文字解码结果。该方法有助于提高整个语音识别系统的识别正确率。

主权项:1.一种基于Transformer模型和WFST模块的语音识别方法,包括:获取待识别语音;提取所述待识别语音的声学特征;将所述声学特征输入转换器模型,以在第i个时间步获得所述转换器模型输出的与第i个语音段相对应的模型分数集合,其中,所述待识别语音包括n个语音段,i=1,2,……,n,所述模型分数集合包括与所述转换器模型所建模的文字集合中的所有文字一一对应的模型分数,每个模型分数表示所述第i个语音段属于该模型分数所对应的文字的概率;结合所述模型分数集合以及加权有限状态机模块,计算从第1个语音段至所述第i个语音段中的所有语音段所对应的至少一个转移路径各自的路径分数;以及基于所述至少一个转移路径各自的路径分数,获得与所述第i个语音段相对应的文字解码结果;其中,所述将所述声学特征输入转换器模型,以在第i个时间步获得所述转换器模型输出的与第i个语音段相对应的模型分数集合包括:将所述待识别语音的声学特征输入所述转换器模型的编码器模块,以获得所述编码器模块输出的编码结果;在所述第i个时间步下,将在所述第i个语音段之前的所有语音段的文字解码结果与所述编码结果一起,输入所述转换器模型的解码器模块,以获得所述解码器模块输出的所述模型分数集合;其中,所述结合所述模型分数集合以及加权有限状态机模块,计算从第1个语音段至所述第i个语音段中的所有语音段所对应的转移路径各自的路径分数包括:从所述加权有限状态机模块中获取所述第i个语音段所对应的转移分数集合,所述转移分数集合包括与从先前状态转移到当前状态集合的所有转移弧一一对应的转移分数,其中,在i=1的情况下,所述先前状态为起始状态,并且在i>1的情况下,所述先前状态为与第i-1个语音段的文字解码结果相对应的状态,所述当前状态集合包括所述先前状态链接到的所有当前状态;对于从所述起始状态出发转移至所述当前状态集合的过程中经历的所有转移路径中的任一当前转移路径,将先前转移路径的路径分数、所述转移分数集合中的与特定转移弧相对应的转移分数、以及所述模型分数集合中的与特定文字相对应的模型分数相加,以获得所述当前转移路径的路径分数,其中,所述当前转移路径包括所述先前转移路径和所述特定转移弧,所述先前转移路径是从所述起始状态出发转移至所述先前状态的过程中经历的转移路径,所述特定转移弧是从所述先前状态转移至所述当前状态集合中的当前状态之一的转移弧,所述特定文字是与所述特定转移弧上的输出标签一致的文字;其中,所述至少一个转移路径是从所述起始状态出发转移至所述当前状态集合的过程中经历的所有转移路径;其中,所述基于所述至少一个转移路径各自的路径分数,获得与所述第i个语音段相对应的文字解码结果包括:从所述至少一个转移路径中选择路径分数最高的转移路径;确定所选择的转移路径中包含的从所述先前状态转移至当前状态的转移弧上的输出标签为所述第i个语音段所对应的文字解码结果。

全文数据:

权利要求:

百度查询: 标贝(青岛)科技有限公司 语音识别方法、装置和系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。