买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于DTW和GMM的短词句语音识别方法及系统_宁夏理工学院_202110591145.3 

申请/专利权人:宁夏理工学院

申请日:2021-05-28

公开(公告)日:2022-07-12

公开(公告)号:CN113112999B

主分类号:G10L15/12

分类号:G10L15/12;G10L15/14;G10L15/22

优先权:

专利状态码:有效-授权

法律状态:2022.07.12#授权;2021.07.30#实质审查的生效;2021.07.13#公开

摘要:本发明公开了一种基于DTW和GMM的短词句语音识别方法及系统,涉及语音识别技术领域,包括根据获取的当前阶段采集的语音音频数据、内置DTW距离的高斯混合模型以及语音音频数据库,确定所述当前阶段采集的语音音频数据对应的识别结果;其中,语音音频数据库包括n个短词句,内置DTW距离的高斯混合模型包括K支高斯模型,且K=n;内置DTW距离的高斯混合模型是根据语音音频数据库、DTW算法和高斯混合模型构建的。应用本发明,以达到识别效率高、识别精度高的目的。

主权项:1.一种基于DTW和GMM的短词句语音识别方法,其特征在于,包括:获取当前阶段采集的语音音频数据;根据所述当前阶段采集的语音音频数据、内置DTW距离的高斯混合模型以及语音音频数据库,确定所述当前阶段采集的语音音频数据对应的识别结果;其中,所述语音音频数据库包括n个短词句,所述内置DTW距离的高斯混合模型包括K支高斯模型,且K=n;所述内置DTW距离的高斯混合模型是根据所述语音音频数据库、DTW算法和高斯混合模型构建的;所述内置DTW距离的高斯混合模型的构建过程为:步骤一:对高斯混合模型中的参数αk,uk,σk进行初始化;其中,αk表示高斯混合模型中第k支高斯模型的权重系数,uk表示高斯混合模型中第k支高斯模型的中心矢量,σk表示高斯混合模型中第k支高斯模型的方差;步骤二:根据公式计算语音音频数据xj属于第k支高斯模型的概率γjk;其中,dDTWxj,uk表示语音音频数据xj与参数uk间的DTW距离;j=1,2,...,N;步骤三:根据所述概率γjk更新参数αk,uk,σk;步骤四:重复步骤二和步骤三,并当步骤三输出的更新后的参数αk,uk,σk收敛时,停止参数更新,进而得到内置DTW距离的高斯混合模型;所述根据所述当前阶段采集的语音音频数据、内置DTW距离的高斯混合模型以及语音音频数据库,确定所述当前阶段采集的语音音频数据对应的识别结果,具体包括:根据所述当前阶段采集的语音音频数据和内置DTW距离的高斯混合模型,计算所述当前阶段采集的语音音频数据属于第k支高斯模型的概率值,进而得到K个概率值;其中,k=1,2,...,K;确定K个所述概率值中的最大概率值,并将所述最大概率值对应的高斯模型确定为选中高斯模型;将所述选中高斯模型对应的短词句确定为所述当前阶段采集的语音音频数据的识别结果;其中,一个所述高斯模型对应一个所述短词句,且不同的所述高斯模型对应不同的所述短词句。

全文数据:

权利要求:

百度查询: 宁夏理工学院 基于DTW和GMM的短词句语音识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。