买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种语音识别方法_山东商业职业技术学院;高寻真源(山东)教育科技有限公司_202211250643.2 

申请/专利权人:山东商业职业技术学院;高寻真源(山东)教育科技有限公司

申请日:2022-10-13

公开(公告)日:2023-01-24

公开(公告)号:CN115331658B

主分类号:G10L15/04

分类号:G10L15/04;G10L15/06;G10L15/16;G10L15/18

优先权:

专利状态码:有效-授权

法律状态:2023.01.24#授权;2022.11.29#实质审查的生效;2022.11.11#公开

摘要:本发明公开一种语音识别方法,应用于语音信号处理领域;解决的技术问题是语音识别,采用的技术方案是一种语音识别方法,包括:(S1)语音识别设备设置识别主题语言;(S2)语音识别设备接收语音信息,并将语音信息存储在语音识别设备中;(S3)采用DTW算法提取语音信息语义模板,与语音识别词典的参考模板进行匹配;(S4)模板匹配成功,语音识别设备的显示器显示语音识别结果;本发明大大提高了语音识别的准确性,提高了人与人之间的沟通能力。

主权项:1.一种语音识别方法,其特征在于:所述方法包括:(S1)通过语音识别设备设置识别主题语言;其中语音识别设备采用CN3704芯片进行语音识别信息控制,语音识别设备包括识别语言设置单元、语音识别处理单元、语音按钮、麦克风和显示器;(S2)语音识别设备接收语音信息,并将语音信息存储在语音识别设备中;其中语音识别设备通过语音按钮开启语音识别设备,采用麦克风接收语音信息,并将语音信号转换为电信号存储在语音识别设备的语音识别处理单元中;(S3)采用DTW算法提取语音信息语义模板,与语音识别词典的参考模板进行匹配;其中通过DTW算法按语音帧进行标记语音信息所有片段,得到语音信息的语义模板表示为,表示语音帧的标记序数,表示语义模板中第帧的特征矢量值;采用欧氏距离的方法计算语义模板与参考模板之间的最优距离,将语音信息的语义模板与语音识别词典中的所有参考模板一一匹配,则计算取最小匹配失真度为: (8)式(8)中,表示参考模板对应的最小匹配失真度;表示语音信息语义模板与参考模板之间的距离;若小于语音识别阈值,则模板匹配成功,输出参考模板的语义为语音信息识别结果;(S4)模板匹配成功,语音识别设备的显示器显示语音识别结果;其中,若G小于语音识别阈值ES,则模板匹配成功,输出参考模板h的语义为语音信息识别结果;在步骤(S3)中,语音识别词典的训练方法,包括以下步骤:步骤1:假设将输入的语音信息分割为个音频分量的语音片段,通过计算每个语音片段的音频分量,获取音频向量进行计数,则每个语音片段的信息熵为: (1)式(1)中,表示语音片段的信息熵,下标表示语音片段序数,表示语音片段的带宽,表示语音片段特征点出现频率,表示语音片段的数据;当语音片段特征点出现频率为3MHz,则该语音片段为高频分量;当语音片段特征点出现频率为3kHz,则该语音片段为低频分量;步骤2:使用OMP算法对每个高频分量的语音片段进行稀疏编码,假设稀疏系数,利用max-L1融合规则对所有高频分量的语音片段进行融合得到: (2)式(2)中,表示max-L1融合规则得到的高频分量的语音片段集,表示每个高频分量的语音片段的稀疏系数,表示OMP算法函数值;步骤3:采用基于L2-范数的加权平均方法对低频分量进行融合,L2-范数最小化公式如下: (3)式(3)中,表示L2-范数最小化,表示L2-范数值,表示具有满秩的约束矩阵,表示常参数;为了减少计算量,在L2-范数中引入了拉格朗日乘子: (4)式(4)中,表示拉格朗日拉格朗日乘子,表示引入的拉格朗日参数,之后根据公式(4)得到融合后的低频分量的语音片段集: (5)式(5)中,表示基于L2-范数的加权平均方法得到的低频分量的语音片段集;步骤4:将融合后的高频分量和低频分量的语音片段集进一步融合,形成最终的融合语音信息: (6)式(6)中,表示输出的融合语音信息;将融合语音信息进行深度学习,构建语音识别词典。

全文数据:

权利要求:

百度查询: 山东商业职业技术学院;高寻真源(山东)教育科技有限公司 一种语音识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。