买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于深度学习的手提电脑语音识别方法及系统_广州紫麦科技有限公司_202410178427.4 

申请/专利权人:广州紫麦科技有限公司

申请日:2024-02-09

公开(公告)日:2024-04-19

公开(公告)号:CN117727298B

主分类号:G10L15/06

分类号:G10L15/06;G10L15/22;G10L15/26;G10L21/0208;G10L25/03

优先权:

专利状态码:有效-授权

法律状态:2024.04.19#授权;2024.04.05#实质审查的生效;2024.03.19#公开

摘要:本申请实施例提供一种基于深度学习的手提电脑语音识别方法及系统,通过对待识别语音数据包含的各语音区块进行声学属性向量解析,可以有效地从复杂的待识别语音数据中获取关键信息,提高了语音识别的准确性和效率。其次,使用时空优化模型进行属性向量优化,能够充分利用语音信号中的时空信息,进一步增强语音识别的精确性。此外,通过确定各语音区块关联的干扰特征参数,能够有效地处理并削减语音信号中的干扰,使得在噪声环境下的语音识别更加准确。最后,根据目标语义意图数据对手提电脑进行功能控制,实现了智能交互,极大地提升了用户体验。

主权项:1.一种基于深度学习的手提电脑语音识别方法,其特征在于,应用于语音识别系统,所述方法包括:获取输入到所述手提电脑中的包含目标声源的待识别语音数据,并对所述待识别语音数据包含的各语音区块进行声学属性向量解析,生成对应的区块声学属性向量;基于在先完成模型参数学习的时空优化模型,依据所述各语音区块分别在所述待识别语音数据中的时空信息,分别对对应的区块声学属性向量进行时空优化,生成对应的包含时空信息的优化属性向量;依据各优化属性向量各自与预先定义的模板属性向量之间的特征距离,分别确定所述各语音区块分别关联的干扰特征参数;其中,各模板属性向量是依据干扰屏蔽音频数据进行解析的,且每个模板属性向量包含相应语音区块的时空信息,所述干扰屏蔽音频数据包含不存在干扰特征的目标声源;依据生成的各干扰特征参数,确定所述待识别语音数据的干扰状态数据,并基于所述待识别语音数据的干扰状态数据对所述待识别语音数据进行优化处理以生成对应的目标语音数据,对所述目标语音数据进行语义意图识别,获得对应的目标语义意图数据后,基于所述目标语义意图数据对所述手提电脑进行功能控制;在所述基于在先完成模型参数学习的时空优化模型,依据所述各语音区块分别在所述待识别语音数据中的时空信息,分别对对应的区块声学属性向量进行时空优化,生成对应的包含时空信息的优化属性向量之前,所述方法还包括:依据多个模板音频数据与分别关联的先验知识标注数据,对初始化权重参数的时空优化模型进行循环模型参数学习,直至符合模型收敛要求时终止,生成所述在先完成模型参数学习的时空优化模型;每个先验知识标注数据表征:相应模板音频数据中各语音区块为干扰语音区块的置信度;在任意一轮模型参数学习过程中,对于一个模板音频数据,对该模板音频数据的各语音区块进行声学属性向量解析,生成对应的模板声学属性向量;依据本轮调用的时空优化模型,依据各语音区块在该模板音频数据中的时空信息,分别对对应的模板声学属性向量进行时空优化,生成对应的包含时空信息的优化属性向量;依据该模板音频数据的各语音区块分别关联的优化属性向量,生成该模板音频数据的干扰状态数据;依据生成的多个干扰状态数据与对应的先验知识标注数据之间的偏离度,对本轮调用的时空优化模型进行模型参数学习;在依据各优化属性向量各自与预先定义的模板属性向量之间的特征距离,分别确定所述各语音区块分别关联的干扰特征参数之前,所述方法还包括:依据第二声学属性向量解析模型,分别对各干扰屏蔽音频数据包含的各语音区块进行声学属性向量解析,生成基础声学属性向量序列,所述基础声学属性向量序列包括所述各干扰屏蔽音频数据的各语音区块分别关联的基础声学属性向量;对于多个作为训练样本的模板音频数据中的一个模板音频数据,依据所述第二声学属性向量解析模型,分别对该模板音频数据中各语音区块进行声学属性向量解析,生成对应的模板声学属性向量;依据生成的各模板声学属性向量与所述基础声学属性向量序列之间的特征距离,确定相应语音区块的区块知识数据,每个区块知识数据表征:相应语音区块为干扰语音区块的置信度,依据生成的各区块知识数据,生成该模板音频数据的先验知识标注数据;依据多个所述模板音频数据与分别关联的先验知识标注数据,对干扰状态检测模型进行循环模型参数学习,直至符合模型收敛要求时终止;其中,所述干扰状态检测模型包括第一声学属性向量解析模型和所述时空优化模型,所述第一声学属性向量解析模型与所述第二声学属性向量解析模型共用相同的模型参数配置数据;依据完成参数学习的所述干扰状态检测模型中的第一声学属性向量解析模型,分别对所述各干扰屏蔽音频数据进行声学属性向量解析,并依据完成参数学习的所述干扰状态检测模型中的时空优化模型对解析到的区块声学属性向量进行时空优化,生成模板属性向量序列,所述模板属性向量序列包括所述预先定义的模板属性向量。

全文数据:

权利要求:

百度查询: 广州紫麦科技有限公司 基于深度学习的手提电脑语音识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。