【发明授权】基于深度学习的手提电脑语音识别方法及系统_广州紫麦科技有限公司_202410178427.4

导航：龙图腾网> 最新专利技术> 基于深度学习的手提电脑语音识别方法及系统_广州紫麦科技有限公司_202410178427.4

申请/专利权人：广州紫麦科技有限公司

申请日：2024-02-09

公开（公告）日：2024-04-19

公开（公告）号：CN117727298B

主分类号：G10L15/06

分类号：G10L15/06;G10L15/22;G10L15/26;G10L21/0208;G10L25/03

优先权：

专利状态码：有效-授权

法律状态：2024.04.19#授权;2024.04.05#实质审查的生效;2024.03.19#公开

摘要：本申请实施例提供一种基于深度学习的手提电脑语音识别方法及系统，通过对待识别语音数据包含的各语音区块进行声学属性向量解析，可以有效地从复杂的待识别语音数据中获取关键信息，提高了语音识别的准确性和效率。其次，使用时空优化模型进行属性向量优化，能够充分利用语音信号中的时空信息，进一步增强语音识别的精确性。此外，通过确定各语音区块关联的干扰特征参数，能够有效地处理并削减语音信号中的干扰，使得在噪声环境下的语音识别更加准确。最后，根据目标语义意图数据对手提电脑进行功能控制，实现了智能交互，极大地提升了用户体验。

主权项：1.一种基于深度学习的手提电脑语音识别方法，其特征在于，应用于语音识别系统，所述方法包括：获取输入到所述手提电脑中的包含目标声源的待识别语音数据，并对所述待识别语音数据包含的各语音区块进行声学属性向量解析，生成对应的区块声学属性向量；基于在先完成模型参数学习的时空优化模型，依据所述各语音区块分别在所述待识别语音数据中的时空信息，分别对对应的区块声学属性向量进行时空优化，生成对应的包含时空信息的优化属性向量；依据各优化属性向量各自与预先定义的模板属性向量之间的特征距离，分别确定所述各语音区块分别关联的干扰特征参数；其中，各模板属性向量是依据干扰屏蔽音频数据进行解析的，且每个模板属性向量包含相应语音区块的时空信息，所述干扰屏蔽音频数据包含不存在干扰特征的目标声源；依据生成的各干扰特征参数，确定所述待识别语音数据的干扰状态数据，并基于所述待识别语音数据的干扰状态数据对所述待识别语音数据进行优化处理以生成对应的目标语音数据，对所述目标语音数据进行语义意图识别，获得对应的目标语义意图数据后，基于所述目标语义意图数据对所述手提电脑进行功能控制；在所述基于在先完成模型参数学习的时空优化模型，依据所述各语音区块分别在所述待识别语音数据中的时空信息，分别对对应的区块声学属性向量进行时空优化，生成对应的包含时空信息的优化属性向量之前，所述方法还包括：依据多个模板音频数据与分别关联的先验知识标注数据，对初始化权重参数的时空优化模型进行循环模型参数学习，直至符合模型收敛要求时终止，生成所述在先完成模型参数学习的时空优化模型；每个先验知识标注数据表征：相应模板音频数据中各语音区块为干扰语音区块的置信度；在任意一轮模型参数学习过程中，对于一个模板音频数据，对该模板音频数据的各语音区块进行声学属性向量解析，生成对应的模板声学属性向量；依据本轮调用的时空优化模型，依据各语音区块在该模板音频数据中的时空信息，分别对对应的模板声学属性向量进行时空优化，生成对应的包含时空信息的优化属性向量；依据该模板音频数据的各语音区块分别关联的优化属性向量，生成该模板音频数据的干扰状态数据；依据生成的多个干扰状态数据与对应的先验知识标注数据之间的偏离度，对本轮调用的时空优化模型进行模型参数学习；在依据各优化属性向量各自与预先定义的模板属性向量之间的特征距离，分别确定所述各语音区块分别关联的干扰特征参数之前，所述方法还包括：依据第二声学属性向量解析模型，分别对各干扰屏蔽音频数据包含的各语音区块进行声学属性向量解析，生成基础声学属性向量序列，所述基础声学属性向量序列包括所述各干扰屏蔽音频数据的各语音区块分别关联的基础声学属性向量；对于多个作为训练样本的模板音频数据中的一个模板音频数据，依据所述第二声学属性向量解析模型，分别对该模板音频数据中各语音区块进行声学属性向量解析，生成对应的模板声学属性向量；依据生成的各模板声学属性向量与所述基础声学属性向量序列之间的特征距离，确定相应语音区块的区块知识数据，每个区块知识数据表征：相应语音区块为干扰语音区块的置信度，依据生成的各区块知识数据，生成该模板音频数据的先验知识标注数据；依据多个所述模板音频数据与分别关联的先验知识标注数据，对干扰状态检测模型进行循环模型参数学习，直至符合模型收敛要求时终止；其中，所述干扰状态检测模型包括第一声学属性向量解析模型和所述时空优化模型，所述第一声学属性向量解析模型与所述第二声学属性向量解析模型共用相同的模型参数配置数据；依据完成参数学习的所述干扰状态检测模型中的第一声学属性向量解析模型，分别对所述各干扰屏蔽音频数据进行声学属性向量解析，并依据完成参数学习的所述干扰状态检测模型中的时空优化模型对解析到的区块声学属性向量进行时空优化，生成模板属性向量序列，所述模板属性向量序列包括所述预先定义的模板属性向量。

全文数据：

权利要求：

百度查询：广州紫麦科技有限公司基于深度学习的手提电脑语音识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：交互设备的测试方法、装置、设备及可读存储介质_腾讯科技(深圳)有限公司_202211473174.0

下一篇：钻井泵自清洁型吸入过滤装置_中油国家油气钻井装备工程技术研究中心有限公司_202211464026.2

相关技术

交互设备的测试方法、装置、设备及可读存储介质_腾讯科技(深圳)有限公司_202211473174.0

钻井泵自清洁型吸入过滤装置_中油国家油气钻井装备工程技术研究中心有限公司_202211464026.2

接口检测方法、装置、介质及电子设备_北京小米移动软件有限公司_202211456014.5

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211459338.4

一种利用低品位热源的矿井水浓缩淡化产盐的系统及方法_国能神东煤炭集团有限责任公司_202211456879.1

业务代码的管理方法、装置、服务器及存储介质_哲库科技(上海)有限公司_202211457565.3

一种数字易货交易系统及数字易货交易方法_深圳励鼎科技有限公司_202310558886.0

一种多孔有序基体材料及其制备方法和应用_思摩尔国际控股有限公司_202211446370.9

应用程序的测试方法、装置、电子设备及存储介质_腾讯科技(深圳)有限公司_202211444321.1

电热水壶控制方法和电热水壶_杭州九阳净水系统有限公司_202211444182.2

薄膜晶体管基板、包括该基板的显示装置及其制造方法_乐金显示有限公司_202311299470.8

用于预测组装的系统和方法_波音公司_202311381921.2

电脑相关技术

一体型电脑_英业达科技有限公司_202211407715.X

强散热电脑机箱_浙江灵轩科技有限公司_202322653780.7

一种电脑散热支座_赵祥_202322007884.0

一种电脑切片机_昆山比高电子科技有限公司_202322566045.2

电子装置及多电脑切换模块_宏正自动科技股份有限公司_202310611449.0

一种静音电脑机箱_武汉理工大学_202410040875.8

一种可隐藏电脑的多功能书桌_深圳冠特家居健康系统有限公司_202322678113.4

一种电脑硬件固定装置_广州辉酷科技有限公司_202321893289.5

笔记本电脑挂钩MIM整形模具_昆山飞博特电子科技有限公司_202322542982.4

电子设备壳体及笔记本电脑_东莞华贝电子科技有限公司_202111132252.6

语音相关技术

语音识别方法和装置_芯倍微科技有限公司_202211443834.0

语音数据处理方法、系统及存储介质_深圳市领芯者科技有限公司_201711080078.9

语音服务唤醒方法、装置、设备及存储介质_鼎桥通信技术有限公司_202211454714.0

语音助手的唤醒方法和唤醒装置_荣耀终端有限公司_202211447447.4

一种语音助手启动方法、装置、终端及存储介质_荣耀终端有限公司_202211445987.9

语音合成方法、装置、电子设备及存储介质_科大讯飞股份有限公司_202211449509.5

一种语音交互方法、电子设备及计算机可读存储介质_荣耀终端有限公司_202211448343.5

语音合成方法、模型训练方法、装置、设备及存储介质_科大讯飞股份有限公司_202211448746.X

语音识别方法和识别装置、存储介质、电子设备、车辆_比亚迪股份有限公司_202211458262.3

一种在线多输入多输出语音信号的去混响方法及系统_海尔优家智能科技(北京)有限公司_202211448747.4

识别相关技术

指纹识别装置、指纹识别方法及摩尔纹图像产生方法_联咏科技股份有限公司_202211638456.1

语音识别方法和识别装置、存储介质、电子设备、车辆_比亚迪股份有限公司_202211458262.3

识别方法及电子设备_荣耀终端有限公司_202211459119.6

语音识别方法和装置_芯倍微科技有限公司_202211443834.0

影像识别边缘设备以及方法_财团法人资讯工业策进会_202310525285.X

车辆属性识别方法及系统_普天信息技术有限公司_201911033290.9

一种手势识别方法_康佳集团股份有限公司_202011485807.0

啮齿动物新物体识别检测装置_中国科学院深圳先进技术研究院_202211450891.1

地址识别方法与装置_北京京东乾石科技有限公司_201811149375.9

数据识别方法及装置_华为技术有限公司_202211456054.X

龙图腾网&IPTOP

【发明授权】基于深度学习的手提电脑语音识别方法及系统_广州紫麦科技有限公司_202410178427.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务