【发明公布】基于语音和语义的多模态语音唤醒识别方法及系统_武汉烽火普天信息技术有限公司_202311847160.5

申请/专利权人：武汉烽火普天信息技术有限公司

申请日：2023-12-27

公开（公告）日：2024-04-12

公开（公告）号：CN117877467A

主分类号：G10L15/06

分类号：G10L15/06;G10L15/22;G10L15/02;G10L15/16;G10L17/22;G10L17/10;G10L17/04;G10L17/02;G10L17/18

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.30#实质审查的生效;2024.04.12#公开

摘要：本申请提供了基于语音和语义的多模态语音唤醒识别方法及系统，方法包括以下步骤：采集获取唤醒词语音和唤醒词语音对应的标注文本，并划分训练集和测试集；采用训练集和测试集训练获取语音和文本的特征提取器；输入采集获取的唤醒词语音和标注文本至特征提取器，获取唤醒语音的语音特征和语义特征；对语音特征和语义特征进行融合处理，获取多模态高维融合特征，输入多模态高维融合特征至语音唤醒分类模型进行模型训练，基于训练后的语音唤醒分类模型，获取多模态语音唤醒识别策略。本申请通过训练获取特征提取器和语音唤醒分类模型，在单语音特征的基础上加入了高维的语义特征信息，有利于提升神经网络和解码处理过程中语音唤醒的准确率。

主权项：1.一种基于语音和语义的多模态语音唤醒识别方法，其特征在于，包括以下步骤：采集获取唤醒词语音和唤醒词语音对应的标注文本，并划分训练集和测试集；采用训练集和测试集训练获取语音和文本的特征提取器；输入采集获取的唤醒词语音和标注文本至特征提取器，获取唤醒语音的语音特征和语义特征；对语音特征和语义特征进行融合处理，获取多模态高维融合特征，输入多模态高维融合特征至语音唤醒分类模型进行模型训练，基于训练后的语音唤醒分类模型，获取多模态语音唤醒识别策略。

全文数据：

权利要求：

百度查询：武汉烽火普天信息技术有限公司基于语音和语义的多模态语音唤醒识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

下一篇：一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

相关技术

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种矿热炉扎眼机自动卸杆装置_乌海三美国际矿业有限公司_202322492884.4

一种农牧业通电线卷绕装置_山东恒通智能新材料有限公司_202322431480.4

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

一种计算机机箱外壳_深圳市丰翼高精密五金有限公司_202322585533.8

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

一种钢带波纹螺旋管接头防护模具_吉林建工集团有限公司_202322063597.1

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种环形导轨间歇循环通电装置_东莞市臻域自动化设备有限公司_202322566793.0

龙图腾网&IPTOP

【发明公布】基于语音和语义的多模态语音唤醒识别方法及系统_武汉烽火普天信息技术有限公司_202311847160.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务