【发明授权】可定制的低延时命令词识别方法及装置_普强时代(珠海横琴)信息技术有限公司_202110865579.8

申请/专利权人：普强时代(珠海横琴)信息技术有限公司

申请日：2021-07-29

公开（公告）日：2024-04-16

公开（公告）号：CN113593560B

主分类号：G10L15/22

分类号：G10L15/22;G10L15/16;G10L15/06;G10L15/02

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2021.11.19#实质审查的生效;2021.11.02#公开

摘要：本发明涉及一种可定制的低延时命令词识别方法及装置，包括获取待识别语音，并根据待识别语音确定待处理的声学特征；将声学特征输入到预构建的神经网络分类模型中进行识别，获取声学特征所属的每个建模单元的后验概率；其中，建模单元为带调拼音；根据后验概率计算每个命令词的置信度以及其包含的建模单元出现的时间点；根据置信度和时间点来判断是否输出该命令词。本发明能够对汉语中所有的带调拼音进行建模，采用简单高效的打分机制，完成低延时命令词列表的识别任务，降低了命令词识别的开发成本和时间成本。本发明采用的置信度计算方法具有极低的计算复杂度和空间复杂度，并具有较高的准确率和较低的误唤醒率，可实时地检测命令词是否出现。

主权项：1.一种可定制的低延时命令词识别方法，其特征在于，包括：获取待识别语音，并根据所述待识别语音确定待处理的声学特征；将所述声学特征输入到预构建的神经网络分类模型中进行识别，获取所述声学特征所属的每个建模单元的后验概率；其中，所述建模单元为带调拼音，包括声母、韵母和声调；根据所述后验概率计算每个命令词对应的置信度以及其包含的建模单元出现的时间点；根据所述置信度和时间点判断是否输出该命令词；还包括：构建神经网络分类模型，所述构建神经网络分类模型，包括：从训练语音库中获取语音数据，对所述语音数据标注对应的建模单元；获取所述语音数据对应的声学特征；将所述语音数据对应的声学特征输入到神经网络进行训练，获取所述语音数据对应的声学特征所属的每个建模单元的后验概率；基于所述语音数据对应的声学特征所属的每个建模单元的后验概率采用时序分类损失函数对所述语音数据对应的声学特征迭代训练，生成神经网络分类模型；所述根据所述后验概率计算每个命令词对应的置信度采用的计算公式为：其中，pik表示时间点k时，第i个建模单元对应的后验概率；hmax＝t-window_size表示命令词检测的开始点；window_size表示命令词检测的时间窗口，取命令词的平均时长；ti表示在命令词检测时间窗口中第i个建模单元对应的后验概率最大的时间点；ft表示置信度；n表示命令词包括建模单元的个数；所述神经网络分类模型为深度前馈序列记忆神经网络。

全文数据：

权利要求：

百度查询：普强时代(珠海横琴)信息技术有限公司可定制的低延时命令词识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

下一篇：一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

相关技术

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种电池叠放平台_济源市万洋绿色能源有限公司_202322480402.3

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种籽晶自动熔接结构_四川永祥光伏科技有限公司_202322431204.8

一种矮轴gasket结构的机械键盘_渴创技术(深圳)有限公司_202322395230.X

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

一种接触器触头机构_杭州玛实迪电器科技有限公司_202322179096.X

龙图腾网&IPTOP

【发明授权】可定制的低延时命令词识别方法及装置_普强时代(珠海横琴)信息技术有限公司_202110865579.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务