申请/专利权人:思必驰科技股份有限公司
申请日:2021-04-27
公开(公告)日:2021-07-16
公开(公告)号:CN113129874A
主分类号:G10L15/06(20130101)
分类号:G10L15/06(20130101);G10L15/08(20060101);G10L15/26(20060101);G10L25/27(20130101)
优先权:
专利状态码:有效-授权
法律状态:2022.05.10#授权;2021.08.03#实质审查的生效;2021.07.16#公开
摘要:本发明实施例提供一种语音唤醒方法。该方法包括:语音唤醒模型在第一阶段预测当前语句包含唤醒词后,将唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入;基于后验纠正分类器的第二阶段的预测结果,判断音频流是否包含唤醒词。本发明实施例还提供一种语音唤醒系统。本发明实施例使用了stage1中的声学模型的隐层值作为stage2中分类器的输入进行模型的训练和测试,能够有效进行二次预测,解决了使用动态规划算法做后处理的唤醒模型区分性弱的问题,提高了唤醒的区分性能。并且,为了减小stage2带来的内存占用,尝试了基于多任务学习训练的后验纠正分类器压缩方案,在减小内存占用的同时,保证了唤醒的准确率。
主权项:1.一种语音唤醒方法,包括:语音唤醒模型在第一阶段预测当前语句包含唤醒词后,将所述唤醒词对应的语音唤醒模型中的隐层值作为后验纠正分类器的输入;基于后验纠正分类器的第二阶段的预测结果,判断所述音频流是否包含唤醒词。
全文数据:
权利要求:
百度查询: 思必驰科技股份有限公司 语音唤醒方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。