申请/专利权人:合肥讯飞数码科技有限公司
申请日:2020-04-20
公开(公告)日:2020-07-17
公开(公告)号:CN111429887A
主分类号:G10L15/02(20060101)
分类号:G10L15/02(20060101);G10L15/06(20130101);G10L15/08(20060101);G10L15/183(20130101);G10L15/26(20060101)
优先权:
专利状态码:有效-授权
法律状态:2023.05.30#授权;2020.08.11#实质审查的生效;2020.07.17#公开
摘要:本发明公开了一种基于端到端的语音关键词识别方法、装置以及设备。本发明的构思在于与端到端思想相结合,由预建的关键词识别网络从特征向目标进行直接拟合,使得识别过程更加简洁、高效且可以避免不良影响的叠加效应,同时关键词识别网络更易达到全局最优,且能够有效降低开发成本,因此在实际业务场景中具有较高的实用价值。本发明还对识别特征的获取策略进行改进,从而可以充分表征出适应业务场景的发音特性,以便捕获到更多的潜在关键信息,降低漏警虚警,此外,本发明提供的关键词识别网络架构可以从声学角度利用到上下文信息,从根本上解决了现有方案仅通过孤立发音样本进行识别的弊端,进而明显改善了从音频中锁定关键词的处理效果。
主权项:1.一种基于端到端的语音关键词识别方法,其特征在于,包括:提取输入音频各帧数据的声学特征;根据所述声学特征和预设的发音聚类及区分策略,获取各帧数据的识别特征;将所述识别特征作为预先训练的关键词识别网络的输入,并由所述关键词识别网络结合声学层面的上下文信息,预测出各帧数据相对既定的关键词类别的概率分布;根据所述概率分布确定出所述输入音频中的关键词。
全文数据:
权利要求:
百度查询: 合肥讯飞数码科技有限公司 基于端到端的语音关键词识别方法、装置以及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。