申请/专利权人:北京声智科技有限公司
申请日:2019-07-09
公开(公告)日:2024-04-23
公开(公告)号:CN112216286B
主分类号:G10L17/22
分类号:G10L17/22;G10L17/04;G10L17/18;G10L17/02
优先权:
专利状态码:有效-授权
法律状态:2024.04.23#授权;2021.01.29#实质审查的生效;2021.01.12#公开
摘要:一种语音唤醒识别方法,应用于语音识别领域,包括:当接收到语音信号后,提取语音信号的声学特征,通过神经网络模型预测声学特征在各声学建模单元上的后验概率,根据后验概率,基于预置的一级评估模型评估是否进入二级评估装置,若进入二级评估装置,则基于后验概率,通过二级评估装置,判断是否进入唤醒状态。本发明还公开了一种语音唤醒识别装置、电子设备及存储介质,具有简单易行、功耗低,同时在保证唤醒率的前提下,降低了误唤醒率。
主权项:1.一种语音唤醒识别方法,其特征在于,包括:当接收到语音信号后,提取所述语音信号的声学特征;通过神经网络模型预测所述声学特征在各声学建模单元上的后验概率;根据所述后验概率,基于预置的一级评估模型评估是否进入二级评估装置,包括:获取预设窗口内各声学建模单元的最大后验概率、各声学建模单元的预设权重系数和各声学建模单元的惩罚值;将所述各声学建模单元的最大后验概率、各声学建模单元的预设权重系数和各声学建模单元的惩罚值,输入至预置的一级评估模型,得到第一评估值;判断所述第一评估值是否大于预设阈值;若是,则进入二级评估装置;若否,则所述预设窗口内不存在唤醒词,不进入唤醒状态,其中,所述一级评估模型具体为:令Z表示评估值,n表示第n个声学建模单元,xn表示在一个移动窗口内第n个声学建模单元的最大特征值,cn表示第n个声学建模单元的预设权重系数,bn表示第n个声学建模单元的惩罚值,则: 若进入二级评估装置,则基于所述后验概率,通过所述二级评估装置,判断是否进入唤醒状态。
全文数据:
权利要求:
百度查询: 北京声智科技有限公司 语音唤醒识别方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。