申请/专利权人:汇顶科技(香港)有限公司
申请日:2016-06-13
公开(公告)日:2024-01-19
公开(公告)号:CN113823319B
主分类号:G10L21/0364
分类号:G10L21/0364;G10L25/15;G10L19/06
优先权:["20150617 EP 15290161.7"]
专利状态码:有效-授权
法律状态:2024.01.19#授权;2022.01.07#实质审查的生效;2021.12.21#公开
摘要:本文公开了一种包括处理器和存储器的装置。存储器包括从采样环境噪声计算噪声频谱估值的噪声频谱估计器,从输入语音计算语音频谱估值的语音频谱估计器,使用在语音频谱中检测的每个共振峰内的噪声频谱估值和语音频谱估值计算SNR估值的共振峰信噪比SNR估计器。存储器还包括共振峰升高估计器,其计算一组增益因数并将该组增益因数应用到输入语音的每个频率分量,使得在每个共振峰内的所得SNR达到预选目标值。
主权项:1.一种用于执行改进语音可懂度的操作的方法,其特征在于,包括:接收输入语音信号;从采样环境噪声计算噪声频谱估值;从所述输入语音信号计算语音频谱估值;计算在所述计算的噪声频谱估值和所述语音频谱估值中的共振峰SNR估值;分割在所述语音频谱估值中的共振峰;以及基于计算的所述共振峰SNR估值计算用于所述共振峰中的每个共振峰的一组增益因数;将所述一组增益因数应用到所述输入语音信号的每个频率分量,以使所述每个共振峰内的所得SNR估值达到预选的目标值;所述计算所述语音频谱估值包括使用低阶线性预测滤波器计算所述语音频谱估值;其中,所述分割在所述语音频谱估值中的共振峰包括:根据定位标志形成分段线性信号,在局部最小值等于0dB的情况下从均衡语音频谱包络减去所述分段线性信号,以获得归一化的频谱包络。
全文数据:
权利要求:
百度查询: 汇顶科技(香港)有限公司 改进的语音可懂度
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。