买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种广播通信场景的近端语音可懂度增强方法和系统_中国科学院声学研究所_202310049766.8 

申请/专利权人:中国科学院声学研究所

申请日:2023-02-01

公开(公告)日:2023-05-16

公开(公告)号:CN116129928A

主分类号:G10L21/0232

分类号:G10L21/0232;G10K11/178

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.06.02#实质审查的生效;2023.05.16#公开

摘要:本发明实施例公开了一种适用于广播通信场景的近端语音可懂度增强方法和系统。该近端语音可懂度增强方法,首先在近端估计出语音和噪声,然后基于语音和噪声利用近端语音可懂度增强算法得到频带增益,最后将频带增益应用于原始的广播语音得到可懂度增强后的语音并在远端进行播放。本发明提供的实施例公开的一种广播通信场景的近端语音可懂度增强系统,将上述方法在基于卡尔曼估计方法和可懂度增强算法应用场景所对应的广播系统中实现。该系统提高了语音的通信质量,并且算法计算量较小,使得系统可以实现实时运行。

主权项:1.一种广播通信场景的近端语音可懂度增强方法,其特征在于,包括:获取原始广播的远端参考语音和麦克风采集的近端混合语音;所述近端混合语音包括混合了背景噪声的经过衰减后的远端参考语音;对参考语音和混合语音进行特征提取,获得所述参考语音和混合语音的傅里叶频谱;在短傅里叶变换域,针对所述参考语音和混合语音的传播路径建立基于自回归信号模型的卡尔曼滤波器,将参考语音和混合语音的傅里叶频谱输入所述卡尔曼滤波器得到参考语音和混合语音最优的自回归系数;利用所述自回归系数进行估计获得近端的语音信号和噪声信号;对所述语音信号和噪声信号进行特征提取,获得所述语音信号和噪声信号的傅里叶频谱;对语音信号的傅里叶频谱进行语音活动性检测,将语音信号和噪声信号的傅里叶频谱输入三分之一倍频程滤波器获得第一输出结果;利用可懂度增强算法对第一输出结果进行计算获得所述语音信号和噪声信号的频带能量,对所述频带能量进行频带间重分配获得所述语音信号的频带增益;对原始广播语音进行特征提取,获得广播语音的傅里叶频谱;对广播语音的傅里叶频谱进行语音活动性检测并输入三分之一倍频程滤波器后获得第二输出结果;将第二输出结果与所述频带增益进行乘法运算得到可懂度增强后的语音频谱,对所述可懂度增强后的语音频谱进行傅里叶逆变换得到可懂度增强后的广播语音。

全文数据:

权利要求:

百度查询: 中国科学院声学研究所 一种广播通信场景的近端语音可懂度增强方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。