买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】用于远场通话的噪声估计方法及系统_苏州思必驰信息科技有限公司_202010537069.3 

申请/专利权人:苏州思必驰信息科技有限公司

申请日:2020-06-12

公开(公告)日:2020-09-22

公开(公告)号:CN111696567A

主分类号:G10L21/0208(20130101)

分类号:G10L21/0208(20130101);G10L21/0216(20130101);G10L21/0232(20130101);G10L25/03(20130101);G10L25/18(20130101);G10L25/30(20130101)

优先权:

专利状态码:有效-授权

法律状态:2022.04.01#授权;2020.10.20#实质审查的生效;2020.09.22#公开

摘要:本发明实施例提供一种用于远场通话的噪声估计和语音降噪方法。该方法包括:通过多个场景的纯噪声集合对纯净语音集合进行加噪处理,得到带噪训练语音集合以及带噪训练语音集合内各带噪训练语音的基准噪声频谱;基于设备的性能,选择噪声频谱估计模型的类型;提取各带噪训练语音的语音特征,将语音特征作为噪声频谱估计模型的输入;将语音特征进行特征处理后,对噪声频谱估计模型进行深度学习训练,直至噪声频谱估计模型输出的估计噪声频谱向基准噪声频谱收敛,以用于估计远场通话的噪声。本发明实施例还提供一种用于远场通话的噪声估计和语音降噪系统。本发明实施例将深度学习和信号处理相结合,显著提升通话质量,如语音清晰度、可懂度等。

主权项:1.一种用于远场通话的噪声估计方法,包括:通过多个场景的纯噪声集合对纯净语音集合进行加噪处理,得到带噪训练语音集合以及所述带噪训练语音集合内各带噪训练语音的基准噪声频谱,其中,所述纯净语音集合包括:由近场纯净语音卷积冲激响应生成的远场纯净语音;基于设备的性能,选择噪声频谱估计模型的类型,其中,所述噪声频谱估计模型的类型包括:深度神经网络、卷积神经网络、长短时记忆神经网络、前馈序列神经网络、递归神经网络中之一或至少两种的组合;提取所述各带噪训练语音的语音特征,将所述语音特征作为所述噪声频谱估计模型的输入,其中,所述语音特征至少包括:FFT频点子带、梅尔域Bark域、Fbank、MFCC、LPC、基音一种或至少两种的组合;将所述语音特征进行特征处理后,对所述噪声频谱估计模型进行深度学习训练,直至所述噪声频谱估计模型输出的估计噪声频谱向所述基准噪声频谱收敛,以用于估计远场通话的噪声,其中,所述特征处理至少包括:前后拼帧、均值归一化、方差归一化一种或至少两种的组合。

全文数据:

权利要求:

百度查询: 苏州思必驰信息科技有限公司 用于远场通话的噪声估计方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。