【发明授权】频带增益模型的训练方法及用于车载场景的语音降噪方法_清华大学苏州汽车研究院(相城)_202110985541.4

申请/专利权人：清华大学苏州汽车研究院(相城)

申请日：2021-08-26

公开（公告）日：2024-04-09

公开（公告）号：CN113782011B

主分类号：G10L15/06

分类号：G10L15/06;G10L15/16;G10L15/20;G10L21/0208;G10L25/24;G10L25/30;G06N3/048;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2021.12.28#实质审查的生效;2021.12.10#公开

摘要：本发明公开了频带增益模型的训练方法及用于车载场景的语音降噪方法，训练方法包括以下步骤：将纯语音信号和纯噪声信号分别分帧后，并逐帧按照频率进行分带，得到纯语音频带和纯噪声频带，将纯语音信号和纯噪声信号混合后，对其进行分帧处理，并逐帧按照相应频率进行分带，得到带噪语音频带，根据各纯噪声、纯语音、带噪语音频带的能量，以得到纯噪声频带相应的对数谱、增益期望值和特征值；将特征值输入频带增益模型，以输出各带噪语音频带对应的增益值，并利用增益期望值以及对数谱作为标签进行神经网络训练，以实现对所述频带增益模型的参数优化。本发明提供的训练方法及语音降噪方法对带噪语音进行降噪的同时保证语音识别系统的鲁棒性。

主权项：1.一种频带增益模型的训练方法，其特征在于，所述频带增益模型基于神经网络模型，采用SRU架构，所述频带增益模型能够依据带噪语音信号的特征值对其多个频段的信号进行降噪增益；所述频带增益模型包括第一SRU层、第二SRU层、第三SRU层、第四SRU层、第五SRU层、第一全连接层和第二全连接层，所述特征值输入至所述第一SRU层，使用tanh激活函数处理后输出；所述特征值输入至所述第一全连接层，使用tanh激活函数处理后输出至所述第二SRU层，在所述第二SRU层，使用Relu激活函数处理后输出至所述第三SRU层；在所述第三SRU层中，对所述第一全连接层的输出和第二SRU层的输出使用Relu激活函数处理后输出；在所述第四SRU层中，对所述第一SRU层的输出和第三SRU层的输出使用Relu激活函数处理后输出；在所述第五SRU层中，对所述第一SRU层的输出、第三SRU层的输出和第四SRU层的输出使用Relu激活函数处理后输出；在所述第二全连接层中，对所述第五SRU层的输出使用sigmoid激活函数处理后输出，以得到所述带噪语音频带的增益值；所述训练方法包括以下步骤：S1、将纯语音信号和纯噪声信号分别分帧后，并逐帧按照频率进行分带，得到n个纯语音频带和n个纯噪声频带，计算各纯语音频带和各纯噪声频带的能量；将所述纯语音信号和纯噪声信号混合后，得到带噪语音信号，对其进行分帧处理，并逐帧按照相应频率进行分带，得到n个带噪语音频带，计算各带噪语音频带的能量；根据各纯噪声频带的能量，以得到所述纯噪声频带相应的n个对数谱；根据所述纯语音频带的能量与相应频段的所述带噪语音频带的能量的比值，以得到n个增益期望值；根据各带噪语音频带的能量，得到相应的对数功率谱，并通过反离散余弦变换得到n个MFCC系数，以作为所述带噪语音频带相应的n个特征值；S2、将所述n个特征值输入所述频带增益模型，以输出各带噪语音频带对应的增益值，并利用所述增益期望值以及所述对数谱作为标签进行神经网络训练，以实现对所述频带增益模型的参数优化。

全文数据：

权利要求：

百度查询：清华大学苏州汽车研究院(相城) 频带增益模型的训练方法及用于车载场景的语音降噪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种文旦柚栽培用的施肥装置_莆田冠腾科技有限公司_202322446584.2

下一篇：一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

相关技术

一种文旦柚栽培用的施肥装置_莆田冠腾科技有限公司_202322446584.2

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种环形导轨间歇循环通电装置_东莞市臻域自动化设备有限公司_202322566793.0

一种注塑机新型泵罩门板_恩格尔注塑机械(常州)有限公司_202322227242.1

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

用于高压柜体的固定防护装置_江苏贯中电气有限公司_202322341188.3

一种具有服药求助警报功能的药丸储存项链_杨洁_202322091839.8

方法相关技术

通信方法及装置_华为技术有限公司_202010617172.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

信息处理方法_丰田自动车株式会社_202311358127.6

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

冰箱及其控制方法_LG电子株式会社_202080061858.2

冰箱及其控制方法_重庆海尔制冷电器有限公司_202211295888.7

用于相关技术

用于换热器的导流结构_天华院(南京)智能制造有限公司_202322658130.1

用于喷码机的水冷装置_武汉远平宏大信息技术有限公司_202321987550.8

用于处理食物的锯条_邓志明_201510441464.0

用于伤口闭合的装置_伊西康有限责任公司_202111149298.9

用于支付的用户接口_苹果公司_202211285112.7

用于车辆的制动系统和用于运行车辆的制动系统的方法_罗伯特·博世有限公司_202010504664.7

用于处理柔性衬底的方法和用于实施方法的真空处理系统_埃尔福利翁有限公司_202080079254.0

用于协调用于基础设施建模的代码的技术_本特利系统有限公司_201880058897.X

用于运行风扇的方法和用于执行该方法的系统_施乐百有限公司_202280059160.6

用于运动或活动的服装_香港教育大学_202211489783.5

训练相关技术

警务政策多功能训练装置_南京软明信息科技有限公司_202322181392.3

用于胸腔穿刺训练的服装_中日友好医院(中日友好临床医学研究所)_202322044819.5

一种足球训练辅助装置_山西铁道职业技术学院_202420196121.7

一种步态康复训练机器人_苏州大学_201811359142.1

一种腿部恢复护理训练装置_鄂俊_202321448389.7

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

一种训练足球反弹率测量装置_天水师范学院_202410145976.1

一种骨关节运动康复训练装置_山东大学齐鲁医院_202322393150.0

图像处理方法、图像处理模型和训练方法_北京百度网讯科技有限公司_202310251906.X

视觉问答模型训练、视觉问答方法和装置_文思海辉元辉科技(大连)有限公司_202110753076.1

龙图腾网&IPTOP

【发明授权】频带增益模型的训练方法及用于车载场景的语音降噪方法_清华大学苏州汽车研究院(相城)_202110985541.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务