【发明授权】一种基于掩膜映射和混合空洞卷积网络的语音增强方法_东南大学_202111192259.7

导航：龙图腾网> 最新专利技术> 一种基于掩膜映射和混合空洞卷积网络的语音增强方法_东南大学_202111192259.7

申请/专利权人：东南大学

申请日：2021-10-13

公开（公告）日：2024-04-09

公开（公告）号：CN113936681B

主分类号：G10L21/0208

分类号：G10L21/0208;G10L21/0264;G10L25/30;G06F17/16;G06F18/214;G06N3/0464;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2022.02.01#实质审查的生效;2022.01.14#公开

摘要：本发明公开了一种基于掩膜映射和混合空洞卷积网络的语音增强方法。本方法在训练阶段，预处理后的含噪语音信号进行短时傅里叶变换，得到对数功率谱，同时计算理想比值掩膜。将若干帧的对数功率谱组成二维对数功率图谱，作为混合空洞卷积网络的输入特征，将对应帧的理想比值掩膜组成二维理想比值掩膜矩阵，作为训练目标，对混合空洞卷积网络进行训练，得到混合空洞卷积网络回归器；测试过程中，利用训练好的混合空洞卷积网络回归器，将含噪测试语音的二维对数功率图谱映射为二维估计比值掩膜矩阵，结合含噪语音的对数功率谱和相位信息，进行逆变换得到重构的语音信号，实现语音增强。本发明提高了语音的感知质量，且算法兼具鲁棒性与泛化性。

主权项：1.一种基于掩膜映射和混合空洞卷积网络的语音增强方法，其特征在于，包括以下步骤：步骤1、在纯净语音信号中加入不同类型、不同信噪比的噪声，得到含噪的训练语音信号；步骤2、对步骤1得到的含噪训练语音信号进行预处理，包括归一化、分帧、加窗，得到分帧后的含噪语音信号；步骤3、对步骤2的各帧语音信号进行短时傅里叶变换，提取各帧含噪语音信号的对数功率谱，将若干帧对数功率谱组成二维对数功率图谱，同时根据纯净语音的对数功率谱和噪声的对数功率谱，计算理想比值掩膜，将若干帧的理想比值掩膜组成二维理想比值掩膜矩阵；步骤4、将步骤3得到的二维对数功率图谱，作为混合空洞卷积网络的输入特征，将对应帧的二维理想比值掩膜矩阵，作为训练目标，基于二维理想比值掩膜矩阵和网络输出的实际二维估计比值掩膜矩阵之间的损失函数对网络权重的偏导，训练混合空洞卷积网络；步骤5、对不同声学环境下的含噪测试语音信号进行预处理，并计算各帧语音信号的短时傅里叶变换，提取各帧语音信号的对数功率谱和相位谱，并将若干帧对数功率谱组成二维对数功率图谱；步骤6、将步骤5的二维对数功率图谱，作为步骤4训练好的混合空洞卷积网络的输入特征参数，计算二维估计比值掩膜矩阵；步骤7、将步骤6得到的二维估计比值掩膜矩阵和步骤5的各帧语音信号对数功率谱进行相乘，得到修正后的对数功率谱，并结合步骤5的各帧相位谱，进行短时逆傅里叶变换，得到增强后的时域语音信号。

全文数据：

权利要求：

百度查询：东南大学一种基于掩膜映射和混合空洞卷积网络的语音增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种园林绿化便携铲_马丽丽_202322375183.2

下一篇：一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

相关技术

一种园林绿化便携铲_马丽丽_202322375183.2

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种勺式高精度防堵塞药剂计量添加装置_浙江威尔博环保科技有限公司_202322743530.2

龙图腾网&IPTOP

【发明授权】一种基于掩膜映射和混合空洞卷积网络的语音增强方法_东南大学_202111192259.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务