买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于联合字典学习和稀疏表示的骨导语音增强方法_中国科学技术大学_202010810196.6 

申请/专利权人:中国科学技术大学

申请日:2020-08-13

公开(公告)日:2024-03-29

公开(公告)号:CN111968627B

主分类号:G10L15/06

分类号:G10L15/06;G10L21/02;G10L21/0224;G10L21/0316;G10L25/18;G10L25/27

优先权:

专利状态码:有效-授权

法律状态:2024.03.29#授权;2020.12.08#实质审查的生效;2020.11.20#公开

摘要:本发明提供一种基于联合字典学习和稀疏表示的骨导语音增强方法。训练阶段,在室内无噪环境中,用骨导麦克风和气导麦克风组成的异型双麦克风阵列同步采集训练语音,构建骨导语音和气导语音的联合训练集;对骨导语音和气导语音的训练信号做短时傅里叶逆变换得到时频谱幅度,在时频谱上学习骨导语音和气导语音的联合语音字典。检测阶段,对于骨导语音进行短时傅里叶变换得到时频谱幅度和相位,将幅度在联合语音字典的骨导语音子字典上进行投影,用得到的稀疏表示系数与联合语音字典的气导语音子字典一起重建气导语音时频谱幅度,并提供两种方法用于增强骨导语音时频谱,最后做短时傅里叶逆变换,得到增强后的骨导语音时域信号,从而提高语音清晰度。

主权项:1.一种基于联合字典学习和稀疏表示的骨导语音增强方法,其特征在于,包括:步骤1、训练阶段步骤11、在室内无噪环境下用骨导麦克风和空气传导麦克风简称气导麦克风组成的异型双麦克风阵列同步采集训练语音,构建骨导语音和气导语音的联合训练集其中xtrt和ytrt分别为骨导麦克风和气导麦克风同步采集的说话人语音;步骤12、对骨导麦克风和气导麦克风同步采集的骨导语音和气导语音分别做短时傅里叶变换,得到时频域上的复数谱简称时频谱,即:Xtrtf,f=STFT{xtrt}Ytrtf,f=STFT{ytrt}其中,STFT{}为短时傅里叶变换算子,tf和f分别为时间帧和频率点,|Xtrtf,f|为Xtrtf,f的幅度,|Ytrtf,f|为Ytrtf,f的幅度;步骤13、将|Xtrtf,f|和|Ytrtf,f|组织起来,形成联合矩阵通过稀疏约束学习算法学习出骨导语音和气导语音时频谱幅度的对应关系和稀疏特征,得到反映骨导语音和气导语音时频谱幅度特征关系的联合语音字典字典的学习过程如下: 其中,DX和DY分别是骨导语音xtrt和气导语音ytrt时频谱幅度的子字典;C是骨导语音和气导语音的联合稀疏表示系数,联合稀疏表示系数为矩阵形式,cg为C的第g列;q为稀疏约束,代表的是弗罗贝尼乌斯范数,||·||1代表的是1-范数;步骤2、检测阶段步骤21、对骨导语音xt做短时傅里叶变换,得到其时频域谱,即:Xtf,f=STFT{xt}其中,STFT{}为短时傅里叶变换算子,tf和f分别为时间帧和频率点,|Xtf,f|为Xtf,f的幅度,Φtf,f为Xtf,f的相位,保留相位信息留待后面进一步使用;步骤22,把骨导语音的时频谱幅度|Xtf,f|在联合字典中的骨导语音子字典上进行投影,获得投影的骨导语音的稀疏表示系数,计算如下: 其中,E为|Xtf,f|在骨导语音子字典DX上的候选稀疏表示系数,E*为通过上述式子从候选稀疏表示系数中选出的最优稀疏表示系数,稀疏表示系数为矩阵形式,eg分别为E的第g列;q为稀疏约束,代表的是弗罗贝尼乌斯范数,||·||1代表的是1-范数;步骤23,对气导语音时频谱幅度的估计;利用稀疏表示系数E*与联合语音字典的气导语音子字典DY一起,重建出气导语音时频谱幅度,如下式所示: 步骤24,对骨导语音时频谱幅度的增强;首先,计算估计的气导语音时频谱幅度与骨导语音时频谱幅度的差,如下式所示: 其次,对于每一时频点tf,f,分别将差Δtf,f与骨导语音时频谱幅度α|Xtf,f|进行比较,其中0<α<1,如果Δtf,f≥α|Xtf,f|,则骨导语音时频谱幅度的增强按下式给出: 如果Δtf,f<α|Xtf,f|,则骨导语音时频谱幅度的增强按下式给出: 当然也可以采用如下的简单方法来增强骨导语音时频谱幅度: 最后结合待检测骨导语音时频谱Xtf,f的相位Φtf,f,计算增强后的骨导语音时频谱,如下式所示: 步骤25,对增强后的骨导语音时频谱进行短时傅里叶逆变换,获得增强后的骨导语音时域语音信号 其中ISTFT{}为短时傅里叶逆变换算子。

全文数据:

权利要求:

百度查询: 中国科学技术大学 一种基于联合字典学习和稀疏表示的骨导语音增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。