买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于自适应多通道线性预测的低复杂度语音去混响方法_西南科技大学;西北工业大学_202410052731.4 

申请/专利权人:西南科技大学;西北工业大学

申请日:2024-01-12

公开(公告)日:2024-04-12

公开(公告)号:CN117877503A

主分类号:G10L21/0208

分类号:G10L21/0208;G10L21/0216;G10L21/0264

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:本发明公开了一种基于自适应多通道线性预测的低复杂度语音去混响方法,为降低自适应多通道线性预测算法的计算复杂度,提出了一种基于最近克罗内克积分解的自适应算法,利用克罗内克积将线性预测滤波器的系数矩阵分解成一组低维滤波器系数矩阵和一组短的滤波器系数向量,由此建立误差信号模型、代价函数和自适应去混响算法,并求解出去混响的语音信号。仿真实验验证了所提方法的有效性和计算效率。

主权项:1.一种基于自适应多通道线性预测的低复杂度语音去混响方法,其特征在于,包括以下步骤:1、参数初始化初始化信号第0帧时间第k个频率柜的以下参数:第一加权因子γ10,k=0,第二加权因子γ20,k=0;子滤波器系数矩阵第p个子滤波器系数向量hp0,k=[η0…0]T,p=1,2,...,P0<η<1;第一相关矩阵的逆矩阵第二相关矩阵的逆矩阵其中,P为调整参数,子滤波器系数矩阵由P个L1×M大小的子滤波器系数矩阵构成,M为麦克风的数量,子滤波器系数向量的长度为L2,L1×L2=MLg,Lg为预测误差滤波器系数向量的长度,δ是正则化参数;2、对M只麦克风获得的语音信号进行采集、分帧和短时傅里叶变换,得到时频信号xmn,k,其中,m表示麦克风的编号,n和k分别表示信号帧时间和频率柜;3、从第n=1帧时间开始,获取去混响后的时频域语音信号向量3.1、计算第n帧时间的第p个子滤波器系数矩阵Gpn,k3.1.1、构建第m只麦克风的时频域延迟信号向量xmn-τ,k:xmn-τ,k=[xmn-τ,kxmn-τ-1,k…xmn-τ-Lg+1,k]T其中,参数τ是一个用于区分早期和中晚期反射声的延迟时间;3.1.2、构建多通道时频域延迟信号向量xn-τ,k: 3.1.3、计算基于第p个子滤波系数向量hpn-1,k的时频域延迟信号向量xh,pn-τ,k: 3.1.4、构建基于P个子滤波系数向量的时频域延迟信号向量xhn-τ,k: 3.1.5、构建时频域语音信号向量xn,k:xn,k=[x1n,kx2n,k...xMn,k]T;3.1.6、根据构建的时频域延迟信号向量以及时频域信号向量,计算第n帧时间的第一先验误差信号向量θ1n,k:θ1n,k=xn,k-GHn-1,kxhn-τ,k;3.1.7、计算第n帧时间的第一加权因子γ1n,k: 其中,α是一平滑因子,ε为防止分母为零的正常数;3.1.8、计算第n帧时间第一加权因子倒数q1n,k: 3.1.9、计算第n帧时间的卡尔曼增益向量khn,k: 其中,0<λ1<1是一个遗忘因子;3.1.10、计算第n帧时间的第一相关矩阵的逆矩阵 3.1.11、计算第n帧时间的子滤波器系数矩阵Gn,k: 这样,得到第n帧时间的第p个子滤波器系数矩阵Gpn,k,p=1,2,…,P;3.2、计算第n帧时间的第p个子滤波器系数向量hpn,k3.2.1、计算基于子滤波向量Gp;:,m(n-1,k的时频域延迟信号向量 其中,Gp;:,m(n-1,k,m=1,2,...,M表示第p个子滤波器系数矩阵Gpn-1,k的第m列;3.2.2、构建基于子滤波矩阵G:,mn-1,k的时频域延迟信号向量xG:,mn-τ,k: 从而得到基于子滤波矩阵Gn-1,k的多通道时频域延迟信号矩阵XGn-τ,k: 3.2.3、计算第n帧时间的第二先验误差向量θ2n,k: 其中,·*表示复数取共轭;3.2.4、计算第n帧时间的第二加权因子γ2n,k: 其中,0<λ2<1是一个遗忘因子;3.2.5、计算第n帧时间第二加权因子倒数q2n,k 3.2.6、计算第n帧时间的卡尔曼增益矩阵KGn,k: 3.2.7、计算第n帧时间的第二相关矩阵的逆矩阵 3.2.8、计算第n帧时间的子滤波器系数向量hn,k: 这样,得到第n帧时间的第p个子滤波器系数向量hpn,k,p=1,2,…,P;3.3、计算第n帧时间的滤波器系数矩阵 3.4、计算第n帧时间的时频域语音信号向量 4、对时频域语音信号向量中的每一路信号进行短时傅里叶逆变换,然后对得到的M路语音信号进行语音合成,得到去混响的语音信号。

全文数据:

权利要求:

百度查询: 西南科技大学;西北工业大学 一种基于自适应多通道线性预测的低复杂度语音去混响方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。