买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于卷积神经网络和子带SRP-PHAT空间谱的声源定位方法_南京工程学院_202110059164.1 

申请/专利权人:南京工程学院

申请日:2021-01-18

公开(公告)日:2024-01-26

公开(公告)号:CN112904279B

主分类号:G01S5/22

分类号:G01S5/22;G10L21/0208;G10L21/0216;G10L25/30;G10L25/45;G06N3/0464;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.01.26#授权;2021.06.22#实质审查的生效;2021.06.04#公开

摘要:本发明公开了一种基于卷积神经网络和子带SRP‑PHAT空间谱的声源定位方法,包括:麦克风阵列采集语音信号,对采集的语音信号进行分帧和加窗的预处理得到单帧信号;计算每帧信号的子带SRP‑PHAT空间谱矩阵;将所有帧信号的子带SRP‑PHAT空间谱矩阵输入训练完成的卷积神经网络,输出语音信号属于每个方位角的概率,取概率最大的方位角作为该语音信号的声源方位角估计值。本发明可提高麦克风阵列在复杂声学环境下的声源定位性能,提高对声源空间结构、混响和噪声的泛化能力;可离线完成卷积神经网络的训练过程,将训练好的卷积神经网络保存于内存中,测试时仅需要一帧信号就可以实现实时声源定位。

主权项:1.一种基于卷积神经网络和子带SRP-PHAT空间谱的声源定位方法,其特征在于,包括如下步骤:S1、麦克风阵列采集语音信号,对采集的语音信号进行分帧和加窗的预处理得到单帧信号;S2、计算每帧信号的子带SRP-PHAT空间谱矩阵;具体包括如下步骤:S21、对每帧信号进行离散傅里叶变换: 其中,xmi,n为麦克风阵列中第m个麦克风的第i帧信号,m=1,2,…,M,M为麦克风的数目,Xmi,k是xmi,n的离散傅里叶变换,表示第m个麦克风第i帧的频域信号,k为频率点,K为离散傅里叶变换的长度,N为帧长,K=2N,DFT·表示离散傅里叶变换;S22、设计Gammatone滤波器组的脉冲响应函数: 其中,j表示Gammatone滤波器的序号;C是Gammatone滤波器的增益;t表示连续时间;a为Gammatone滤波器的阶数;表示相位;fj表示第j个Gammatone滤波器的中心频率;bj表示第j个Gammatone滤波器的衰减因子,bj计算公式为:bj=1.109ERBfjERBfj=24.74.37fj1000+1对每个Gammatone滤波器的脉冲响应函数进行离散傅里叶变换: 其中,Gjk是第j个Gammatone滤波器的频域表达式,k为频率点,K为离散傅里叶变换的长度,N为帧长,K=2N,fs表示信号采样率,DFT·表示离散傅里叶变换;S23、计算每帧信号的子带SRP-PHAT函数: 其中,Pi,j,r表示波束方向为r时,第i帧信号的第j个子带SRP-PHAT函数;M为麦克风阵列中麦克风的数目;τmnr表示声波从波束方向r传播到第m个麦克风和第n个麦克风的时间差,其计算公式为: 其中,r表示波束方向的坐标,rm表示第m个麦克风的位置坐标,rn表示第n个麦克风的位置坐标,c为空气中的声速;S24、对每帧信号的子带SRP-PHAT函数进行归一化处理: S25、将同一帧信号的所有的子带SRP-PHAT函数组合为矩阵形式,得到子带SRP-PHAT空间谱矩阵: 其中,yi表示第i帧信号的子带SRP-PHAT空间谱矩阵,J为子带个数,即Gammatone滤波器的个数,L为波束方向的个数;S3、将所有帧信号的子带SRP-PHAT空间谱矩阵输入训练完成的卷积神经网络,输出语音信号属于每个方位角的概率,取概率最大的方位角作为该语音信号的声源方位角估计值。

全文数据:

权利要求:

百度查询: 南京工程学院 基于卷积神经网络和子带SRP-PHAT空间谱的声源定位方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。