买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于伪彩色时频图像及卷积网络的环境声音识别方法_西北工业大学_202011299987.3 

申请/专利权人:西北工业大学

申请日:2020-11-18

公开(公告)日:2021-04-13

公开(公告)号:CN112652326A

主分类号:G10L25/30(20130101)

分类号:G10L25/30(20130101);G10L21/0216(20130101);G10L21/0232(20130101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101)

优先权:

专利状态码:有效-授权

法律状态:2023.07.04#授权;2021.04.30#实质审查的生效;2021.04.13#公开

摘要:本发明涉及一种基于伪彩色时频图像及卷积网络的环境声音识别方法,该方法首先提出了一种基于模态中心频率差分的自适应变分模态分解方法,通过其对环境声音信号进行噪声去除与信号重建,并结合伪Wigner‑Vile算法生成时频图像,该时频表征算法能在降低噪声对时频图像污染的同时有效对非稳态信号进行表征;在时频图像基础上,应用伪彩色变换将灰度时频图像转换为伪彩色时频图像,进一步提升了时频表征的鲁棒特性;针对传统分类器鲁棒性较差的问题,构建了一个基于深度卷积神经网络的环境声音信号识别模型,将伪彩色时频图像输入该模型进行识别,有效提高了算法的识别精度和鲁棒性。

主权项:1.一种基于伪彩色时频图像及深度卷积神经网络的鲁棒环境声音信号识别方法,其特征在于,包括以下步骤:步骤1:计算模态数为K时各模态信号uk及相应的中心频率ωk: 其中,f表示输入的声音信号,n表示迭代次数,τ为噪声容限,λ为拉格朗日乘子,ζ为无约束变分问题,{}表示集合;步骤2:计算相邻模态信号中心频率的差分值Dk=ωk+1t-ωktk=1,...,K-14λk=Dk+1Dkk=1,...,K-25其中,Dk为中心频率差值,λk中心频率差分值。步骤3;确定最优分解个数K 满足终止条件时,最优分解个数Kbest=K-1。步骤4去除噪声分量后计算各模态信号的时频分布: 其中,hτ为高斯核函数,表示对频率的二维卷积,imfn为第n个模态分量信号,pwvdnt,f为第n个IMF的PWVD时频图。步骤5重构得到灰度时频图 步骤6引入阈值并进行归一化PWVDt,f=max[PWVDt,f-maxPWVD,-80dB]9 步骤7非线性变换得到伪彩色时频图Mcf,t=hcGt,fc=red,green,blue11其中,Mcf,t为第c个单色图像,hc为第c个单色图像的非线性映射函数;灰度图映射到hsv伪彩色时频图的三个通道所对应的非线性变换为: 参数{l2,l1,u1,u2}在三个通道下的值分别为: 得到伪彩色时频图后,利用Lancazosa=3插值算法将时频图像大小调整为512×512。步骤8:构建深度卷积神经网络。

全文数据:

权利要求:

百度查询: 西北工业大学 基于伪彩色时频图像及卷积网络的环境声音识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。