买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于集成学习的神经网络噪声源分类的方法及装置_杭州爱华仪器有限公司_202410116989.6 

申请/专利权人:杭州爱华仪器有限公司

申请日:2024-01-29

公开(公告)日:2024-04-16

公开(公告)号:CN117690451B

主分类号:G10L25/18

分类号:G10L25/18;G10L25/30;G10L25/51;G10L21/0232;G06N3/0442;G06N3/0464;G06N3/098

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2024.03.29#实质审查的生效;2024.03.12#公开

摘要:本申请涉及环境噪声识别技术领域,解决了现有技术中因噪声类别过多而导致的神经网络模型难以训练以及准确率难以得到提升的问题,公开了一种基于集成学习的神经网络噪声源分类的方法及装置,该方法先通过初级噪声分类模型对噪声进行分大类,根据所述第一推理结果和预设的次级噪声分类模型选择策略匹配出次级噪声分类模型,再利用大类对应的次级噪声分类模型对噪声进行分小类,最后结合两次分类结果得出最终的分类结果,通过设置多个模型有效的降低了每一个模型中的类别,进而有效的降低了模型训练的难度,同时大大的提高了模型预测的准确率。

主权项:1.一种基于集成学习的神经网络噪声源分类的方法,其特征在于,包括:将噪声音频分为若干大类对第一卷积神经网络模型进行训练以得到初级噪声分类模型,将每一大类中的细分噪声音频单独对第二卷积神经网络模型进行训练以得到若干个次级噪声分类模型,所述第一卷积神经网络模型和第二卷积神经网络模型均依次包括:二维conv层、特征提取模块、二维DepthwiseConv层、mean池化层、二维conv层、池化层、Reshape层、二维conv层和Softmax层,其中,所述特征提取模块包括4个TransitionBlock块和12个NormalBlock块;获取噪声音频;将所述噪声音频经过频谱转换成log-mel特征矢量;将所述log-mel特征矢量输入到初级噪声分类模型中,以推理得出第一推理结果,其中,所述第一推理结果包括初级噪声类别与第一概率;根据所述第一推理结果和预设的次级噪声分类模型选择策略匹配出次级噪声分类模型;将所述log-mel特征矢量输入到次级噪声分类模型中,以推理得出第二推理结果,其中,所述第二推理结果包括次级噪声类别与第二概率;根据第一推理结果和第二推理结果得出所述噪声音频的最终类别与概率;其中,预设的次级噪声分类模型选择策略包括:从第一推理结果中选出第一概率最大的初级噪声类别记为P(A);将第一推理结果中除P(A)以外的初级噪声类别记为P(i);计算P(A)与P(i)的差值X;将所述差值X与阈值M进行比较,其中,0.05≤M≤0.15,若存在差值X小于阈值M的情况,则进一步判断差值X小于阈值M的P(i)的数量是否大于预设值N,其中,1≤N≤4,若判断结果为否,则将差值X对应的P(i)以及P(A)对应的次级噪声分类模型作为匹配出的次级噪声分类模型,若判断结果为是,则将差值X对应的P(i)中概率排名靠前的N个P(i)以及P(A)对应的次级噪声分类模型作为匹配出的次级噪声分类模型。

全文数据:

权利要求:

百度查询: 杭州爱华仪器有限公司 一种基于集成学习的神经网络噪声源分类的方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。