【发明授权】一种基于宽度和深度神经网络的声场景分类方法_华南理工大学_202010624687.1

导航：龙图腾网> 最新专利技术> 一种基于宽度和深度神经网络的声场景分类方法_华南理工大学_202010624687.1

申请/专利权人：华南理工大学

申请日：2020-07-02

公开（公告）日：2023-05-26

公开（公告）号：CN111723874B

主分类号：G06F18/214

分类号：G06F18/214;G06F18/213;G06F18/2431;G06N3/0464;G06N3/047;G06N3/048;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2023.05.26#授权;2020.10.27#实质审查的生效;2020.09.29#公开

摘要：本发明公开了一种基于宽度和深度神经网络的声场景分类方法，包括下列步骤：首先从声场景音频样本提取对数梅尔谱特征，并划分为训练集和测试集；再设计宽度神经网络和深度联合概率网络；将训练集各音频样本的对数梅尔谱特征作为输入，对上述两个网络进行预训练；根据预训练结果构建联合判别分类树模型，训练并调优该联合判别分类树模型；最后将测试集各音频样本的对数梅尔谱特征输入联合判别分类树模型，辨识各音频样本所对应的声场景。本发明构建的联合判别分类树模型可以补足单一网络泛化能力差、稳定性弱的缺点，并利用宽度神经网络和深度神经网络的优势互补特性提升声场景分类效果。

主权项：1.一种基于宽度和深度神经网络的声场景分类方法，其特征在于，所述的声场景分类方法包括下列步骤：S1、建立音频数据集；从声场景音频样本提取对数梅尔谱特征，并按比例划分为训练集和测试集；S2、构建宽度神经网络：建立特征映射层和增强层，特征映射层和增强层对输入样本进行特征映射，映射的特征并列组合成输入层，输入层到输出层通过权重矩阵相连接；S3、构建深度联合概率网络：分别建立一维卷积神经网络和长短时记忆网络，然后通过加权平均一维卷积神经网络和长短时记忆网络的输出概率，将一维卷积神经网络和长短时记忆网络组合成一个深度联合概率网络；S4、构建联合判别分类树模型：根据宽度神经网络和深度联合概率网络初步训练的结果构建一个联合判别分类树模型，训练并调整联合判别分类树模型的参数直到模型收敛，得到经过训练的联合判别分类树模型；所述的步骤S4过程如下：S4.1、用步骤S1中划分出的训练集对步骤S2中构建的宽度神经网络和步骤S3中构建的深度联合概率网络进行初步的训练，得到宽度神经网络的分类准确率，并对其从高到低排名，准确率越高的分类排名越靠前，深度联合概率网络得到预训练权重；S4.2、将宽度神经网络和深度联合概率网络作为分类树的节点进行分类，并设定宽度神经网络的节点数BN和深度联合概率网络节点数DN，其中，DN＝1，其中表示向下取整，n表示整个音频数据集的分类数目，a表示宽度神经网络可分出的子类数目的超参数，a取值是在范围内的整数；S4.3、构建联合判别分类树模型，该联合判别分类树模型由BN个宽度神经网络节点和DN个深度联合概率网络节点构成，所有输入样本先经过宽度神经网络节点得到准确率最高的BN×a-1类，再将其余n-BN×a-1类输入样本经过深度联合概率网络节点进行分类，过程如下：S4.3.1、联合判别分类树模型将宽度神经网络作为联合判别分类树模型的分支节点向下延伸，待分类数据经过分支节点后分类输出：宽度敏感1类、宽度敏感2类、……宽度敏感a-1类和宽度非敏感类，这里的a即S4.2中定义的a，即以分类结果组成一个分支节点的输出；若分类结果为敏感类，则直接输出结果，若为宽度非敏感类，则将待分类数据输入下一个节点；S4.3.2、若联合判别分类树模型中宽度神经网络节点的数目未达到BN，则继续步骤S4.3.1的过程向下延伸联合判别分类树模型，若联合判别分类树模型中宽度神经网络节点的数目已达到BN，则进行步骤S4.3.3；S4.3.3、联合判别分类树模型将深度联合概率网络作为分类树的最后一个节点，接收经过BN个宽度神经网络节点的最终输出的宽度非敏感类作为输入，得到最终的宽度非敏感类分类输出，至此，联合判别分类树模型中树的末梢分支得出所有分类；S4.4、训练过程中，逐渐增加分类树的两类节点数直到设定的节点数目，以平均整体准确率ACC和深度联合概率网络的损失函数Ldeep作为监督信号：式中，acci表示音频数据集的第i分类经过整个联合判别分类树模型后的准确率，n表示整个音频数据集的分类数目；S4.5、最后训练并调优联合判别分类树模型，采用网络搜索法，寻找合适的a、wc、wl值，wc和wl分别表示一维卷积神经网络和长短时记忆网络的权值，每次选定a，联合判别分类树模型的结构做出相应的变化，联合判别分类树模型中的宽度神经网络和深度联合概率网络按照联合判别分类树模型的结构变化后的输入输出数据进行对应的训练，对整个联合判别分类树模型的训练和优化应使得ACC最大且深度联合概率网络的损失使用交叉熵函数Ldeep最小，优化后得到经过训练的联合判别分类树模型；S5、声场景辨识：将测试音频样本的对数梅尔谱特征输入经过训练的联合判别分类树模型，得到各测试音频样本的声场景类别。

全文数据：

权利要求：

百度查询：华南理工大学一种基于宽度和深度神经网络的声场景分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：电连接器及连接器组件_中山得意电子有限公司_202410011497.0

下一篇：一种中药材仓储存放装置_重庆鼎立元药业有限公司_202410029088.3

相关技术

电连接器及连接器组件_中山得意电子有限公司_202410011497.0

一种中药材仓储存放装置_重庆鼎立元药业有限公司_202410029088.3

一种火电厂燃煤锅炉_内蒙古聚达发电有限责任公司_202311830876.4

地形识别结果序列在线决策方法、系统、设备及介质_华南理工大学_202311685447.2

一种充气装置_海南泽彬科技贸易有限公司_202311861590.2

一种钠离子电池用凝胶态电解质膜及其制备方法与应用_贲安能源科技江苏有限公司_202311830511.1

一种治疗骨关节炎中药复方的质量检测方法_广州白云山医药集团股份有限公司白云山制药总厂_202311765114.0

一种应用于遥感载荷的深低温模拟前端集成电路_北京空间机电研究所_202311723307.X

一种民机装配大纲生成方法和系统_中国商用飞机有限责任公司_202311821803.9

氧化铝复合纱线的成型方法及包缠装置_武汉纺织大学_202410011431.1

一种基于时间步长收缩的脉冲神经网络训练方法_电子科技大学_202410018366.5

化学强化玻璃及其制备方法与应用_清远南玻节能新材料有限公司_202311709340.7

网络相关技术

网络装置、通信系统以及用于网络装置的方法_恩智浦有限公司_202311144214.1

网络切换方法、装置、网络设备及存储介质_迈普通信技术股份有限公司_202111202292.3

网络集线装置_马自达汽车株式会社_202080043898.4

高频灵敏神经网络_拉莫特特拉维夫大学有限公司_202280050915.6

针对基于弹性复杂社交网络的僵尸网络的多层应对系统_电子科技大学长三角研究院(湖州)_202311634838.1

一种配电网络监测系统和配电网络_广东电网有限责任公司_202311699288.1

一种SRv6网络中带内网络遥测实现方法_厦门大学_202410090220.1

基于网络编程语言在异构网络中实现意图智能配置的方法_浙江工商大学_202311800429.4

一种基于最优网络选择的CPE系统及网络配置方法_深圳市迈腾电子有限公司_202410146867.1

网络拓扑模型的训练方法、网络拓扑的重构方法及装置_北京邮电大学_202210334149.8

场景相关技术

汽车及会议场景控制方法、会议场景控制装置、车载终端_重庆长安汽车股份有限公司_202410126593.X

用于生成网络模拟场景的技术_萨伯康姆有限责任公司_202410204439.X

一种场景装饰用品_余清鑫_202322421851.0

一种场景控制器_佛山市银河兰晶科技股份有限公司_202322007178.6

用于音频场景分类的音频处理装置及其方法_华为技术有限公司_201880099051.0

场景生成方法、装置、存储介质及电子装置_网易(杭州)网络有限公司_202311840643.2

大场景监控的数据优化方法及优化系统_四川新视创伟超高清科技有限公司_202410051216.4

一种可伸缩场景式立体书_青岛时代色彩文化发展股份有限公司_202322513047.5

高分遥感图像人工构建筑场景智能分类方法_宜昌黑鹿屿森科技有限公司_202410114236.1

基于大数据的交通场景解析方法及系统_智慧互通科技股份有限公司_202410055432.6

神经相关技术

神经网络的训练方法、利用神经网络进行图像处理的方法_北京百度网讯科技有限公司_202211214431.9

神经网络处理组件及多神经网络处理方法_清华大学_202210193974.0

神经形态微机电系统设备_索克普拉科学与工程公司_201980083480.3

脑神经调控手术规划系统_首都医科大学附属北京天坛医院_202410124834.7

神经网络方法和装置_三星电子株式会社_201910558887.9

脉冲神经网络加速器_中国科学技术大学_202311787213.9

神经调节蛋白多肽片段及其用途_上海泽生科技开发股份有限公司_202410049480.4

一种神经外科术后按摩护理装置_李惺_202210165567.9

一种神经内科康复训练装置_成都市第二人民医院_202322147981.X

基于ResNet神经网络的白蚁识别方法_华能澜沧江水电股份有限公司_202410020841.2

龙图腾网&IPTOP

【发明授权】一种基于宽度和深度神经网络的声场景分类方法_华南理工大学_202010624687.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务