买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于注意力超复数卷积组合网络的声音定位和检测方法_陕西师范大学_202311840709.8 

申请/专利权人:陕西师范大学

申请日:2023-12-28

公开(公告)日:2024-04-12

公开(公告)号:CN117877514A

主分类号:G10L25/30

分类号:G10L25/30;G06N3/0464;G06N3/045;G06N3/08;G01S5/18;G10L25/51

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:一种基于注意力超复数卷积组合网络的声音定位和检测方法,由数据集预处理、特征提取、构建注意力超复数卷积组合网络、训练注意力超复数卷积组合网络、测试注意力超复数卷积组合网络步骤组成。注意力超复数卷积组合网络通过调节参数在输入信号维度之间进行参数共享,在用户自定义域中动态适应输入信号变化来进行超复数卷积操作,在提取更深层次的多尺度局部特征的同时,减少参数冗余,避免了尺度变换造成局部信息丢失,扩张了在时间维度上深层提取全局上下文信息,提高了学习时间维度信息以及提取局部和全局特征信息。本发明具有网络稳定性强、识别准确率高、定位误差低等优点,可用于声音事件定位和检测。

主权项:1.一种基于注意力超复数卷积组合网络的声音定位和检测方法,其特征由下述步骤组成:1数据集预处理从STARSS22真实场景的空间记录数据集和synth-set数据集中提取声音信号,包含13种声音事件类别:女性演讲说话、男性演讲说话、鼓掌声、电话声、笑声、室内声音、走路的脚步声、开关门声、音乐声、乐器声、水龙头的水声、钟声、敲打声,将数据集按7:1:2划分为训练集、验证集、测试集;2提取特征采用快速傅里叶变换的方法对数据集的声音信号提取对数梅尔频谱特征和声强矢量特征;3构建注意力超复数卷积组合网络注意力超复数卷积组合网络由超复数卷积块、双流注意力块、全连接层1依次串联构成;所述的超复数卷积块由超复数自适应卷积层与批量归一化层1、修正线性单元1依次串联构成;所述的双流注意力块由尺度变换注意力网络、扩张自注意力网络、注意力融合网络构成,尺度变换注意力网络与扩张自注意力网络并联后的输出端与注意力融合网络的输入端相连;4训练注意力超复数卷积组合网络1确定目标函数目标函数包括均方误差损失函数MSE、置换性不变训练损失函数LPIT;按下式确定均方误差损失函数MSE: 其中,l表示样本的数量,l为有限的正整数,ys表示第s个样本的实际值,ys′表示第s个样本的预测值;按下式确定置换性不变训练损失函数LPIT: 其中,C表示类的数量,H表示帧的数量,Z表示轨道的数量,C、H、Z是有限正整数,γ表示在类c和帧h上的一种排列,γ∈Permch,表示排列γ的活动耦合笛卡尔到达方向的目标,表示在轨道m、类别c和帧h处的活动耦合笛卡尔到达方向;2确定评价函数评价函数包括评价函数F20°、评价函数ER20°、评价函数LECD、评价函数LRCD;按下式确定评价函数F20°: 其中,C表示类的数量,C是有限正整数,TPc表示类c的空间阈值不超过20°的真阳性,FNc表示类c的假阴性,FPc表示类c的假阳性;按下式确定评价函数ER20°: 其中,N表示参考中活动声音事件类的数量,T表示检测到但预测错误的声音事件类的数量,D和I表示剩余的假阴性和假阳性的数量;按下式确定评价函数LECD: 其中,C表示类的数量,E表示参考值的数量,C、E是有限正整数,θv表示第v个参考与预测之间的角度误差,TPc表示类c的真阳性;按下式确定评价函数LRCD: 其中TPc表示类c的真阳性,FNc表示类c的假阴性;3训练注意力超复数卷积组合网络将训练集输入到注意力超复数卷积组合网络进行训练,在训练过程中,训练参数为:注意力超复数卷积组合网络的学习率为0.001,衰减率为0.5,采用Adam优化器,迭代次数为1000,训练至目标函数收敛;将验证集输入到训练好的注意力超复数卷积组合网络,用评价函数评估注意力超复数卷积组合网络的性能;5测试注意力超复数卷积组合网络将测试集输入到训练好的注意力超复数卷积组合网络中进行测试,注意力超复数卷积组合网络输出声音事件定位和检测结果。

全文数据:

权利要求:

百度查询: 陕西师范大学 基于注意力超复数卷积组合网络的声音定位和检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。