申请/专利权人:中国科学院声学研究所
申请日:2023-08-22
公开(公告)日:2024-03-22
公开(公告)号:CN117173549B
主分类号:G06V20/05
分类号:G06V20/05;G06V10/44;G06V10/32;G06V10/25;G06V10/80;G06V10/764;G06V10/766;G06V10/82;G06N3/0464;G06N3/048;G06N3/08
优先权:
专利状态码:有效-授权
法律状态:2024.03.22#授权;2023.12.22#实质审查的生效;2023.12.05#公开
摘要:本发明涉及水声信号处理领域,尤其涉及复杂场景下合成孔径声纳图像多尺度目标检测方法及系统,所述方法包括:对阵元接收的声学回波数据进行处理,得到满足尺寸要求的合成孔径声纳图像;将满足尺寸要求的合成孔径声纳图像输入预先建立和训练好的目标检测模型,实现水下多尺度目标检测;所述目标检测模型为改进的Cascade‑RCNN网络,所述改进的Cascade‑RCNN网络包括高分辨率骨干网络,所述高分辨率骨干网络采用改进的特征提取模块。本发明可对水下多尺度目标进行检测,有效降低了复杂场景下目标检测的虚警率,同时提高了目标检测的精度,为基于合成孔径声纳图像的水下目标检测任务提供了一种有效解决的手段。
主权项:1.一种复杂场景下合成孔径声纳图像多尺度目标检测方法,所述方法包括:步骤1对阵元接收的声学回波数据进行处理,得到满足尺寸要求的合成孔径声纳图像;步骤2将满足尺寸要求的合成孔径声纳图像输入预先建立和训练好的目标检测模型,实现水下多尺度目标检测;所述目标检测模型为改进的Cascade-RCNN网络,所述改进的Cascade-RCNN网络包括高分辨率骨干网络,所述高分辨率骨干网络采用改进的特征提取模块;所述改进的特征提取模块的输入为特征D,输出DBBSS为:DBBSS=D+Dsim;其中,Dsim为第一支路的输出,所述第一支路为依次连接的第一个3x3卷积层单元、SGE组件、第二个3x3卷积层单元和SIM组件,所述第一个3x3卷积层单元包括BN层和ReLU层,第二个3x3卷积层单元包括BN层;所述第一支路的处理过程具体包括:输入特征D经过第一个3x3卷积层单元,其输出特征D1为:D1=f1D,D∈ΦH×H×M其中,H×H为输入特征的尺寸,M为输入特征的通道数,Φ表示特征图,f1为第一个3x3卷积层单元;D1进入SGE组件,按通道维度将D1分为G个组,对每个组进行单独处理,SGE组件输出特征Dsge,其中第i个输出特征为: 其中,Di1为第i个卷积组,σ为激活函数,ai为第i个卷积组的注意力系数,满足下式: 其中,γ和β分别表示第i个卷积组的权重和偏置,为量化后的第i个卷积组注意力系数: ε=1e-5,ci为第i个卷积组经过全局平均池化操作得到特征系数,σc和μc均为中间变量,cj为第j个卷积组经过全局平均池化操作得到特征系数,m表示卷积组总数;Dsge经过第二个3x3卷积层单元,其输出特征D2为:D2=f2Dsge,Dsge∈ΦH×H×M其中,f2为第二个3x3卷积层单元;D2经过SIM组件的输出Dsim为: 其中,sigmoid表示S型函数,E表示SIM组件单个通道所有神经元组成的能量矩阵,其中的某个神经元t的能量函数et为: 其中,xi表示SIM组件单个通道t以外的其他神经元,wt和bt为神经元t线性变换后的权重和偏置,λ为权重系数,N为单个通道的神经元个数。
全文数据:
权利要求:
百度查询: 中国科学院声学研究所 复杂场景下合成孔径声纳图像多尺度目标检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。