买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于深度学习的蓝藻图像识别方法_河海大学_202210318599.8 

申请/专利权人:河海大学

申请日:2022-03-29

公开(公告)日:2024-04-16

公开(公告)号:CN114722928B

主分类号:G06V10/764

分类号:G06V10/764;G06V10/40;G06V10/56;G06V10/82;G06N3/045;G06N3/0464;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.07.26#实质审查的生效;2022.07.08#公开

摘要:本发明公开一种基于深度学习的蓝藻图像识别方法,利用基于双线性网络改进的ResNet16进行粗粒度的特征提取,得到蓝藻图像的粗粒度特征图;在ResNet16后加入卷积模块的注意力机制模块,通过学习权重获得图像中重要的蓝藻特征信息,得到增强的细粒度特征;将双线性模型中A、B两个特征提取函数提取的蓝藻细粒度图像特征进行双线性融合,得到M×N维的矩阵b;对矩阵b进行求和池化得到矩阵ξ,并对矩阵ξ进行矢量展开重组为特征向量x,并使用分类函数对双线性向量x进行预测。本发明充分发挥了双线性模型和注意力机制对细粒度图像的特征提取优势,达到了较高的蓝藻识别精度,增强了网络模型的鲁棒性,有效地完成了蓝藻图像的识别。

主权项:1.一种基于深度学习的蓝藻图像识别方法,其特征在于,包括以下步骤:1利用基于双线性网络改进的ResNet16进行粗粒度的特征提取,得到蓝藻图像的粗粒度特征图;2在ResNet16后加入卷积模块的注意力机制模块,通过学习权重获得图像中重要的蓝藻特征信息,得到增强的细粒度特征;3将双线性模型中A、B两个特征提取函数提取的蓝藻细粒度图像特征进行双线性融合,得到M×N维的矩阵b;4对步骤3中得到的矩阵b进行求和池化得到矩阵ξ,并对矩阵ξ进行矢量展开重组为特征向量x,并使用分类函数对双线性向量x进行预测;在步骤1中,使用基于双线性网络的改进ResNet16进行特征提取得到蓝藻图像的粗粒度特征图,相较于原型网络ResNet18,改进的ResNet16增大了卷积层的卷积核数,减少了部分卷积层;改进的ResNet16网络是在原型网络ResNet18的基础上,将第一层卷积层的卷积核数由64改为128,减少了ResNet18中最大池化操作后的卷积层数,由原来的4层减少为2层;在改进的ResNet16中,采用ReLU激活函数简化计算,使用步长为2的卷积核作下采样,卷积层的卷积核大小为3×3;残差单元表示为:yl=hxl+Fxl,Wl,xl+1=fyl;其中xl和xl+1分别表示的是第l个残差单元的输入和输出,每个残差单元一般包含多层结构;F是残差函数,表示学习到的残差,而hxl=xl表示恒等映射,f是ReLU激活函数;在步骤2中,将获取的粗粒度特征图输入注意力机制模块的通道注意力模块和空间注意力模块分别获得通道注意力和空间注意力,并将获得的通道注意力和空间注意力分别加权到步骤1输出的粗粒度特征图,得到新的细粒度特征图,具体步骤如下:2.1将步骤1中输出的大小为H×W×C的粗粒度特征图F分别经过基于宽度和高度的全局最大池化和全局平均池化,得到两个1×1×C的通道注意力特征图,接着,再将它们分别送入一个两层的多层感知器;而后,将多层感知器输出的特征进行基于元素层面的加和操作,再经过sigmoid激活操作,生成最终的通道注意力特征M_c;最后将通道注意力特征M_c和输入蓝藻图像的粗粒度特征图F做元素层面乘法操作,生成空间注意力模块需要的输入特征;2.2将通道注意力模块输出的蓝藻图像的粗粒度特征图F作为空间注意力模块的输入特征图;首先做一个基于通道的全局最大池化和全局平均池化,得到两个H×W×1的特征图,然后将这2个特征图基于通道做通道拼接操作;然后经过一个7×7卷积操作,降维为1个通道,即H×W×1;再经过sigmoid生成空间注意力特征,即M_s;最后将该空间注意力特征M_s和该模块的输入特征做乘法,得到生成的特征。

全文数据:

权利要求:

百度查询: 河海大学 一种基于深度学习的蓝藻图像识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。