首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】适用于复杂水下环境的端到端生物目标检测方法_杭州电子科技大学_202111342981.4 

申请/专利权人:杭州电子科技大学

申请日:2021-11-12

公开(公告)日:2024-05-17

公开(公告)号:CN114092793B

主分类号:G06V20/05

分类号:G06V20/05;G06V10/25;G06V10/44;G06V10/52;G06V10/764;G06V10/82;G06T5/40;G06N3/0464;G06N3/0475;G06N3/094;G06N3/048

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2022.03.15#实质审查的生效;2022.02.25#公开

摘要:本发明公开一种适用于复杂水下环境的端到端生物目标检测方法。包括以下步骤:S1,使用的水下数据集由水下机器人抓取,划分为训练集和测试集,先将水下图像通过上采样或下采样统一尺寸,然后进行归一化;S2,从已有水下数据集中挑选出成像质量较差的水下图像,通过直方图均衡的方法增强图像,形成增强网络的数据集;S3,将较差的水下图像作为增强网络的输入,增强后的图像作为真实值,训练水下图像增强网络;S4,使用全卷积网络提取经过网络增强后的水下训练集图像的特征,然后使用一阶段检测网络对水下图像的特征图进行目标识别和分类,得到已训练完的模型;S5,将处理后的水下测试集送入已经训练完的模型中测试。

主权项:1.一种适用于复杂水下环境的端到端生物目标检测方法,其特征在于,包括以下步骤:S1,使用的水下数据集由水下机器人抓取,划分为训练集和测试集,水下数据集包括海参、海胆、扇贝和海星的水下目标,其中20%作为测试集,80%作为训练集,先将水下图像通过上采样或下采样统一尺寸,然后进行归一化;S2,从已有水下数据集中挑选出成像质量较差的水下图像,通过直方图均衡的方法增强图像,形成增强网络的数据集;S3,将较差的水下图像作为增强网络的输入,增强后的图像作为真实值,训练水下图像增强网络;S4,使用全卷积网络提取经过网络增强后的水下训练集图像的特征,然后使用一阶段检测网络对水下图像的特征图进行目标识别和分类,得到已训练完的模型;S5,将处理后的水下测试集送入已经训练完的模型中测试;S1进一步包括:假设xi是图像像素点值,minxi和maxxi分别表示图像像素的最大值和最小值,归一化后的水下图像为: S2进一步包括:统计图像中各灰度级的像素数目nk,k的范围为[0,L-1],图像直方图初始概率密度函数为prk,则变换函数为: 通过变换函数即可得到均衡化后的概率密度函数pSk,应用到实际图像中获取成对的水下数据集;S3进一步包括:S301,使用生成对抗网络做图像增强,将经过质量较差水下图像的X输入到生成网络之中,每一层的卷积模块中包含了卷积,批处理归一化和ReLu三个过程,输入的X经过N个kernel_size为3*3的卷积核,得到输出N表示总的通道数,i表示第i个通道,提取到的特征为: 式中表示卷积操作,一共通过5个卷积层,第3个卷积层的输出和第五个卷积层的输出叠加;S302,卷积层后的数据进一步处理,为了使模型易于收敛,网络训练过程更加稳定,在卷积之后加入了批归一化,通过计算每个批次中数据的均值和方差,假设一个小批次中有Nm个样本,那么定义输出为其中Fn表示第n个样本对应的卷积输出,在每个小批次中,对中的数据进行批归一化得到表示为: 其中,Fnk,l表示批归一化之前的样本对应的卷积层输出中,第k个通道中的第l个元素,即为批归一化之后的数据,αk和βk为可训练的对应于第k个通道的参数,ε是一个很小的数,防止除数为0,E.为求均值操作,Var.表示求方差操作;S303,之后使用激活函数ReLU对中每一个元素进行非线性激活得到若输入为则经过ReLU之后对应的输出表示为: S304,将生成网络生成的图像输入对抗网络中判别生成网络的输出是否达到增强的目的,判别器由3个简单的卷积层组成,每个卷积层也有卷积,批处理归一化和ReLu三个过程;S305,为了保证结果有一个好的视觉和定量的成绩,损失函数由对抗损失L1和特征损失L2两部分组成;对抗损失是为了让生成器生成更好效果的输出,假设D表示判别器网络,xr和xf分别是从真实分布和伪分布中的采样值,则对抗损失为: 特征损失是输入和生成图像分别通过VGG16的卷积层中抽取的特征数据的欧式距离,假设IL表示偏色的输入,GIL表示生成网络的输出,φi表示从特征提取网络中获得的特征图,i表示它的第i个池化后的特征图,Wi,Hi是提取的特征图的维数,则特征损失为: S4进一步包括:S401,特征提取层使用Resnet50模块,Resnet50网络结构首先对输入做了卷积操作,之后包含4个残差块,一共50次卷积操作,各个残差块有跳跃连接解决梯度消散或爆炸的问题,假设残差块的输入是X,卷尺网络的输出为H,则输出为:Y=HX+XS402,低层的特征语义信息比较少,但是目标位置准确;而高层的特征语义信息比较丰富,但是目标位置比较粗略,首先采用自顶向下的路径,将高层的强语义特征传递下来,然后再添加一个自底向上的路径,对特征图进行补充,将低层的强定位特征传递上去;S5进一步包括:S501,检测模块主要由两个子网络:分类子网络和边框回归子网络组成,分类子网络为每个锚点预测每个空间位置的目标存在概率及类别概率,这个子网络是一个简单的全卷积模块,由四个全卷积层构成,此子网络的参数在所有不同尺度的特征图之间共享,最后使用sidmoid进行分类,假设pi为经网络判断当前第i个锚点可能为目标的概率,为第i个锚点标记为目标的概率,则分类损失函数为: S502,与目标分类子网络并行,使用另一个简单的全卷机网络将每个锚框的偏移量回归到附近的真实值,目标分类子网络和边框回归子网络虽然结构相同,但使用参数不同,假设ti为正样本预测框相对于锚点的偏移量,为真实值相对于锚点的偏移量,则边框回归损失为:

全文数据:

权利要求:

百度查询: 杭州电子科技大学 适用于复杂水下环境的端到端生物目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。