买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于全局注意力的安全帽配戴检测方法_北京工业大学_202210062829.9 

申请/专利权人:北京工业大学

申请日:2022-01-19

公开(公告)日:2024-03-22

公开(公告)号:CN114463677B

主分类号:G06V20/40

分类号:G06V20/40;G06N3/0464;G06N3/084;G06V10/764;G06V10/80;G06V10/82

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2022.05.27#实质审查的生效;2022.05.10#公开

摘要:一种基于全局注意力的安全帽配戴检测方法,属于安全帽配戴检测系统领域,包括步骤:1预处理,2构建全局注意力的目标框类别分类和预测框位置回归任务的神经网络,3训练神经网络,4安全帽配戴检测。本发明针对施工现场复杂,容易忽略重要特征信息,检测精度低无法达到实时性的问题,1提出了一种相关卷积聚合模块框架,以增强上下文特征信息的能力;2利用基于全局注意力的上下文信息聚合模块以增强特征融合与聚合上下文特征的能力;3通过自注意力局部特征提取模块使网络模型可以更多提取的特征中安全帽特征信息以及上下文整体信息;4在全局检测网络模块联合了全局注意力,保留高频特征信息细化网络模型。

主权项:1.一种基于全局注意力的安全帽配戴检测方法,其特征在于包括以下步骤:步骤1:构建数据集并进行预处理,利用RGB相机采集施工场地中配戴或未配戴安全帽的工人进行拍摄并利用标注工具软件进行标注制作数据集或利用已有公开数据集构造训练数据集;通过噪声模拟环境、高斯滤波去噪的方式将输入数据进行预处理,达到数据扩增与增强,利用自适应图片缩放方法对输入图像缩放到网络的输入大小进行归一化操作;步骤2:构建全局注意力的目标框类别分类和预测框位置回归任务的神经网络,所述的构建全局注意力的目标框类别分类和预测框位置回归任务的神经网络包括相关卷积聚合模块,全局检测网络模块,多尺度上下文聚合模块,自注意力局部特征提取模块,以及输出模块;所述相关卷积聚合模块用于解决多尺度金字塔特征图存在冗余特征,造成训练时的资源浪费,相关卷积聚合模块表示输入图像首先经过普通卷积后得到的特征图的通道数只有预期输出通道数的12,而剩下12则采用线性运算得到剩余预期输出通道数,最后将二者沿通道方向进行拼接即为输出特征图;因此相关卷积聚合模块将原本的乘法变成了两个乘法的加法,利用线性运算来增加特征与通道数;所述全局检测网络模块针对在深层特征提取阶段时输入图像存在图像中特征信息丢失的问题,在输出模块和全局注意力之前使用扩张因子为1,2,3,大小为3*3的空洞卷积串联组成,从而保留高频特征信息的同时能够进一步进行特征提取;安全帽占整个特征图像的18及以下时,该检测不仅关注空间上的特征信息,而且也需要关注通道维度中的特征信息,而全局注意力则沿着空间和通道两个维度进行获取重要的上下文全局特征信息;所述多尺度上下文聚合模块表示对输入图像使用三种滤波器尺寸为2、4、6,步长均为1的pooling结构和相同大小的空洞卷积,同时采用级联结构的跨阶段特征融合,将该三个以及输入特征信息,总共四个传递路径,将梯度信息进行传递;同时将空洞卷积放入多尺度上下文聚合模块中的同时在前端加入全局注意力来避免忽略输入图像特征中安全帽占总图像的18及以下的特征信息;所述的自注意力局部特征提取模块主要体现在通道上跨阶段的将局部特征提取出来,通过将梯度的变化从头到尾地集成到特征图中,将特征图拆成两个部分,其中一部分采用残差卷积结构与自注意力结合的方式跨阶段地将局部特征提取出来,自注意力机制可以让网络模型更多的关心特取特征中的某些重要信息或上下文整体信息,另一部分仅做简单的卷积操作,最后这两部分操作的结果进行通道维度的拼接;输出模块由卷积神经网络组成,用于整合整个网络层中具有类别区分性的局部信息,为了提高网络的性能,将多尺度特征信息输入到输出模块中进行检测,输出生成带有类别概率、置信度得分和包围框的最终输出向量,并使用加权非极大值抑制将冗余的目标框抑制,仅保留置信度最高的目标框,输出的特征图上会应用目标框;步骤3:模型训练:首先将预处理后的训练数据集输入到安全帽配戴检测网络的模型中进行前向传播训练;然后,将输出的预测结果和真实标签值输入到损失函数中,利用批量梯度下降法进行反向传播;然后将输出预测标签值和真实标签值、输出预测位置坐标和真实位置坐标输入到交叉熵损失函数和GIOU中,利用批量梯度下降法进行反向传播;根据梯度500次以上更新迭代模型的学习参数以获得最优的检测网络模型;加权非极大值抑制是当两个预测框重叠度即IoU超过0.6时,比较二者的置信度,将比另一个小的置信度通过函数fIoU降低,函数fIoU计算公式如下: 其中,Nconfi表示第i个预测框降低后的置信度,ci表示原有二者的置信度中值小的预测框的置信度,bi是二者的置信度中值小的预测框的整体形状,m是二者的置信度中值大的预测框的整体形状,IoUm,bi表示m、bi重叠部分是m与bi总面积的占比;s表示sigmoid函数,是利用高斯加权的方法使得该函数连续;步骤4:利用训练完成的分类网络模型进行安全帽配戴检测方法。

全文数据:

权利要求:

百度查询: 北京工业大学 一种基于全局注意力的安全帽配戴检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。