申请/专利权人:佳源科技股份有限公司
申请日:2022-03-28
公开(公告)日:2024-04-26
公开(公告)号:CN114782986B
主分类号:G06V40/10
分类号:G06V40/10;G06V10/764;G06V10/82;G06N3/0464;G06N3/045;G06N3/048;G06N3/09
优先权:
专利状态码:有效-授权
法律状态:2024.04.26#授权;2022.08.09#实质审查的生效;2022.07.22#公开
摘要:本发明公开基于深度学习的安全帽佩戴检测方法、装置、设备及介质,该方法包括如下步骤:获取待检测的人员图像;将所述待检测的人员图像输入已训练的多尺度感知网络模型中;所述多尺度感知网络模型包括三个并行的CNN子网络,三个所述CNN子网络的结构仅卷积核的尺寸不同,每个CNN子网均包括用于提取全局特征的通道注意力模块和用于提取局部特征的空间注意力模块;输出所述待检测的人员图像分类结果,所述分类结果包括未佩戴安全帽和佩戴安全帽。本发明在变电站的复杂场景有很高的检出率和很低的误检率,且使用深度学习的方法可以减少之前人工监控的操作,降低人工成本,并确保安全帽检测的实时性。
主权项:1.基于深度学习的安全帽佩戴检测方法,其特征在于,包括如下步骤:获取待检测的人员图像;将所述待检测的人员图像输入已训练的多尺度感知网络模型中;所述多尺度感知网络模型包括三个并行的CNN子网络,三个所述CNN子网络的结构仅卷积核的尺寸不同,每个CNN子网均包括用于提取全局特征的通道注意力模块和用于提取局部特征的空间注意力模块,所述通道注意力模块,具体处理步骤:使用卷积核得到特征图Xg;使用全局池化来消除Xg在图像宽高维度的影响,全局池化Fgp定义如公式1: 其中,Hg和Wg表示特征图Xg的宽和高,xc是Xg的一个通道特征图,zc是xc平均池化后的结果,每一个通道特征图的结果zc连接在得到一个向量Zc,使用平均池化的操作可以降低空间信息的影响,针对Zc使用两个全连接来进一步提取特征和权重,具体如公式2: 其中,W1和W2是两个全连接层的权重,b1和b2是对应的偏置,δ1是激活函数ReLU,δ2是Sigmoid激活函数,完成特征图的校准,具体如公式: 其中,是通道注意力模块最终输出的特征图;所述空间注意力模块,具体处理步骤:使用卷积核获得特征图Xg使用全局卷积Zsi,j降低Xg的信道信息影响,全局卷积的公式如下: 其中,i∈Hg,j∈Wg,FgcXg是全局卷积函数,K是全局卷积的卷积核,K的尺寸是m×n×Cg,b是偏置,使用空洞卷积Us来细化单通道空间特征图,公式如下:Us=δ2K2*δ1K1*Zs+b1+b25使用两组不同的空洞卷积来扩大空间感受野,空洞卷积核的权重分别是K1和K2,偏移分别是b1和b2,δ1是ReLU激活函数,δ2是Sigmoid激活函数,*是空洞卷积操作,增强特征图的空间特性,公式如下7: 式中,是空间注意力模块最终输出的特征图,exp是指数运算;输出所述待检测的人员图像分类结果,所述分类结果包括未佩戴安全帽和佩戴安全帽。
全文数据:
权利要求:
百度查询: 佳源科技股份有限公司 基于深度学习的安全帽佩戴检测方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。