买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于改进YOLOv5的桥梁设计图的子图布局识别方法_安徽省交通规划设计研究总院股份有限公司_202310906376.8 

申请/专利权人:安徽省交通规划设计研究总院股份有限公司

申请日:2023-07-21

公开(公告)日:2024-04-09

公开(公告)号:CN116978052B

主分类号:G06V30/422

分类号:G06V30/422;G06V30/146;G06V30/16;G06V30/18;G06V30/19;G06F30/13;G06F30/20;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2023.11.17#实质审查的生效;2023.10.31#公开

摘要:本发明涉及基于改进YOLOv5的桥梁设计图的子图布局识别方法,与现有技术相比解决了难以针对桥梁设计图进行子图识别的缺陷。本发明包括以下步骤:桥梁设计图的获取及预处理;构建改进的YOLOv5模型;改进的YOLOv5模型的训练;待识别桥梁设计图的获取;桥梁设计图的子图布局识别结果的获得。本发明利用已标注的桥梁设计图数据集对改进的网络进行训练和测试,通过在原YOLOv5网络中添加CA注意力机制,针对性地提取感兴趣区域的图像特征,同时引入可转换的空洞卷积SAConv,自适应扩大感受野范围并进行卷积计算,提高特征提取能力,从而减少关键信息的漏检,提高布局识别精度。

主权项:1.一种基于改进YOLOv5的桥梁设计图的子图布局识别方法,其特征在于,包括以下步骤:11桥梁设计图的获取及预处理:获取标注的桥梁设计图数据集,并对数据集进行预处理;12构建改进的YOLOv5模型:对YOLOv5模型进行改进,构建出改进的YOLOv5模型;所述构建改进的YOLOv5模型包括以下步骤:121设定改进的YOLOv5模型包括输入端Input模块、主干网络Backbone模块、颈部Neck模块、输出端Head模块;输入端Input模块使用Mosaic数据增强、自适应初始锚框计算、图片缩放对图像进行预处理;主干网络Backbone模块采用Focus下采样、改进CSP结构、SPPF池化金字塔结构提取图像的特征信息;颈部Neck模块采用FPN+PAN的特征金字塔结构,实现不同尺寸目标特征信息的传递,解决多尺度问题;输出端Head模块采用二元交叉熵损失BCELoss和CIoULoss来计算分类、定位和置信度损失,并通过非极大值抑制NMS提高网络预测的准确度;122在颈部Neck模块的第一个卷积层后面添加CA注意力机制模块;123将颈部Neck模块的前两个标准3x3卷积替换为可转换的空洞卷积SAConv;13改进的YOLOv5模型的训练:将预处理后的桥梁设计图数据集输入改进的YOLOv5模型进行训练;所述改进的YOLOv5模型的训练包括以下步骤:131设置训练参数即网格训练参数,网格训练参数包括迭代次数、批量大小、初始学习率、动量和权重衰减系数,其中,迭代次数epoch为100,批量大小batch-size为8,初始学习率lr0为0.01,动量momentum为0.937,权重衰减系数weight_decay为0.0005;132设置YOLOv5网络模型参数即数据增强参数,数据增强参数包括色调hsv_h、饱和度hsv_s、亮度hsv_v、旋转角度degrees、上下翻转概率flipud和左右翻转概率fliplr,其中,hsv_h为0.015,hsv_s为0.7,hsv_v为0.4,degrees为0,flipud为0,fliplr为0.5;133将预处理后的桥梁设计图数据集输入改进的YOLOv5模型;134YOLOv5模型的输入端Input模块对预处理后的桥梁设计图数据集中的数据进行随机缩放和拼接,得到训练图像;135输入端Input模块输出的训练图像进入主干网络Backbone模块,主干网络Backbone模块输出训练图像的特征信息;136训练图像的特征信息进入颈部Neck模块的特征金字塔结构,特征金字塔结构的第一个卷积层输出尺寸为C*H*W的Input特征图,Input特征图进入CA注意力机制模块;137CA注意力机制模块的训练:1371CA注意力机制模块对尺寸为C*H*W的Input特征图分别沿着水平坐标X方向和垂直坐标Y方向进行平均池化,生成一对尺寸为C*H*1和C*1*W的方向感知特征图;1372接着对提取到的特征信息进行Concat操作,并利用1*1卷积变换操作,生成尺寸为Cr*1*W+H的中间特征图;1373然后沿着空间维度对特征图进行split操作,将其分解为两个单独的张量,再分别利用1*1的卷积变换为具有相同通道数的张量,并结合sigmoid激活函数得到C*H*1的注意力向量;1374最后将输出结果进行扩展并作用于注意力权重,生成更新后的特征图;138可转换的空洞卷积SAConv的训练:CA注意力机制模块输出更新后的特征图进入可转换的空洞卷积SAConv;1381更新后的特征图经过全局平均池化层压缩,获得全局上下文信息,再经过1*1卷积变换,将输出添加回主流;1382然后由5*5的平均池化层和1*1的卷积层构成转换函数S·,将全局信息添加到转换函数里,并根据输入和位置的不同,以相同的权重自适应地选择不同的空洞率进行卷积计算;1383最后再次经过全局上下文模块得到预测特征图;139颈部Neck模块输出的预测特征图进入输出端Head模块,得到输出结果;14待识别桥梁设计图的获取:获取待识别的桥梁设计图并进行预处理;15桥梁设计图的子图布局识别结果的获得:将预处理后的待识别桥梁设计图输入训练后的改进的YOLOv5模型,获得子图布局识别结果。

全文数据:

权利要求:

百度查询: 安徽省交通规划设计研究总院股份有限公司 基于改进YOLOv5的桥梁设计图的子图布局识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。