【发明授权】基于改进YOLOv5的桥梁设计图的子图布局识别方法_安徽省交通规划设计研究总院股份有限公司_202310906376.8

申请/专利权人：安徽省交通规划设计研究总院股份有限公司

申请日：2023-07-21

公开（公告）日：2024-04-09

公开（公告）号：CN116978052B

主分类号：G06V30/422

分类号：G06V30/422;G06V30/146;G06V30/16;G06V30/18;G06V30/19;G06F30/13;G06F30/20;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2023.11.17#实质审查的生效;2023.10.31#公开

摘要：本发明涉及基于改进YOLOv5的桥梁设计图的子图布局识别方法，与现有技术相比解决了难以针对桥梁设计图进行子图识别的缺陷。本发明包括以下步骤：桥梁设计图的获取及预处理；构建改进的YOLOv5模型；改进的YOLOv5模型的训练；待识别桥梁设计图的获取；桥梁设计图的子图布局识别结果的获得。本发明利用已标注的桥梁设计图数据集对改进的网络进行训练和测试，通过在原YOLOv5网络中添加CA注意力机制，针对性地提取感兴趣区域的图像特征，同时引入可转换的空洞卷积SAConv，自适应扩大感受野范围并进行卷积计算，提高特征提取能力，从而减少关键信息的漏检，提高布局识别精度。

主权项：1.一种基于改进YOLOv5的桥梁设计图的子图布局识别方法，其特征在于，包括以下步骤：11桥梁设计图的获取及预处理：获取标注的桥梁设计图数据集，并对数据集进行预处理；12构建改进的YOLOv5模型：对YOLOv5模型进行改进，构建出改进的YOLOv5模型；所述构建改进的YOLOv5模型包括以下步骤：121设定改进的YOLOv5模型包括输入端Input模块、主干网络Backbone模块、颈部Neck模块、输出端Head模块；输入端Input模块使用Mosaic数据增强、自适应初始锚框计算、图片缩放对图像进行预处理；主干网络Backbone模块采用Focus下采样、改进CSP结构、SPPF池化金字塔结构提取图像的特征信息；颈部Neck模块采用FPN+PAN的特征金字塔结构，实现不同尺寸目标特征信息的传递，解决多尺度问题；输出端Head模块采用二元交叉熵损失BCELoss和CIoULoss来计算分类、定位和置信度损失，并通过非极大值抑制NMS提高网络预测的准确度；122在颈部Neck模块的第一个卷积层后面添加CA注意力机制模块；123将颈部Neck模块的前两个标准3x3卷积替换为可转换的空洞卷积SAConv；13改进的YOLOv5模型的训练：将预处理后的桥梁设计图数据集输入改进的YOLOv5模型进行训练；所述改进的YOLOv5模型的训练包括以下步骤：131设置训练参数即网格训练参数，网格训练参数包括迭代次数、批量大小、初始学习率、动量和权重衰减系数，其中，迭代次数epoch为100，批量大小batch-size为8，初始学习率lr0为0.01，动量momentum为0.937，权重衰减系数weight_decay为0.0005；132设置YOLOv5网络模型参数即数据增强参数，数据增强参数包括色调hsv_h、饱和度hsv_s、亮度hsv_v、旋转角度degrees、上下翻转概率flipud和左右翻转概率fliplr，其中，hsv_h为0.015，hsv_s为0.7，hsv_v为0.4，degrees为0，flipud为0，fliplr为0.5；133将预处理后的桥梁设计图数据集输入改进的YOLOv5模型；134YOLOv5模型的输入端Input模块对预处理后的桥梁设计图数据集中的数据进行随机缩放和拼接，得到训练图像；135输入端Input模块输出的训练图像进入主干网络Backbone模块，主干网络Backbone模块输出训练图像的特征信息；136训练图像的特征信息进入颈部Neck模块的特征金字塔结构，特征金字塔结构的第一个卷积层输出尺寸为C*H*W的Input特征图，Input特征图进入CA注意力机制模块；137CA注意力机制模块的训练：1371CA注意力机制模块对尺寸为C*H*W的Input特征图分别沿着水平坐标X方向和垂直坐标Y方向进行平均池化，生成一对尺寸为C*H*1和C*1*W的方向感知特征图；1372接着对提取到的特征信息进行Concat操作，并利用1*1卷积变换操作，生成尺寸为Cr*1*W+H的中间特征图；1373然后沿着空间维度对特征图进行split操作，将其分解为两个单独的张量，再分别利用1*1的卷积变换为具有相同通道数的张量，并结合sigmoid激活函数得到C*H*1的注意力向量；1374最后将输出结果进行扩展并作用于注意力权重，生成更新后的特征图；138可转换的空洞卷积SAConv的训练：CA注意力机制模块输出更新后的特征图进入可转换的空洞卷积SAConv；1381更新后的特征图经过全局平均池化层压缩，获得全局上下文信息，再经过1*1卷积变换，将输出添加回主流；1382然后由5*5的平均池化层和1*1的卷积层构成转换函数S·，将全局信息添加到转换函数里，并根据输入和位置的不同，以相同的权重自适应地选择不同的空洞率进行卷积计算；1383最后再次经过全局上下文模块得到预测特征图；139颈部Neck模块输出的预测特征图进入输出端Head模块，得到输出结果；14待识别桥梁设计图的获取：获取待识别的桥梁设计图并进行预处理；15桥梁设计图的子图布局识别结果的获得：将预处理后的待识别桥梁设计图输入训练后的改进的YOLOv5模型，获得子图布局识别结果。

全文数据：

权利要求：

百度查询：安徽省交通规划设计研究总院股份有限公司基于改进YOLOv5的桥梁设计图的子图布局识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

下一篇：一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

相关技术

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

摄像头安装组件和应用其的仪表屏_深圳市航盛电子股份有限公司_202322569773.9

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种液压锁密闭性测试装置_靖江市长源液压机械有限公司_202322518953.4

双组份胶水即停防干装置_重庆金芯麦斯传感器技术有限公司_202322250925.9

一种钝化复合功能层和TOPCon电池_中环新能(安徽)先进电池制造有限公司_202322011797.2

子相关技术

一种基于深度神经网络与子空间原理的测向方法_西北工业大学_202210525049.3

一种变电站内绝缘子污秽程度监测装置_内蒙古电力(集团)有限责任公司乌海供电分公司_202322284098.5

一种悬式绝缘子铁帽抗拉伸强度测试设备_淄博桥宇电瓷附件有限公司_202420593972.5

以子块为单位恢复的方法和图像解码装置_SK电信有限公司_202080037105.8

一种防风输电线路瓷绝缘子_江西百新电瓷电气有限公司_202322605218.7

一种电气化铁路用绝缘子状态检测方法_中铁电气化局集团有限公司_202410303451.6

一种纯硅AlPO-16分子筛及其制备方法_中国石油化工股份有限公司_202211289899.4

一种悬式绝缘子铁帽钻削工装_淄博桥宇电瓷附件有限公司_202420478426.7

酶裂解连接子及包含其的配体-艾瑞布林偶联物_英诺湖医药(杭州)有限公司_202310853999.3

一种改善塑胶产品螺丝柱不饱的滑块入子结构_上海英济电子塑胶有限公司_202322496610.2

图相关技术

基于图神经网络的汉越跨语言观点对象识别分析方法_昆明理工大学_202210532418.1

图计算方法、装置、计算机集群及计算机存储介质_华为技术有限公司_202211273798.8

家具布局图生成方法、装置、设备及存储介质_深圳须弥云图空间科技有限公司_202111074456.9

一种基于深度学习的柔性压力传感阵列图的识别方法_中国科学院宁波材料技术与工程研究所_202210314179.2

一种基于图划分卷积神经网络的行人轨迹预测方法_武汉大学_202111105740.8

核电站DCS系统应用软件逻辑图连线数据处理方法_中国核动力研究设计院_202111246992.2

用于紧凑型平视显示器的全息图计算_恩维世科斯有限公司_202311285242.5

建图方法、图像采集和处理系统和定位方法_上海快仓智能科技有限公司_201811475564.5

电路图生成方法、计算机设备及存储介质_芯行纪科技有限公司_202410156710.7

基于图神经网络的智能合约漏洞检测方法、系统和设备_烟台大学_202311579362.6

设计图相关技术

电源设计架构_财团法人工业技术研究院_202310002574.1

业务路径设计方法、设计装置、电子设备及存储介质_腾讯科技(深圳)有限公司_201911115038.2

车辆模态设计方法及装置_中车唐山机车车辆有限公司_201811517990.0

一种基于AIGC的建筑智能设计系统_中国建筑设计研究院有限公司_202410104947.0

一种室内设计用测绘装置_沈阳大学_202321763505.4

一种超透镜设计方法及超透镜_浙江大学杭州国际科创中心_202310817864.1

一种设计方案演示板_沈阳大学_202321818381.5

一种建筑设计用楼宇监控装置_谭慧_202322093747.3

一种广告设计展示装置_湖北经济管理大学(长江职业学院)_202322279484.5

出口流量改变的安全工程设计_瞻博网络公司_202110088971.6

龙图腾网&IPTOP

【发明授权】基于改进YOLOv5的桥梁设计图的子图布局识别方法_安徽省交通规划设计研究总院股份有限公司_202310906376.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务