买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于改进FasterR-CNN的岩画检测方法_宁夏大学_202110795038.2 

申请/专利权人:宁夏大学

申请日:2021-07-14

公开(公告)日:2022-11-25

公开(公告)号:CN113537045B

主分类号:G06V10/25

分类号:G06V10/25;G06V10/774;G06V10/82;G06V30/413;G06N3/04;G06T3/40

优先权:

专利状态码:有效-授权

法律状态:2022.11.25#授权;2021.11.09#实质审查的生效;2021.10.22#公开

摘要:一种基于改进FasterR‑CNN的岩画检测方法,包括以下步骤:制作岩画数据集,采用摄影设备拍摄岩画信息,并将岩画信息按照岩画的物种对岩画进行分类保存;数据集的采集与增强;利用空间金字塔池化;建立金字塔卷积模块;设计RoIAlign构造基于改进FasterR‑CNN目标检测算法,通过空间金字塔池化,提取出岩画图像的多尺度特征,金字塔卷积模块利用不同类型的核进行信息互补,将原来的RoIPooling替换成RoIAlign,构造出基于改进FasterR‑CNN目标检测算法。本发明相比于FasterR‑CNN目标检测算法实现了识别精度和检测性能的提升,改进后的算法回归的边界框将羊像更完整的包含在内,置信度由0.69增加到了0.96,改进后的算法没有产生误检,生成的边界框将羊像完整地包含且置信度高达0.99。

主权项:1.一种基于改进FasterR-CNN的岩画检测方法,其特征在于:基于改进FasterR-CNN的岩画检测方法包括以下步骤:步骤一,制作岩画数据集,采集岩画信息,并将岩画信息按照岩画的物种对岩画进行分类保存;步骤二,数据集的采集与增强;步骤三,利用空间金字塔池化;步骤四,建立金字塔卷积模块;步骤五,设计RoIAlign构造基于改进FasterR-CNN目标检测算法,通过空间金字塔池化,提取出岩画图像的多尺度特征,金字塔卷积模块利用不同类型的核进行信息互补,将原来的RoIPooling替换成RoIAlign,构造出基于改进FasterR-CNN目标检测算法;步骤一中,使用摄影设备寻找相关岩画信息并进行实地拍摄,并且在拍摄过程中,注意拍摄位置的光照,避免其他物体的遮挡,确保相机的准确对焦,调整拍摄距离的远近和拍摄角度,通过对岩画的图像进行提取;通过搜索引擎搜索相关图像并对其进行保存;对图像的数据进行筛除,之后对图像进行人工分类,按照物种进行分类并命名;步骤二中,使用深度神经网络对岩画数据集进行训练,在训练阶段利用在线数据增强技术对训练集中的图像进行处理,生成等价的数据;步骤二中具体使用的增强方法为:调整图像大小、翻转、归一化和填充;步骤一中,岩画数据集按照VOC2007数据格式进行制作,首先,通过运行Python代码将获取到的图像全部转换为JPG格式的图像,并按照VOC2007数据集的图像命名要求进行统一批量重命名,之后创建名为JPEGImages的文件夹,将统一命名好的JPG格式的岩画图像全部放入;其次,创建名为Annotations的文件夹,该文件夹下存放标注岩画图像生成的XML文档,该文档包含了图像及图像中目标的相关信息,然后创建名为ImageSets的文件夹,并在该文件夹下新建Main文件夹,该文件夹下存放数据集按比例划分后的训练验证集、测试集、训练集和验证集的相关txt文档;采用LabelImg图像标注软件对岩画进行标注,用sheep、monkey_face、sun_spirit和human_face分别表示羊像、猴面像、太阳神像和人面像,标注完后岩画图像及图中目标的信息以XML文件格式进行保存,将产生的XML文件通过相应的代码按比例随机分配,其中训练集占整体数据集的十分之九,测试集占整体数据集的十分之一,之后再将训练验证集按照一定比例随机分配,其中训练集占训练验证集的五分之四,验证集占训练验证集的五分之一;步骤三中,首先通过ResNet101对输入岩画图像进行处理,生成特征图,在ResNet101的卷积组的一层的输出后加入空间金字塔池化结构,对岩画图像的多尺度特征进行提取,池化操作输出大小计算公式: 式一中,Wi和Hi分别为输入的宽和高,池化核的大小记为f×f,S为步长大小,Wo和Ho分别为输出的宽和高,在上述公式中加入填充操作,并对步长的计算公式进行修正: 之后利用带有填充的池化操作输出大小计算公式: 式二中PW,Ph为填充padding,sizew为空间金字塔池化核的宽度大小,sizeh为空间金字塔池化核的长度大小,式三中,stridew为步长宽度大小,strideh为步长长度大小,式二和式三中的w、h分别为空间金字塔的宽度和长度,n为图像输出的宽度和长度,核的大小设置为3、5、7三种尺度,池化操作的步长设置为1并进行填充操作,之后将池化后的特征与原始特征进行合并;步骤四中,在FPN后增加金字塔卷积模块,金字塔卷积从底部到顶部共两层,每层的输入为256,输出为128;第一层卷积核的空间大小为3×3,第二层卷积核的空间大小为5×5;每层使用了相同深度的卷积,其组数都设置了分组数64,即输入特征图被分成64组,每组独立的应用卷积进行计算,步长采用相同的大小,默认设置为1,第一层和第二层填充的大小分别设置为1和2;将原来的RoIPooling替换成RoIAlign,其将取整操作替换成双线性插值,将RoI取得的特征和原图对齐。

全文数据:

权利要求:

百度查询: 宁夏大学 基于改进FasterR-CNN的岩画检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。