申请/专利权人:中国矿业大学
申请日:2023-03-15
公开(公告)日:2024-03-19
公开(公告)号:CN116486285B
主分类号:G06V20/17
分类号:G06V20/17;G06V10/764;G06V10/778
优先权:
专利状态码:有效-授权
法律状态:2024.03.19#授权;2023.08.11#实质审查的生效;2023.07.25#公开
摘要:本发明公开了一种基于类别掩码蒸馏的航拍图像目标检测方法,包括预训练教师网络、学生网络和类别掩码蒸馏模块,类别掩码蒸馏模块负责提取预训练教师网络和学生网络各自的多尺度特征层及对应Softmax激活函数层的预测分数,利用多尺度特征层和预测分数分别产生预训练教师网络和学生网络各个类别的激活映射区域,设置阈值抑制对各个类别有负影响的区域,通过类别掩码蒸馏损失实现教师—学生网络对所有类别的有效区域的迁移,为加大对不易检测类别的学习,设置一个动态权重来加大对难样本学习的惩罚。本发明能够实现对指定类别有效区域的蒸馏,提高对难样本的学习,在教师网络的指导下提升学生网络的检测性能和泛化能力。
主权项:1.一种基于类别掩码蒸馏的航拍图像目标检测方法,其特征在于,包括以下步骤:步骤S1、利用小型无人机平台采集M幅航拍图像,1000M10000,对上述M幅航拍图像逐张统一尺寸,将统一尺寸后的航拍图像按照7:3的比例随机划分为训练数据集和测试数据集,对训练数据集进行数据增强构成教师—学生网络训练数据集,转入步骤S2;步骤S2、将教师—学生网络训练数据集输入教师网络,利用教师—学生网络训练数据集对教师网络进行预训练,得到预训练教师网络,转入步骤S3;步骤S3、利用预训练教师网络、学生网络和类别掩码蒸馏模块构建教师—学生网络,转入步骤S4;步骤S4、利用教师—学生网络训练数据集对教师—学生网络进行训练,提取预训练教师网络和学生网络各自的多尺度特征层、及各多尺度特征层对应Softmax激活函数层的输出预测分数,并将上述多尺度特征层及预测分数一并送入类别掩码蒸馏模块,基于类别掩码蒸馏模块产生的类别掩码蒸馏损失对学生网络的网络参数进行更新,最终获得教师—学生网络中训练好的学生网络,具体如下:步骤S4.1、将预训练教师网络和学生网络各自提取的多尺度特征层及其对应Softmax激活函数层的输出预测分数一起送入类别掩码蒸馏模块,所述类别掩码蒸馏模块包括四个相同结构的并行掩码模块;步骤S4.2、掩码模块负责获取预训练教师网络和学生网络各自的各类别激活特征图,对获取的各类别激活特征图进行处理得到预训练教师网络和学生网络分别对应的各类别掩码图;步骤S4.3、基于L2损失函数计算单个掩码模块中单个类别的掩码蒸馏损失,对得到的单个类别损失执行相加操作,获取单个模块的掩码蒸馏损失;步骤S4.4、对四个并行处理的掩码模块获取的掩码蒸馏损失进行相加操作,得到类别掩码蒸馏损失;步骤S4.5、基于类别掩码蒸馏损失对学生网络的网络参数进行更新,最终获得教师—学生网络中训练好的学生网络;转入步骤S5;步骤S5、将测试数据集输入教师—学习网络中训练好的学生网络,输出测试数据集中所有目标在图像中的位置和所属类别,测试训练好的学生网络的准确率。
全文数据:
权利要求:
百度查询: 中国矿业大学 一种基于类别掩码蒸馏的航拍图像目标检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。