买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于Crowd-RetinaNet网络的拥挤人群检测方法_南京邮电大学_202211464101.5 

申请/专利权人:南京邮电大学

申请日:2022-11-22

公开(公告)日:2024-02-20

公开(公告)号:CN115731517B

主分类号:G06V20/52

分类号:G06V20/52;G06V10/40;G06V10/764;G06V10/774;G06V10/80

优先权:

专利状态码:有效-授权

法律状态:2024.02.20#授权;2023.03.21#实质审查的生效;2023.03.03#公开

摘要:本发明公开了一种基于Crowd‑RetinaNet网络的拥挤人群检测方法,属于人工智能技术领域,对采集到的行人图像进行预处理,生成样本数据集;将样本数据集导入基于Crowd‑RetinaNet网络构建的拥挤人群检测模型中,对模型进行训练;拥挤人群检测模型检测模型包括目标识别模块和优化模块;采用目标识别模块识别导入样本中的行人,并对识别到的行人添加完整框和可见框;通过在完整框预测和训练中增加可见框V‑box辅助预测及训练,在不增加过多的模型参量的前提下,有效提高了模型精度,同时在特征提取模块中加入了通道‑空间注意力机制模块,不仅可以控制模型参数量,还使网络更好地提取场景中行人的特征,提升了模型的检测性能。

主权项:1.一种基于Crowd-RetinaNet网络的拥挤人群检测方法,其特征在于,包括:对采集到的行人图像进行预处理,生成样本数据集;将样本数据集导入基于Crowd-RetinaNet网络构建的拥挤人群检测模型中,对模型进行训练;拥挤人群检测模型检测模型包括目标识别模块和优化模块;采用目标识别模块识别导入样本中的行人,并对识别到的行人添加完整框和可见框;所述目标识别模块包括特征提取模块、通道-空间注意力机制模块、预测器、抑制模块和融合模块;所述特征提取模块用于对导入的样本图像进行图像特征提取;所述通道-空间注意力机制模块包括通道注意力模块和空间注意力模块,用于将提取到的图像特征进行处理得到细化特征图;所述预测器用于对细化特征图进行预测处理,得到完整框预测和可见框预测;所述预测器对细化特征图进行预测处理的方法步骤包括:边界框回归预测分支其中的一个卷积层对细化特征图进行边界框回归参数预测;分类预测分支其中的一个卷积层对细化特征图进行分类预测;增加可见框预测,优化模块将边界框回归预测分支的最后一层卷积层的输出通道进行拓展,将可见框的回归参数加入到完整框预测中同时预测所述预测器包括边界框回归预测分支和分类预测分支;所述边界框回归预测分支与分类预测分支均包括四个用于特征提取的卷积核为3×3的卷积层和一个用于分类预测或边界框回归参数预测的卷积核大小为3×3的卷积层;所述抑制模块用于对被预测的可见框区域进行代表性区域非极大值抑制算法处理;所述抑制模块对被预测的可见框区域进行处理具体包括:求取被预测可见框区域的交并比IOU;根据基于集合的代表性区域非极大值抑制对交并比IOU大于预设阈值的针对同一类别目标预测框的两个预测,抑制其中置信度较小的一个;对所有预测框进行两两比较之后,得到重合程度小于预设阈值,且得分最高的一系列目标框,将其作为最终的预测结果;在预测可见框的基础上进行后处理,以被预测的可见框间交并比IOU求得的重叠度为判据,当被抑制的预测框和可见框来自同一提案时,则跳过此抑制;所述融合模块用于对特征层进行卷积连接;所述可见框预测使用BV-EMDLoss函数计算损失,损失函数Lbvemdbi为: 其中, 代表完整框的groundtruth; 代表可见框的groundtruth;α,β分别是完整框回归损失和可见框回归损失所占比重,即α+β=1,通过调整α,β分析可见框标注辅助训练对于检测模型性能的影响,当α=1,β=0时,检测模型退化为没有可见框辅助训练时的模型;采用优化模块对完整框和可见框进行处理后得到优化后的预测框。

全文数据:

权利要求:

百度查询: 南京邮电大学 一种基于Crowd-RetinaNet网络的拥挤人群检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。