买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】用于拥挤人群计数的自适应多尺度上下文聚合方法_上海应用技术大学_202110242403.7 

申请/专利权人:上海应用技术大学

申请日:2021-03-04

公开(公告)日:2024-04-16

公开(公告)号:CN112966600B

主分类号:G06V20/52

分类号:G06V20/52;G06V10/82;G06V10/80;G06N3/0499;G06N3/082

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.07.02#实质审查的生效;2021.06.15#公开

摘要:本发明提供了一种用于拥挤人群计数的自适应多尺度上下文聚合方法,该方法包括:将样本图片输入到主干网络,提取大小为输入图像分辨率j倍的特征图;将提取的特征图以级联的形式输入到多个多尺度上下文聚合模块,提取并自适应聚合多尺度上下文信息,得到多尺度上下文特征;对生成的多尺度上下文特征进行卷积层处理,生成密度图;对所述密度图进行积分求和,得到预测人数。本发明有效地提取了多尺度信息,解决了人头大小不统一的问题,并通过通道注意力机制自适应选择和聚合有用的上下文信息,避免了信息的冗余,可以在拥挤场景下有更精确的密度估计,具有较高的鲁棒性。

主权项:1.一种用于拥挤人群计数的自适应多尺度上下文聚合方法,其特征在于,包括:步骤1:将样本图片输入到主干网络,提取大小为输入图像分辨率j倍的特征图;步骤2:将提取的特征图以级联的形式输入到多个多尺度上下文聚合模块,提取并自适应聚合多尺度上下文信息,得到多尺度上下文特征;其中,每个多尺度上下文聚合模块的后面均设有一个上采样层,所述上采样层用于将多尺度上下文特征转为更高分辨率的特征图;步骤3:对生成的多尺度上下文特征进行卷积层处理,生成密度图;步骤4:计算生成的密度图与真值密度图之间的损失函数,对网络参数进行优化;步骤5:对所述生成的密度图进行积分求和,得到预测人数;所述步骤2包括:多尺度上下文聚合模块自适应选择小尺度上下文特征,并将所述小尺度上下文特征与大尺度上下文特征进行聚合;所述多尺度上下文聚合模块包括多个空洞率不同的空洞卷积的分支;采用来表示通过第i个尺度的空洞卷积提取的特征;其中,i表示卷积核的空洞率,表示分辨率是输入图像的分辨率的j倍,r表示指主干网络的缩减率,表示第i个尺度的空洞卷积提取的特征图,且所述特征图分辨率为原来的j倍;W×H表示图像的分辨率,C表示图像的通道数,R表示j倍分辨率的所有特征图的集合;将空洞卷积提取的特征图输入到通道注意力模块中,所述通道注意力模块采用一个选择函数f自适应的选择中有用的上下文特征信息,并输出聚合了上下文信息的特征图Yj∈RjW×jH×C,其中Yj定义如下: Yj表示通过聚合模块提取的j倍分辨率的特征图,⊕表示逐个元素求和,表示提取第1个尺度的特征图,表示提取第2个尺度的特征图,表示提取第3个尺度的特征图,表示提取第n个尺度的特征图,j表示分辨率是输入图片的分辨率的j倍;所述采用一个选择函数f自适应的选择中有用的上下文特征信息,包括:将每一个上下文特征通过一个全局空间平均池化层进行池化处理,输出特征信息采用由两个完全连接的层组成瓶颈结构对特征信息Favg进行处理,并通过sigmoid函数将输出特征归一化为0,1,其中,自适应输出系数的计算公式如下: 式中:和分别表示两个全连接层的权重系数,其中第一个全连接层的后面有一个RELU函数,第二个全连接层的后面采用一个Sigmoid函数,表示通过平均池化层后的输出;在通道注意力机制的输入和输出之间加入残差连接,得到选择函数定义如下: 式中:表示第i个通道注意力机制模块的输出,表示表示第i个尺度的空洞卷积提取的特征图,表示第i个通道注意力机制模块的自适应系数。

全文数据:

权利要求:

百度查询: 上海应用技术大学 用于拥挤人群计数的自适应多尺度上下文聚合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。