买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】多级注意力尺度感知人群计数方法_上海应用技术大学_202110605990.1 

申请/专利权人:上海应用技术大学

申请日:2021-05-31

公开(公告)日:2024-04-05

公开(公告)号:CN113283356B

主分类号:G06V40/10

分类号:G06V40/10;G06V20/52;G06V10/774;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2021.09.07#实质审查的生效;2021.08.20#公开

摘要:本发明提供了一种多级注意力尺度感知人群计数方法,属于深度学习在计算机视觉中的应用。该方法具体步骤如下:S1:获取数据集;S2:构建多级注意力尺度感知神经网络;S3:调试并训练多级注意力尺度感知神经网络并测试;S4:获取摄像头图像,输入训练好的神经网络进行测试,得到该图片的预测密度图和预测人数。通过上述方式,本发明能够适用于大规模场景时的人群数量检测,有效的提高检测结果准确性。

主权项:1.一种基于多级注意力尺度感知人群计数方法,其特征在于,包括:S1:获取数据集并进行预处理,得到训练集的密度图和测试集的密度图;S2:构建多级注意力尺度感知神经网络的主干;S3:基于所述训练集、测试集和多级注意力尺度感知神经网络的主干,调试并训练多级注意力尺度感知神经网络并测试网络有效性,以得到训练好的神经网络;S4:获取摄像头图像,输入训练好的神经网络进行测试,得到该图片的预测密度图和预测人数;所述步骤S1包括:S11:下载公开数据集,将所述公开数据集分成训练集和测试集;S12:对训练集和测试集进行数据增强,将图像左右翻转,增加一倍数据量,以分别得到训练集的图像数据和测试集的训练集和测试集;S13:将所述训练集的图像数据和测试集的训练集和测试集的宽高像素补充为16的倍数,并按比例调整定位图的位置,以得训练集的标签的定位图和测试集的标签的定位图;S14:利用高斯核大小为15的高斯核函数,将所述标签的训练集的标签的定位图处理为训练集的密度图,并将所述标签的测试集的标签的定位图处理为测试集的密度图;所述步骤S2包括:S21:设计提取特征的编码器的结构:以VGG16的前十层作为特征提取层,kernel=3,采用Conv2d卷积,每个卷积层后都加上Relu激活函数,层数为64,64,128,128,maxpooling,kernel=2,,256,256,256,maxpooling,kernel=2,512,512,512,用此编码器的结构提取到深度特征feature,加载VGG16预训练参数;S22:设计所述解码器的回归人群密度图和人数;所述步骤S22包括:S221:后端主干网络为SA-UGA-SA-UPA-SA-USA,尺度感知模块SA,kernel为3,输入网络层数为512,输出网络层数为128,后接Relu激活函数;自定义的通道注意力上采样模块UGA;二维卷积,kernel为3,输入网络层数为128,输出网络层数为64,后接Relu激活函数;自定义的空间注意力上采样模块USA;二维卷积,kernel为3,输入网络层数为64,输出网络层数为16,后接Relu激活函数;自定义的像素注意力上采样模块USA;最后一层为输入网络层数为16,输出网络层数为1,kernel为1的全卷积网络,后接Relu激活函数,此外还在SA与SA间增加残差结构,最终输出预测密度图;S222:构建像素注意力模块:将输入图像in做二维卷积,输入通道等于输出通道,kernel为1,后接sigmoid函数处理得到out,最后输出为in和out的点乘加in,通过此方式为每个像素点增加一个权重参数;S223:构建自定义多级注意力模块:通道注意力上采样模块UGA流程为二倍上采样,取自适应平均池化和自适应最大池化的和,经过Sigmoid函数,再加上之前二倍上采样后的特征图,即为模块的输出特征图;空间注意力上采样模块USA流程为二倍上采样,按通道连接通道层面特征图的平均值与最大值,经过卷积核大小为7,扩张率为3的卷积,经过Sigmoid函数,再加上之前二倍上采样后的特征图,即为模块的输出特征图;像素注意力上采样模块UPA流程为通过二倍上采样和卷积核为3的二维卷积,再通过卷积核为一的二维卷积,Sigmoid函数输出后的权重加上卷积核为一的二维卷积的输出,再通过卷积核为一的二维卷积和卷积核为3的卷积,即为模块的输出特征图;S224:构建自定义尺度感知模块SA;输入为x,复制x通道数c;输入并行的四个不同方式提取特征,第一层卷积核大小为3,空洞卷积dilation为1,得到f1;第二层设置不同的空洞卷积,得到f2;第三层设置不同的空洞卷积,得到f3;第四层设置不同的空洞卷积,得到f4;将f1经过像素注意力模块与下一层f2相加,二维卷积后通道数为c,经过像素注意力模块得到y1,再与下一层f3连接,二维卷积后通道数为c,经过像素注意力模块得到y2,再与下一层f4连接,二维卷积后通道数为c,经过像素注意力模块得到y3、y1、y2、y3按通道连接后二维卷积将通道数由3c变为c,得到输出y。

全文数据:

权利要求:

百度查询: 上海应用技术大学 多级注意力尺度感知人群计数方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。