买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】用于人群计数的轻量金字塔空洞卷积聚合网络的训练方法_上海应用技术大学_202111428983.5 

申请/专利权人:上海应用技术大学

申请日:2021-11-29

公开(公告)日:2024-04-16

公开(公告)号:CN114120233B

主分类号:G06V20/52

分类号:G06V20/52;G06V10/77;G06V10/80;G06V10/82;G06N3/0455;G06N3/0464;G06N3/082

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.03.18#实质审查的生效;2022.03.01#公开

摘要:本发明提供一种用于人群计数的轻量金字塔空洞卷积聚合网络的训练方法,包括:输入一张图片,首先经过主干网络提取特征信息,然后将提取的特征图以级联的形式输入到多个多尺度上下文聚合模块。该模块首先用空洞率不同的卷积核提取多尺度信息,然后通过通道注意力机制自适应选择通道上下文特征信息并进行聚合。每通过一个多尺度上下文聚合模块,就通过上采样将特征图转化为分辨率更高的特征图,最后经过一个1*1的卷积核输出估计密度图,并通过积分求和得到预测的人数。本发明提供的方法通过多个空洞率不同的卷积核有效的提取了多尺度信息,解决了人头大小不统一的问题,并通过通道注意力机制自适应选择和聚合有用的上下文信息,避免了信息的冗余。

主权项:1.一种用于人群计数的轻量金字塔空洞卷积聚合网络的训练方法,其特征在于,包括:步骤一,将图片输入到轻量化主干网络中,提取大小为原图像分辨率132倍的特征图;步骤二,将提取到的特征图输入到多个轻量金字塔空洞卷积提取多尺度信息模块中,每一个轻量金字塔空洞卷积提取多尺度信息模块,采用金字塔形式聚合不同空洞率的单通道空洞卷积模块来实现多尺度特征信息的提取,同时降低模型的参数量;步骤三,对提取到的多尺度特征信息进行上采样,最后通过一个1×1的卷积核生成通道数为1的密度图;步骤四,对密度图进行积分求和得到图片的预测人数;步骤二之前,还包括,生成轻量金字塔空洞卷积提取多尺度信息模块,包括:将输入的特征图记为通道数为m,首先将特征图输入到3x3的卷积层提取主要的特征信息并对通道数进行降维,得到通道数为n的特征图,记为每一个通道上的特征图表示为i表示第i个通道;采用单通道空洞卷积的方法,即采用n个通道数为1、空洞率为d的空洞卷积与对应的第i个通道上的特征图进行卷积,i=1,2,…,n,公式如下: 其中,表示一组空洞率为d的空洞卷积提取出的特征信息,Pi表示第i个通道上的特征图,fid表示第i个空洞率为d的空洞卷积,它与第i个特征图Pi进行卷积,记为Pi*fid,φ·表示将n个空洞卷积提取出的特征图在通道上直接进行连接融合;多个轻量金字塔空洞卷积提取多尺度信息模块中一共使用4组空洞率不同的空洞卷积,将不同组提取的特征图记为然后采用融合机制将4组特征图进行信息融合,记为F,并将F的结构称为以金字塔形式聚合不同空洞率的单通道空洞卷积模块;将提取到的主要特征信息与以金字塔形式聚合不同空洞率的单通道空洞卷积模块输出的特征信息F在通道上直接进行连接,公式为:Y=φP,F,其中,Y表示轻量金字塔空洞卷积提取多尺度信息模块的输出,φ·表示将P和F直接在通道上直接进行连接,如果以金字塔形式聚合不同空洞率的单通道空洞卷积模块采用的是元素相加融合机制,则最终输出的通道数为2n;如果以金字塔形式聚合不同空洞率的单通道空洞卷积模块采用的是连接融合机制,则最终输出的通道数为5n;所述轻量金字塔空洞卷积提取多尺度信息模块,采用元素相加融合机制和连接融合机制的两种信息融合机制,根据融合机制的不同,将PSCD模块分为两大类,S-PSCD模块和C-PSCD模块;所述S-PSCD模块,直接对提取到的四组特征信息在对应的位置上进行像素点相加,d=1,2,3,6,通道数为n,其公式记为: 所述C-PSCD模块是在通道上对提取的特征图直接进行连接,通道数为4n,其公式记为:Fconcat=φD1,D2,D3,D6。

全文数据:

权利要求:

百度查询: 上海应用技术大学 用于人群计数的轻量金字塔空洞卷积聚合网络的训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。