【发明公布】基于场景分类和多尺度特征融合的复杂场景人群计数方法_西北工业大学_202010583112.X

导航：龙图腾网> 最新专利技术> 基于场景分类和多尺度特征融合的复杂场景人群计数方法_西北工业大学_202010583112.X

申请/专利权人：西北工业大学

申请日：2020-06-23

公开（公告）日：2020-10-16

公开（公告）号：CN111783589A

主分类号：G06K9/00(20060101)

分类号：G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101)

优先权：

专利状态码：有效-授权

法律状态：2022.03.15#授权;2020.11.03#实质审查的生效;2020.10.16#公开

摘要：本发明提供了一种基于场景分类和多尺度特征融合的复杂场景人群计数方法。首先，标注并建立密度等级数据集；然后，利用建立的数据集分别对分类、稀疏估计和密集估计子网络进行预训练；接着，结合自标记机制，利用测试数据集对网络再次进行训练；最后，将图片输入到训练好的网络，利用分类权重对两种密度估计结果进行加权后得到人群密度图。采用本发明方法可以解决由于拍摄角度不同导致的图片尺度畸变和人群分布不均问题，具有更高的估计准确度和更强的鲁棒性。

主权项：1.一种基于场景分类和多尺度特征融合的复杂场景人群计数方法，其特征在于步骤如下：步骤1：由公开的数据集ShangHaiTechPartA中随机裁截出2000-4000张图片，并计算这些图片中人数的平均值，以人数平均值的23为阈值α1，以人数平均值的43为阈值α2，将图片中人数低于α1的图片类别标注为稀疏，归入稀疏数据集，将图片中人数高于α2的图片类别标注为密集，归入密集数据集，将图片中人数处于α1和α2之间的图片类别随机标注为稀疏或密集，并归入相应的数据集；如果得到的稀疏数据集和密集数据集中的图片数量不同，在原数据集ShangHaiTechPartA中进行新的图片随机裁截，并按照前面所述方法根据阈值α1和α2进行图片类别标注和分类，直至两个数据集中的图片数量相同；两个数据集共同构成密度等级数据集；步骤2：构建包括前端特征提取模块、分类模块、密集估计模块和稀疏估计模块四个模块的分类估计网络模型，其中，前端特征提取模块由在ImageNet数据集上预训练过的VGG-16的前10层卷积层组成，其输出为512通道的特征图，作为后续三个模块的输入；分类模块包括1个自适应池化层、3个卷积层和1个全连接层，3个卷积层的通道数分别为512、256、128，卷积核大小均为3×3，全连接层的输入为128通道，输出为2通道，分别代表密集与稀疏的权重，权重为0-1范围内的值，两个权重值的和为1；密集估计模块和稀疏估计模块的网络结构相同，均包含6层卷积层，通道数分别为512、256、256、128、32、1，卷积核大小均为3×3，输出分别为密集估计的密度图和稀疏估计的密度图，密度图中的像素值代表在该像素位置处的人数，密度图中所有像素值的和即为图片的人数估计值；所述的特征提取模块与密集估计模块、稀疏估计模块还存在如下连接：特征提取模块的第7层卷积层的输出与密集估计模块的第3层卷积层的输出按通道叠加后输入到密集估计模块的第4层卷积层，特征提取模块的第10层卷积层的输出与密集估计模块的第1层卷积层的输出按通道叠加后输入到密集估计模块的第2层卷积层，特征提取模块的第7层卷积层的输出与稀疏估计模块的第3层卷积层的输出按通道叠加后输入到稀疏估计模块的第4层卷积层，特征提取模块的第10层卷积层的输出与稀疏估计模块的第1层卷积层的输出按通道叠加后输入到稀疏估计模块的第2层卷积层；步骤3：首先，设定分类模块的损失函数为交叉熵损失函数，计算公式为：其中，LC表示交叉熵损失函数，y表示真值标签密集或稀疏，表示预测标签；固定稀疏估计模块和密集估计模块中的参数，将密度等级数据集输入到网络对分类模块进行训练；然后，设定密集估计和稀疏估计两个模块的损失函数都为均方差损失函数，计算公式为：其中，LD表示均方差损失函数，N表示测试图片数量，i表示图片标号，yi表示第i张图片的真值人数，y'i表示第i张图片的预测人数；固定分类模块、特征提取模块和稀疏估计模块的参数，将密集数据集输入到网络对密集估计模块进行训练；最后，固定分类模块、特征提取模块和密集估计模块的参数，将稀疏数据集输入到网络对稀疏估计模块进行训练，至此完成整个网络的预训练；步骤4：对于测试数据集，首先，将其训练集中的所有图片输入到步骤3预训练后的网络，并按下式对图片进行密集程度标记：其中，denD表示密集估计模块输出的人数估计值，denS表示稀疏估计模块输出的人群估计值，gt代表图片中总人数的真实值，label表示输入图片的密集程度标签，Dense表示密集，Sparse表示稀疏；然后，将带密集程度标签的训练集中的所有图片输入到网络进行整体训练，训练中设定网络总的损失函数Lall为：Lall＝αLC+βLD4其中，α为控制分类模块比重的权重系数，取值范围为0-1，β为控制密集估计模块和稀疏估计模块比重的权重系数，取值范围为0-1；所述的待测试数据集包括ShanghaiTech数据集、UCF_CC数据集；步骤5：将待计数人群图片输入到步骤4得到的训练好的网络中，经过三个模块的估计，分别得到密集与稀疏的分类权重、密集估计结果和稀疏估计结果，将密集估计结果和稀疏估计结果按照其对应的分类权重进行加权求和，即得到图片的密度图，将密度图中所有像素值相加，即得到图片的估计总人数。

全文数据：

权利要求：

百度查询：西北工业大学基于场景分类和多尺度特征融合的复杂场景人群计数方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

下一篇：涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

相关技术

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

涨紧机构及包含该机构的内模组件_江苏江扬建材机械有限公司_202322625490.1

管带纠偏装置_武汉巨沣工程技术有限公司_202322765867.3

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种网格化终端旋转装置_北京国旺盛源智能终端科技有限公司_202322619930.2

一种药材脱皮机_安徽亳药福泰药业有限公司_202322752517.3

一种散热户外路灯灯头_中山市澳斯朗电控科技有限公司_202322819842.7

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种新型箱式变电站户外壳体_武汉市合力电器有限公司_202322574997.9

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

一种危废行业可快速更换的水封出渣系统_渤瑞环保股份有限公司_202322016372.0

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

复杂相关技术

降低复杂度的极化编码和解码_交互数字专利控股公司_201980031411.8

一种适用于复杂水力联系的海绵城市洪涝优化调度方法_南昌工程学院_202011092833.7

一种基于复杂度引导相位恢复的散斑成像重建方法_杭州电子科技大学_202110746763.0

一种便于在复杂地型安装的环形水泥电杆_澜沧浩博水泥制品有限责任公司_202322591775.8

一种复杂干扰场景下的机载雷达无意干扰抑制方法_西安电子科技大学_202010819190.5

复杂工况故障诊断方法、设备、存储介质及装置_中南民族大学_202110776972.X

一种适用于复杂地质环境的深层地热钻探装置_大安润风能源开发有限公司_202410149091.9

用于双向光流的复杂度降低和位宽控制_VID拓展公司_201980060852.0

复杂电子系统可靠性量化方法、装置和计算机设备_中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室))_202010328159.1

一种低复杂度的适用于双流传输的信道均衡与软解调方法_成都中科微信息技术研究院有限公司_202210138473.2

场景相关技术

金融场景下的身份认证方法、装置和系统_北京金山云网络技术有限公司_202110027863.8

自动驾驶测试场景构建方法、装置、设备及可读存储介质_长安大学_202010625061.2

一种电网运行场景动态判定方法及系统_北京科东电力控制系统有限责任公司_202010410473.4

基于时序生成对抗网络的月度风光发电功率场景分析方法_重庆大学_202110345017.0

一种基于数据孪生的自动化场景信息生成方法_中国电力科学研究院有限公司_202110636718.X

虚拟场景中AI角色的行为控制方法、系统及存储介质_南京维赛客网络科技有限公司_202410214906.7

一种复杂干扰场景下的机载雷达无意干扰抑制方法_西安电子科技大学_202010819190.5

同时满足物用及人用场景的5G组网方法以及系统_天翼物联科技有限公司_202111624454.2

金融场景下的身份验证方法、装置和系统_北京金山云网络技术有限公司_202110022592.7

一种基于锚点图像的地下停车场多尺度场景识别方法_湖北工业大学_202111627216.7

融合相关技术

抗体融合蛋白及其制备和应用_北京诺诚健华医药科技有限公司_202211293426.1

一种含雾图像融合模型和方法_佛山科学技术学院_202410076413.1

一种塑料件高温融合设备_河源艺昇精密科技有限公司_202322688573.5

一种多特征融合的行人跟踪方法_杭州锐颖科技有限公司_202311346658.3

一种基于多路口多传感器的航迹融合方法及系统_超级视线科技有限公司_202111569137.5

一种致癌性融合激酶抑制剂的晶型及其应用_南京再明医药有限公司_202080058668.5

轨道几何参数与车辆动力学融合影响分析方法及系统_南京地铁运营咨询科技发展有限公司_202410172454.0

一种基于运动约束的融合定位方法及装置_北京斯年智驾科技有限公司_202211198340.0

一种全领域产品节点体系动态融合与生长方法_杭州量知数据科技有限公司_202111166990.2

一种基于Transformer的特征融合的调制识别方法_中国人民解放军军事科学院系统工程研究院_202210933070.7

龙图腾网&IPTOP

【发明公布】基于场景分类和多尺度特征融合的复杂场景人群计数方法_西北工业大学_202010583112.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务