买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于VGG网络的自动人群计数图像识别方法_北京大学_202110028647.5 

申请/专利权人:北京大学

申请日:2021-01-11

公开(公告)日:2024-03-01

公开(公告)号:CN112733714B

主分类号:G06V20/52

分类号:G06V20/52;G06V10/82;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.03.01#授权;2021.05.21#实质审查的生效;2021.04.30#公开

摘要:本发明公布了一种基于VGG网络的自动人群计数图像识别方法,利用VGG网络模型对图像进行嵌入式层归一化处理,基于VGG网络嵌入式层归一化进行人群计数图像识别,所述自动人群计数图像识别方法命名为VadaLN;包括:建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet;采用尺度重组网络模块SSM用于进行人群计数,使用散度马尔可夫随机场损失函数DivMRF对人群计数任务建模,并通过对抗式上下文损失函数ACL建立非对齐优化方法,实现密度图估计的非一致训练,优化VadaLNet的参数。本发明方法对输入的包含人群的图像进行识别和人群计数,过滤与计数任务无关的图像特征,即得到VadaLN值,实现基于VGG网络的自动人群计数图像识别。

主权项:1.一种基于VGG网络的自动人群计数图像识别方法,利用VGG网络模型对图像进行嵌入式层归一化处理,基于VGG网络嵌入式层归一化进行人群计数图像识别,所述自动人群计数图像识别方法命名为VadaLN;包括:建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet;采用尺度重组网络模块SSM用于进行人群计数,使用散度马尔可夫随机场损失函数DivMRF对人群计数任务建模,并通过对抗式上下文损失函数ACL建立非对齐优化方法,实现密度图估计的非一致训练,优化VadaLNet的参数;所述自动人群计数图像识别方法VadaLN对输入的包含人群的图像进行识别和人群计数,过滤与计数任务无关的图像特征,即得到VadaLN值;包括如下步骤:1建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet,包括VGG网络的后端和新创建的尺度重组网络模块SSM,SSM包括像素重组模块;2预训练基于VGG网络模型的嵌入式层归一化网络模型VadaLNet,采用提出散度马尔可夫随机场损失函数DivMRF和对抗式上下文损失函数ACL优化VadaLNet的参数;训练过程中,将图像分割成小块,并进行标准化处理,计算损失函数;具体实现包括如下过程:21尺度归一化处理:将所有的图像数据归一化到统一的分辨率和长宽比;22图像标准化处理:对图像的像素点的强度分别依照正态分布进行调整;23进行像素重组:图像经过神经网络之后得到N层的张量,将张量的N层合并到同一层;层中的特征图与下采样得到的特征图通过尺度重组网络模块SSM进行拼接,得到重组后的张量;24将重组后的张量进行空洞卷积操作,得到新的特征图,进行像素叠加后计算最终的计数结果;25训练的损失函数采用逐像素的L1范数进行计算;包括:251散度马尔可夫随机场损失函数DivMRF的计算;将图像分割成小块,并作标准化处理,使其服从高斯分布;PatchX={x0,0,x0,1,…,xM-1,N-1},PatchY={y0,0,y0,1,…,yM-1,N-1}. 其中,PatchX,PatchY表示由输入图像X,Y分割的小块组成的集合,N表示标准化操作,μ和σ分别为均值和标准差;计算KL散度,再利用KL散度计算损失函数: 其中,Nk表示集合由PatchX,PatchY中标准化后的元素;252对抗式上下文损失函数ACL的计算方法 其中,CX指的是上下文相似度;φ指的是预训练的VGG网络;φ的上标表示使用的是哪一层的特征;D*ACL是ACL函数使用的对抗性损失函数;ina表示待计算的图像;inb表示参考的计数结果;3利用训练好的基于VGG网络模型的嵌入式层归一化网络模型VadaLNet,对输入的包含人群的图像进行识别和人群计数,过滤与计数任务无关的图像特征,得到VadaLN值;具体输入包含人群的RGB图像;将RGB图像输入预训练好的VadaLNet中的VGG网络,收集VGG网络中的conv33和conv42特征层,并对这两个特征层作归一化处理,对这两个特征层的内容计算均值μ和标准差σ: 其中,H为张量的层数,xi=张量的第i层,σ为该张量的标准差;再通过计算得出VadaLN的值,即进行基于VGG的适应性层归一化,表示为: 其中,σf和μf是VGG特征中代表语义内容的特征计算得到的标准差和均值;σs和μs是VGG特征中代表图像质量的特征计算得到的标准差和均值;通过上述步骤,即实现基于VGG网络嵌入式层归一化进行人群计数图像识别。

全文数据:

权利要求:

百度查询: 北京大学 一种基于VGG网络的自动人群计数图像识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。