买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于去相机偏差和动态更新记忆模型的无监督行人重识别方法_中国科学技术大学_202210049404.4 

申请/专利权人:中国科学技术大学

申请日:2022-01-17

公开(公告)日:2024-04-02

公开(公告)号:CN114419670B

主分类号:G06V40/10

分类号:G06V40/10;G06V10/42;G06V10/62;G06V10/74;G06V10/762;G06V10/82;G06N3/0464;G06N3/045;G06N3/0442;G06N3/088;G06N3/084;G06N3/048

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2022.05.20#实质审查的生效;2022.04.29#公开

摘要:本发明公开了一种基于去相机偏差和动态更新记忆模型的无监督行人重识别方法,其步骤包括:1.基于一个可学习的通道注意力模块可以从特征图中提取出与只和相机相关的特征,从而在全局特征中去除相机偏差,得到能够代表行人的鲁棒性的特征;2.采用一种根据实例特征与类别特征之间的距离实现动态更新记忆模型的方法,使类别特征趋向于真实的特征点。本发明能在全局特征中去除相机偏差,保证类别特征更新的正确性,从而能提升行人重识别的准确率。

主权项:1.一种基于去相机偏差和动态更新记忆模型的无监督行人重识别方法,其特征是按如下步骤进行:步骤1、获取行人图像数据集X1,X2,…,Xi,…,XN,其中,Xi表示第i张行人图像,N表示图像总数;获取所述行人图像数据集中每张行人图像的相机标签,其中,第i张行人图像Xi的相机标签记为Yj表示第j种标签,M表示标签的种类数;步骤2、构建特征提取器,包括:骨干网络以及通道注意力模块;所述骨干网络以ResNet-50网络为基础,并包括r个layer层,每个layer层中包含有不同数量的block块,每个block块中包含s个卷积层;利用ImageNet数据集对所述特征提取器进行预训练,得到预训练后的特征提取器;步骤2.1、将所述第i张行人图像Xi输入到预训练后的特征提取器中,并经过所述骨干网络,输出第i张行人图像的全局特征向量Fi∈Rh×w×c,h表示特征图Fi的高度,w表示特征图Fi的宽度,c表示特征图Fi的通道数;步骤2.2、所述全局特征向量Fi输入所述通道注意力模块中,并利用式1得到通道注意力向量ai∈Rc:ai=σw2δW1poolFi1式1中,pool表示全局平均池化操作、W1表示全连接操作、δ表示ReLu激活函数、W2表示另一个全连接操作、σ表示sigmoid函数;步骤2.3、将通道注意力向量ai与全局特征向量Fi在对应通道维度相乘后得到行人特征Ci=ai·Fi,且Ci∈Rh×w×c,从而得到所有行人图像的行人特征C=C1,C2,…,Ci,…,CN;步骤2.4、利用DBSCAN聚类方法对所有行人图像的行人特征C进行聚类,从而得到行人图像数据集的伪标签表示第i张行人图像Xi的伪标签,月K为伪标签类别数目;步骤3、将聚类后的每个类别的伪标签下所有行人特征的均值作为每一类的类别特征并存储在记忆模型中,并记为{Q1,Q2,…,Qj,…,QK};其中,Qj表示记忆模型中第j类的类别特征;步骤4、特征提取器的训练;步骤4.1、将所述第i张行人图像Xi输入预训练后的特征提取器中,并得到通道注意力向量ai和行人特征Ci,从而得到第i张行人图像Xi的相机风格特征Ii=1-ai·Fi;步骤4.2、利用式2得到第i张行人图像Xi的相机预测概率Pi:Pi=SoftmaxW×GAPIi+b2式2中,Softmax表示归一化指数函数,GAP表示全局池化操作,W表示全连接层的权重,b表示全连接层的偏置;步骤4.3、利用式3得到第i张行人图像Xi的相机预测损失 步骤4.4、利用所述第i张行人图像Xi的行人特征Ci与记忆模型中对应的类别特征构建第i张行人图像Xi的对比学习损失步骤4.5、利用式4得到第i张行人图像Xi的更新因子mi: 式4中,表示按批次输入网络的图片中与第i张行人图像Xi伪标签一致的行人图片的行人特征的均值,σ表示按批次输入网络的图片中与第i张行人图像Xi伪标签一致的行人图片的行人特征的方差,γ表示放缩因子;步骤4.6、利用式5得到记忆模型中更新后的第j类的类别特征 步骤4.7、利用式6建立全局损失函数L: 式6中,λ表示的系数,B表示当前批次大小;表示当前批次中第s张行人图像Xs的相机预测损失,表示当前批次中第s张行人图像Xs的对比学习损失;步骤4.8、通过随机梯度下降法对预训练后的特征提取器进行优化求解,并计算全局损失函数L后进行梯度反向传播,直到达到全局损失函数L收敛为止,从而得到训练后的特征提取模型;步骤5、行人重识别的查询匹配;将待查询的行人图像输入训练后的特征提取模型并提取行人特征,再将所提取的行人特征与检索库中所有行人特征进行相似度计算,并按照相似度进行降序排序,从而在所得到的排序列表中找到与待查询的行人图像行人身份一致的行人图片。

全文数据:

权利要求:

百度查询: 中国科学技术大学 基于去相机偏差和动态更新记忆模型的无监督行人重识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。