买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于伪标签优化的无监督域适应行人重识别方法_南京大学;江苏万维艾斯网络智能产业创新中心有限公司_202110469776.8 

申请/专利权人:南京大学;江苏万维艾斯网络智能产业创新中心有限公司

申请日:2021-04-28

公开(公告)日:2024-04-12

公开(公告)号:CN113378632B

主分类号:G06F30/27

分类号:G06F30/27

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2021.09.28#实质审查的生效;2021.09.10#公开

摘要:本发明公开了一种基于伪标签优化的无监督域适应行人重识别算法,属于计算机视觉研究方向。本发明使用了辅助分类器结构,利用概率分布距离度量方法来度量深浅网络的不同表达能力,该方法包括:步骤S1、利用在大型图像数据集ImageNet上预训练的模型对本发明的backbone网络进行初始化;步骤S2、在源域数据集上进行有监督训练微调模型;步骤S3、源域数据集上训练的模型初始化提出的伪标签优化框架,并使用聚类算法生成置信度为1的硬伪标签;步骤S4、计算辅助分类器结构输出的类别预测向量与主分类器结构输出的类别预测向量之间的KL散度值;步骤S5、设计新的损失函数训练网络;步骤S6、不断迭代进行伪标签生成、伪标签可靠性度量与伪标签优化步骤,直至模型收敛。

主权项:1.一种基于伪标签优化的无监督域适应行人重识别方法,其特征在于,包括如下步骤:步骤S1、使用ResNet-50网络作为主干网络,去除其最后一层全连接层,并额外添加两个全连接层,分别命名为FC-1000和FC-MS;在FC分类器结构之前引入了SPP结构,首先通过1×1的卷积层来控制输出通道数为2048;接着,利用空间金字塔池化整合特征,得到固定尺寸的输出,然后将其送入FC层;最后,使用在大型数据集ImageNet上预训练的模型进行初始化,确保参数的有效性;步骤S2、行人图像经过统一调整为相同尺寸256×128,随后,我们设置了网络训练的相关参数,并通过调整不同的随机参数进行多次有监督训练;在训练过程中,我们选取了两个性能更好的预训练模型;损失函数方面,采用了交叉熵分类损失和基于阈值的三元组损失;步骤S3、网络由三条支路组成,平均网络是主干网络的过去形式,而源域数据集训练好的两个更优模型被用来初始化主干网络和平均网络,主干网络与平均网络的结构有所不同,在ResNet-50-4b5网络层和ResNet-50-5c网络层,分别引入了辅助分类器和主分类器结构,只有主分类器所属的分支结构会被用来在源域上进行训练;此外,辅助结构的网络参数也同样使用源域预训练参数进行初始化;最后,指定了K-Means聚类算法所需的超参数K,代表最终生成的样本类别数,聚类算法被用于为目标域图像生成置信度为1的硬伪标签;步骤S4、对于每张输入图像,主干网络的主分类器和辅助分类器分别生成不同的类别概率预测,使用相对熵公式计算这两类别预测之间的概率分布距离,结果越大,表示通过聚类算法生成的伪标签越不可靠;步骤S5、首先,根据计算得到的相对熵值,设计一种正则化损失形式,分别应用于硬分类损失和硬三元组损失,形成正则分类损失和正则三元组损失;其次,利用平均网络为主干网络提供软的伪标签,分别设计为软分类损失和软三元组损失;最后,这四种损失函数通过加权形式组合在一起,对网络进行优化;步骤S6、聚类算法用于为主干网络生成硬伪标签,通过可靠性度量值来校正硬损失,同时,平均网络为主干网络生成软伪标签,并设计相应的软损失,整个过程包括伪标签生成、伪标签批判度量、伪标签优化步骤,直至模型收敛,在测试阶段,利用平均网络的特征编码部分提取目标域测试集中查询图像和搜索集图像的特征,度量二者之间的相似度,返回相似度从高到低的排序结果,并计算评价指标,以完成行人重识别检索任务。

全文数据:

权利要求:

百度查询: 南京大学;江苏万维艾斯网络智能产业创新中心有限公司 一种基于伪标签优化的无监督域适应行人重识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。