申请/专利权人:南京信息工程大学
申请日:2024-01-18
公开(公告)日:2024-04-26
公开(公告)号:CN117935307A
主分类号:G06V40/10
分类号:G06V40/10;G06V10/30;G06V10/42;G06V10/62;G06V10/764;G06V10/77;G06V10/82;G06N3/045;G06N3/08
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.14#实质审查的生效;2024.04.26#公开
摘要:本发明公开了一种双模态对齐的跨模态行人重识别方法,首先利用双重注意力视觉transformer作为特征提取的骨干网络,可以消除背景噪声并且充分捕捉可见光和红外图像中行人的全局特征信息。其次,提出了多粒度特征互学习策略,结合域对齐和自蒸馏策略来缓解模态差异,通过设计的损失函数来增强可见光特征和红外特征之间的识别感知能力和信息交互能力。此外,设计了双模态对齐子模块,分别在模态间和模态内利用全局自注意力机制来探索两种模态之间的潜在交互作用。本发明在两个广泛使用的跨模态数据集上进行了全面的评估,证明了所提出方法的有效性。此外,还在两个被损坏的跨模态数据集上进行了评估实验,结果表明了该方法的强泛化性。
主权项:1.一种双模态对齐的跨模态行人重识别方法,其特征在于,包括如下步骤:步骤1,基于双重注意力视觉transformer构建具有四个阶段的特征提取网络,用于对行人的可见光模态图片和红外模态图片进行特征提取;步骤2,将特征提取网络第三阶段和第四阶段输出的特征使用多粒度特征互学习策略进行特征优化;步骤3,利用双模态对齐模块对特征提取网络最终输出的特征进行特征处理;步骤4,利用损失函数对网络和分类结果进行优化,并对双模态对齐模块输出的特征进行相似性度量,输出匹配结果。
全文数据:
权利要求:
百度查询: 南京信息工程大学 一种双模态对齐的跨模态行人重识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。