【发明公布】一种针对缺乏文本信息的行人图像隐式类别提示学习方法_浙江工商大学_202410025270.1

导航：龙图腾网> 最新专利技术> 一种针对缺乏文本信息的行人图像隐式类别提示学习方法_浙江工商大学_202410025270.1

申请/专利权人：浙江工商大学

申请日：2024-01-08

公开（公告）日：2024-03-15

公开（公告）号：CN117711070A

主分类号：G06V40/20

分类号：G06V40/20;G06V30/18;G06V30/19;G06V10/82;G06N3/09

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.02#实质审查的生效;2024.03.15#公开

摘要：本发明公开了一种针对缺乏文本信息的行人图像隐式类别提示学习方法。本发明在视觉语言预训练模型的基础上首先经过其图像编码器分支得到对应行人图像的全局表征，在文本编码器分支上，在文本编码器之前加入本发明提出的行人图像隐式类别提示学习模块PID_Learner，再将行人图像对应的下标输入PID_Learner得到对应行人图像的隐式类别提示标记，然后将这些隐式类别提示标记作为输入由文本编码器得到对应行人图像的文本特征。本发明解决了当大量行人图像缺乏对应文本信息时，无法利用大型视觉语言预训练模型进行行人重识别下游任务的难题。

主权项：1.一种针对缺乏文本信息的行人图像隐式类别提示学习方法，其特征在于该方法包括以下步骤：选取一组带有下标的行人图像，冻结文本编码器和图像编码器参数；利用图像编码器提取该组行人图像的全局表征；提取该组行人图像对应标签，获得行人类别隐式文本提示；所述文本编码器根据得到的行人类别隐式文本提示进行文本编码，得到行人图像对应的文本特征；利用监督对比损失函数来的文本特征和图像特征的相似度损失值进行模型训练。

全文数据：

权利要求：

百度查询：浙江工商大学一种针对缺乏文本信息的行人图像隐式类别提示学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：图像传感器、图像传感方法、电子设备_华为技术有限公司_202211705564.6

下一篇：一种制备C18混合芳烃的方法与系统_中国石油化工股份有限公司_202211342226.0

相关技术

图像传感器、图像传感方法、电子设备_华为技术有限公司_202211705564.6

一种制备C18混合芳烃的方法与系统_中国石油化工股份有限公司_202211342226.0

一种栓接桥梁结构安装三维姿态控制方法_重庆交通大学_202311485642.0

一种便携式气管插管系统_中国人民解放军战略支援部队特色医学中心_202311457414.2

相机拍照防抖方法，装置，电子设备及介质_北京小米移动软件有限公司_202211339791.1

具有求平均值功能的装置和/或分析设备_西门子股份公司_202311415545.4

低速时车辆档位控制的方法和装置_上海汽车集团股份有限公司_202211337164.4

信道探测参考信号SRS的发送方法和电子设备_荣耀终端有限公司_202211349911.6

参数优化方法及相关装置_华为技术有限公司_202211347771.9

一种曲面抛光打磨装置中的双轴力控补偿机构_朝华力拓精密(深圳)有限公司_202410058832.2

显示面板及其制备方法、显示装置_深圳市华星光电半导体显示技术有限公司_202410042140.9

安装装置和安装方法_利萨·德雷克塞迈尔有限责任公司_202311339998.3

龙图腾网&IPTOP

【发明公布】一种针对缺乏文本信息的行人图像隐式类别提示学习方法_浙江工商大学_202410025270.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务