【发明公布】一种基于检索增强机制与视觉提示学习的小样本视觉分类方法和装置_浙江工业大学_202410079967.7

申请/专利权人：浙江工业大学

申请日：2024-01-19

公开（公告）日：2024-04-30

公开（公告）号：CN117953282A

主分类号：G06V10/764

分类号：G06V10/764;G06V10/774;G06V10/82;G06N3/0464

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.17#实质审查的生效;2024.04.30#公开

摘要：一种基于检索增强机制与视觉提示学习的小样本视觉分类方法和装置，包括：步骤1、获取多任务跨域小样本数据集并划分为训练集、验证集和测试集；步骤2、在CLIP模型的视觉编码器和文本编码器两端添加可学习提示参数以进行提示学习；步骤3、在小样本数据集上构建由键值对构成的检索数据库；步骤4、将图片输入视觉编码器得到查询表征，获取带有下游数据集先验的视觉提示；步骤5、将图像和类别文本输入带提示的视觉编码器和文本编码器，计算图文表征计算内积相似度，得到图像的多类别概率；步骤6、复制检索库的键和标签值作为辅助分类器，获得测试图像与训练图像检索的多类别概率，与图像的多类别概率加权求和得到最终多类别概率并计算交叉熵损失。

主权项：1.基于检索增强机制与视觉提示学习的小样本视觉分类方法，其特征在于：步骤1：获取多任务跨域的小样本数据集，单任务的原生数据集划分为训练集，验证集和测试集，从单任务数据集的训练集中随机采样得到小样本分类训练集，训练集Dtrain包含N个类别，包含原生训练集的所有类别，每类可以有1，2，4，8，16-shot的训练样本，验证集Dval的类别分布和训练集一致，但每类有4个训练样本，Dtest则是原生测试集；步骤2：在CLIP模型的视觉编码器和文本编码器两端添加可学习的提示参数以进行提示学习，文本编码器和视觉编码器的提示学习参数不共享；步骤3：在小样本训练集上构建检索数据库，包含|Dtrain|个键值对，键是使用CLIP的视觉编码器编码训练图像得到的图像表征值包含两种类型，标签y和可变的训练图像表征检索数据库提供适应下游任务变化的训练图像表征，并可以通过外部数据扩展检索库以提升检索丰富度；步骤4：图片经CLIP的视觉编码器编码获得查询表征，在查询表征和键表征间执行余弦相似度检索获取相关值，采用检索增强的视觉提示学习，获取带有下游数据集先验的视觉提示；步骤5：冻结视觉编码器和文本编码器参数，将图像和类别文本输入带提示的视觉编码器和文本编码器，计算图文表征计算内积相似度后得到图像x的多类别概率；步骤6：将检索库初始化为辅助分类器参与分类决策，复制检索库的键表征作为全连接层的初始化权重和对标签值进行独热编码，在训练时更新全连接层权重，将独热编码一致的训练图像表征与测试图像的相似度累加，获得测试图像与训练图像间检索的多类别概率，并与步骤5的多类别概率做加权求和得到最终多类别概率。

全文数据：

权利要求：

百度查询：浙江工业大学一种基于检索增强机制与视觉提示学习的小样本视觉分类方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

下一篇：消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

相关技术

一种可燃气体监测装置和方法_天信仪表集团有限公司_202111562761.2

消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

一种特殊螺纹上扣扭矩的分类识别方法及识别设备_中国石油天然气股份有限公司_202110576266.0

聚离子弹性体及其制备方法与应用_赛感科技(深圳)有限公司_202211412739.4

一种蜡样芽孢杆菌YZ-228发酵制剂及其制备方法和应用_吉林农业大学_202310313518.X

一种即时检验抗凝药物监测系统_北京倍肯恒业科技发展股份有限公司_202310581047.0

一种带角度弹性垫圈的热处理方法及热处理装置_贵州航天精工制造有限公司_202111464284.6

一种富氦气藏区带的评价方法、装置、设备及介质_中国石油天然气股份有限公司_202311208279.8

基于对抗样本的人体康复运动数据增强方法_大连海事大学_202110864746.7

高速公路隧道边墙二次衬砌模板支座、结构及使用方法_中铁十四局集团建筑工程有限公司_202111210321.0

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

龙图腾网&IPTOP

【发明公布】一种基于检索增强机制与视觉提示学习的小样本视觉分类方法和装置_浙江工业大学_202410079967.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务