【发明授权】基于CLIP快速构建图像分类模型的方法_厦门瑞为信息技术有限公司_202311719576.9

导航：龙图腾网> 最新专利技术> 基于CLIP快速构建图像分类模型的方法_厦门瑞为信息技术有限公司_202311719576.9

申请/专利权人：厦门瑞为信息技术有限公司

申请日：2023-12-14

公开（公告）日：2024-03-01

公开（公告）号：CN117409262B

主分类号：G06V10/764

分类号：G06V10/764;G06V10/82;G06N3/0464;G06N3/0895

优先权：

专利状态码：有效-授权

法律状态：2024.03.01#授权;2024.02.02#实质审查的生效;2024.01.16#公开

摘要：本发明公开一种基于CLIP快速构建图像分类模型的方法，包括S1、搜集图像；S2、使用CLIP模型筛选特定标签图像；S3、制作分类数据集，将数据集划分为训练集和测试集；S4、使用DivideMix方法训练分类模型。本发明采用CLIP图文匹配技术，通过输入标签文本即可从海量数据中提取出符合标签要求的数据图像，构建出可以用学习分类模型的数据集，而无需人工标注。同时针对筛选出的图像中可能存在的噪声（即类别错误）的问题，本发明引入带噪声数据的学习方法DivideMix，以降低数据集中噪声带来的影响。用此方法训练图像分类模型，可以提升模型的训练效率，降低数据标注需求，成本低，同时还可以达到不错的模型效果。

主权项：1.基于CLIP快速构建图像分类模型的方法，其特征在于，包括以下步骤：S1、搜集图像；S2、使用CLIP模型筛选特定标签图像，得到带噪声的数据集；S3、采用CLIP模型对图片进行零样本分类制作数据集，具体做法为：对于特定的一张图片，计算其与所有类别描述的相似性，将其归为相似度最大的文本类别，将带噪声的数据集按8:2划分为训练集和测试集，对测试集中的图片进行人工核验，修正错误分类的图像；S4、使用DivideMix方法，用带噪声的数据集训练分类模型，DivideMix训练分类模型的流程分为以下步骤：S41、模型初始化：随机初始化两个相同的分类神经网络A模型、B模型；S42、预训练：A、B每个模型先正常训练对应的多个epoch，预训练阶段的损失函数为交叉熵损失加negativeentropy惩罚项，其作用是限制置信度过高的预测结果，避免模型对噪声数据的过拟合；S43、数据集划分：记录训练集中每个样本的分类loss，使用高斯混合模型建模，将loss分布分解为两个高斯分布的统计模型，一个为正确分类的分布，处于这个分布中心的样本loss较小；另外一个为错误分类的分布，处于这个分布中心的样本loss较大，选取分类loss较小的分布，使用阈值将样本分为两部分，大于设定阈值的保留原标签，剩下的设为无标签；S44、半监督训练：半监督训练采用DivideMix中改进的MixMatch半监督训练方法，A模型划分的数据集用于给到B模型进行半监督训练，B模型划分的数据集用于给到A模型进行半监督训练；具体实现方法主要包括以下步骤：A21、加载数据训练数据，对数据进行增强；一个batch加载等量的有标签和无标签的图像数据，标签转换为One-hot编码形式，有标签和无标签的图像样本均经过数据增强产生2张增强后的图像样本；A22、对有标签的数据的标签进行线性加权修正，对无标签的数据的标签进行猜测；其中，有标签数据线性加权修正标签的做法是：当对A模型进行半监督训练时，将带标签的样本的标签运用B模型的预测结果进行修正，假设B网络预测样本为正确分类的概率为，类别标签为，B模型的网络预测为，则修正的标签为：训练时会将一个样本增强为2个样本，采用sharpening函数对一个样本对应的2个标签向量进行降温，得到该样本的标签，当训练B模型时也是如此，只是采用A模型作为辅助；无标签数据联合推测标签做法是：针对无标签样本和其数据增强后的2个样本，分别输入A模型和B模型，得到4个预测向量，对每个样本的2个两个预测结果取平均，并采用sharpening函数对这4个样本的预测向量进行降温，得到该样本的标签；A23、对数据增强后的数据进行MixUp；一个次数据加载n个有标签的样本和n个无标签的样本，经过数据增强会产生2n个有标签的样本，和2n个无标签的样本，将所有样本合成一个列表，前面2n个为有标签的样本，后面2n个为无标签的样本，列表中的每个样本与4n个样本中的随机一个做MixUp，产生4n个新的样本，无标签样本在MixUp时使用的是猜测的标签，MixUp时，令合并系数；A24、使用MixUp后的数据训练模型；训练模型时，模型损失函数分为三部分，前2n个以有标签为主的MixUp数据采用交叉熵损失，后2n个以猜测标签为主的MixUp数据采用均方差损失，另外加上正则项，避免模型的所有输出为同一类；S45、迭代：重复步骤S43、S44，训练多个epoch；S46、半监督模型推理，主要有两种方法：A、B双模型联合推理和单模型推理，A、B双模型联合推理的做法是：读取图片，图像预处理，A模型前向推理得到结果tensorA，B模型前向推理得到结果tensorB，将tensorA与tensorB相加，取概率最大的值对应的类别；单模型推理的做法是：选择A模型、B模型中在测试集上表现更好的模型作为最终的模型。

全文数据：

权利要求：

百度查询：厦门瑞为信息技术有限公司基于CLIP快速构建图像分类模型的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种商用燃气蒸饭柜_安徽铂悦厨业科技股份有限公司_202322509637.0

下一篇：一种带有调节机构的抗震支架_陕西开天实业有限公司_202322564448.3

相关技术

一种商用燃气蒸饭柜_安徽铂悦厨业科技股份有限公司_202322509637.0

一种带有调节机构的抗震支架_陕西开天实业有限公司_202322564448.3

一种用于公路施工的防撞装置_江苏常鑫路桥集团有限公司_202322375940.6

一种皮带机料仓缓冲装置_唐山天和环保科技股份有限公司_202322478618.6

换向阀铸造模具_烟台古河智能装备有限公司_202322526540.0

一键式智能配茶机_上海嘻粒粒食品科技有限公司_202322460102.9

雷达安装结构及车辆_长城汽车股份有限公司_202322575661.4

一种提高密封性能的轴承_杭州星淼机械有限公司_202322592333.5

一种橡胶注射成型机_航大电气有限公司_202322534855.X

一种砂卵地层浅埋暗挖快速注浆施工设备_中铁六局集团有限公司_202322371235.9

一种具有伸缩式笔盖功能的硅胶笔_富东新材料科技(东莞)有限公司_202322580378.0

一种畜牧用定量自动配比喂料装置_金阳县农业农村局_202322376066.8

构建相关技术

样本数据构建方法及装置_杭州阿里云飞天信息技术有限公司_202410109946.5

学习完成模型的构建方法_川崎重工业株式会社_202280060412.7

一种风机盘管换热量计算模型的构建方法及构建装置_北京建筑大学_202111312783.3

知识图谱构建方法、装置、设备及存储介质_北京百度网讯科技有限公司_202410005382.0

一种可视化流程构建方法_苏州循迹科技有限公司_202410124125.9

一种单倍型的构建方法_上海韦翰斯生物医药科技有限公司_202011004177.0

视图构建方法、系统、电子设备及存储介质_香港科技大学(广州)_202311770146.X

画像构建方法、训练方法及其相关装置_科大讯飞股份有限公司_202311842651.0

一种生态沟渠及其构建方法_中国电建集团重庆工程有限公司_202310954183.X

一种知识图谱构建方法及系统_国家能源集团新能源技术研究院有限公司_202410044149.3

分类相关技术

螺栓检测分类装置_中国建筑第八工程局有限公司_202322796253.1

宠物饲料分类储存桶_廖建新_201810208778.X

图像分类方法及装置_中国科学院自动化研究所_202311801526.5

对象分类模型的训练方法、对象分类方法及装置_马上消费金融股份有限公司_202311255275.5

文本分类模型的训练方法、文本分类方法及相关装置_马上消费金融股份有限公司_202310978155.1

文本分类模型的训练方法、分类方法、设备及存储介质_马上消费金融股份有限公司_202311438585.0

储集层分类模型训练方法、分类方法、系统、设备及介质_北京月新时代科技股份有限公司_202410164032.9

文本分类模型的训练方法、文本分类方法及相关设备_马上消费金融股份有限公司_202311229312.5

文本分类模型训练方法、文本分类方法及相应装置_马上消费金融股份有限公司_202311213593.5

一种工具分类存放架_绿苑景观规划设计(山东)有限公司_202322706719.4

图像相关技术

图像处理装置及图像处理方法_歌乐株式会社_202010236643.1

图像处理装置及图像读取方法_株式会社理光_202110635351.X

图像特征处理方法、图像编码方法、图像解码方法及装置_浙江大华技术股份有限公司_202311736442.8

使用伪图像的面部图像识别_斯托瓦斯医学研究所_201980044730.2

图像处理方法、图像处理装置及存储介质_北京小米松果电子有限公司_202010803059.X

图像处理方法、图像处理模型的训练方法_阿里巴巴(中国)有限公司_202310691722.5

图像传感器、图像传感方法、电子设备_华为技术有限公司_202211705564.6

图像生成装置、图像生成方法和程序_株式会社理光_201910327488.1

图像形成方法及图像形成装置_兄弟工业株式会社_202080043285.0

图像测定系统、图像测定方法以及程序_株式会社三丰_202311396969.0

龙图腾网&IPTOP

【发明授权】基于CLIP快速构建图像分类模型的方法_厦门瑞为信息技术有限公司_202311719576.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务