【发明授权】一种基于CLIP的零样本文本分类方法、系统及介质_中南大学_202310778409.5

导航：龙图腾网> 最新专利技术> 一种基于CLIP的零样本文本分类方法、系统及介质_中南大学_202310778409.5

申请/专利权人：中南大学

申请日：2023-06-29

公开（公告）日：2024-03-08

公开（公告）号：CN116701637B

主分类号：G06F16/35

分类号：G06F16/35;G06F40/30;G06N3/0455;G06N3/0464;G06V10/82;G06V10/74;G06F18/22

优先权：

专利状态码：有效-授权

法律状态：2024.03.08#授权;2023.09.22#实质审查的生效;2023.09.05#公开

摘要：本发明公开了一种基于CLIP的零样本文本分类方法、系统及介质，其中方法包括：S1：获取待分类文本；S2：将文本输入文本编码器得到文本向量，将文本图像集中的图像集输入图像编码器得到图像向量；S3：将文本向量和图像向量进行计算处理得到图片和文本的相似程度；S4：根据当前分类任务类型和计算得到的相似程度进行预测匹配得到文本分类的结果。将文本信息和图像信息相结合，并应用于自然语言处理中，实现了将文本分类任务重构为CLIP模型能够解决的文本图像匹配任务，提高了文本分类的精度。

主权项：1.一种基于CLIP的零样本文本分类方法，其特征在于，包括：S1：获取待分类文本；S2：将文本输入文本编码器得到文本向量，将文本图像集中的图像集输入图像编码器得到图像向量；其中，所述文本图像集中图像集获取过程为：S21：根据待分类文本获取文本集、标签集；其中文本集为待分类文本的集合，标签集为待分类文本可能所属分类的集合；S22：针对标签集中每个标签随机下载一张图片，得到由所有下载图片构成的图像集；S23：将文本标签集转换为文本图像集；或者，所述文本图像集中图像集获取过程为：S21：根据待分类文本获取文本集、标签集；其中文本集为待分类文本的集合，标签集为待分类文本可能所属分类的集合；S22：针对标签集中每个标签随机下载多张图片进行ensemble增强，得到由所有下载图片构成的图像集；S23：将文本标签集转换为文本图像集；其中，所述文本标签集转换为文本图像集的具体过程为：按照每个标签的种类，采用S22中获取的对应图片做替换，使文本标签对映射到文本图像集其中，xi为第i个文本，yi为第i个标签，为yi对应的M张图片，N为测试集中文本的数量；其中，获取文本图像集后，在测试集中文本的开头前添加额外的语义提示词用于prompt增强，表示为：其中，Prompt为针对不同文本分类测试集的特定任务的语义提示词；x为测试集中的文本；为添加额外的语义提示词后的文本；S3：将文本向量和图像向量进行计算处理得到图片和文本的相似程度；S4：根据当前分类任务类型和计算得到的相似程度进行预测匹配得到文本分类的结果；其中，所述分类任务类型包括单标签分类任务、多标签分类任务；所述根据计算得到相似程度和当前分类任务类型进行预测匹配得到分类的结果过程具体为：若分类任务类型为单标签分类任务，则选择相似程度最高的类别作为最终匹配结果；若分类任务类型为多标签分类任务，则选择相似程度大于预设阈值的类别作为最终匹配结果。

全文数据：

权利要求：

百度查询：中南大学一种基于CLIP的零样本文本分类方法、系统及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：信息处理方法、装置、电子设备及存储介质_马上消费金融股份有限公司_202211335487.X

下一篇：水系喷墨油墨组合物及喷墨记录方法_精工爱普生株式会社_202311414049.7

相关技术

信息处理方法、装置、电子设备及存储介质_马上消费金融股份有限公司_202211335487.X

水系喷墨油墨组合物及喷墨记录方法_精工爱普生株式会社_202311414049.7

一种曲面抛光打磨装置中的双轴力控补偿机构_朝华力拓精密(深圳)有限公司_202410058832.2

显示面板及其制备方法、显示装置_深圳市华星光电半导体显示技术有限公司_202410042140.9

一种便携式气管插管系统_中国人民解放军战略支援部队特色医学中心_202311457414.2

一种显示设备及笔迹显示方法_京东方科技集团股份有限公司_202310637028.5

视频处理方法、装置、设备、系统及可读取存储介质_华为技术有限公司_202211336886.8

一种气象数据对船闸影响度的预测方法及系统_长江三峡通航管理局_202311632552.X

数字信号解析方法、装置、设备及车辆_北京罗克维尔斯科技有限公司_202211349864.5

随流检测方法、装置及系统_华为技术有限公司_202211348549.0

参数优化方法及相关装置_华为技术有限公司_202211347771.9

流体控制组件_浙江三花汽车零部件有限公司_202211325586.X

龙图腾网&IPTOP

【发明授权】一种基于CLIP的零样本文本分类方法、系统及介质_中南大学_202310778409.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务