【发明公布】基于概念蒸馏和CLIP的可提示分割模型预训练方法及系统_北京智源人工智能研究院_202311675435.1

申请/专利权人：北京智源人工智能研究院

申请日：2023-12-07

公开（公告）日：2024-03-08

公开（公告）号：CN117671426A

主分类号：G06V10/774

分类号：G06V10/774;G06V10/26

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.03.26#实质审查的生效;2024.03.08#公开

摘要：一种基于概念蒸馏和CLIP的可提示分割模型预训练方法，可提示分割模型包括一体化的图像解码器、CLIP视觉编码器和CLIP文本编码器；方法包括：获取用于可提示分割模型预训练的图片‑掩码输入，并获得用于概念蒸馏的模板文本描述；将图片输入经过可提示分割初始模型ProTo的图像解码器进行第一视觉嵌入操作获得第一视觉嵌入；将图片输入经过CLIP视觉编码器进行第二视觉嵌入操作获得第二视觉嵌入；将模板文本描述经过CLIP文本编码器进行第三文本嵌入操作获得第三文本嵌入；基于分割损失Segloss与概念蒸馏损失KLloss的联合优化损失Lloss进行基于概念蒸馏和CLIP的可提示分割模型预训练；其中概念蒸馏损失KLloss与第一视觉嵌入、第二视觉嵌入和第三文本嵌入相关联。

主权项：1.一种基于概念蒸馏和CLIP的可提示分割模型预训练方法，其特征在于，所述可提示分割模型基于可提示分割初始模型ProTo预训练获得，所述可提示分割模型包括一体化的图像解码器、CLIP视觉编码器和CLIP文本编码器；所述方法包括：S1，获取用于可提示分割模型预训练的图片-掩码输入，并获得用于概念蒸馏的模板文本描述；S2，将所述图片输入经过可提示分割初始模型ProTo的图像解码器进行第一视觉嵌入操作获得第一视觉嵌入；S3，将所述图片输入经过CLIP视觉编码器进行第二视觉嵌入操作获得第二视觉嵌入；S4，将所述模板文本描述经过CLIP文本编码器进行第三文本嵌入操作获得第三文本嵌入；S5，基于分割损失Segloss与概念蒸馏损失KLloss的联合优化损失Lloss进行基于概念蒸馏和CLIP的可提示分割模型预训练；其中所述概念蒸馏损失KLloss与第一视觉嵌入、第二视觉嵌入和第三文本嵌入相关联。

全文数据：

权利要求：

百度查询：北京智源人工智能研究院基于概念蒸馏和CLIP的可提示分割模型预训练方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：随流检测方法、装置及系统_华为技术有限公司_202211348549.0

下一篇：流体控制组件_浙江三花汽车零部件有限公司_202211325586.X

相关技术

随流检测方法、装置及系统_华为技术有限公司_202211348549.0

流体控制组件_浙江三花汽车零部件有限公司_202211325586.X

魏斯氏菌及其应用_湖南农业大学_202311706432.X

安装装置和安装方法_利萨·德雷克塞迈尔有限责任公司_202311339998.3

分层定压配水方法_大庆油田有限责任公司_202211326164.4

心理辅导用的环境照明灯光_西安鼎力信息技术有限责任公司_202211332585.8

用于生成多个道路使用者的轨迹信息的方法和系统_APTIV技术股份公司_202311406778.8

隐私保护图像传感器_豪威科技股份有限公司_202310919691.4

用于虚拟直播的播控方法、PC设备、移动终端、计算机可读存储介质_蓝色宇宙数字科技有限公司_202311811538.6

基于终端设备的线程调度方法、终端设备和介质_荣耀终端有限公司_202211349182.4

一种用于废气净化的镍合金洗涤器_南京胜德金属装备有限公司_202311756686.2

天线组件和电子设备_深圳市锐尔觅移动通信有限公司_202211347912.7

龙图腾网&IPTOP

【发明公布】基于概念蒸馏和CLIP的可提示分割模型预训练方法及系统_北京智源人工智能研究院_202311675435.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务