【发明公布】基于有监督对比学习的跨模态视频-文本哈希检索方法_南京理工大学_202311698236.2

导航：龙图腾网> 最新专利技术> 基于有监督对比学习的跨模态视频-文本哈希检索方法_南京理工大学_202311698236.2

申请/专利权人：南京理工大学

申请日：2023-12-12

公开（公告）日：2024-03-22

公开（公告）号：CN117743639A

主分类号：G06F16/783

分类号：G06F16/783;G06F16/75;G06V20/40;G06V10/764;G06V10/774;G06V10/82;G06F16/35;G06F18/214;G06F18/2415;G06F40/30;G06N3/0455;G06N3/0895

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明公开了一种基于有监督对比学习的跨模态视频‑文本哈希检索方法，该方法为：使用时间一致性的空间增强方法对视频数据进行增强，使用EDA方法对文本数据进行增强，获得所有数据点对应的增强样本；分别使用双向Transformer自动编码器对视频和文本进行编码，将Transformer输出的特征输入到哈希层中得到视频和文本的哈希码；利用标签信息设计多模态对比学习，定义和锚点具有相同标签的数据点为正样本，和锚点标签不相同的数据点为负样本，分别在视频和文本模态间和模态内设计有监督多模态对比损失，并加入分类损失、量化损失和平衡损失，对模型进行训练之后，进行跨模态视频‑文本检索。本发明提高了从大数据中检索视频的效率和准确性。

主权项：1.一种基于有监督对比学习的跨模态视频-文本哈希检索方法，其特征在于，该方法包括以下步骤：步骤1、使用时间一致性的空间增强方法对视频数据进行增强，使用EDA方法对文本数据进行增强，获得所有数据点对应的增强样本；步骤2、分别使用双向Transformer自动编码器对视频和文本进行编码，将双向Transformer自动编码器输出的特征输入到哈希层中得到视频和文本的哈希码；步骤3、利用标签信息设计多模态对比学习，定义和锚点具有相同标签的数据点为正样本，和锚点标签不相同的数据点为负样本，然后设计多模态有监督对比损失，缩小锚点与正样本的距离，并扩大锚点与负样本的距离；步骤4、加入分类损失、量化损失和平衡损失，确定总体目标函数，对双向Transformer自动编码器进行训练；步骤5、使用训练好的双向Transformer自动编码器，进行跨模态视频-文本检索。

全文数据：

权利要求：

百度查询：南京理工大学基于有监督对比学习的跨模态视频-文本哈希检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

下一篇：电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

相关技术

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

用于高压柜体的固定防护装置_江苏贯中电气有限公司_202322341188.3

一种天然气管道不停输开孔装置_盐城新奥燃气有限公司_202322202238.X

一种高精度智能浊度检测装置_江苏奥坤仪表科技有限公司_202322546638.2

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

一种大米加工砂辊碾米机_湖北九龙湖米业有限公司_202322482168.8

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种防堵污水管道_浩卓泵业(杭州)有限公司_202322092893.4

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

龙图腾网&IPTOP

【发明公布】基于有监督对比学习的跨模态视频-文本哈希检索方法_南京理工大学_202311698236.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务