【发明授权】基于动态卷积和捷径的视频检索方法、设备和存储介质_北方工业大学_202210223064.2

导航：龙图腾网> 最新专利技术> 基于动态卷积和捷径的视频检索方法、设备和存储介质_北方工业大学_202210223064.2

申请/专利权人：北方工业大学

申请日：2022-03-09

公开（公告）日：2024-04-12

公开（公告）号：CN114579803B

主分类号：G06F16/78

分类号：G06F16/78;G06F16/783;G06V10/74;G06V10/82;G06N3/0464;G06N3/048;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.12#授权;2022.06.21#实质审查的生效;2022.06.03#公开

摘要：本文提出了一种视频检索框架，其包括视频编码器，视频编码器采用MMT对输入视频中提取的多个模态进行处理，所述MMT包括：与多个模态对应的多个输入端，用于接收与所述多个模态相对应的多个视频嵌入，用于输出输入视频的视频特征表示的多个输出端，以及在多个输入端与多个输出端之间的、以转换器编码器为节点的全连接网络，其中，转换器编码器包括多头注意力模块，其接收查询Q、键K和值V作为输入，并且进一步包括：子注意力子模块，其接收查询Q、键K和值V，并将查询和一组键‑值对映射到输出；基于跨度的动态卷积子模块，其接收查询Q、键K和值V，对键K应用卷积以得到卷积键Ks，并将查询和一组卷积键‑值对映射到输出；以及联接器，其用于连接子注意力子模块的输出和基于跨度的动态卷积子模块的输出。

主权项：1.一种用于检索视频的方法，包括：使用视频编码器来获得输入视频的视频特征表示，所述视频编码器采用多模态转换器MMT对所述输入视频中提取的多个模态进行处理，所述MMT包括：与所述多个模态对应的多个输入端，用于接收与所述多个模态相对应的多个视频嵌入E1-EN，用于输出所述输入视频的视频特征表示T1-TN的多个输出端，以及在所述多个输入端与所述多个输出端之间的、以转换器编码器Trm为节点的全连接网络；使用文本编码器来获得输入文本的文本特征表示；计算所述视频特征表示与所述文本特征表示之间的相似度，其中，所述转换器编码器Trm包括多头注意力模块，所述多头注意力模块接收查询Q、键K和值V作为输入，并且所述多头注意力模块进一步包括：子注意力子模块，其接收所述查询Q、所述键K和所述值V，并将所述查询和一组键-值对映射到输出；基于跨度的动态卷积子模块，其接收所述查询Q、所述键K和所述值V，对所述键K应用卷积以得到卷积键Ks，并将查询和一组卷积键-值对映射到输出；以及联接器，其用于连接所述子注意力子模块的输出和所述基于跨度的动态卷积子模块的输出，其中，所述转换器编码器Trm包括：所述多头注意力模块，其接收所述转换器编码器Trm的输入；第一加法器，其将所述多头注意力模块的输出、所述转换器编码器Trm的输入以及N个增强捷径相加；第一层标准化模块，用于对所述第一加法器的输出进行层标准化；前向反馈模块，其接收所述第一层标准化模块的输出，执行前向反馈；第二加法器，其将所述前向反馈模块的输出、所述第一层标准化模块的输入以及N个增强捷径相加；以及第二层标准化模块，用于对所述第二加法器的输出进行层标准化。

全文数据：

权利要求：

百度查询：北方工业大学基于动态卷积和捷径的视频检索方法、设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

下一篇：无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

相关技术

一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种方便拆装的瓦楞机用瓦楞辊_浙江永暉瓦楞辊有限公司_202322675014.0

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种打孔装置_广州市骏褀无纺布实业有限公司_202321762517.5

检索相关技术

一种图像中对象的检索方法、装置、设备和存储介质_北京迈格威科技有限公司_202110508436.1

基于注意力机制与特征融合的图像检索方法_西安理工大学_202111501068.4

基于问题检索的单句意图识别方法、装置和系统_北京淇瑀信息科技有限公司_201911331026.3

基于分类编码的轨道交通文档检索系统及检索方法_中铁四局集团电气化工程有限公司_202211040946.1

数据检索的方法和装置_华为技术有限公司_201811298840.5

资源的检索方法、装置和电子设备_广州博冠信息科技有限公司_202311550780.2

一种智能化检索方法及系统_福建省政务门户网站运营管理有限公司_202410292236.0

一种数据订阅检索分发方法_中国西安卫星测控中心_202410293111.X

知识库知识存储、检索方法及装置_中国银行股份有限公司_202010905086.8

电网工程移交数据的检索方法及装置_国网江苏省电力有限公司经济技术研究院_202410055585.0

方法相关技术

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

通信方法及装置_华为技术有限公司_202010617172.9

信息处理方法_丰田自动车株式会社_202311358127.6

通信方法及装置_华为技术有限公司_202311024020.8

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

冰箱及其控制方法_LG电子株式会社_202080061858.2

视频相关技术

数字人视频显示方法及设备_卓世未来(成都)科技有限公司_202410164673.4

视频处理方法、装置及设备_北京字节跳动网络技术有限公司_202110407802.4

用于视频译码的双向预测_VID拓展公司_201980063042.0

视频问答方法及电子设备_华为技术有限公司_202211289300.7

一种道路交通用视频监控装置_中国市政工程中南设计研究总院有限公司_202322498762.6

一种视频设备简化配置方法及系统_天翼物联科技有限公司_202111654279.1

基于RGB视频的物体重建方法和装置_清华大学_202110832398.5

基于过滤机制的视频解码方法_天津津航计算技术研究所_202110826187.0

一种软硬结合的视频解码方法_天津津航计算技术研究所_202110699068.3

视频播放方法、可读介质和电子设备_荣耀终端有限公司_202311046469.4

龙图腾网&IPTOP

【发明授权】基于动态卷积和捷径的视频检索方法、设备和存储介质_北方工业大学_202210223064.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务