买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于多尺度差异信息和集中式Transformer网络的视觉定位方法_中国石油大学(华东)_202311718609.8 

申请/专利权人:中国石油大学(华东)

申请日:2023-12-14

公开(公告)日:2024-03-29

公开(公告)号:CN117788845A

主分类号:G06V10/52

分类号:G06V10/52;G06N3/0455;G06V10/80;G06V10/82;G06V10/766

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明公开了基于多尺度差异信息和集中式Transformer网络的视觉定位方法。现有方法直接提取多尺度特征来捕获图像中不同尺度的信息容易产生大量冗余信息,削弱不同尺度特征之间的互补性,导致定位不准确和边缘模糊。本发明提出了一种独特的具有多尺度差异信息的集中式transformer网络,用于视觉定位任务。设计了一个新的多尺度差异信息模块,通过计算不同尺度特征的变化来提取独特的信息。这使得网络能够专注于捕捉细粒度的细节,同时保持对视觉内容的整体理解。为了增强跨模态的交互,进一步提出了集中式transformer,以同时聚合多模态融合特征的局部本质信息和全局距离相关性。在3个典型数据集上的综合实验验证了所提方法的优越性。

主权项:1.基于多尺度差异信息和集中式Transformer网络的视觉定位方法,其特征在于,所述方法包括以下步骤:S1.构建一种新的多尺度差异信息模块,通过减法聚合来捕获不同尺度特征之间的差异,以减轻冗余信息的干扰,增强模型在每个尺度上关注关键和独特信息的能力;S2.构建一种集中式Transformer模块,通过探索局部关键信息和多模态特征的全局远程依赖关系,获得全面和有区别的特征表示;S3.结合S1中的模块和S2中的模块构建基于多尺度差异信息和集中式Transformer网络的视觉定位方法的整体架构;S4.基于多尺度差异信息和集中式Transformer网络的视觉定位方法的训练。

全文数据:

权利要求:

百度查询: 中国石油大学(华东) 基于多尺度差异信息和集中式Transformer网络的视觉定位方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。