Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京大学王利民获国家专利权

南京大学王利民获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京大学申请的专利一种基于混合注意力机制的端到端单目标跟踪方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114550040B

龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210152336.4,技术领域涉及:G06V20/40;该发明授权一种基于混合注意力机制的端到端单目标跟踪方法及装置是由王利民;崔玉涛;蒋承;武港山设计研发完成,并于2022-02-18向国家知识产权局提交的专利申请。

一种基于混合注意力机制的端到端单目标跟踪方法及装置在说明书摘要公布了:一种基于混合注意力机制的端到端单目标跟踪方法,构建一个基于Transformer跟踪的跟踪框架MixFormer,用于目标跟踪,跟踪框架的构建包括以下步骤:1数据准备阶段;2网络配置阶段;3离线训练阶段;4在线跟踪阶段。本发明采用了基于混合注意力的骨干网络来同时进行特征提取与目标信息融合,得到了一个简洁清晰的跟踪框架,并且能有效地提升性能。此外,本发明的跟踪方法能对跟踪过程中的物体变形有更好的适应能力,有效地提升目标回归的精度。

本发明授权一种基于混合注意力机制的端到端单目标跟踪方法及装置在权利要求书中公布了:1.一种基于混合注意力机制的端到端单目标跟踪方法,其特征是构建一个跟踪框架MixFormer用于目标跟踪,所述跟踪框架MixFormer为一个端到端训练的Transformer跟踪网络,包括一个主干网络和一个跟踪头,跟踪框架MixFormer的构建实现包括如下阶段: 1数据准备阶段,对训练数据集中所有视频帧裁剪出目标搜索区域,从每个视频的帧序列的前半部分抽取两帧作为模板帧,后半部分抽取一帧作为测试帧,对测试帧标注目标框作为验证帧,每个验证帧中目标框的对角坐标作为离线训练过程中的真实标签; 2网络配置阶段,主干网络为一个基于混合注意力模块的特征提取器,将特征提取和信息融合通过Transformer结构统一起来,跟踪头为一个回归头,采用卷积网络实现;将模板帧和测试帧同时输入到主干网络中产生融合了模板信息的测试帧特征,然后再将该测试帧特征通过回归头产生目标的对角坐标,作为测试帧产生的最终目标框; 其中,主干网络基于混合注意力机制,对模板帧和测试帧的特征进行自注意力和互注意力操作,自注意力用于提取模板帧和测试帧的自身特征,互注意力用于目标帧和测试帧的特征信息交互,以得到融合了模板信息的测试帧特征;主干网络具体为:对模板帧和测试帧分别生成块向量,进行自注意力操作得到模板自身特征和测试帧自身特征,分别将二者通过公共的多头注意力函数得到各自的query,key和value,然后进行互注意力操作,将两者的query,key和value拼接后经过一个线性层,模板帧和测试帧的块向量拉平拼接得到拼接向量Ftoken,线性层的输出与Ftoken相加得到一次混合的向量,将混合向量分割后再进行自注意力和互注意力操作得到新的混合向量,重复M次得到最终混合特征,经分割Reshape之后得到融合了模板信息的测试帧特征; 3离线训练阶段,对于回归头目标框的训练,采用L1损失函数和GIoU损失函数来进行监督,结合由验证帧得到的真实标签,使用AdamW优化器,通过反向传播算法来更新整个网络参数,不断训练配置的网络,直至达到迭代次数,得到跟踪框架MixFormer; 在线跟踪,对待跟踪视频的第一帧标注目标搜索区域作为模板帧,后续帧作为测试帧,输入训练得到的跟踪框架MixFormer,输出得到测试帧上的目标框,实现目标跟踪。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。