【发明授权】一种基于多层次注意力机制的单目标追踪方法_中南大学_202210047253.9

导航：龙图腾网> 最新专利技术> 一种基于多层次注意力机制的单目标追踪方法_中南大学_202210047253.9

申请/专利权人：中南大学

申请日：2022-01-17

公开（公告）日：2024-04-16

公开（公告）号：CN114399533B

主分类号：G06T7/246

分类号：G06T7/246;G06N3/0464;G06N3/084

优先权：

专利状态码：有效-授权

法律状态：2024.04.16#授权;2022.05.13#实质审查的生效;2022.04.26#公开

摘要：本发明公开了一种基于多层次注意力机制的单目标追踪方法，其实施方案为：1获取数据集与追踪标签；2选取并裁剪追踪样本；3提取、展平、拼接样本图像特征图；4构建多层次注意力网络；5构建特征增强模块；6构建目标预测网络；7获取追踪模型；7构建损失函数；8训练追踪模型；9单目标追踪。本发明构建的追踪模型，利用多层次注意力网络对搜索区域和模板的图像特征进行全局的相关性建模，产生多层的注意力特征；利用特征增强模块对多层注意力特征进行融合，获得目标的最终预测结果。该模型能够解决当追踪目标发生大的形变时难以追踪的问题，并可有效提高单目标追踪的准确率和鲁棒性。

主权项：1.一种基于多层次注意力机制的单目标追踪方法，其特征在于包括以下步骤：1获取数据集与追踪标签：从单目标追踪公开数据集中获取追踪视频的帧序列与对应的追踪标签；2选取并裁剪追踪样本，具体包括以下步骤：2-a读取步骤1获取的追踪视频帧序列，将第一帧作为初始模板帧，从第二帧开始逐帧读取，并将之作为搜索帧；在初始模板帧和搜索帧之间选取一帧作为动态模板帧，选取方式为：其中，表示动态模板帧的相对位置，nS代表搜索帧的相对位置，N为动态模板帧的更新间隔，N为正整数，且取值范围为[1,300]，符号表示向下取整；2-b将初始模板帧、动态模板帧和搜索帧分别裁剪到HT2×WT2和HS×WS像素大小，并将它们分别作为初始模板、动态模板和搜索区域，其中Hi和Wii＝T1,T2,S分别代表高度和宽度，且Hi和Wii＝T1,T2,S都为正整数，取值范围为[50,500]；3提取、展平、拼接样本图像特征图，具体包括以下步骤：3-a利用卷积神经网络提取步骤2获得的初始模板、动态模板和搜索区域的图像特征，分别得到特征图和其中R代表实数，k代表模板和搜索区域经过图像特征提取后尺寸缩小的倍数，k取正整数，且k的取值范围为[2,64]；C代表得到的特征图的通道数，C取正整数，且C的取值范围为[2,2048]；3-b展平并拼接特征图和fS，得到特征序列其中特征序列fα的长度Xα由特征图和fS的高和宽计算得到，Xα的定义如下： 4构建多层次注意力网络，具体包括以下步骤：4-a构建自注意力模块，该模块一共包含n组相同的自注意力层，自注意力层由一个多头注意力模块，两个残差与批归一化模块，一个前馈模块组成；步骤3-b得到的特征序列fα依次经过这n组自注意力层，分别得到自注意力特征矩阵Si，i＝1,2,…,n；4-b构建自增强模块，该模块一共包含n组相同的自增强层，自增强层由一个多头注意力模块，一个残差与批归一化模块组成；4-c构建相互注意力模块，该模块一共包含n组相同的相互注意力层，相互注意力层与4-a所述自注意力层在结构上完全一致；4-d构建随机初始化矩阵q∈R1×C，其中R代表实数，C与步骤3-a中特征图的通道数相同；4-e将随机初始化矩阵q输入到步骤4-b构建的第一组自增强层，得到注意力特征矩阵E1，将E1与步骤4-a中得到的自注意力特征矩阵S1输入到步骤4-c构建的第一组相互注意力层，得到相互注意力特征矩阵M1；将M1输入到步骤4-b构建的第二组自增强层，得到注意力特征矩阵E2，将E2与步骤4-a中得到的自注意力特征矩阵S2输入到步骤4-c构建的第二组相互注意力层，得到相互注意力特征矩阵M2；依此类推，直到得到最后一个相互注意力特征矩阵Mn；5构建特征增强模块，具体包括以下步骤：5-a利用sigmoid激活函数将步骤4-a得到的自注意力特征矩阵S1内部特征值映射为0到1分布，并与步骤4-a得到的自注意力特征矩阵Sn逐像素相乘，得到自注意力特征增强矩阵H，H的计算公式如下：其中表示逐像素相乘操作；5-b将步骤5-a得到的自注意力特征增强矩阵H和步骤4-e中得到的相互注意力特征矩阵Mn逐列数乘，获得H和Mn之间的相似性关联矩阵D，逐列数乘的操作定义如下：其中⊙表示逐列数乘操作，C与步骤3-a中特征图的通道数相同，Xα与步骤3-b中特征序列fα的长度相同；再将H与D逐像素相乘，得到目标特征描述矩阵T，T的计算公式如下： 6构建目标预测网络：构建目标预测网络，该网络一共包含五组结构相同的卷积块，将步骤5-b得到的目标特征描述矩阵T依次经过这五组卷积块，得到目标矩形框的左上角、左下角、右上角和右下角的坐标和该矩形框所在区域即为最终目标的预测结果；7获取追踪模型：结合步骤4构建的多层次注意力网络、步骤5构建的特征增强模块和步骤6构建的目标预测网络，获得最终的追踪模型；8构建损失函数：根据单目标追踪的任务特点构建基于平均绝对误差损失与广义交并比损失的损失函数Lmix，定义如下：其中L1表示平均绝对误差损失，LGiou表示广义交并比损失，和λGiou为平衡L1和LGiou的超参数，和λGiou为正实数，且取值范围为[1，20]；xtl，xbl，xtr和xbr分别代表标签矩形框的左上角、左下角、右上角和右下角坐标的x值，ytl，ybl，ytr和ybr分别代表标签矩形框的左上角、左下角、右上角和右下角坐标的y值，A表示预测目标矩形框的面积，B表示标签矩形框的面积，Z表示包围预测目标矩形框和标签矩形框的最小矩形面积；9训练追踪模型：利用步骤3得到的特征序列fα训练步骤7构建完成的追踪模型，根据步骤8构建的损失函数得到损失值，并使用随机梯度下降法更新追踪模型内的参数，直到损失函数的损失值不再下降，得到训练好的追踪模型；10单目标追踪：获取单目标追踪视频的帧序列，首先按照步骤2选取并裁剪追踪样本，再按照步骤3分别提取、展平、拼接样本图像特征图，得到特征序列，将特征序列输入到步骤9得到的训练好的追踪模型，输出目标追踪结果。

全文数据：

权利要求：

百度查询：中南大学一种基于多层次注意力机制的单目标追踪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种双级节能水冷式平衡系统_麦克斯流体科技(江苏)有限公司_202210852648.6

下一篇：视频数据发送方法、装置及电子设备_维沃移动通信有限公司_202210930148.X

相关技术

一种双级节能水冷式平衡系统_麦克斯流体科技(江苏)有限公司_202210852648.6

视频数据发送方法、装置及电子设备_维沃移动通信有限公司_202210930148.X

基于NX变形设计的坚果异物智能监测系统的设计方法_浙江农林大学_202110880161.4

一种核素治疗后使用的自动水化治疗系统_中国人民解放军空军军医大学_202111466443.6

一种发动机扭矩控制方法、装置及车辆_长城汽车股份有限公司_202111257306.1

一种电力电缆加工设备_广州溶江线材有限公司_202111263852.6

一种基于数据处理的污染时空风险监管评估系统及方法_安徽新宇环保科技股份有限公司_202211394841.6

一种异形球轴承半自动装配合套设备_宁波蓝海量子精工轴承制造有限公司_202210855486.1

一种玻璃瓶药品的剥离装置_南京市第一医院_201911225399.2

一种实现无钢圈内衣立防下垂功能的软支撑装置_素肌(广州)科技有限公司_202111627899.6

一种智能动态数据库管理系统_上海齐屹信息科技有限公司_202111612314.3

一种火花机加工中心专用调节装置_广东牧野迪克精密机械有限公司_202011612998.2

机制相关技术

一种机制砂搅拌设备_衡阳源峰建材有限公司_202111511497.X

操作系统安装机制_慧与发展有限责任合伙企业_202110437153.2

用于拇指外翻矫形预防挡板机制的拖鞋_武汉市圣佳汇康复科技有限公司_202322070623.3

一种机制砂石粉分离设备_浙江沙王建材有限公司_201910010712.4

用于防止重试或重放攻击的安全机制_维萨国际服务协会_202080073945.X

以共享频谱机制非协调指派频率_谷歌有限责任公司_202080048456.9

一种香薰机制造用夹持设备_杭州芬享生物科技有限公司_202322717831.8

融合自相关机制的交通流预测方法、装置及存储介质_重庆高速公路路网管理有限公司_202410228644.X

融合注意力机制的心率变异性压力检测方法及相关组件_佛山需要智能机器人有限公司_202410323333.1

脱档处理机制的激活方法、装置、系统、车辆及存储介质_东风汽车集团股份有限公司_202410026511.4

目标相关技术

目标检测方法及装置_深兰人工智能(深圳)有限公司_202011454846.4

一种面向目标特性的多目标优化高光谱图像波段选择方法_大连海事大学_202111462742.2

一种目标跟踪方法、目标跟踪装置、设备和介质_科大讯飞股份有限公司_202311868970.9

报文发送方法、目标节点、非目标节点与报文传输系统_苏州挚途科技有限公司_202211447265.7

一种基于多目标对比学习的水声目标识别方法_东南大学_202410017826.2

目标检测模型的训练方法、目标检测方法和装置_苏州挚途科技有限公司_202110663377.5

目标跟踪方法、装置以及存储介质_广东电网有限责任公司_202311715026.X

基于双目视觉的目标识别方法及目标识别模型训练方法_元橡科技(北京)有限公司_202410101228.3

一种目标位姿识别定位方法_江苏电子信息职业学院_202410116038.9

基于骨架-边缘标签引导的伪装目标检测方法_福州大学_202410111566.5

单相关技术

智能单舌锁体_温州瓯海利尔达五金制品有限公司_201910869072.2

单头伺服跟踪机构_佛山市鑫得锋数控设备有限公司_202311859027.1

汽车单踏板测试设备_中汽院新能源科技有限公司_202322672928.1

线上商单拆解方法_伟吉鑫(湖北)电子科技有限公司_202311270152.9

单头注液泵_东莞市锂想自动化设备有限公司_202322783749.5

一种纵置前驱单电机单档混合动力变速系统_南京邦奇自动变速箱有限公司_202410207667.2

单辊弧形轧机高效进料装置、方法及单辊弧形轧机系统_北京科技大学_202311856117.5

一种基于单分子检测液路系统的单分子检测方法_上海邦先医疗科技有限公司_202311679082.2

单盖环保垃圾桶_江门市新会区安万居家庭用品有限公司_202322398961.X

单支撑摆角锯头_济南欧翔机械设备有限公司_202322667447.1

龙图腾网&IPTOP

【发明授权】一种基于多层次注意力机制的单目标追踪方法_中南大学_202210047253.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务