Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 国家体育总局体育科学研究所李清正获国家专利权

国家体育总局体育科学研究所李清正获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉国家体育总局体育科学研究所申请的专利一种杠铃检测与轨迹跟踪方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119579652B

龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411740614.3,技术领域涉及:G06T7/246;该发明授权一种杠铃检测与轨迹跟踪方法和系统是由李清正设计研发完成,并于2024-11-29向国家知识产权局提交的专利申请。

一种杠铃检测与轨迹跟踪方法和系统在说明书摘要公布了:本发明公开一种杠铃检测与轨迹跟踪方法和系统,包括:对帧率为frate的原始视频帧I进行采样操作,得到采样后的多张图片集合I';输入基于YOLOv8n改进的杠铃检测网络,进行左右杠铃片检测,获得目标边界框的中心点坐标bx,by和长宽尺寸bh,bw,杠铃检测网络包括基于CBFormer的骨干网络、基于TriFPN的颈部和检测头;根据首次检测到目标的开始帧τ,生成跟踪点的查询向量Qtr;使用CoTracker模型根据生成的查询向量Qtr,在视频中逐帧获取跟踪点的位置向量Tr;根据所述位置向量Tr和原始视频帧的帧率frate,进行杠铃运动参数计算。本发明可以对杠铃进行检测与轨迹跟踪。

本发明授权一种杠铃检测与轨迹跟踪方法和系统在权利要求书中公布了:1.一种杠铃检测与轨迹跟踪方法,其特征在于,所述方法包括: S1、对帧率为frate的原始视频帧I进行采样操作,得到采样后的多张图片集合I'; S2、将所述多张图片集合I'输入基于YOLOv8n改进的杠铃检测网络,进行左右杠铃片检测,获得目标边界框的中心点坐标bx,by和长宽尺寸bh,bw,所述杠铃检测网络包括基于CBFormer的骨干网络、基于三元特征金字塔网络TriFPN的颈部和检测头; S3、根据首次检测到目标的开始帧τ,生成跟踪点的查询向量Qtr,所述查询向量Qtr包含了待跟踪的左右杠铃片中心点的初始位置和开始帧; S4、使用CoTracker模型根据生成的所述查询向量Qtr,在视频中逐帧获取跟踪点的位置向量Tr; S5、根据所述位置向量Tr和原始视频帧的帧率frate,进行杠铃运动参数计算; 所述基于CBFormer的骨干网络,用于提取图像特征,采用四层金字塔结构,在第一层使用图像块嵌入模块,在第二到第四层使用图像块合并模块来降低输入空间分辨率以及增加通道数,然后每层在所述图像块嵌入模块与所述图像块合并模块之后均是采用CBFormer块进行特征变换; 所述CBFormer块,首先使用3×3的逐深度卷积实现隐式编码相对位置信息,输出通过残差连接进行跳跃连接,随后进行层归一化,随后应用级联双级路由注意力CBRA模块进行跨位置关系建模且输出通过残差连接相加,随后再次进行层归一化,最后是2层的多层感知机MLP进行位置嵌入,输出结果同样通过残差连接相加; 所述级联双级路由注意力CBRA模块,通过多个双级路由注意力BRA级联操作获得更加完备的特征表示,每个双级路由注意力BRA能够以自适应查询的动态方式实现稀疏的注意力模式,关键思想是将注意力计算分为在粗粒度区域和细粒度区域的两个层次上依次进行,粗粒度区域级别筛选出最相关的键值对,通过构建和修剪区域级别的有向图来实现的,然后在细粒度区域的联合中应用标记到标记的注意力,在单输入的单头自注意力视角下,BRA注意力的计算过程为: 给定一个2D输入特征图特征图的宽高为W和H,通道为C,将其划分为S×S个非重叠的粗粒度区域,使得每个区域包含个特征向量,随后通过线性投影计算出查询、键、值张量 Q=XrWq,K=XrWk,V=XrWv 其中分别为查询、键、值的投影权重; 接着通过构造一个有向图来找到各个区域的参与关系,在Q和K上分别应用各区域平均值来导出区域级的查询和键 然后通过Qr和Kr的转置之间的矩阵乘法,计算得出区域到区域有向图的邻接矩阵 Ar=QrKrT 随后通过为每个区域只保留前k个连接来修剪有向图,从而推导出一个路由索引矩阵 Ir=topkIndexAr 使用区域到区域的路由索引矩阵Ir,应用细粒度的标记到标记的注意力,对于区域i中的每个查询标记,它将关注位于以Ir i,1,Ir i,2,…,Ir i,k索引的k个区域的并集中的所有键值对,收集键和值张量 Kg=gatherK,Ir,Vg=gatherV,Ir 随后将注意力操作应用于收集到的键值对,从而得到输出,此处引入了一个局部上下文增强项LCEV,使用逐深度卷积进行参数化,内核大小设置为5,如下所示: O=AttentionQ,Kg,Vg+LCEVj; 所述基于三元特征金字塔网络TriFPN的颈部,用于进一步特征融合,其在传统自顶向下融合特征的特征金字塔网络中增添了三元特征融合,通过三分支特征聚合与扩散连接允许特征信息在不同尺度层次之间进行传播,而且在提高特征融合效果的同时并没有带来过大的额外计算开销; 并且由于不同的输入特征信息具有不同的分辨率,对输出的特征信息贡献不一,因此TriFPN为每个输入添加一个可学习的额外权重,使用快速归一化融合对输入特征进行加权融合,如下所示: 其中,Ini为输入特征,Out为输出特征,ωi、ωj是添加的额外权重,∈=0.0001是避免数值不稳定的小值; 所述杠铃检测网络训练的损失函数分为分类分支与边界框回归分支; 所述分类分支使用的是二元交叉熵损失BCE,分类损失的计算如下: 其中N为目标类别数,为第i个样本所属的类别,pi为第i个样本预测的类别概率; 所述边界框回归分支包括分布焦点损失DFL与MPSDIoU损失,计算如下: 其中yi和yi+1是标签离散分布中最接近标签y的两个值使得yi≤y≤yi+1,Si和Si+1分别为对应概率的Sigmoid输出; 所述MPSDIoU损失,不仅考虑了目标框的重叠或非重叠区域,还考虑了中心点距离、宽高比、角点平方距离和尺度变化影响,设x1,y1,x2,y2分别表示边界框左上方点与右下方点的坐标,那么真实边界框表示为 预测边界框表示为原始输入图片的宽高为w和h,则所述MPSDIoU损失的计算如下: 其中IoU为IoU损失函数; 因此所述杠铃检测网络训练中总的损失函数计算如下: 其中λCls、λDFL、λBox为训练时的超参数,分别为相应损失所对应的权重。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国家体育总局体育科学研究所,其通讯地址为:100010 北京市东城区体育馆路11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。