【发明授权】一种基于松弛变换解码器的直接时序动作检测方法_南京大学_202110115997.5

导航：龙图腾网> 最新专利技术> 一种基于松弛变换解码器的直接时序动作检测方法_南京大学_202110115997.5

申请/专利权人：南京大学

申请日：2021-01-28

公开（公告）日：2024-03-22

公开（公告）号：CN114821379B

主分类号：G06V20/40

分类号：G06V20/40;G06V10/764;G06V10/82;G06N3/006;G06N3/0455;G06N3/0499;G06N3/084;G06T3/4038;G06T7/246;G06T7/269;G06T9/00;H04N19/42;H04N19/44;H04N19/60

优先权：

专利状态码：有效-授权

法律状态：2024.03.22#授权;2022.08.16#实质审查的生效;2022.07.29#公开

摘要：一种基于松弛变换解码器的直接时序动作检测方法，包括生成训练样例阶段、网络配置阶段、训练阶段以及测试阶段，结合动作起始点和结束点的概率以实现边界增强，并通过注意力机制自适应调整特征，实现时序动作检测。本发明通过边界增强的特征表示，有效利用全局上下文信息，显著提高生成提名的鲁棒性；利用松弛匹配的策略使网络快速稳定收敛；引入了时间交并比来指导动作提名排序，在有限的预测中，覆盖所有视频中的动作真值，灵活、高效、快速、准确的完成时序动作检测任务。

主权项：1.一种基于松弛变换解码器的直接时序动作检测方法，其特征是对视频数据结合动作起始点和结束点的概率以实现边界增强，并通过注意力机制自适应调整特征，实现时序动作检测，所述时序动作检测步骤包括生成训练特征阶段、网络配置阶段、训练阶段以及测试阶段：1生成训练特征阶段：使用基于ResNet-50的I3D网络对训练样例视频进行特征提取，对于每个视频，将视频图像序列Lf分为若干个长度为Ls帧的视频段，每段为由Ls帧图像组成图像序列Sf，将图像序列Sf送入I3D网络，经过预训练参数的卷积层和池化层，输出得到LD帧的双流特征，将不同视频段的双流特征按照时间顺序拼接起来，再经过一个池化层，得到整个视频D维的高维特征其中，视频段长度Ls的大小表示在全局上进行时间划分的细粒程度；2网络配置阶段：基于多层感知机编码器和变换解码器，建立时序动作检测模型RTD-Net，模型包括以下配置：2.1计算边界概率：首先使用时间分割网络TSN对步骤1得到的图像序列Sf处理得到时序双流特征，再送入由三个卷积层组成的边界概率预测模块，计算得到每个时间节点作为动作起始点和动作结束点的概率，得到边界概率序列；2.2获得边界增强特征：对于1中生成的高维特征和2.1中计算出的边界概率序列，进行点乘操作，获得边界增强特征Fb，再将边界增强特征Fb送入多层感知机编码器得到编码特征Fenc，实现通道上的交互；2.3解析边界增强特征：对于2.2中获得的边界增强特征的编码特征Fenc，利用变换解码器进行解析，变换解码器包含ND个解码层，每个解码层包含一个自注意力层、一个编码器-解码器注意力层和两个线性映射层，输入的特征依次经过自注意力层、编码器-解码器注意力层和堆叠的线性映射层后输出，边界增强特征通过堆叠的ND个解码层后，实现特征的解析；2.4时序动作提名的生成与评分：变换解码器输出的解析特征，送入三个不同的前馈神经网络：边界FFN、完整度FFN和分类FFN，三个前馈神经网络分别用于输出：动作提名的起始时刻和结束时刻、完整度分数以及置信度分数；2.5分配训练标签：采用松弛的训练标签匹配策略：首先，根据定义的匹配代价，匹配器利用匈牙利算法得到一组最优的one-to-one匹配，每个获得正标签的预测提名都能被分配到一个相应的实际提名，作为训练标签，其次，计算预测提名和实际提名的overlap，选取overlap大于Ot的预测提名，为其分配相应的实际提名作为标签；2.6时序动作提名的分类：生成一系列的时序提名后，通过以下两类方法进行提名分类：第一种是选取UntrimmedNet视频级别top1的分类得分，第二种是将提名送入P-GCN进行分类；3训练阶段：对配置的模型采用训练数据进行训练，使用交叉熵、L1距离、交并比作为损失函数，使用AdamW优化器，使用退火策略通过反向传播算法来更新网络参数，不断重复步骤1和步骤2，直至达到迭代次数；4测试阶段：将待测试数据的视频特征序列输入到训练完成的RTD-Net模型中，生成动作提名，再利用2.6中的两种方式，得到提名分类结果，实现时序动作检测。

全文数据：

权利要求：

百度查询：南京大学一种基于松弛变换解码器的直接时序动作检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

下一篇：一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

相关技术

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种高效型苗种植机_海南勤璞园农业科技有限公司_202322496666.8

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

用于高压柜体的固定防护装置_江苏贯中电气有限公司_202322341188.3

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

时序相关技术

基于时序生成对抗网络的月度风光发电功率场景分析方法_重庆大学_202110345017.0

一种基于分层计时序自适应模糊H网的配电网故障诊断方法及系统_武汉科技大学_201810753893.5

基于时序路径树的时序网络节点中心性评估方法及装置_西南大学_202211052281.6

网表化简时序模型的构建方法及静态时序分析方法_深圳国微晶锐技术有限公司_202310777310.3

时序干预效果的预测方法_浙江大学_202110898099.1

传感器融合的时序同步方法_财团法人车辆研究测试中心_202211228944.5

一种点火时序管制电路及应用_湖北三江航天红峰控制有限公司_202311871996.9

一种基于OpenCL实现时序数据降采样预计算方法_山东浪潮数据库技术有限公司_202311413597.8

一种基于寄存器的时序收敛结构、方法及数模混合芯片_上海韬润半导体有限公司_202410302913.2

一种时序数据的处理方法、系统、设备及介质_天翼物联科技有限公司_202311847946.7

直接相关技术

一种直接还原铁矿石的生产工艺_河钢集团有限公司_202310575082.1

直接由氯化锂（LiCl）生产氢氧化锂（LiOH）而不需要中间生产碳酸锂等的系统_智利化学和矿业股份有限公司_202180097724.0

包括直接声音补偿的听力装置_奥迪康有限公司_202010023574.6

直接输出短消息保存输出方法_中科数金(河南)科技有限公司_201911167919.9

远程直接数据存取方法及相关设备_中国电信股份有限公司技术创新中心_202410077335.7

直接穿透型透气模杯及内衣_东莞市宏华内衣辅料制品有限公司_202321031234.3

一种直接式高效电加热器_上海韵申新能源科技有限公司_201611007105.5

具有开环控制直接驱动的致动器_MMT有限公司_201880082676.6

一种直接插接的光伏组件_北海蓝天能源建设工程有限公司_202322349234.4

可共享远程直接数据存取链接的创建方法及装置_阿里巴巴(中国)有限公司_202210195653.4

解码器相关技术

降低复杂度的极化编码和解码_交互数字专利控股公司_201980031411.8

一种编解码方法及装置_西安万像电子科技有限公司_202210848599.9

一种软硬结合的视频解码方法_天津津航计算技术研究所_202110699068.3

一种解码方法、接收设备以及存储介质_华为技术有限公司_202110105094.9

一种高效可转码的视频解码方法_天津津航计算技术研究所_202110824903.1

基于过滤机制的视频解码方法_天津津航计算技术研究所_202110826187.0

用于对图像信号编码和解码的方法及计算机可读记录介质_LG电子株式会社_202210567582.6

用于提前终止迭代检测和解码的方法和系统_三星电子株式会社_202311027856.3

基于照明补偿的视频编码和解码的方法和装置_交互数字VC控股公司_201880065223.2

一种流式端到端语音识别模型训练和解码方法_中科极限元(杭州)智能科技股份有限公司_202010220477.6

龙图腾网&IPTOP

【发明授权】一种基于松弛变换解码器的直接时序动作检测方法_南京大学_202110115997.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务