申请/专利权人:同济大学
申请日:2023-11-26
公开(公告)日:2024-03-22
公开(公告)号:CN117746493A
主分类号:G06V40/20
分类号:G06V40/20;G06V20/40;G06V10/44;G06V10/82;G06N3/045;G06N3/0464;G06N3/048
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.09#实质审查的生效;2024.03.22#公开
摘要:本发明属于计算机视觉领域,提出了一种细粒度时序动作检测方法,包括:步骤1、对数据集中的原始视频进行预处理与特征抽取;步骤2、对步骤1得到的视频特征构建特征金字塔;步骤3、利用全局时序特征编码器对步骤2得到的特征金字塔中的每一层级的特征序列进行编码,并生成粗糙预测结果;步骤4、利用步骤2得到的特征金字塔的对应下层特征对步骤3生成的粗糙预测进行边界修正得到最终的动作实例检测结果。本发明提出了一个全局特征感知与局部边界修正的无锚时序动作检测方法,有效地提升了细粒度时序动作检测的准确率,对于视频理解领域有重大意义。
主权项:1.一种细粒度时序动作检测方法,其特征在于,包括:步骤1、对数据集中的原始视频进行预处理与特征抽取;步骤2、对步骤1得到的视频特征构建特征金字塔;步骤3、利用全局时序特征编码器对步骤2得到的特征金字塔中的每一层级的特征序列进行编码,并生成粗糙预测结果;步骤4、利用步骤2得到的特征金字塔的对应下层特征对步骤3生成的粗糙预测进行边界修正得到最终的动作实例检测结果。
全文数据:
权利要求:
百度查询: 同济大学 一种细粒度时序动作检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。