申请/专利权人:智慧眼科技股份有限公司
申请日:2023-12-05
公开(公告)日:2024-03-22
公开(公告)号:CN117746286A
主分类号:G06V20/40
分类号:G06V20/40;G06V40/20;G06V10/82;G06N3/0464
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.09#实质审查的生效;2024.03.22#公开
摘要:本发明公开了一种基于视频去重的在线动作识别方法、装置、计算机设备及存储介质,所述方法包括:从在线视频中获取当前帧图像和历史帧图像序列,并将当前帧图像和历史帧图像序列输入动作识别模型中。确定当前帧图像对应的空间编码向量和历史帧图像序列对应的空间编码向量序列;对所述空间编码向量序列中的向量进行时间编码,得到编码结果,对编码结果中满足预设条件的特征进行去重,得到历史时间编码向量;对所述历史时间编码向量和所述当前帧图像对应的空间编码向量进行交互注意力计算,并对得到的注意力结果进行连接,得到解码结果;对解码结果进行动作识别,得到动作识别结果,采用本发明提高在线视频动作识别的精度、增强模型的鲁棒性。
主权项:1.一种基于视频去重的在线动作识别方法,其特征在于,所述基于视频去重的在线动作识别方法包括:从在线视频中获取当前帧图像和历史帧图像序列,并将所述当前帧图像和所述历史帧图像序列输入动作识别模型中,其中,所述历史帧图像序列包括预设数量的历史帧图像,所述历史帧图像为所述当前帧图像的前向图像帧,所述动作识别模型包括骨干网络、图像编码器、去重模块、图像解码器和识别模块;基于所述骨干网络,确定所述当前帧图像对应的空间编码向量和所述历史帧图像序列对应的空间编码向量序列;基于所述图像编码器,对所述空间编码向量序列中的向量进行时间编码,得到时间编码特征;基于所述去重模块,对所述时间编码特征中满足预设条件的特征进行去重,得到历史时间编码向量;基于所述图像解码器,对所述历史时间编码向量和所述当前帧图像对应的空间编码向量进行交互注意力计算,并对得到的注意力结果进行连接,得到解码结果;基于所述识别模块,对所述解码结果进行动作识别,得到动作识别结果。
全文数据:
权利要求:
百度查询: 智慧眼科技股份有限公司 基于视频去重的在线动作识别方法、装置及相关设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。