买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】使用文本的杂乱视频场景中的动作对象识别_国际商业机器公司_202180068200.9 

申请/专利权人:国际商业机器公司

申请日:2021-09-10

公开(公告)日:2023-06-23

公开(公告)号:CN116324906A

主分类号:G06V20/40

分类号:G06V20/40;G06V10/25;G06V10/26;G06V40/20;G06V10/764

优先权:["20201005 US 17/062,896"]

专利状态码:在审-实质审查的生效

法律状态:2023.07.11#实质审查的生效;2023.06.23#公开

摘要:提供了一种机制来实现用于识别杂乱视频场景中的动作的动作‑对象交互检测机制。围绕初始帧中对应的标签中标识的感兴趣对象计算对象边界框,其中感兴趣对象出现在该帧中。对象边界框从初始帧传播到后续帧。对于初始帧和后续帧:初始帧和后续帧的对象边界框基于相关联的细化对象边界框被细化和裁剪。处理该一组裁剪帧,以确定将要从对应的标签验证的动作正在被执行的概率。响应于确定概率等于或超过验证阈值,提供动作‑对象交互视频执行要验证的动作的确认。

主权项:1.一种方法,在包括至少一个处理器和至少一个存储器的数据处理系统中,其中所述至少一个存储器包括由所述至少一个处理器执行的指令,以配置所述至少一个处理器实现用于识别杂乱视频场景中的动作的动作-对象交互检测机制,所述方法包括:响应于接收到具有对应的标签的动作-对象交互视频,计算在所述动作-对象交互视频的一组帧的初始帧中在所述对应的标签中标识的感兴趣对象周围的对象边界框,其中感兴趣对象出现在所述帧中;将所述对象边界框从所述初始帧传播到所述一组帧中的后续帧;对于所述动作-对象交互视频中具有对象边界框的初始帧和后续帧:使用所述感兴趣对象的知识来细化所述初始帧和所述后续帧的对象边界框,从而形成相关联的细化对象边界框;以及基于所述相关联的细化对象边界框裁剪所述初始帧和所述后续帧,从而形成一组裁剪帧;以与所述动作-对象交互视频中相同的顺序处理所述一组裁剪帧,以确定将要从所述对应的标签验证的动作正在被执行的概率;以及响应于确定要从所述对应的标签验证的动作等于或超过验证阈值的概率,提供所述动作-对象交互视频执行要验证的动作的确认。

全文数据:

权利要求:

百度查询: 国际商业机器公司 使用文本的杂乱视频场景中的动作对象识别

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。