【发明公布】使用文本的杂乱视频场景中的动作对象识别_国际商业机器公司_202180068200.9

导航：龙图腾网> 最新专利技术> 使用文本的杂乱视频场景中的动作对象识别_国际商业机器公司_202180068200.9

申请/专利权人：国际商业机器公司

申请日：2021-09-10

公开（公告）日：2023-06-23

公开（公告）号：CN116324906A

主分类号：G06V20/40

分类号：G06V20/40;G06V10/25;G06V10/26;G06V40/20;G06V10/764

优先权：["20201005 US 17/062,896"]

专利状态码：在审-实质审查的生效

法律状态：2023.07.11#实质审查的生效;2023.06.23#公开

摘要：提供了一种机制来实现用于识别杂乱视频场景中的动作的动作‑对象交互检测机制。围绕初始帧中对应的标签中标识的感兴趣对象计算对象边界框，其中感兴趣对象出现在该帧中。对象边界框从初始帧传播到后续帧。对于初始帧和后续帧：初始帧和后续帧的对象边界框基于相关联的细化对象边界框被细化和裁剪。处理该一组裁剪帧，以确定将要从对应的标签验证的动作正在被执行的概率。响应于确定概率等于或超过验证阈值，提供动作‑对象交互视频执行要验证的动作的确认。

主权项：1.一种方法，在包括至少一个处理器和至少一个存储器的数据处理系统中，其中所述至少一个存储器包括由所述至少一个处理器执行的指令，以配置所述至少一个处理器实现用于识别杂乱视频场景中的动作的动作-对象交互检测机制，所述方法包括：响应于接收到具有对应的标签的动作-对象交互视频，计算在所述动作-对象交互视频的一组帧的初始帧中在所述对应的标签中标识的感兴趣对象周围的对象边界框，其中感兴趣对象出现在所述帧中；将所述对象边界框从所述初始帧传播到所述一组帧中的后续帧；对于所述动作-对象交互视频中具有对象边界框的初始帧和后续帧：使用所述感兴趣对象的知识来细化所述初始帧和所述后续帧的对象边界框，从而形成相关联的细化对象边界框；以及基于所述相关联的细化对象边界框裁剪所述初始帧和所述后续帧，从而形成一组裁剪帧；以与所述动作-对象交互视频中相同的顺序处理所述一组裁剪帧，以确定将要从所述对应的标签验证的动作正在被执行的概率；以及响应于确定要从所述对应的标签验证的动作等于或超过验证阈值的概率，提供所述动作-对象交互视频执行要验证的动作的确认。

全文数据：

权利要求：

百度查询：国际商业机器公司使用文本的杂乱视频场景中的动作对象识别

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

下一篇：数据标注方法、电子设备和计算机可读存储介质_浙江大华技术股份有限公司_202311671122.9

相关技术

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

数据标注方法、电子设备和计算机可读存储介质_浙江大华技术股份有限公司_202311671122.9

一种差分解耦双螺线气敏间隙传感元件及其制备方法_中南大学_202410106028.7

POCT血细胞分析仪_深圳市帝迈生物技术有限公司_202410426762.1

设备控制方法、装置、配电设备及存储介质_深圳市正浩创新科技股份有限公司_202410171534.4

一种RISC-V架构芯片快速测试加速单元的方法及装置_山东浪潮科学研究院有限公司_202410162392.5

一种探测烟雾粒度及浓度的方法_烟台创为新能源科技股份有限公司_202410159903.8

保护开关设备和方法_西门子股份公司_202280065501.0

一体集成微同轴气密封装结构及其制造方法_中国电子科技集团公司第十三研究所_202410148673.5

为放大器操作进行的平台资源的选择_超威半导体公司_202280065509.7

无机人造石脱模剂及其制备方法和无机人造石的制备方法_深圳市润丰新材料科技有限公司_202410151462.7

用于超声速进发直连风洞试验的发动机台架及设计方法_中国空气动力研究与发展中心高速空气动力研究所_202410420425.1

龙图腾网&IPTOP

【发明公布】使用文本的杂乱视频场景中的动作对象识别_国际商业机器公司_202180068200.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务