买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】利用无监督元学习来提升小样本动作识别_微软技术许可有限责任公司_202280057727.6 

申请/专利权人:微软技术许可有限责任公司

申请日:2022-07-22

公开(公告)日:2024-04-09

公开(公告)号:CN117859156A

主分类号:G06V10/774

分类号:G06V10/774;G06N3/0464;G06V10/778;G06V10/82;G06V20/40

优先权:["20210927 US 63/248,912","20211124 US 17/535,517"]

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本文的公开内容描述了使用预先训练的编码器和新颖类别微调来准备和使用用于动作识别的交叉注意力模型。训练视频数据被转换为增强训练视频片段,以用于训练外观编码器和动作编码器。外观编码器被训练为基于空间语义对视频片段进行编码,动作编码器被训练为基于时空语义对视频片段进行编码。难挖掘的训练回合集合通过使用经训练的编码器而被生成。交叉注意力模块然后被使用难挖掘的训练回合进行训练以用于动作‑外观对齐分类。然后,获取支持视频片段,其中每个支持视频片段与视频类别相关联。交叉注意力模块通过使用获取的支持视频片段和相关视频类别进行微调。使用经微调的交叉注意模块获取查询视频片段并将其分类为视频类别。

主权项:1.一种系统,包括:至少一个处理器;以及至少一个存储器,包括计算机程序代码,所述至少一个存储器和所述计算机程序代码被配置为与所述至少一个处理器一起使所述至少一个处理器:将无标签的训练视频数据转换为增强训练视频片段集合;基于所述增强训练视频片段集合来训练外观编码器,其中所述外观编码器被训练以基于视频片段中的空间语义对视频片段进行编码,其中所述外观编码器使用无监督训练而被训练;基于所述增强训练视频片段集合来训练动作编码器,其中所述动作编码器被训练以基于视频片段中的时空语义对视频片段进行编码,其中所述动作编码器使用无监督训练而被训练;使用经训练的所述外观编码器和经训练的所述动作编码器来生成难挖掘的训练回合集合;以及使用所生成的所述难挖掘的训练回合集合来训练用于动作-外观对齐分类的交叉注意力模块。

全文数据:

权利要求:

百度查询: 微软技术许可有限责任公司 利用无监督元学习来提升小样本动作识别

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。