申请/专利权人:北京交通大学;中移雄安信息通信科技有限公司;中移系统集成有限公司
申请日:2022-12-13
公开(公告)日:2024-04-02
公开(公告)号:CN116189281B
主分类号:G06V40/20
分类号:G06V40/20;G06V10/764;G06V10/82;G06V10/778;G06V10/80;G06N3/082;G06N3/0464;G06N3/0499;G06N3/045
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2023.06.16#实质审查的生效;2023.05.30#公开
摘要:本发明提供基于时空自适应融合的端到端人体行为分类方法及系统,属于计算机识别技术领域,获取待分类行为的多个图像;利用基于时空自适应融合的端到端人体行为分类模型对多个图像进行处理,得到行为特征图像,基于时空自适应融合的端到端人体行为分类模型根据基于时空自适应融合的端到端人体行为分类模型训练方法训练得到。本发明在网络结构上控制了计算复杂度和参数量,后期轻量化过程减少了特征在时间和空间维度上的关键信息丢失,保证模型在性能和效率之间的平衡;针对时间维度上的特征通道自适应剪枝,根据情况挑选保留、丢弃和复用的通道,减少了参数量;针对不同行为对象关系建模的自适应剪枝,减少模型在空间维度上的计算复杂度和参数量。
主权项:1.一种基于时空自适应融合的端到端人体行为分类模型训练方法,其特征在于,包括:获取训练数据;所述训练数据包括多张图像以及标注图像中行为分布特征;所述行为分布特征指示至少一个行为在所述标注图像中的位置分布;基于训练数据对行为分类模型进行训练;其中,所述行为分类模型包括主干特征提取网络、特征解耦融合网络和分类网络;其中,所述主干特征提取网络用于提取所述多张图像的行为类别特征和位置特征,得到三维特征图;所述特征解耦融合网络用于对所述三维特征图分别在时间维度和空间维度上进行全局平均池化后,分别编码空间属性和时间尺度属性,再进行融合得到融合特征图;所述分类网络用于对所述融合特征图进行分类,得到所述融合特征图中各个通道的行为分类,并根据各个通道的行为分类,进行归一化处理,得到标注图像在单通道的行为分布特征。
全文数据:
权利要求:
百度查询: 北京交通大学;中移雄安信息通信科技有限公司;中移系统集成有限公司 基于时空自适应融合的端到端人体行为分类方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。