合肥大学年福东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥大学申请的专利面向室内安防监控视频场景的开放词汇群体行为检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119851351B 。
龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510315321.9,技术领域涉及:G06V40/20;该发明授权面向室内安防监控视频场景的开放词汇群体行为检测方法是由年福东;吴志泽;汪珺;谷艳红;王妍设计研发完成,并于2025-03-18向国家知识产权局提交的专利申请。
本面向室内安防监控视频场景的开放词汇群体行为检测方法在说明书摘要公布了:本发明提供一种面向室内安防监控视频场景的开放词汇群体行为检测方法,属于视频动作识别领域。步骤如下:S1:收集并处理室内场景监控视频,获取含人有效视频片段,获得各有效视频片段的三元标注结果视频,文本,标志;S2:对视频每一帧和对应的文本,利用CLIP预训练模型的Swin‑B、BERT结构分别作为图像、文本编码器;Swin‑B和BERT参数均更新且用正则项约束,最终确定图像‑文本编码器;S3:构建、训练并确定开放词汇群体行为检测模型;S4:输入实际监控视频至开放词汇群体行为检测模型获得每个群体的行为类别。本发明能同时实现对室内安防监控视频中的每个人员识别出其属于哪个群体,并同时对每个群体的行为都进行分类,还能满足开放词汇检测需求。
本发明授权面向室内安防监控视频场景的开放词汇群体行为检测方法在权利要求书中公布了:1.一种面向室内安防监控视频场景的开放词汇群体行为检测方法,其特征在于,包括以下步骤: S1:收集并处理室内场景的监控视频数据,获取含人的有效视频片段,结合手动细粒度标注和自动全局语义标注获得各有效视频片段的三元标注结果视频,文本,标志; S2:构建基于视频-文本多模态编解码模型的图像-文本编码器并训练,具体为: 根据三元标注结果,对视频的每一帧和对应的文本,利用CLIP预训练模型的Swin-B结构作为图像编码器以及BERT结构作为文本编码器;Swin-B和BERT的参数参与训练阶段优化,同时用正则项约束Swin-B和BERT参数的更新并确定最终的图像-文本编码器; S3:构建基于视频-个体位置信息多模态交叉注意力模型的开放词汇群体行为检测模型并训练,进行参数优化确定开放词汇群体行为检测模型; S4:将实际监控视频输入确定的开放词汇群体行为检测模型,获得每个群体的行为类别; 步骤S4的具体过程为: S41:对实际监控视频进行切分获得视频片段; S42:利用行人检测跟踪工具获得视频片段中所有个体在每一帧的时序位置信息; S43:利用基于视频-个体位置信息多模态交叉注意力模型的开放词汇群体行为检测模型获得所有个体的群体归属嵌入表示向量和群体行为类别嵌入表示向量; S44:通过聚类算法对所有个体的群体归属嵌入表示向量进行聚类,群体行为类别相同的个体属于同一个群体; S45:对属于同一个群体的所有个体对应的群体行为类别嵌入表示向量与基于群体行为类别文字描述的向量表示做内积运算,取内积运算结果最大值对应的类别作为每个个体的行为类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥大学,其通讯地址为:230000 安徽省合肥市经开区锦绣大道99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。