【发明授权】基于交互建模的第一人称视角视频交互行为识别方法_中山大学_202010009544.X

导航：龙图腾网> 最新专利技术> 基于交互建模的第一人称视角视频交互行为识别方法_中山大学_202010009544.X

申请/专利权人：中山大学

申请日：2020-01-06

公开（公告）日：2023-07-14

公开（公告）号：CN111241963B

主分类号：G06V40/20

分类号：G06V40/20;G06V20/40;G06V10/764;G06V10/82;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2023.07.14#授权;2020.06.30#实质审查的生效;2020.06.05#公开

摘要：本发明公开了一种基于交互建模的第一人称视角视频交互行为识别方法，提出对摄像头佩戴者和交互者进行分离，分别学习其对应的静态外观和动态运动特征，再显式建模二者之间的交互关系。为了将交互者从背景中分离出来，利用一个注意力模型生成掩码，并用人体解析模型辅助注意力模型的学习；提出一个运动模块分别预测摄像头佩戴者对应和交互者对应的运动信息矩阵，并通过对下一帧的重构辅助运动模块的学习。最后，提出一个用于交互建模的对偶长短时记忆模块，并在此模块基础上显式地建模交互关系。本发明能很好地对第一人称视角的交互行为进行描述和识别，并在常用的第一人称视角交互行为研究数据集上取得当前较优的识别结果。

主权项：1.基于交互建模的第一人称视角视频交互行为识别方法，其特征在于，包括下述步骤：S1、将摄像头佩戴者和交互者显式分离，分别学习二者的行为特征，包括：S1.1、通过注意力模块将交互者从背景中分离出来；S1.2、分别提取和学习摄像头佩戴者和交互者的行为特征，所述行为特征包括静态外观特征和动态运动特征；所述静态外观特征为摄像头佩戴者看见的静态视觉内容的特征，即对应摄像头佩戴者的视频帧It的全局外观特征，以及对应交互者的视频帧It的局部外观特征；S1.3、运动特征学习，对于摄像头佩戴者，其运动信息即为摄像头运动信息，该运动信息对视频帧变化的影响是全局性的；对于交互者，其运动信息对视频帧变换的影响是局部的，通过一个密集的运动矩阵D∈RHxW来表示交互者的运动信息，并通过和注意力模块生成的掩码Mt3逐渐相乘，使运动矩阵D只作用于交互者而不作用于背景；S1.4、对于每一对相邻的视频帧It-1，It，通过上述的注意力模块和运动矩阵分别得到摄像头佩戴者对应的全局静态外观特征ftg，a和运动特征ftg，m，以及交互者对应的局部静态外观特征ft1，a和运动特征ft1，m，摄像头佩戴者的行为特征定义为ftego＝[ftg，a，ftg，m]，交互者的行为特征定义为ftexo＝[ft1，a，ft1，m]，这两个特征将用于摄像头佩戴者和交互者之间的交互关系建模；S2、对偶交互关系建模；S2.1、构建用于交互建模的长短时记忆模块；步骤S2.1中，构建用于交互建模的长短时记忆模块具体为：摄像头佩戴者和交互者的个体行为特征分别输入对应的长短时记忆模块，这两个模块互为对偶模块，采用对称的更新方式：[it；ot；gt；at]＝σWft+UFt-1+Jt-1+b ct＝itat+gtct-1Ft＝ottanhct其中it，ot，gt，at分别是长短时记忆模块的输入门限值，输出门限值，遗忘门限值和输入特征，σ是非线性函数sigmoid函数，Φ是线性整流函数，ft是摄像头佩戴者或交互者的个体行为特征，ct是长短时记忆模块的中间特征，Ft则是对应的长短时记忆模块的输出特征，Ft*是对偶模块的输出特征，V、b为长短时记忆模块的可学习参数；S2.2、用于交互建模的长短时记忆模块通过把对偶模块在上一帧的输出作为当前帧的输入，显式建模了摄像头佩戴者和交互者的交互关系；步骤S2.2中，还包括下述步骤：将两个长短时记忆模块在视频的最后一帧N时的输出逐点相加并通过非线性操作得到融合后的特征：在RN上添加一个线性分类器，并通过softmax函数可以得到对应于各个行为类别的概率：py|RN＝softmaxWRN+b使用交叉熵损失函数对分类结果进行优化：其中yk为类别k的标签，即如果行为类别编号为k，则yk＝1，否则yk＝0；K为总的类别数。

全文数据：

权利要求：

百度查询：中山大学基于交互建模的第一人称视角视频交互行为识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具有防护结构的对讲门禁装置_深圳市创视达电子有限公司_202322457095.7

下一篇：一种面膜膜袋压爆检测机构_苏州安特化妆品股份有限公司_202322566136.6

相关技术

一种具有防护结构的对讲门禁装置_深圳市创视达电子有限公司_202322457095.7

一种面膜膜袋压爆检测机构_苏州安特化妆品股份有限公司_202322566136.6

一种砂卵地层浅埋暗挖快速注浆施工设备_中铁六局集团有限公司_202322371235.9

一种具有快装结构的液晶显示屏_深圳市众投微电子科技有限公司_202322542428.6

一种玩具制造的积木钻孔机_海门市谷丽纺织品有限公司_202322616704.9

一种藻类浮框结构_大长江环境工程技术有限责任公司_202322487284.9

一种橡胶注射成型机_航大电气有限公司_202322534855.X

一种基于电调滤波器结构的增强型数字调频接收机电路_四川九洲电器集团有限责任公司_202322634610.4

一种畜牧用定量自动配比喂料装置_金阳县农业农村局_202322376066.8

一种用于公路施工的防撞装置_江苏常鑫路桥集团有限公司_202322375940.6

一种信息读取模组及终端_东集技术股份有限公司_202322635210.5

一种污水处理用药剂投放机_常州市尚明环保科技有限公司_202322438903.5

交互相关技术

一种交互手柄_青岛小鸟看看科技有限公司_201810896194.6

边框结构及交互平板_广州视源电子科技股份有限公司_202322282514.8

一种儿童安全座椅的交互系统及交互方法_欧颂科技(海南)有限公司_202410286386.0

设备间交互控制方法、设备间交互控制装置及存储介质_北京小米移动软件有限公司_202110057901.4

交互方法、装置、设备和存储介质_北京字跳网络技术有限公司_202410140800.7

交互方法、智能终端及存储介质_深圳市泰衡诺科技有限公司_202410208318.2

基于直播的交互方法及装置_北京优酷科技有限公司_202210078799.0

与笔记用户界面交互_苹果公司_202410148957.4

一种基于笔式交互及语音交互的三维立体几何绘制系统_南京大学_202011119060.7

交互方法及装置、电子设备及存储介质_北京字跳网络技术有限公司_202211291819.9

视频相关技术

视频展示方法、装置、视频展示设备和存储介质_影石创新科技股份有限公司_202211332301.5

视频编辑方法、装置和视频编辑系统_中国邮政储蓄银行股份有限公司_202410216241.3

视频解码方法及视频解码器_华为技术有限公司_202311810141.5

直肠视频检查装置_姜籽宇_202322128916.2

视频拍摄方法及其装置_维沃移动通信有限公司_202410170406.8

视频推荐方法及装置_北京达佳互联信息技术有限公司_202011450193.2

视频片段的剪辑方法、视频推荐方法、装置、设备及介质_腾讯科技(北京)有限公司_202110139361.4

视频类别的价值模型的训练方法、视频搜索方法和装置_北京字跳网络技术有限公司_202410107615.8

面向加密流量的视频资源与视频播放页面的域名关联方法_中国科学院信息工程研究所_202210727746.7

视频码率控制方法、视频码率控制装置及计算机存储介质_浙江大华技术股份有限公司_202311860196.7

视角相关技术

一种面向受限空间的多视角几何场景建立方法和装置_北京大学_202311058030.3

可变视角的3D视频制作方法、装置、设备及存储介质_成都市谛视科技有限公司_202110873276.0

针对视频开会的建立的视角用户界面和用户体验_微软技术许可有限责任公司_202280062112.2

一种基于平衡视角的蓄滞洪区分洪策略确定方法、装置、介质及产品_三峡大学_202410138881.7

一种基于单视角的人脸三维轮廓特征重建装置及重建方法_娄浩哲_202110774263.8

一种融合视角信息的顶视角行人重识别方法及系统_中山大学_202410041120.X

多机位自由视角导播方法、系统_中国传媒大学_202410324003.4

植物多视角图像的处理方法及系统_岭南现代农业科学与技术广东省实验室河源分中心_202311570402.0

一种基于多视角的软件测试质量评价方法_中国人民解放军军事科学院战争研究院_202311394541.2

一种基于多视角时间特征的短期电力负荷预测方法_云南电网有限责任公司_202311393746.9

龙图腾网&IPTOP

【发明授权】基于交互建模的第一人称视角视频交互行为识别方法_中山大学_202010009544.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务