【发明授权】基于深度神经网络和注意力机制的手势识别方法_北京工业大学_202110518115.X

导航：龙图腾网> 最新专利技术> 基于深度神经网络和注意力机制的手势识别方法_北京工业大学_202110518115.X

申请/专利权人：北京工业大学

申请日：2021-05-12

公开（公告）日：2024-04-09

公开（公告）号：CN113378641B

主分类号：G06V40/20

分类号：G06V40/20;G06V10/80;G06F3/01;G06V10/82;G06N3/0464

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2021.09.28#实质审查的生效;2021.09.10#公开

摘要：基于深度神经网络和注意力机制的手势识别方法属于电子信息领域。首先，本发明设计在双流算法中引入ECA有效通道注意力增强双流算法对手势关键帧的关注度，并利用双流算法中的空间卷积网络和时间卷积网络分别提取动态手势中的空间和时序特征；其次，通过ECA在空间流中选取最高关注度的手势帧，利用单发多框检测器技术提取相应手部姿态特征；最后，将手部姿态特征与双流中提取的人体姿态特征、手势时序特征融合后分类识别手势。本方法在Chalearn2013多模态手势数据集上进行了验证，准确率为66.23％，相比之前在该数据集上仅使用RGB信息进行双流识别的方法获得了更好的手势识别效果。

主权项：1.基于深度神经网络和注意力机制的手势识别方法，其特征在于：1利用双流算法提取动态手势的人体姿态特征、手势时序特征a人体姿态特征提取对于一个输入宽为w、高为h的手势视频，首先按照该视频的开始时间和结束时间从中平均选取T帧手势图Xτ,X2τ…XTτ，将其堆叠作为双流算法中空间卷积网络的输入，用来提取动态手势的人体姿态特征G；其中，Xτ,X2τ…XTτ表示选取的手势帧集合，下标τ表示每选取两帧手势图之间相隔的帧数；双流算法中的空间卷积网络用开源的MobileNetV3实现；b手势时序特征提取手势的浅层时序特征可利用相邻视频帧之间的光流位移场向量表示；用开源的DenseFlow方法提取光流；光流是相邻视频帧中所有像素点位移矢量信息的一种表示，其中第t和第t+1连续视频帧之间的位移矢量信息可定义为dt，而dt的水平分量和垂直分量则分别表示手势在相邻视频帧中沿水平和垂直方向的运动轨迹；为了从光流数据中获取更深层次的手势运动变化规律，针对选取手势帧集合Xτ,X2τ…XTτ中的每一帧，将其左右邻域内的光流图叠加，并将叠加后的光流图作为双流算法时间卷积网络的输入用来提取动态手势的时序特征S，使用开源的MobileNetV3特征提取网络实现；其中，每个手势帧获取光流的左右视频帧邻域数设置为5；2利用ECA注意力为手势帧和光流帧集合赋予初始权重在双流算法的数据输入层后面引入开源的ECA注意力模块为手势帧和光流帧集合赋予初始权重，进而提升手势关键帧的学习；ECA模块的结构使用全局平局池化操作将每个通道的特征图映射为单一变量；然后再使用大小为1×1、填充幅度为k-1的一维卷积操作求取变量间的线性映射关系，k为5；最后再使用Sigmoid激活函数得到每个特征图通道的初始权重，如式1所示：其中，C表示需要加权的特征图通道集合，ci表示C中的第i层特征图通道，函数GAP·表示全局平均池化操作，li表示特征图通道ci全局平均池化后的单一变量，表示第i个变量1×1卷积内的第j个变量，αj表示该变量的系数，σ表示Sigmoid激活函数，wi表示特征图通道ci对应的初始权重；至此，识别动态手势关键帧的注意力模块已建立；将输入双流算法中的手势帧与光流帧集合在通道维度上进行堆叠，则每个手势帧和光流帧都可以看作一个特征图通道；然后再将手势帧集合和光流帧集合分别代入到公式1中的C，则可求对应通道的初始权重，进而增强手势关键帧的学习；3利用SSD从初始权重最高的手势帧中提取手部姿态特征利用开源的SSD目标检测技术从初始权重最高的手势帧中提取手部姿态特征O，用来增强双流算法对相似手势的识别效果；其中，手部姿态特征O共包含Oleft、Oright两部分，分别表示关键帧中左右手预测为不同手部姿态类型的置信度集合；表示左手属于第i类手部姿态的置信度，Oleft、Oright中置信度最高的即为对应的左右手类别；在此基础上，将左右手姿态特征O与双流算法中提取的人体姿态特征G和手势时序特征S融合即可构成最终的手势时空上下文特征F；4特征融合及手势分类双流算法提取的人体姿态特征G和手势时序特征S具有像素级的对应关系；首先在通道维度上堆叠特征G、S用来满足特征图层的像素级对应关系；然后使用三维卷积，三维卷积核大小设置为3*3*3，和三维池化，池化大小设置为2*2*2，最大池化；进一步融合特征G、S；最后设计在全连接层拼接手部姿态特征O，如式2所示：其中，表示向量拼接或通道堆叠，ψ·表示对变量进行三维卷积和三维池化，R·表示将变量转换为一维向量；最后，特征F通过全连接层即可计算当前视频属于每一类手势的预测概率，预测概率最大的即为最终的手势类型。

全文数据：

权利要求：

百度查询：北京工业大学基于深度神经网络和注意力机制的手势识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

下一篇：一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

相关技术

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

一种对氟甲苯制备用精馏设备_湖北联昌新材料有限公司_202322580010.4

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

机制相关技术

基于过滤机制的视频解码方法_天津津航计算技术研究所_202110826187.0

一种手机制造用的可调节夹具_深圳市赛特尔通讯技术有限公司_202322489979.0

具有多位单元读取机制的设备及用于操作所述设备的方法_美光科技公司_202311291924.7

基于注意力机制与特征融合的图像检索方法_西安理工大学_202111501068.4

基于注意力机制的幽默文本分类方法、装置、设备、介质_中国平安人寿保险股份有限公司_202111433978.3

具有分层保护机制的半导体装置及相关系统、装置及方法_美光科技公司_201880069079.X

测试图卡、相机制造装置、相机的制造方法以及计算机可读记录介质_长川日本株式会社_202180004830.X

一种可调式发动机制动执行机构及其使用方法_东风商用车有限公司_201910222832.0

基于张量分解的车联网RIS辅助注意力机制通信与感知方法_上海师范大学_202211382306.9

电机制造用绕线装置_荣成市宏达动力科技有限公司_202321651161.8

注意力相关技术

基于注意力机制的幽默文本分类方法、装置、设备、介质_中国平安人寿保险股份有限公司_202111433978.3

一种利用重映射注意力识别分心驾驶的方法_东南大学_202111564286.2

基于张量分解的车联网RIS辅助注意力机制通信与感知方法_上海师范大学_202211382306.9

基于融合注意力的宫颈细胞学图像异常区域定位方法及装置_华南理工大学_202210378225.5

力传感器_公益财团法人电磁材料研究所_202080022168.6

一种考虑索力耦合效应的索力优化方法、装置及设备_中铁大桥勘测设计院集团有限公司_202211074047.3

承受大径向力柱柱回转支承_马鞍山精一工程机械有限公司_202322356692.0

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种无侧向力的浮动平台_博众精工科技股份有限公司_201910565433.4

一种模拟划桨的滑轮回力组件_杭州竞航科技股份有限公司_202211159537.3

网络相关技术

用于标识通信网络中的网络节点的方法和通信网络_罗伯特·博世有限公司_201910574227.X

网络设备的升级_瑞典爱立信有限公司_201780096272.8

在区块链网络中验证交易的方法以及构成该网络的节点_比特飞翔区块链株式会社_201980026000.X

一种移动通信网络辅助广播网络的收发方法及其装置_上海交通大学_202210665237.6

基于多通道图卷积网络的社交网络节点分类方法与系统_扬州大学_202210353954.5

深度神经网络的正确性保持优化_通用汽车环球科技运作有限责任公司_201910504097.2

管理IOT网络中的数据和数据使用_勤达睿公司_202080032483.7

一种时间敏感网络性能评估方法_中国科学院沈阳自动化研究所_202111441534.4

主动安全网络及构建方法_北京北信源软件股份有限公司_202210505613.5

一种网络加速方法和装置_荣耀终端有限公司_202211284598.2

龙图腾网&IPTOP

【发明授权】基于深度神经网络和注意力机制的手势识别方法_北京工业大学_202110518115.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务