买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于主动跟踪和自适应手势识别的交接方法、装置及设备_北京大学深圳研究生院_202410060569.0 

申请/专利权人:北京大学深圳研究生院

申请日:2024-01-16

公开(公告)日:2024-04-16

公开(公告)号:CN117576787B

主分类号:G06V40/20

分类号:G06V40/20;G06V20/40;G06V10/22;G06V10/82;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2024.03.08#实质审查的生效;2024.02.20#公开

摘要:本申请公开了一种基于主动跟踪和自适应手势识别的交接方法、装置及设备,方法包括通过机器人安装的深度相机采集视频图像;基于视频图像通过媒体管道获取相机坐标系下的第一手部地标;将第一手部地标转换至预设的世界坐标系以得到第二手部地标;将第二手部地标输入经过训练的手势识别模型,通过手势识别模型确定所述视频图像对应的用户手势;通过机器人将交互对象交互给用户。本申请实施例通过使用包括媒体管道提示手部地标和通过手势识别模型识别用户手势的两阶段方法,在面对不同物体和不同照明条件时均能准确识别到用户手势,提高了人机交互的准确性,确保了与人类抓握一致的平稳和自然的交接过程。

主权项:1.一种基于主动跟踪和自适应手势识别的交接方法,其特征在于,所述的基于主动跟踪和自适应手势识别的交接方法具体包括:通过机器人安装的深度相机采集视频图像,其中,所述深度相机为自调节深度相机,所述深度相机安装于机器人的机械臂,并且深度相机与机械臂的手臂末端执行器之间的相对姿态保持不变;基于所述视频图像,通过媒体管道获取相机坐标系下的第一手部地标;将所述第一手部地标转换至预设的世界坐标系,以得到第二手部地标;将所述第二手部地标输入经过训练的手势识别模型,通过所述手势识别模型确定所述视频图像对应的交互对象,其中,所述手势识别模型用于根据媒体管道识别到的手部地标识别出用户手势,再确定到用户手势对应的交互对象,所述手势识别模型为基于由全连接层组成的神经网络构建的,输入层表示为一个维数为N×21×3的张量变量,N表示用于视频图像的视频帧数量,21对应手部地标的地标点数量,3表示三维坐标,输出层使用softmax来识别与用户手势对应的交互对象;通过机器人将交互对象交互给用户;其中,所述通过机器人安装的深度相机采集视频图像之前还包括:通过机器人安装的深度相机采集初始图像;通过媒体管道获取初始图像在相机坐标系下的第三手部地标,其中,所述媒体管道为一个跨平台的开源机器学习框架;将所述第三手部地标转换至机器人坐标系,以得到第四手部地标;将所述第三手部地标转换至预设的世界坐标系,以得到第五手部地标;获取所述第五手部地标中的若干第五手部地标点和所述第四手部地标中的第四手部地标点;以所述第四手部地标点为原点,以若干第五手部地标点构建x轴方向,基于朝向手掌和右手规则,构建手部坐标系;在所述手部坐标系中选取目标位置;将所述深度相机移动至所述目标位置,并控制所述深度相机与用户手部对齐。

全文数据:

权利要求:

百度查询: 北京大学深圳研究生院 基于主动跟踪和自适应手势识别的交接方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。