申请/专利权人:人工智能与数字经济广东省实验室(深圳)
申请日:2023-12-12
公开(公告)日:2024-04-05
公开(公告)号:CN117817657A
主分类号:B25J9/16
分类号:B25J9/16
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.23#实质审查的生效;2024.04.05#公开
摘要:本申请提供了一种对练机器人训练方法及装置。所述方法包括:将物体的状态和第一期望落点输入至第二预测模型,获得第二预测模型输出的第一击打角度和第一击打速度,并控制对练机器人沿着第一击打轨迹挥动,以在第一击打位置按照第一击打角度和第一击打速度击打物体;获取并存储物体的当前实际落点;在对练机器人工作预设时间后,获取优化数据;利用优化数据,训练第二预测模型,直至对练机器人击打后物体的落点与第一期望落点之间的差异值小于第一阈值,获得优化后第二预测模型。本申请在模仿学习基础上,持续利用物体状态和实际落点训练第二预测模型,使得优化后第二预测模型能够适应不同情况,将物体落入指定点,为用户提供良好的对练效果。
主权项:1.一种对练机器人训练方法,其特征在于,包括:获取对练场景的第一图像,并根据所述第一图像确定物体的当前状态;将所述物体的当前状态输入至已训练的第一预测模型,获得所述已训练的第一预测模型输出的针对所述物体的第一选择信息和第一击打位置;将所述物体的当前状态和所述物体的第一期望落点输入至已训练的第二预测模型,获得所述已训练的第二预测模型输出的第一击打角度和第一击打速度,并控制对练机器人沿着第一击打轨迹挥动,以在所述第一击打位置按照所述第一击打角度和所述第一击打速度击打所述物体,所述第一击打轨迹为根据所述第一选择信息确定的;在所述对练机器人击打所述物体后,获取并存储所述物体的当前实际落点;每当所述对练机器人工作预设时间后,获取优化数据,所述优化数据包括多组物体状态和实际落点;利用所述优化数据,训练所述已训练的第二预测模型,直至所述对练机器人击打后所述物体的落点与所述第一期望落点之间的差异值小于第一阈值,获得优化后第二预测模型。
全文数据:
权利要求:
百度查询: 人工智能与数字经济广东省实验室(深圳) 一种对练机器人训练方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。