【发明公布】基于生成对抗模仿学习的机械臂复杂操作技能学习方法及系统_南京邮电大学_202311665423.0

申请/专利权人：南京邮电大学

申请日：2023-12-06

公开（公告）日：2024-03-22

公开（公告）号：CN117733841A

主分类号：B25J9/16

分类号：B25J9/16

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明公开了一种基于生成对抗模仿学习的机械臂复杂操作技能学习方法及系统，方法包括：获取复杂任务数据，将复杂任务的轨迹分割为多个子任务轨迹；针对每个子任务轨迹，确定每个子任务的强化学习RL参数，获取对应子任务的专家策略，形成子任务专家策略集合；基于所述子任务专家策略集合，使用生成对抗模仿学习GAIL算法进行预训练，得到子任务策略集合；其中所述子任务策略集合包括子任务专家策略和子任务生成策略以及对应的奖励函数；基于子任务策略集合，通过领域随机化的方法，使用SAC算法进行正式训练，得到子任务的最优策略集合。通过GAIL预训练使底层子任务不再从零开始学习，只需要有限的样本数量就可以引导策略学习。

主权项：1.一种机械臂复杂操作技能学习方法，其特征在于，包括：获取复杂任务数据，其中所述复杂任务数据包括机械臂执行复杂任务的轨迹；将复杂任务的轨迹分割为多个子任务轨迹；针对每个子任务轨迹，确定每个子任务的强化学习RL参数，获取对应子任务的专家策略，形成子任务专家策略集合；基于所述子任务专家策略集合，使用生成对抗模仿学习GAIL算法进行预训练，得到子任务策略集合；其中所述子任务策略集合包括子任务专家策略和子任务生成策略以及对应的奖励函数；基于子任务策略集合，通过领域随机化的方法，使用SAC算法进行正式训练，得到子任务的最优策略集合。

全文数据：

权利要求：

百度查询：南京邮电大学基于生成对抗模仿学习的机械臂复杂操作技能学习方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

下一篇：一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

相关技术

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

一种醋酸酐含量检测装置_山东嘉驰新材料股份有限公司_202322220520.0

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种环形导轨间歇循环通电装置_东莞市臻域自动化设备有限公司_202322566793.0

一种新型立式磷石膏废料破碎机_湖北旭特建材科技有限公司_202322371565.8

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

龙图腾网&IPTOP

【发明公布】基于生成对抗模仿学习的机械臂复杂操作技能学习方法及系统_南京邮电大学_202311665423.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务