买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法_太原工业学院_202311744849.5 

申请/专利权人:太原工业学院

申请日:2023-12-18

公开(公告)日:2024-03-22

公开(公告)号:CN117742387A

主分类号:G05D3/12

分类号:G05D3/12

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.09#实质审查的生效;2024.03.22#公开

摘要:本申请涉及智能液压挖掘机技术领域,公开了一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法,包括在不考虑回转作业的情况下,挖掘机工作装置在作业过程中以动臂、斗杆和铲斗三个关节之间耦合运动来实现铲斗齿尖末端的运动轨迹,将动臂、斗杆和铲斗每个关节作为单独的决策智能体,最终规划的作业轨迹是三个关节的决策序列;采用集中训练‑分布执行训练方式,将环境状态和三个智能体的联合动作作为训练过程中评价器决策网络的输入。通过不依赖于特定的插值策略模型,利用强化学习算法‑TD3算法可实现挖掘机的自主在线作业轨迹规划,不需要根据规划路径的目标点选择对应的插值策略模型,也就是避免了对复杂规划任务的精确建模。

主权项:1.一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法,其特征在于,包括以下步骤:步骤一、在不考虑回转作业的情况下,挖掘机工作装置在作业过程中以动臂、斗杆和铲斗三个关节之间耦合运动来实现铲斗齿尖末端的运动轨迹,将动臂、斗杆和铲斗每个关节作为单独的决策智能体,最终规划的作业轨迹是三个关节的决策序列;步骤二:采用集中训练-分布执行训练方式,将环境状态和三个智能体的联合动作作为训练过程中评价器决策网络的输入,使得输出的评价值函数包含了三个关节智能体协同的指导信息;步骤三:基于步骤二的训练结果,进行分布式执行,主要通过各智能体执行动作无需互相沟通,经过长时间的训练,可实现动臂、斗杆和铲斗三个关节协同作业,完成多智能体系统模型的建立,之后对建立的多智能体系统模型的基本要素进行定义;步骤四:利用TD3算法对挖掘机点到点作业任务进行优化,对步骤三建立的多智能体系统模型进行训练,对动臂、斗杆和铲斗各关节建立Actor-Critic框架。

全文数据:

权利要求:

百度查询: 太原工业学院 一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。