【发明公布】一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法_太原工业学院_202311744849.5

导航：龙图腾网> 最新专利技术> 一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法_太原工业学院_202311744849.5

申请/专利权人：太原工业学院

申请日：2023-12-18

公开（公告）日：2024-03-22

公开（公告）号：CN117742387A

主分类号：G05D3/12

分类号：G05D3/12

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本申请涉及智能液压挖掘机技术领域，公开了一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法，包括在不考虑回转作业的情况下，挖掘机工作装置在作业过程中以动臂、斗杆和铲斗三个关节之间耦合运动来实现铲斗齿尖末端的运动轨迹，将动臂、斗杆和铲斗每个关节作为单独的决策智能体，最终规划的作业轨迹是三个关节的决策序列；采用集中训练‑分布执行训练方式，将环境状态和三个智能体的联合动作作为训练过程中评价器决策网络的输入。通过不依赖于特定的插值策略模型，利用强化学习算法‑TD3算法可实现挖掘机的自主在线作业轨迹规划，不需要根据规划路径的目标点选择对应的插值策略模型，也就是避免了对复杂规划任务的精确建模。

主权项：1.一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法，其特征在于，包括以下步骤：步骤一、在不考虑回转作业的情况下，挖掘机工作装置在作业过程中以动臂、斗杆和铲斗三个关节之间耦合运动来实现铲斗齿尖末端的运动轨迹，将动臂、斗杆和铲斗每个关节作为单独的决策智能体，最终规划的作业轨迹是三个关节的决策序列；步骤二：采用集中训练-分布执行训练方式，将环境状态和三个智能体的联合动作作为训练过程中评价器决策网络的输入，使得输出的评价值函数包含了三个关节智能体协同的指导信息；步骤三：基于步骤二的训练结果，进行分布式执行，主要通过各智能体执行动作无需互相沟通，经过长时间的训练，可实现动臂、斗杆和铲斗三个关节协同作业，完成多智能体系统模型的建立，之后对建立的多智能体系统模型的基本要素进行定义；步骤四：利用TD3算法对挖掘机点到点作业任务进行优化，对步骤三建立的多智能体系统模型进行训练，对动臂、斗杆和铲斗各关节建立Actor-Critic框架。

全文数据：

权利要求：

百度查询：太原工业学院一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种分级保护的过流保护器件_上海维安电子股份有限公司_202311783950.1

下一篇：一种用于汽车内饰板的自动化检测设备_爱卓智能科技(常州)有限公司_202410362013.7

相关技术

一种分级保护的过流保护器件_上海维安电子股份有限公司_202311783950.1

一种用于汽车内饰板的自动化检测设备_爱卓智能科技(常州)有限公司_202410362013.7

以2,3`-联吲哚为原料制备吲哚[3,2-a]咔唑类生物碱的方法_重庆医科大学_202410109636.3

一种精准提高鸡翅和鸡爪比例的选育方法_中国农业大学_202410140992.1

一种用于立式炉的冷却系统_中国电子科技集团公司第四十八研究所_202410300395.0

一种废旧锂离子电池石墨负极材料除杂修复协同方法_中南大学_202410221314.8

一种富含硒补充剂的特膳食品_荆楚理工学院_202311813204.2

一种冲击桥的架设控制系统和控制方法_中国船舶重工集团应急预警与救援装备股份有限公司_202311800480.5

用于松材线虫病识别的无人机拍摄图像处理系统_安徽大学_202410361601.9

智慧水利中基于流程的安全检测方法、系统、设备及介质_长沙理工大学_202311787032.6

一种陶瓷绝缘子和高压电力电容器绝缘子装置_河北盛平电子科技有限公司_202311859558.0

一种分布式信息技术服务运行系统_北京金智达管理顾问有限公司_202410125712.X

龙图腾网&IPTOP

【发明公布】一种基于TD3强化学习算法的液压挖掘机用轨迹规划方法_太原工业学院_202311744849.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务