【发明公布】基于HER-SAC算法的机器人路径规划方法及装置_华南理工大学_202311779904.4

导航：龙图腾网> 最新专利技术> 基于HER-SAC算法的机器人路径规划方法及装置_华南理工大学_202311779904.4

申请/专利权人：华南理工大学

申请日：2023-12-22

公开（公告）日：2024-04-12

公开（公告）号：CN117873070A

主分类号：G05D1/43

分类号：G05D1/43;G05D1/633;G05D1/644;G05D1/247;G05D1/648;G05D105/22

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.30#实质审查的生效;2024.04.12#公开

摘要：本发明公开了一种基于HER‑SAC算法的机器人路径规划方法及装置，方法包括：在物理引擎中搭建环境和障碍物，创建目标点，并初始化相关参数，所述相关参数包括奖励折扣因子、熵参数、学习率、状态空间和动作空间；构建HER‑SAC深度强化学习网络模型，然后开始训练模型，训练过程如下：根据目标运行机器人，对运行轨迹采样并收集轨迹经验，然后存放到经验回放池中；采用未来采样法得到新目标，根据当前时刻的状态和动作，重新计算新的奖励并放入经验池；从经验池中选取样本，更新价值网络和策略网络，然后迭代训练模型，直到机器人运行参数收敛，训练终止。本发明通过HER方法与SAC算法相结合，有效的解决了训练中奖励稀疏的问题，提高了训练的效率。

主权项：1.基于HER-SAC算法的机器人路径规划方法，其特征在于，包括下述步骤：在物理引擎中搭建环境和障碍物，创建目标点，并初始化相关参数，所述相关参数包括奖励折扣因子、熵参数、学习率、状态空间和动作空间；构建HER-SAC深度强化学习网络模型并进行训练，模型包括HER算法模块和SAC算法模块；所述HER算法模块用于对经验回放池中的序列添加新的目标利用奖惩函数重新计算奖励，获取新的序列，并将其放进经验回放池中；所述SAC算法模块用于构建机器人路径规划网络，初始化相关参数，在训练中对机器人路径规划网络进行更新；所述机器人路径规划网络包括价值网络和策略网络；对HER-SAC深度强化学习网络模型的训练过程如下：收集轨迹经验，将基于实际目标采样的经验存放到经验回放池中；在HER算法中采用未来采样法，即选取从现在开始k个随机状态作为新目标，对每个新目标重新计算奖励值，并将新的序列添加到经验池中，使用事后经验回放来改善奖励的稀疏程度；所述新的序列为st||g，at，rg，t，st+1||g；从经验池中选取样本，更新价值网络和策略网络，所述策略网络输入当前状态state，输出动作概率分布函数；所述价值网络输入当前的状态state和采取的动作action，输出动作-状态对价值大小的估计；利用训练好的HER-SAC深度强化学习网络模型对机器人路径进行规划。

全文数据：

权利要求：

百度查询：华南理工大学基于HER-SAC算法的机器人路径规划方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种玉米种植用病虫害防治装置_黄金双_202322446508.1

下一篇：一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

相关技术

一种玉米种植用病虫害防治装置_黄金双_202322446508.1

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

一种文旦柚栽培用的施肥装置_莆田冠腾科技有限公司_202322446584.2

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

一种籽晶自动熔接结构_四川永祥光伏科技有限公司_202322431204.8

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种注塑机新型泵罩门板_恩格尔注塑机械(常州)有限公司_202322227242.1

龙图腾网&IPTOP

【发明公布】基于HER-SAC算法的机器人路径规划方法及装置_华南理工大学_202311779904.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务