首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于障碍检测和DDPG算法的仓储环境路径规划方法_中国科学技术大学_202410184333.8 

申请/专利权人:中国科学技术大学

申请日:2024-02-19

公开(公告)日:2024-05-17

公开(公告)号:CN118050019A

主分类号:G01C21/34

分类号:G01C21/34;G01S17/931;G01S17/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.04#实质审查的生效;2024.05.17#公开

摘要:本发明涉及物流运输机器人路径规划技术领域,公开了一种基于障碍检测和DDPG算法的仓储环境路径规划方法,包括:通过机载雷达获取物流机器人周围的障碍物的分布信息,规划出合适的路径点,并通过周围障碍物之间的空间大小选择不同的奖励函数,对强化学习的神经网络进行训练;将障碍检测方法和训练收敛的神经网络策略应用到真实的物流机器人上,通过障碍检测方法和神经网络的输出指令来进行物流机器人的路径规划。本发明根据不同的障碍检测分类,更换规划路径点和分别切换至不同的奖励函数,在提高了强化学习训练的安全性的同时,减少了路径长度和路径平滑性等其他性能指标的牺牲。

主权项:1.一种基于障碍检测和DDPG算法的仓储环境路径规划方法,包括以下步骤:步骤一,使用雷达获取物流机器人周围障碍物的速度和位置,计算出障碍物与物流机器人的相对速度vr和相对位移dr;步骤二,用以下障碍检测方法对物流机器人前进方向的障碍物分布进行检测分类:如果dd0,则在雷达探索的局部地图中使用A*算法重新规划出新的路径点R,使物流机器人移动至新的路径点R,并回到步骤一;其中d为物流机器人前进方向上两个障碍物之间的间距,d0为设置的安全距离,d0大于物流机器人的宽度;如果d0≤d2d0,则将相对速度vr和相对位移dr作为当前状态st输入到深度确定性策略梯度算法的神经网络中,输出动作at供物流机器人执行,并根据奖励函数一得到奖励rt;如果d≥2d0,则将相对速度vr和相对位移dr作为当前状态st输入到深度确定性策略梯度算法的神经网络中,输出动作at供物流机器人执行,并根据奖励函数二得到奖励rt;步骤三,将上一时刻的状态st-1,以及当前时刻的状态st、奖励rt、动作at组成经验参数st-1,st,rt,at放入经验回放池D;步骤四,从经验回放池中随机抽取一批样本对深度确定性策略梯度算法的神经网络进行训练,并更新神经网络的参数;步骤五,循环进行步骤一至步骤四,直至神经网络的参数收敛;步骤六,将障碍检测方法和完成训练的神经网络应用到真实的物流机器人上,通过障碍检测方法和神经网络输出的动作来对物流机器人的路径进行规划。

全文数据:

权利要求:

百度查询: 中国科学技术大学 基于障碍检测和DDPG算法的仓储环境路径规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术