买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】利用中层视觉先验的强化学习路径规划方法_复旦大学_202310177338.3 

申请/专利权人:复旦大学

申请日:2023-02-28

公开(公告)日:2024-01-16

公开(公告)号:CN117408127A

主分类号:G06F30/27

分类号:G06F30/27;G01C21/20;G06V20/00;G06V10/82;G06N3/092

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.02.02#实质审查的生效;2024.01.16#公开

摘要:本发明提供了一种利用中层视觉先验的强化学习路径规划方法,具有这样的特征,包括以下步骤:步骤S1,将图像数据输入视觉处理网络得到中层特征信息;步骤S2,将中层特征信息向量化为向量信息D;步骤S3,对坐标进行转化;步骤S4,将向量信息D、当前位置坐标Q’和目标点坐标T’输入决策模型,得到下一个路径点P’;步骤S5,将下一个路径点P’作为当前位置坐标Q’,迭代执行步骤S4,得到可跟随路径L;步骤S6,控制机器人根据可跟随路径L移动,t时间后重新采集图像数据;步骤S7,重复执行步骤S1至步骤S6,直至控制机器人移动至目标点。总之,本方法能够利用感知信息控制机器人进行更有效的导航移动。

主权项:1.一种利用中层视觉先验的强化学习路径规划方法,用于根据机器人采集的图像数据、机器人当前位置坐标Q和目标点坐标T控制所述机器人移动至目标点,其特征在于,包括以下步骤:步骤S1,将所述机器人的传感器获得的所述图像数据输入训练好的基于残差神经网络的视觉处理网络,得到中层特征信息;步骤S2,将所述中层特征信息进行卷积操作,向量化为向量信息D;步骤S3,将世界坐标系下的所述机器人的所述当前位置坐标Q和所述目标点坐标T转化为机器人坐标系下的当前位置坐标Q’和目标点坐标T’;步骤S4,将所述向量信息D、所述当前位置坐标Q’和所述目标点坐标T’输入训练好的基于PPO算法的决策模型,得到所述当前位置坐标Q’的下一个路径点P’;步骤S5,将所述下一个路径点P’作为所述当前位置坐标Q’,迭代执行所述步骤S4,直至得到n个路径点,作为可跟随路径L;步骤S6,控制所述机器人根据所述可跟随路径L移动,在经过固定时间t后,根据所述传感器采集得到所述机器人当前位置的所述图像数据;步骤S7,重复执行所述步骤S1至所述步骤S6,直至控制所述机器人移动至所述目标点,其中,所述世界坐标系为以大地为基准的x-y坐标系,选取环境中的任意一点作为原点,所述机器人坐标系为以所述机器人当前位置为原点,以所述机器人面向位置为x轴正方向的坐标系。

全文数据:

权利要求:

百度查询: 复旦大学 利用中层视觉先验的强化学习路径规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。