【发明授权】一种基于深度蒙特卡洛树搜索的信源导航方法及装置_北京科技大学顺德研究生院_202110316103.9

申请/专利权人：北京科技大学顺德研究生院

申请日：2021-03-24

公开（公告）日：2024-02-09

公开（公告）号：CN113139644B

主分类号：G01C21/20

分类号：G01C21/20;G06N3/0442;G06N3/045;G06N3/006;G06N3/092;G06N3/084;G06N3/0464;G06N5/01

优先权：

专利状态码：有效-授权

法律状态：2024.02.09#授权;2021.08.06#实质审查的生效;2021.07.20#公开

摘要：本发明公开了一种基于深度蒙特卡洛树搜索的信源导航方法及装置，该方法包括：获取待导航智能体在历史时间步内的环境信息和执行的动作信息；通过预设的第一神经网络，基于历史时间步内的环境信息和动作信息，预测出智能体在当前时间步的各个方向的动作概率；以预测的动作概率作为蒙特卡洛树搜索算法的先验知识，选择智能体在当前时间步内的最佳执行动作；结合每一时间步的最佳执行动作，得到智能体移动至信源的最优路径。本发明提出在蒙特卡洛树中使用循环神经网络的集成规划路径框架，帮助提高导航控制的稳定性和性能，通过对时间动作序列数据的处理，解决连续空间中的路径规划问题。

主权项：1.一种基于深度蒙特卡洛树搜索的信源导航方法，其特征在于，包括：获取待导航的智能体在历史时间步内的环境信息和执行的动作信息；通过预设的第一神经网络，基于所述历史时间步内的环境信息以及执行的动作信息，预测出智能体在当前时间步的各个方向的动作概率；以预测的当前时间步的各个方向的动作概率作为蒙特卡洛树搜索算法的先验知识，通过蒙特卡洛树搜索算法选择智能体在当前时间步内的最佳执行动作；结合每一时间步的最佳执行动作，得到智能体移动至信源的最优路径；所述预设的第一神经网络为长短期记忆人工记忆神经网络；在通过蒙特卡洛树搜索算法选择智能体在当前时间步内的最佳执行动作时，在蒙特卡洛树搜索算法的模拟阶段，所述方法还包括：将预测的动作概率和当前节点的状态信息输入预设的第二神经网络，通过预设的第二神经网络为当前节点分配奖励值，再将奖励值反向传播至根节点；所述预设的第二神经网络为卷积神经网络；在通过预设的第二神经网络为当前节点分配奖励值，再将奖励值反向传播至根节点之后，所述方法还包括：用获取的奖励值继续训练所述预设的第二神经网络，以提高预测能力。

全文数据：

权利要求：

百度查询：北京科技大学顺德研究生院一种基于深度蒙特卡洛树搜索的信源导航方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

下一篇：一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

相关技术

CNC加工用快速换线治具_东莞华清光学科技有限公司_202322418777.7

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种LED线性地埋灯_上海科铃纳光电科技有限公司_202322244017.9

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

一种注塑机新型泵罩门板_恩格尔注塑机械(常州)有限公司_202322227242.1

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

龙图腾网&IPTOP

【发明授权】一种基于深度蒙特卡洛树搜索的信源导航方法及装置_北京科技大学顺德研究生院_202110316103.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务