【发明公布】一种基于离散PPO的潜航器节能路径跟踪方法_天津大学_202311669432.7

导航：龙图腾网> 最新专利技术> 一种基于离散PPO的潜航器节能路径跟踪方法_天津大学_202311669432.7

申请/专利权人：天津大学

申请日：2023-12-07

公开（公告）日：2024-04-05

公开（公告）号：CN117826848A

主分类号：G05D1/485

分类号：G05D1/485;G05D101/10

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.23#实质审查的生效;2024.04.05#公开

摘要：本发明涉及一种基于离散PPO算法的潜航器节能路径跟踪方法，可解决目前海洋环境中潜航器动态、自适应的能源路径跟踪，并在实际运行中不断优化能源消耗的问题。包括下列步骤：基于Gazebo平台进行环境建模任务表示，对海洋环境、任务路径以及障碍物信息进行详细规定，并且对环境状态以及潜航器的状态做数值表示；对PPO算法的三个网络进行参数初始化；对收集到的状态信息进行归一化预处理，将状态空间、动作空间以及奖励制存入优先经验回放池中；设计节能奖励函数；用最大似然法更新策略并且反复迭代。最后得到一种基于离散PPO算法的潜航器节能路径跟踪算法，有望在潜航器的路径跟踪问题中的能源效率和环境可持续性方面产生显著的影响。

主权项：1.一种基于离散PPO算法的潜航器节能路径跟踪方法，其特征在于：1环境建模和任务表示：根据潜航器的路径跟踪任务，基于Gazebo仿真平台建立海洋环境模型，该海洋环境模型主要包括海洋地形、海流、水温等因素，用于模拟真实的海洋环境。其中，设置Python算法与ROS的话题通信接口，算法为环境提供基于时间序列的动作指令，并且从环境中采样算法训练所需要的状态。任务表示中，对潜航器的路径跟踪任务定义为三维空间中运动的螺旋路径，设计螺旋路径半径20m，并且用明确的函数方程表示。2强化学习算法设计：初始化离散PPO算法所需的三个网络，分别是actor_old，actor和critic。actor网络用于选择动作，需要训练更新、梯度反向传播；actor_old网络参数复制于actor网络，不需要梯度反向传播；critic网络用于计算状态价值，需要训练更新、梯度反向传播。每个网络的结构设计均需考虑动作空间和状态空间的维数，其中critic的设计中，网络输入维度与状态空间的维数一致、输出为一维标量数据；actor的设计中，网络输入维度与状态空间的维数一致、输出为与动作空间维数一致的数据。3状态空间的设计及数据处理：在Gazebo仿真环境中，将环境状态转化为合适的状态表示，主要包括环境洋流不同位置的速度、障碍物位置信息、以及潜航器当前位置，共9维。由于数据差异较大，直接输入网络容易导致网络的崩溃以及收敛速度下降，将状态数据进行归一化的预处理操作，使不同状态之间的尺度差异较小，从而有助于神经网络模型更好地学习状态之间的关系，有助于提高算法的稳定性和收敛速度。4优先级经验回放：为了提高稳定性，构建优先级队列，将经验样本按照优先级从高到低排序，并构建一个优先级队列。这样，具有较高优先级的样本将在训练过程中被更频繁地选择。每次训练迭代中，从优先级队列中选择一定数量的经验样本。其中，优先级的定义主要依靠算法训练中的TD误差，误差大的优先级高，这有助于平稳地更新策略网络，避免因为数据的相关性导致训练不稳定。5奖励函数的设计：提出一种潜航器在运动中可以降低能耗的奖励函数。该奖励函数主要包含能源消耗量、任务完成度两个指标。能保证潜航器在利用较少能量的情况下，更好地完成任务。

全文数据：

权利要求：

百度查询：天津大学一种基于离散PPO的潜航器节能路径跟踪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种分布式资源管理框架的多层次架构和管理方法_中国科学院深圳先进技术研究院_201910767009.8

下一篇：异构多层结构_特斯拉公司_202280064643.5

相关技术

一种分布式资源管理框架的多层次架构和管理方法_中国科学院深圳先进技术研究院_201910767009.8

异构多层结构_特斯拉公司_202280064643.5

一种锂电池外壳自动泄压结构_天能帅福得能源股份有限公司_201811323218.5

图片优化方法、装置、电子设备及存储介质_平安科技(深圳)有限公司_201911060155.3

一种透平膨胀机用闭式叶轮_江苏国富氢能技术装备股份有限公司_201910743198.5

一种基于电网接线模式及变压器规模的导线截面选取方法_国家电网有限公司_202010813787.9

图像融合的方法、装置、存储介质及电子设备_北京大米科技有限公司_202011069359.6

一种石材加工设备及加工方法_宋贵江_202410337373.1

基于消息队列的数据同步方法、装置、设备及存储介质_平安科技(深圳)有限公司_202011264779.X

中学生物实验操作测评方法、装置、电子设备及存储介质_北京师范大学珠海校区_202410399294.3

吸附脱附部件的安装结构_东洋纺MC株式会社_202280060457.4

循环压钉设备_苏州领裕电子科技有限公司_202011023281.4

器相关技术

分液器及空调器_珠海格力电器股份有限公司_201711215999.1

气体分布器及反应器_中国石油化工股份有限公司_202211330457.X

穿刺器_杭州康基医疗器械有限公司_201810789907.9

喂药器_广东顺德雷蒙电器科技有限公司_202410057650.3

连接器壳体、电连接器、对配连接器及连接器组件_泰科电子(上海)有限公司_201710059653.0

收发器中隔离接收器和发射器的方法和装置_康杜实验室公司_202410141837.1

连接器壳体组件、连接器和连接器组件_西霸士电子(厦门)有限公司_202322622698.8

存储器检查方法、存储器检查装置及存储器检查系统_群联电子股份有限公司_202110236924.1

微型显示器背板系统和像素驱动器控制器_上海显耀显示科技有限公司_202180102454.8

一种供水淋浴器主体、淋浴器和供水淋浴器_厦门市得尔美卫浴有限公司_202322319860.9

节能相关技术

高效节能制冷空调_浙江杭强制冷设备股份有限公司_202322453727.2

家用热水节水节能装置_厦门华旸建筑工程设计有限公司_202322980213.2

高效节能电加热板装置_大具企业股份有限公司_202211630313.6

反萃法硼酸生产节能装置_苏州友硼光电材料有限公司_202322474003.6

用于纸张烘干的节能烘箱_东莞海辉纸业有限公司_202322779202.8

一种节能式电炉炉体_新疆喀拉通克矿业有限责任公司_202322964488.7

半导体工厂节能换热机组_山东汉华工业设备有限公司_202410193022.8

一种高导节能电缆_新疆胡杨线缆制造有限公司_202322375494.9

高效节能静音式无雾加湿器_杨天宇_202321198246.5

一种新型节能建材_西安异聚能科技研究院有限公司_201811020013.X

潜航相关技术

双推杆式全向矢量推进装置及潜航器_上海船舶电子设备研究所(中国船舶集团有限公司第七二六研究所)_202322862805.4

自隐气泡帷幕防护系统和潜航器_中国船舶重工集团公司第七一九研究所_202111445366.6

一种水下潜航器_广东蓝潜海洋技术有限公司_202410133592.8

一种仿生章鱼的无人潜航器_周欣_202410210122.7

基于海洋温差的自主水下潜航器动力补给系统_中国科学院上海高等研究院_202311729935.9

一种潜航器微气泡减阻装置及控制系统_江苏海洋大学_202410291391.0

一种可浮沉无人潜航发射器_北华航天工业学院_202410106226.3

面向复杂动态环境的水下无人潜航器航迹生成方法及系统_中国船舶重工集团公司第七一九研究所_202211336332.8

可视化海洋潜航器水动力学模型辨识方法和系统_上海交通大学_202410108861.5

潜航器路径规划方法及控制系统_苏州桑泰海洋仪器研发有限责任公司_202410081166.4

龙图腾网&IPTOP

【发明公布】一种基于离散PPO的潜航器节能路径跟踪方法_天津大学_202311669432.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务