【发明公布】一种基于强化学习的无人航行器安全控制方法_江苏科技大学_202311767574.7

导航：龙图腾网> 最新专利技术> 一种基于强化学习的无人航行器安全控制方法_江苏科技大学_202311767574.7

申请/专利权人：江苏科技大学

申请日：2023-12-21

公开（公告）日：2024-04-26

公开（公告）号：CN117930625A

主分类号：G05B9/03

分类号：G05B9/03

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.14#实质审查的生效;2024.04.26#公开

摘要：本发明公开了一种基于强化学习的无人航行器安全控制方法，通过将深度强化学习DDPG算法应用到无人航行器的安全保护控制中，通过使无人航行器在不断交互学习中寻找最优安全控制策略。该方法设计一种由稳定控制器和保护控制器组成的新型控制结构，步骤如下：对潜航器模型按一定的步长求取平衡点，并做线性化处理；利用反馈控制设计镇定控制器，并将其作为内环控制；利用强化学习方法设计保护控制器，将其作为外环控制。通过设计镇定控制器，使原系统只通过提取的这些主要特征点系统就能进行整体描述，有效解决航行器安全航行时存在的鲁棒性低以及设计复杂性。通过对新型控制结构的设计以达到对无人航行器安全控制的目的。

主权项：1.一种基于强化学习的无人航行器安全控制方法，其特征在于：所述控制方法采用双环控制结构，包括内环控制和外环控制，内环控制为采用反馈控制设计的镇定控制器，镇定控制器包括依次信号连接的动态配平器、控制器和航行器，动态配平器输出信号作用于航行器，航行器输出信号反馈给控制器；外环控制为采用强化学习方法设计的保护控制器，保护控制器包括Critic网络模块、Actor网络模块和经验缓存区，航行器与Actor网络模块互通信号，且航行器的输出信号在经验缓存区中储存，并通过经验缓存区输出信号对Actor网络模块、Critic网络模块进行训练以更新两者的网络参数，通过Critic网络模块输出当前状态下以及下一状态下执行对应动作的评估价值以及对应决策，实现航行器的安全飞行。

全文数据：

权利要求：

百度查询：江苏科技大学一种基于强化学习的无人航行器安全控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种靶向性介孔聚多巴胺纳米颗粒及其制备方法和应用_中国药科大学_202410163612.6

下一篇：一种海底设施多关节柔性智能体的控制方法及系统_同济大学_202410164319.1

相关技术

一种靶向性介孔聚多巴胺纳米颗粒及其制备方法和应用_中国药科大学_202410163612.6

一种海底设施多关节柔性智能体的控制方法及系统_同济大学_202410164319.1

一种基于视觉和图像处理的叉车AGV控制系统_中建材智能自动化研究院有限公司_202410146298.0

一种探测烟雾粒度及浓度的方法_烟台创为新能源科技股份有限公司_202410159903.8

一种助力外骨骼辅助运动装置_中国人民解放军总医院第四医学中心_202311762144.6

一种脑膜炎球菌发酵培养基及其制备方法和应用_成大生物(本溪)有限公司_202410343870.2

锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

POCT血细胞分析仪_深圳市帝迈生物技术有限公司_202410426762.1

一种用于降解餐厨垃圾的诱变菌株的复配及其应用_北京林业大学_202410173755.5

一种双频段相控阵雷达智能抗干扰方法_成都金武科技有限公司_202410410853.6

一种吊具点测方法、装置、系统和存储介质_一汽丰田汽车有限公司_202410173152.5

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

龙图腾网&IPTOP

【发明公布】一种基于强化学习的无人航行器安全控制方法_江苏科技大学_202311767574.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务