买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】航行器路径跟踪控制器的对抗学习架构、控制方法和装置_华中科技大学_202311785947.3 

申请/专利权人:华中科技大学

申请日:2023-12-22

公开(公告)日:2024-04-02

公开(公告)号:CN117806364A

主分类号:G05D1/495

分类号:G05D1/495;G05D1/46;G05D101/15;G05D109/20

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.19#实质审查的生效;2024.04.02#公开

摘要:本发明公开了航行器路径跟踪控制器的对抗学习架构、控制方法和装置,属于航行器自动控制领域。本发明使控制器适应性学习未知扰动作用下产生的状态分布,实现三维空间目标路径鲁棒跟踪控制。本发明采用长短期记忆神经网络与多层感知机构建控制器与对抗深度网络,通过深度强化学习方法训练控制器将高频采样的状态信息序列转换为控制量。训练过程中通过引入对抗体输出对抗控制量使航行器产生不同的状态分布,提高控制器的泛化能力。上述控制器与对抗学习架构部署于航行器的艇载机载计算机上,对传感器反馈的状态数据高频采样,通过实时训练控制执行机构,实现未知扰动作用下航行器对三维空间目标路径的鲁棒跟踪控制。

主权项:1.一种航行器路径跟踪控制器的对抗学习方法,其特征在于,所述航行器路径跟踪控制器解耦为水平面控制器与深度面控制器,所述方法包括:确定水平面深度面控制器当前状态元组,输入至水平面深度面控制器学习架构,得到水平面深度面控制向量,再映射为水平面深度面真实控制向量;确定水平面深度面控制对抗体当前状态元组,输入至水平面深度面控制对抗体学习架构,得到水平面深度面对抗控制向量,再映射为水平面深度面真实对抗控制向量;叠加水平面深度面真实控制量和真实对抗控制向量,得到水平面深度面最终控制量,反馈给航行器,并添加新的状态元组;按照上述方式进行训练,直至满足停止条件,得到训练好的水平面控制器与深度面控制器,其中,所述水平面深度面控制器学习架构基于TD3算法构建,其中,actor网络为水平面深度面控制器网络,由长短期记忆神经网络与多层感知机级联构成,用于将输入的水平面深度面状态信息序列转换为水平面深度面控制向量;评判网络均采用多层感知机;所述水平面深度面控制对抗体学习架构基于TD3算法构建,其中,actor网络为水平面深度面控制对抗体网络,其由多层感知机构成,用于将输入的水平面深度面状态信息序列转换为水平面深度面对抗控制向量;评判网络均采用多层感知机。

全文数据:

权利要求:

百度查询: 华中科技大学 航行器路径跟踪控制器的对抗学习架构、控制方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。