申请/专利权人:哈尔滨工程大学
申请日:2023-12-19
公开(公告)日:2024-03-22
公开(公告)号:CN117742147A
主分类号:G05B13/04
分类号:G05B13/04
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.09#实质审查的生效;2024.03.22#公开
摘要:本发明提供了一种基于强化学习的舰载机自动着舰智能制导方法及系统,属于飞行控制领域。确定制导律的飞行状态输入量与指令输出量,建立基于强化学习的制导算法的状态空间与动作空间;设计基于强化学习的制导算法的奖励函数;设计强化学习的制导律框架,设置TD3强化学习算法的超参数并对神经网络训练,设置训练次数,保存最终训练完成的神经网络的参数;检验该制导律下舰载机着舰精度是否满足要求,不满足时重新设置新的奖励函数后,重新训练直至满足要求。考虑了舰载机当前飞行高度与理想下滑道高度的偏差以及姿态角和空速飞行状态与理想值的偏差,对舰尾流的抑制效果更强,提高了舰载机的着舰精度;避免了PID控制参数复杂的调参工作。
主权项:1.一种基于强化学习的舰载机自动着舰智能制导方法,其特征在于,包括以下步骤:步骤一、确定制导律的飞行状态输入量与指令输出量,建立基于强化学习的制导算法的状态空间与动作空间;步骤二:根据舰载机着舰任务要求,设计基于强化学习的制导算法的奖励函数;步骤三:选取强化学习算法训练智能体,所述强化学习算法为TD3强化学习算法,设置TD3强化学习算法中的神经网络结构,并根据步骤一和步骤二建立的状态空间、动作空间与奖励函数设计强化学习的制导律框架,设置TD3强化学习算法的超参数;步骤四:利用TD3算法对神经网络训练,设置训练次数,保存最终训练完成的神经网络的参数;步骤五:加载保存的神经网络参数,检验该制导律下舰载机着舰精度是否满足要求,不满足时返回步骤二,设置新的奖励函数后,继续执行步骤三至步骤五,直至满足要求。
全文数据:
权利要求:
百度查询: 哈尔滨工程大学 一种基于强化学习的舰载机自动着舰智能制导方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。