买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于强化学习的空战控制方法_西安电子科技大学_202311649111.0 

申请/专利权人:西安电子科技大学

申请日:2023-12-04

公开(公告)日:2024-03-29

公开(公告)号:CN117787086A

主分类号:G06F30/27

分类号:G06F30/27;G06N3/092

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明公开了一种基于强化学习的空战控制方法,以解决专家系统对复杂环境的适应性差,神经网络对战场处理实时性差、训练需要大量实验样本、不利于空战结果分析以及简化并优化对飞机三维空间机动控制的问题。具体包括步骤1、超视距空战战场建模;步骤2、超视距空战机动建模;步骤3、超视距空战决策序列建模;步骤4、强化学习环境建模;步骤5、智能体训练;步骤6、智能体部署;本发明采用预处理过载表的方法处理空战问题,可以处理复杂作战环境下的作战任务,针对不同的复杂环境,其中飞机可以依据过载表对当前状态迅速做出动作决策,以高效完成作战任务,提高战场作战的实时性。

主权项:1.一种基于强化学习的空战控制方法,其特征在于,包括以下步骤:步骤1、超视距空战战场建模;根据敌我双方的空间位置、几何关系、相对运动状态以及所在空域范围建立超视距空战战场模型;步骤2、超视距空战机动建模;基于地面直角坐标系、飞机机体坐标系以及飞机速度坐标系对飞机六自由度建立超视距空战机动模型;步骤3、超视距空战决策序列建模;基于步骤1建立的超视距空战战场模型,通过马尔可夫决策过程建立超视距空战场景下的超视距空战决策序列模型;步骤4、强化学习环境建模;根据步骤1建立的超视距空战战场模型以及步骤2建立的超视距空战机动模型对飞机的动作空间、状态空间以及作战场景奖励建立强化学习环境模型;步骤5、智能体训练;在所述强化学习环境模型下,采用步骤3得到的超视距空战决策序列模型以及强化学习算法训练我方智能体在单对单作战场景下的过载控制能力,使得我方智能体在任意初始条件下均可对敌方飞机在指定作战范围内按照所述过载控制能力包含的距离过载表和差角过载表控制我方飞机进行作战;步骤6、智能体部署;单对单作战:将训练后的所述智能体部署至我方飞机上,控制我方飞机进行作战,直至敌方飞机被击毁,完成作战任务;多对多作战:将训练后的智能体部署至多架我方飞机上,控制我方飞机进行作战;在多对多的作战场景下,通过威胁度指标对我方飞机进行作战目标的分配,完成打击任务的我方飞机迅速切换作战对象,辅助我方其他飞机对敌方飞机进行打击,直至敌方飞机全部被击毁,完成作战任务。

全文数据:

权利要求:

百度查询: 西安电子科技大学 一种基于强化学习的空战控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。