【发明公布】一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法_西北工业大学_202410300128.3

申请/专利权人：西北工业大学

申请日：2024-03-15

公开（公告）日：2024-05-17

公开（公告）号：CN118052290A

主分类号：G06N5/04

分类号：G06N5/04;G06N20/00

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.04#实质审查的生效;2024.05.17#公开

摘要：本发明公开了一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法，具体包括以下主要过程：以速度脉冲为追逃双方基本策略，建立多航天器围捕追逃博弈优化数学模型；基于近端策略优化框架设计智能学习算法，在此基础上，融合脉冲大小选择、行为切换和任务分配三种决策能力；设计群体非依赖性基本博弈行为集合，并建立以行为奖励核心的奖励函数模型；设计加减速、半强制性行为切换和动态任务分配三种辅助博弈机制。本发明所提算法以底层简单行为作引导，相对传统基于终端距离的智能学习策略，能够提升航天器学习效率和质量，同时所设计辅助机制可有效提升集群博弈的灵活性。该发明具有训练简单、适应性强和实时性强等特点。

主权项：1.一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法，其特征在于，包括如下步骤：步骤1：在多航天器围捕追逃博弈场景下建立追逐航天器、监视航天器以及目标航天器在轨道参考点LVLH坐标系下的运动模型，描述航天器的相对运动过程；以速度脉冲为博弈双方基本策略，以相对距离为优化目标，考虑航天器速度脉冲幅值、时间约束及终端博弈约束，基于零和博弈原理构建多航天器围捕追逃博弈问题模型；LVLH坐标系表示局部垂直局部水平坐标系；步骤2：基于近端策略优化框架设计航天器智能学习算法，构建包括追逃双方位置速度的观测状态空间，构建包括速度脉冲大小、行为类型和目标分配序列的动作状态空间，并基于左右互博原理设计追逃双方训练过程；步骤3：在步骤2的基础上，设计奖励函数，将航天器博弈中的包括前绕飞、后绕飞、交会和编队飞行的博弈策略分解和转化成六种有利于航天器集群高动态博弈的底层行为，并结合终端距离状态奖励共同组成航天器训练动作激励，其中行为奖励占90％以上，保证行为引导为核心；步骤4：设计加减速机制对航天器动作进行选择性修正，确保追逐星在相对距离不断扩大时快速扭转劣势；设计半强制性行为切换机制，通过灵活但不频繁的行为切换，保证追逐星在不同博弈阶段的适应性；设计动态任务分配机制，在有效分配追逐任务的基础上保持资源均匀分配；步骤5：对步骤1-步骤4构成的航天器追逃博弈决策算法进行训练和更新，最终输出适应高动态博弈场景的航天器围捕追逃博弈策略。

全文数据：

权利要求：

百度查询：西北工业大学一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种海域段灌注桩施工质量控制系统_中化学南方建设投资有限公司_202410298081.1

下一篇：一种制动蠕动噪音的前期识别方法_一汽-大众汽车有限公司_202211556421.3

相关技术

一种海域段灌注桩施工质量控制系统_中化学南方建设投资有限公司_202410298081.1

一种制动蠕动噪音的前期识别方法_一汽-大众汽车有限公司_202211556421.3

一种用于缝纫机梭芯套的表面打磨工艺_宁波鸿云精密机械有限公司_202210483579.6

一种矿区开采沉陷水底地表变形监测装置及方法_平安煤炭开采工程技术研究院有限责任公司_202410321509.X

一种基于自适应逆补偿的压电驱动器复合控制方法_长春理工大学中山研究院_202410277126.7

一种捕获大气中二氧化碳的气肥增施变电吸附组件及其应用_大连理工大学_202410350057.8

图像解码设备、图像解码方法和存储介质_佳能株式会社_202410260046.0

一种加热机构及硅胶粘接机_苏州港阳科技有限公司_202410283250.4

数据传输方法、设备及存储介质_中兴通讯股份有限公司_202211551808.X

基于热重分析测量沥青路面自修复胶囊囊芯含量的方法_武汉理工大学_202410331310.5

一种能源站调价方法、装置、计算机设备和可读存储介质_山东能链控股有限公司_202410149603.1

访问第三方应用系统的方法和装置_北京嘀嘀无限科技发展有限公司_202211522859.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于群体非依赖性学习策略的多航天器围捕追逃博弈决策方法_西北工业大学_202410300128.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务