【发明公布】一种基于强化学习的智能飞行器群体组建与重构方法_北京临近空间飞行器系统工程研究所_202410048119.X

申请/专利权人：北京临近空间飞行器系统工程研究所

申请日：2024-01-12

公开（公告）日：2024-05-17

公开（公告）号：CN118052271A

主分类号：G06N3/092

分类号：G06N3/092;G06F30/20;G06N3/006;G06F30/27

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.04#实质审查的生效;2024.05.17#公开

摘要：本发明提出一种基于强化学习的智能飞行器群体组建与重构方法，属于人工智能技术领域，包括如下步骤：S1、基于强化学习的蜂群自组织；先进行作战任务分析，再进行杀伤链要素解析，在杀伤链要素解析的基础上，完成基于强化学习的作战单元自组织；采取基于深度强化学习的组织结构自学习方式针对每个特定任务形成特定组织结构，使用专家知识系统形成迁移学习与强化学习结合的方式，用收集的专家数据行为，约束智能体的探索性行为；S2、蜂群杀伤链路径动态优化，完成蜂群杀伤链路径规划任务；S3、自适应对抗演练与高质量博弈决策，通过实验结果验证模型合理性与先进性。本发明解决了现有技术无法求解蜂群最优组合，限制了蜂群最大作战效能发挥的问题。

主权项：1.一种基于强化学习的智能飞行器群体组建与重构方法，其特征在于，包括如下步骤：S1、基于强化学习的蜂群自组织包括作战任务分析、杀伤链要素解析和基于强化学习的作战单元自组织；S1.1、作战任务分析融合作战单元携带的蜂群中各项信息，实现对战场环境的全部探测，在实现共享目标信息、任务信息及指挥控制信息的基础上，组合形成信息网；S1.2、杀伤链要素解析预定义蜂群中的各项行为，将蜂群的行为分类为跟随、回避、攻击，将不同的作战单元预划分为不同种类的作战方式；采用四元素构造策略信息描述，分别为策略类型、选中单元、策略目标、执行动作序列；在作战方式预定义的基础上，对每一个作战单元的作战能力进行评估，为形成组织结构后的杀伤链作战能力解析作战方式，评估作战能力；策略类型表示下次输出动作的类型；选中单元为执行动作的单元；策略目标表示选择执行动作的目的地和对象；执行动作序列表示是否马上进行该动作，对于执行动作的人物的行为序列；S1.3、在杀伤链要素解析模块的基础上，完成基于强化学习的作战单元自组织模型以五元组S,A,P,R,γ描述，在一个离散时间步t＝0,1,2,3..中，在每一个t，智能体接收到环境状态的描述st∈S，S是环境中所有可能的状态空间，在当前的环境状态st基础上，模型选择一个动作at∈Ast，Ast代表在状态st时所有可行的动作区间，执行该动作at后，时间步跳转到t+1，智能体在该状态下获取到新的状态st+1，同时，环境反馈一个奖励值rt+1∈R；在每一个时间t，智能体接收到的环境状态到选择相应动作之间的映射称为策略，用π表示，πa|s＝p[At＝a|St＝s]表示在给定环境状态St＝s的情况下，策略网络选择动作At＝a的概率；奖励值函数为在系统采取策略时，在给定环境状态的情况下，智能体采用策略π时的期望奖励值；公式如下：式中，γ表示时间折扣，即不同时间步的奖赏在当前时间步的不同权重；在强化学习的训练过程中，智能体的目的即为让环境反馈的奖励值最大；采取基于深度强化学习的组织结构自学习方式针对每个特定任务形成特定组织结构，使用专家知识系统形成迁移学习与强化学习结合的方式，用收集的专家数据行为，约束智能体的探索性行为，缩小策略空间；S2、蜂群杀伤链路径动态优化根据作战任务、战场环境和作战单元的性能，为蜂群中每一个作战单元制定有序任务序列，在避免资源冲突达到整体最优；针对飞行器的特点及战场环境的约束进行建模，约束不同因素完成蜂群杀伤链路径规划任务；S3、自适应对抗演练与高质量博弈决策首先搭建一套基于红蓝对抗的即时战略平台，利用该仿真推演平台综合处理战场反馈数据与作战单元蜂群对战决策，让蜂群组建与重构模型依托推演平台完成基于逆向强化学习的自我博弈，通过实验结果验证模型合理性与先进性。

全文数据：

权利要求：

百度查询：北京临近空间飞行器系统工程研究所一种基于强化学习的智能飞行器群体组建与重构方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种输气站场突发事件应急处置仿真系统、方法及介质_国家石油天然气管网集团有限公司_202410135094.7

下一篇：一种矿区开采沉陷水底地表变形监测装置及方法_平安煤炭开采工程技术研究院有限责任公司_202410321509.X

相关技术

一种输气站场突发事件应急处置仿真系统、方法及介质_国家石油天然气管网集团有限公司_202410135094.7

一种矿区开采沉陷水底地表变形监测装置及方法_平安煤炭开采工程技术研究院有限责任公司_202410321509.X

训练数据的生成方法、装置、电子设备和存储介质_OPPO广东移动通信有限公司_202211499299.0

一种高度可调的船舶高度检测系统_大连海事大学_202410262681.2

基于5G多接入边缘计算的PLC设计优化方法及系统_杭州一目倾诚网络科技有限公司_202410269502.8

一种石化储油罐安装过程防漏检测方法、介质及系统_中建安装集团有限公司_202410282425.X

数据传输方法、设备及存储介质_中兴通讯股份有限公司_202211551808.X

一种应用废弃土的材料、制造方法及其应用_深圳市深汕特别合作区世纪凯恒科技有限公司_202410257908.4

图像解码设备、图像解码方法和存储介质_佳能株式会社_202410260046.0

一种薄膜电容器及其制造方法_广东电网有限责任公司_202210540305.6

压驱助剂自适应调节伴注系统_中国石油化工股份有限公司_202211549249.9

上下料控制方法、装置、计算机设备和存储介质_深圳市衡亿安科技有限公司_202410144851.7

飞行器相关技术

一种用于飞行器的组件及该飞行器_空中客车运营简化股份公司_202010206468.1

飞行器进气道结构的保形设计方法及飞行器_西北工业大学_202010943421.3

飞行器局部结构的保形设计方法及飞行器_西北工业大学_202010942451.2

飞行器热管理系统_杭州三花研究院有限公司_202311158075.8

柔性可展开折叠飞行器_中国空间技术研究院_202410256189.4

飞行器热管理系统_杭州三花研究院有限公司_202311162156.5

飞行器燃料补充系统_空中客车营运有限公司_202311656942.0

高超声速飞行器机载轨迹规划方法、装置、飞行器及介质_中国人民解放军国防科技大学_202111580724.4

飞行器的返航方法、装置、飞行器及计算机可读存储介质_深兰科技(上海)有限公司_202011604508.4

一种无人飞行器及其机翼组件_深圳市道通智能航空技术股份有限公司_201811622482.9

群体相关技术

基于设备移动近似群体密度_国际商业机器公司_202280067256.7

群体内部行动能力评估方法及系统_数据空间研究院_202311482678.3

一种产群体效应抑制剂的真菌_井冈山大学_202410345742.1

客户群体的圈选方法、装置、电子设备和介质_中国工商银行股份有限公司_202410268956.3

地埋式截留型群体体温检测系统及其控制与检测方法_桂林海威科技股份有限公司_202010762919.X

一种适用于半失能群体的多功能小车_深圳市研天科技有限公司_202322374807.9

客户群体的生产方法、装置、电子设备和介质_中国工商银行股份有限公司_202410264851.0

基于家庭码或群体码的信息处理方法、装置及设备_钉钉科技有限公司_202110352362.7

群体关系网的构建方法、装置、设备及可读存储介质_深圳云天励飞技术有限公司_201911142229.8

用户群体分类方法、装置、电子设备、介质和程序产品_中国工商银行股份有限公司_202410379062.1

组建相关技术

组播组建立方法、设备、装置及存储介质_大唐移动通信设备有限公司_202211559733.X

一种自组建免穿戴式3D建模系统及方法_南京航空航天大学_202410172471.4

一种堆叠系统组建方法、装置、设备及介质_锐捷网络股份有限公司_202310458303.7

虚拟家庭组的组建方法及系统和共享支付方法及系统_广东方天软件科技股份有限公司_202310271869.9

一种基于强化学习的智能飞行器群体组建与重构方法_北京临近空间飞行器系统工程研究所_202410048119.X

一种铝合金门窗组建结构_南京迈豪幕墙工程有限公司_202322728856.8

一种多向全角度连接的脚手架及其组建方法_中铁四局集团第七工程有限公司_202410347622.5

一种数字工厂的订单和产品的组建方法_华鼎国联四川动力电池有限公司_202311651119.0

基于模糊聚类的大规模电池储能系统成组建模方法、系统、设备及可读存储介质_中国电力科学研究院有限公司_202010519497.3

基于员工画像的项目团队组建方法、系统及电子设备_北京易华录信息技术股份有限公司_202311823674.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于强化学习的智能飞行器群体组建与重构方法_北京临近空间飞行器系统工程研究所_202410048119.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务