【发明公布】应用于无人机协同对抗的改进QMIX方法_西安工业大学_202310444700.9

导航：龙图腾网> 最新专利技术> 应用于无人机协同对抗的改进QMIX方法_西安工业大学_202310444700.9

申请/专利权人：西安工业大学

申请日：2023-04-23

公开（公告）日：2023-07-14

公开（公告）号：CN116430898A

主分类号：G05D1/10

分类号：G05D1/10

优先权：

专利状态码：在审-实质审查的生效

法律状态：2023.08.01#实质审查的生效;2023.07.14#公开

摘要：本发明提供了一种应用于无人机协同对抗的改进QMIX方法，无人机在当前时刻观测其他无人机获取观测值；无人机将自身的当前状态以及观测值输入训练后的QMIX网络中，以使该QMIX网络输出无人机在当前时刻的联合动作；无人机执行步骤2的联合动作以实现协同对抗。本发明在训练QMIX网络过程中采用梯度正则化防止QMIX中的联合Q值网络梯度过大，设置多步回报返回的惩罚基线，利用正则项因子惩罚偏离该基线联合Q值的无人机。其次，采用softmax函数优化联合Q值以减少联合Q值的过估计，避免多个无人机陷入局部最优造成算法不稳定。因此本发明可以提升无人机协同对抗的稳定性以及质量，利于野外作业。

主权项：1.一种应用于无人机协同对抗的改进QMIX方法，其特征在于，包括：步骤1，无人机在当前时刻观测其他无人机获取观测值；步骤2，无人机将自身的当前状态以及观测值输入训练后的QMIX网络中，以使该QMIX网络输出无人机在当前时刻的联合动作；步骤3，无人机执行步骤2的联合动作以实现协同对抗；其中，训练QMIX网络通过在任一个训练步执行：a无人机将自身在任一历史时刻的状态、该时刻得到的观测值输入至自身对应单智能体行为网络获取添加熵罚项约束的Q值，并根据该Q值选择执行动作；b无人机将该时刻自身对应的单智能体行为网络的输入、输出以及选择执行动作的奖励作为该时刻的回合数据，并放入经验回放池；c根据每个无人机的熵罚项约束的Q值计算联合Q值，并利用softmax函数对联合Q值进行分类取值；d利用累计所有历史时刻得到的联合奖励设置奖励基线，以对分类取值的联合Q值作限制；e对损失函数梯度以增加正则项系数的方式实现正则化，并判断是该训练步是否满足终止条件，如果是则训练结束得到训练后的QMIX网络。

全文数据：

权利要求：

百度查询：西安工业大学应用于无人机协同对抗的改进QMIX方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

下一篇：基于模糊控制的电力设备智能调控方法_太原理工大学_202410258512.1

相关技术

一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

基于模糊控制的电力设备智能调控方法_太原理工大学_202410258512.1

面向建筑工地具体作业场景的施工适宜度气象预报方法_广东省气象服务中心(广东气象影视宣传中心)_202311186968.3

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种富氦气藏区带的评价方法、装置、设备及介质_中国石油天然气股份有限公司_202311208279.8

具有高吞吐量的多反射质谱仪_莱克公司_202011284023.1

一种带有环状槽的齿轮制备模具_蓝山县金山川粉末冶金有限公司_202111384059.1

消息的发送方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202210060996.X

一种基于准零刚度原理的空气悬架及其结构设计与优化方法_江苏大学_202111438418.7

一种乘用车极限强度冲击试验平台辅助装置_中汽研汽车试验场股份有限公司_201911236112.6

RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

龙图腾网&IPTOP

【发明公布】应用于无人机协同对抗的改进QMIX方法_西安工业大学_202310444700.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务