【发明公布】不完全信息下的基于自注意力强化学习方法及决策智能体_中国人民解放军国防科技大学_202410116624.3

申请/专利权人：中国人民解放军国防科技大学

申请日：2024-01-29

公开（公告）日：2024-04-26

公开（公告）号：CN117933421A

主分类号：G06N20/00

分类号：G06N20/00;G06N3/006

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.14#实质审查的生效;2024.04.26#公开

摘要：本发明提供了一种不完全信息下的基于自注意力强化学习方法及决策智能体，在面对水下对抗态势错综复杂，对抗情报信息不完全的情况时，通过离线‑在线混合驱动的强化学习框架，通过历史数据库引入游戏平台的对抗专家经验来指导模型的前期决策，再基于在线交互的学习模式驱动防御目标的后期智能决策，从而加快智能体的收敛速度，提高其类人的智能决策水平。同时针对多目标攻击问题，提出敌我态势分块交互的自注意力机制，捕捉我方完全信息下的态势表征与不完全信息下的敌方情报的对抗关联信息，实现对抗双方的态势信息融合表征及关联信息挖掘，提高智能体的态势感知能力，实现水下平台防御来袭目标的实时高效决策。

主权项：1.一种不完全信息下的基于自注意力强化学习方法，其特征在于，包括以下步骤：步骤1：获取水下平台敌我双方态势信息；步骤2：对敌我双方态势信息进行整合编码和状态编码；步骤3：将状态编码后的敌我双方态势信息输入智能体决策模型；步骤4：对智能体的序贯决策结果进行解码并输出给水下平台进行相应的防御动作。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学不完全信息下的基于自注意力强化学习方法及决策智能体

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

下一篇：一种果树吊枝方法_上海市农业科学院_202410367417.5

相关技术

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

一种果树吊枝方法_上海市农业科学院_202410367417.5

一种RISC-V架构芯片快速测试加速单元的方法及装置_山东浪潮科学研究院有限公司_202410162392.5

净化珊瑚生境水质的生物过滤装置_广东海洋大学深圳研究院_202311835959.2

一种数控龙门铣床_河北大恒重型机械有限公司_202410333473.7

一种助力外骨骼辅助运动装置_中国人民解放军总医院第四医学中心_202311762144.6

一种新型射灯天线_摩比天线技术(深圳)有限公司_202410125372.0

锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

一种海底设施多关节柔性智能体的控制方法及系统_同济大学_202410164319.1

一种炮孔自动填塞机_新疆天河爆破工程有限公司_202410337157.7

设备控制方法、装置、配电设备及存储介质_深圳市正浩创新科技股份有限公司_202410171534.4

一种吊具点测方法、装置、系统和存储介质_一汽丰田汽车有限公司_202410173152.5

龙图腾网&IPTOP

【发明公布】不完全信息下的基于自注意力强化学习方法及决策智能体_中国人民解放军国防科技大学_202410116624.3

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务