买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】不完全信息下的基于自注意力强化学习方法及决策智能体_中国人民解放军国防科技大学_202410116624.3 

申请/专利权人:中国人民解放军国防科技大学

申请日:2024-01-29

公开(公告)日:2024-04-26

公开(公告)号:CN117933421A

主分类号:G06N20/00

分类号:G06N20/00;G06N3/006

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本发明提供了一种不完全信息下的基于自注意力强化学习方法及决策智能体,在面对水下对抗态势错综复杂,对抗情报信息不完全的情况时,通过离线‑在线混合驱动的强化学习框架,通过历史数据库引入游戏平台的对抗专家经验来指导模型的前期决策,再基于在线交互的学习模式驱动防御目标的后期智能决策,从而加快智能体的收敛速度,提高其类人的智能决策水平。同时针对多目标攻击问题,提出敌我态势分块交互的自注意力机制,捕捉我方完全信息下的态势表征与不完全信息下的敌方情报的对抗关联信息,实现对抗双方的态势信息融合表征及关联信息挖掘,提高智能体的态势感知能力,实现水下平台防御来袭目标的实时高效决策。

主权项:1.一种不完全信息下的基于自注意力强化学习方法,其特征在于,包括以下步骤:步骤1:获取水下平台敌我双方态势信息;步骤2:对敌我双方态势信息进行整合编码和状态编码;步骤3:将状态编码后的敌我双方态势信息输入智能体决策模型;步骤4:对智能体的序贯决策结果进行解码并输出给水下平台进行相应的防御动作。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 不完全信息下的基于自注意力强化学习方法及决策智能体

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。