买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于深度强化学习的炮兵连智能作战演练系统_中北大学_202011051742.9 

申请/专利权人:中北大学

申请日:2020-09-29

公开(公告)日:2022-07-19

公开(公告)号:CN112221149B

主分类号:A63F13/60

分类号:A63F13/60;A63F13/822;G06N3/04;G09B9/00

优先权:

专利状态码:有效-授权

法律状态:2022.07.19#授权;2021.02.02#实质审查的生效;2021.01.15#公开

摘要:本发明属于计算机仿真领域,具体涉及一种基于深度强化学习的炮兵连智能作战演练系统。该系统包括包括任务管理模块、算法决策模块和可视化演示模块。针对强化学习、矩阵对策、影响图对策、遗传算法和遗传模糊树等方法存在的“维度灾难”、“人类主观性影响”、“规则漏洞”等问题,本发明采用深度强化学习算法,通过其与环境的交互对神经网络进行训练,避免了人类主观影响;不需要经典样本案例;通采用深度神经网络避免“维度灾难”问题。本发明在炮兵连军事演练中战术研究、火力打击、装备性能评估等领域具备广泛的应用前景。

主权项:1.一种基于深度强化学习的炮兵连智能作战演练系统,其特征在于,包括任务管理模块、算法决策模块和可视化演示模块;所述任务管理模块采用客户服务器模式的网络架构,用于作战任务的新建、作战任务的查询、作战任务的控制;所述作战任务的新建为任务管理模块提供表单填写页面并呈现给用户,以供用户录入对应的作战任务数据,录入过程进行合法性检测,检测完毕后任务管理模块会对录入的作战任务数据进行序列化,之后将序列化后的数据储存在自动生成的文件目录,供算法决策模块和可视化演示模块调用;所述作战任务的查询分为任务列表的查询和单个任务详细信息的查询,单个任务详细信息的查询由任务管理模块向算法决策模块的输出反馈单元发送查询请求,算法决策模块的输出反馈单元查询任务对应的数据并返回给任务管理模块;所述作战任务的控制每隔三秒刷新一次当前任务的状态,用于作战任务的修改、作战任务的撤销、停止DDQN深度强化学习算法的推演和开启作战任务的动画演示;所述算法决策模块用于训练神经网络,包括工作台创建单元、计算分析单元和输出反馈单元;所述工作台创建单元调用序列化后的数据并将其进行反序列化,并创建以对应ID命名的文件夹,并持久化各类作战任务信息文件;所述计算分析单元读取作战任务信息文件,采用DDQN深度强化学习算法对其进行训练,得到一个具备高智能行为的炮兵智能体模型,并且输出一个当前最优的炮兵智能体行为决策序列;所述输出反馈单元将当前最优的炮兵智能体行为决策序列持久化储存供可视化演示模块使用,所述输出反馈单元将DDQN深度强化学习算法当前迭代轮数以及每轮迭代所走步数数据持久化存储供任务管理模块使用;所述可视化演示模块基于Unity3D游戏引擎,根据炮兵智能体行为决策序列对炮兵智能体模型进行行为演示,包括动画预处理单元、逻辑控制单元和粒子特效单元;所述动画预处理单元调用序列化后的数据初始化各个对象的属性,完成各个对象的复制与实例化、动画位置的刷新;所述逻辑控制单元根据当前最优的炮兵智能体行为决策序列对各个对象实体的逻辑控制,将所述炮兵智能体模型的动作分为移动动作和攻击动作;所述粒子特效单元利用火焰与烟雾特效给予用户更好的视觉效果,所述各个对象为防御工事、己方作战单位、敌方作战单位、敌方基地。

全文数据:

权利要求:

百度查询: 中北大学 一种基于深度强化学习的炮兵连智能作战演练系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。