【发明公布】一种兵棋推演的策略生成方法、电子设备、存储介质_鹏城实验室_202410038263.5

导航：龙图腾网> 最新专利技术> 一种兵棋推演的策略生成方法、电子设备、存储介质_鹏城实验室_202410038263.5

申请/专利权人：鹏城实验室

申请日：2024-01-10

公开（公告）日：2024-04-12

公开（公告）号：CN117861230A

主分类号：A63F13/822

分类号：A63F13/822;A63F13/55;G06N3/092

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.30#实质审查的生效;2024.04.12#公开

摘要：本实施例提出一种兵棋推演的策略生成方法、电子设备和存储介质。通过基于每个智能体的状态空间和动作空间构建多智能体的联合状态空间、联合动作空间、联合奖励函数和状态转移函数，使多智能体可以在团队层面进行学习和决策，将多智能体决策问题转化为生成动作序列的策略生成问题，大幅降低了多智能体决策的复杂度，同时，控制每个智能体在决策时除了基于智能体的观测信息外还需考虑其它智能体的动作序列，避免由于多智能体之间的策略不可传递导致每个智能体在决策时陷入局部最优，使得多智能体可以输出全局最优解，同时避免多智能体协作过程中的不平稳问题，有效提高了兵棋推演场景下多智能体决策的平稳性。

主权项：1.一种兵棋推演的策略生成方法，其特征在于，所述方法包括：获取战场仿真环境；将至少两个对战方的对战实体分别进行编队，得到每个所述对战方的多个编组，其中，每个所述对战方包括多个智能体，每个所述智能体分别控制一个编组，其中，属于不同的所述对战方的智能体互为对手智能体；构建每个所述智能体在所述战场仿真环境中的状态空间和动作空间；根据每个所述对战方的所有所述智能体的所述状态空间和所述动作空间构建所述对战方的联合观测空间、联合动作空间、联合奖励函数和状态转移函数；根据所述联合观测空间确定所述对战方在每个时间步下的观测序列；根据所述观测序列确定观测表征序列；根据所述观测表征序列确定动作序列，其中，所述动作序列包括每个所述智能体的动作，第i个所述智能体的动作根据前i-1个所述智能体的动作和所述观测表征序列确定；通过所述联合动作空间将所述动作序列转换为每个所述对战实体的动作指令并控制每个所述对战实体对所述战场仿真环境执行动作指令；根据所述状态转移函数确定所述智能体执行所述动作序列前后的所述联合观测空间的变化值，并根据所述联合奖励函数确定每个所述智能体执行所述动作序列的奖赏值；根据所述观测序列，所述动作序列和所述奖赏值构成回放经验并存储到经验回放池中；在所述经验回放池中的所述回放经验的数量大于第一经验阈值的情况下，采样所述回放经验训练所述智能体的策略网络和评价网络；在采样所述回放经验的次数大于训练局数阈值，且所述智能体在所述回放经验的对局中的胜率大于第一胜率阈值的情况下，根据对手策略选择机制控制所述智能体和所述对手智能体进行对抗训练以生成策略以构建所述智能体的策略池；在所述智能体与所述对手智能体对抗的局数大于对抗局数阈值且所述智能体在与所述对手智能体对抗的过程中胜率大于第二胜率阈值的情况下，确定完成对所述智能体的训练；通过完成训练的所述智能体从所述策略池中输出策略。

全文数据：

权利要求：

百度查询：鹏城实验室一种兵棋推演的策略生成方法、电子设备、存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

下一篇：一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

相关技术

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

一种网格化终端旋转装置_北京国旺盛源智能终端科技有限公司_202322619930.2

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

一种可调节车挡_自贡市城市规划设计研究院有限责任公司_202322421392.6

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

方法相关技术

定子及其制造方法_LG麦格纳电子动力总成有限公司_202110012057.3

通信方法及装置_华为技术有限公司_202211296381.3

模型剪枝方法、人脸识别模型训练方法及人脸识别方法_苏州元脑智能科技有限公司_202311803044.3

通信方法及装置_华为技术有限公司_202010617172.9

信息处理方法_丰田自动车株式会社_202311358127.6

通信方法及装置_华为技术有限公司_202311024020.8

曝光方法、曝光装置、以及物品的制造方法_佳能株式会社_202311346914.9

蓄电设备的检查方法及制造方法_丰田自动车株式会社_202010574534.0

能力确定方法、上报方法、装置、设备及存储介质_北京小米移动软件有限公司_202280001087.7

冰箱及其控制方法_LG电子株式会社_202080061858.2

生成相关技术

气溶胶生成装置及气溶胶生成系统_深圳市合元科技有限公司_202322425016.4

基于生成对抗网络的人偶模特生成算法_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202311484349.2

骨架动作图生成方法、生成装置、计算机设备及介质_深兰科技(上海)有限公司_202110895154.1

生成参数化空间音频表示_诺基亚技术有限公司_202311364414.8

生成参数化空间音频表示_诺基亚技术有限公司_202311364503.2

气溶胶生成装置及其制造方法_韩国烟草人参公社_202080005689.0

报表生成方法及装置_中盈优创资讯科技有限公司_201911043076.1

一种多功能便携式氢气生成装置及一种氢气生成方法_深圳市珐彩科技有限公司_202010330550.5

生成情绪组合内容的方法及装置_三星电子株式会社_202280057521.3

详单生成的方法、装置及计算设备_中国移动通信集团安徽有限公司_202010015473.4

电子设备相关技术

电子设备_三星显示有限公司_202322201102.7

电子设备_合肥联宝信息技术有限公司_201711106618.6

电子设备_联想(新加坡)私人有限公司_202311364004.3

电子设备_深圳市嘉晋实业有限公司_202322601396.2

电子设备_联想(新加坡)私人有限公司_202311356838.X

电子设备_联想(北京)有限公司_202121048913.2

电子设备_联想(北京)有限公司_202320261233.1

电子设备_联想(北京)有限公司_202322038862.0

电池和电子设备_珠海冠宇电池股份有限公司_202322439080.8

风扇和电子设备_联想(北京)有限公司_202322357859.5

龙图腾网&IPTOP

【发明公布】一种兵棋推演的策略生成方法、电子设备、存储介质_鹏城实验室_202410038263.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务