申请/专利权人:中国电子科技集团公司第二十研究所
申请日:2023-10-11
公开(公告)日:2024-04-09
公开(公告)号:CN117852384A
主分类号:G06F30/27
分类号:G06F30/27;G06N3/092;G06Q50/26
优先权:["20221102 CN 2022113627330"]
专利状态码:在审-实质审查的生效
法律状态:2024.04.26#实质审查的生效;2024.04.09#公开
摘要:本发明提出了一种基于强化学习的指挥官意图识别方法及装置,方法包括:根据作战任务场景,配置目标函数;利用当前目标函数进行仿真测试,统计本次迭代的所述仿真测试的第一战效能指标;配置不同的意图权重系数进行仿真测试,以得到本次迭代对应的第二战效能指标;响应于指挥官交互的选择,学习指挥官的喜好,对意图权重系数进行配置;根据当前意图权重系数确定指挥官的意图。本发明将指挥官意图表示为作战决策的偏好权重,为指挥官提供了量化的决策依据,通过指挥官和辅助决策系统之间的不断交互,系统可以学习到指挥官最认同的权重配比,即指挥官的意图。
主权项:1.一种基于强化学习的指挥官意图识别方法,其特征在于,包括:步骤1,根据作战任务场景,配置目标函数,其中,所述目标函数的参数中的意图权重系数用于表征指挥官的意图;步骤2,利用当前所述目标函数进行仿真测试,统计本次迭代的所述仿真测试的第一战效能指标;步骤3,在所述目标函数中配置不同的所述意图权重系数,利用当前的目标函数进行仿真测试,以得到本次迭代对应的第二战效能指标;步骤4,响应于指挥官对所述第一战效能指标的选择,不再更新所述意图权重系数;或者,响应于指挥官对所述第二战效能指标的选择,将第一战效能指标所对应的目标函数中的意图权重系数,增加或减小一个预先配置的学习步长,以使得第一战效能指标所对应的目标函数中的意图权重系数更接近所述第二战效能指标所对应的目标函数的意图权重系数,并重复步骤3至步骤4,直至所述意图权重系数不再更新;步骤5,根据当前所述意图权重系数确定指挥官的意图。
全文数据:
权利要求:
百度查询: 中国电子科技集团公司第二十研究所 一种基于强化学习的指挥官意图识别方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。