买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种智能空战决策方法、系统及电子设备_北京师范大学_202310889524.X 

申请/专利权人:北京师范大学

申请日:2023-07-20

公开(公告)日:2024-03-29

公开(公告)号:CN117556681B

主分类号:G06F30/27

分类号:G06F30/27;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.03.29#授权;2024.03.01#实质审查的生效;2024.02.13#公开

摘要:本发明提供了一种智能空战决策方法、系统及电子设备,属于人工智能领域,方法包括:针对任一飞机,根据当前时刻飞机的观测数据、前一时刻飞机的隐状态及前一时刻飞机的动作,基于空战策略模型,确定当前时刻飞机的动作,以调整飞机的运行状态;空战策略模型为预先采用自博弈算法进行智能体联盟对抗训练得到的;空战策略模型包括状态预测模型及动作预测模型;状态预测模型为预先根据历史交互数据,基于轨迹判别器,对世界模型进行训练得到的;历史交互数据包括历史设定时段内飞机的观测数据、隐状态及动作;动作预测模型为预先基于融合奖励,根据历史设定时段内飞机的隐状态,对演员评论家模型进行训练得到的。本发明提高了空战策略的准确度。

主权项:1.一种智能空战决策方法,其特征在于,所述智能空战决策方法包括:针对任一飞机,获取当前时刻所述飞机的观测数据、前一时刻所述飞机的隐状态及前一时刻所述飞机的动作;根据当前时刻所述飞机的观测数据、前一时刻所述飞机的隐状态及前一时刻所述飞机的动作,基于空战策略模型,确定当前时刻所述飞机的动作,以调整所述飞机的运行状态;所述空战策略模型为预先采用自博弈算法进行智能体联盟对抗训练得到的;所述空战策略模型包括状态预测模型及动作预测模型;所述状态预测模型为预先根据历史交互数据,基于轨迹判别器,对世界模型进行训练得到的;所述历史交互数据包括历史设定时段内飞机的观测数据、隐状态及动作;所述动作预测模型为预先基于融合奖励,根据历史设定时段内飞机的隐状态,对演员评论家模型进行训练得到的;所述状态预测模型用于根据当前时刻飞机的观测数据、前一时刻飞机的隐状态及前一时刻飞机的动作,确定当前时刻飞机的隐状态;所述动作预测模型用于根据当前时刻飞机的隐状态,确定当前时刻飞机的动作;所述空战策略模型的训练过程包括:针对任一次智能体联盟对抗训练,根据t时刻的观测数据、t-1时刻的隐状态及t-1时刻的动作,采用世界模型,确定t时刻的预测隐状态及t时刻的奖励;t时刻为历史设定时段内的任一时刻;根据t时刻的观测数据、t-1时刻的隐状态及t-1时刻的动作,采用轨迹判别器,确定t时刻的判别数据;根据t时刻的预测隐状态、t时刻的真实隐状态及t时刻的判别数据,确定世界模型的目标函数,并基于世界模型的目标函数对世界模型进行迭代训练,以得到状态预测模型;根据t时刻的预测隐状态,采用演员评论家模型,确定t时刻的预测动作;基于能量机动理论和态势评估方法,根据t时刻的奖励,确定t时刻的融合奖励;根据t时刻的判别数据及t时刻的融合奖励,确定演员评论家模型的目标函数,并基于演员评论家模型的目标函数对演员评论家模型进行迭代训练,以得到动作预测模型。

全文数据:

权利要求:

百度查询: 北京师范大学 一种智能空战决策方法、系统及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。