申请/专利权人:深圳市大数据研究院
申请日:2024-01-03
公开(公告)日:2024-03-29
公开(公告)号:CN117787419A
主分类号:G06N5/04
分类号:G06N5/04;G06F17/16
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.16#实质审查的生效;2024.03.29#公开
摘要:本发明公开了一种应用于未知矩阵博弈的博弈策略更新方法、设备及介质,涉及矩阵博弈技术领域,本发明通过在未知矩阵博弈的情况下,根据当前回合下所述雷达的任一第一动作与所述干扰机的任一第二动作之间的收益均值和收益方差,来估计预测当前回合的目标估计收益矩阵,进而基于干扰机在当前回合下的目标动作,在当前回合的目标估计收益矩阵选取得到收益向量,以基于收益向量,对雷达的博弈策略进行更新,从而大大提高了未知矩阵博弈中的效果,解决当收益矩阵未知时,无论是纳什均衡优化算法还是无后悔学习算法都无法得到应用的情况,并且提高了样本利用率。
主权项:1.一种应用于未知矩阵博弈的博弈策略更新方法,其特征在于,包括:获取雷达对应的第一动作空间以及干扰机对应的第二动作空间;确定当前回合下所述雷达的任一第一动作与所述干扰机的任一第二动作之间的收益均值和收益方差,其中,所述第一动作是基于所述第一动作空间选取得到,所述第二动作是基于所述第二动作空间选取得到;基于任一所述第一动作与任一所述第二动作之间的收益均值和收益方差,确定当前回合的目标估计收益矩阵;基于所述干扰机在当前回合下的目标动作,在所述当前回合的目标估计收益矩阵选取得到收益向量;基于所述收益向量,对所述雷达的博弈策略进行更新。
全文数据:
权利要求:
百度查询: 深圳市大数据研究院 应用于未知矩阵博弈的博弈策略更新方法、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。