申请/专利权人:上海大学
申请日:2024-01-25
公开(公告)日:2024-04-26
公开(公告)号:CN117933357A
主分类号:G06N3/094
分类号:G06N3/094;G06N3/04
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.14#实质审查的生效;2024.04.26#公开
摘要:本发明公开一种基于异质关系的多智能体对抗策略生成方法及相关装置,涉及多智能体对抗博弈领域,方法包括:基于各智能体间的异质关系和各智能体的空间拓扑结构,构建各个智能体的态势关系图;随后基于一智能体的态势关系图,确定出智能体的局部态势信息融合向量;最后利用预先训练好的智能体的对抗策略生成模型,根据智能体的局部态势信息融合向量作出合适的对抗策略,本发明在空间拓扑结构的基础上,考虑了各智能体之间的异质关系来生成态势关系图,使得决策生成模型能够更好理解智能体之间的态势关系,可适应智能体间博弈态势动态变化的条件,更准确的表达博弈态势,提高了生成模型对博弈态势的理解和适应能力,保障了生成的对抗策略的有效性。
主权项:1.一种基于异质关系的多智能体对抗策略生成方法,其特征在于,包括:针对任一智能体,基于所述智能体与其他智能体之间的异质关系和各智能体的空间拓扑结构,构建智能体的态势关系图;所述异质关系包括协作关系和竞争关系;所述态势关系图中包括态势关系邻接矩阵和态势关系特征矩阵;所述态势关系邻接矩阵表征所述智能体与其他智能体之间的异质关系;所述态势关系特征矩阵表征各智能体的局部观测信息;基于智能体的所述态势关系图,确定智能体的局部态势信息融合向量;局部态势信息融合向量为根据智能体的最临近协作智能体的局部观测信息和智能体的最临近竞争智能体的局部观测信息得到;所述最临近协作智能体为与所述智能体的异质关系为协作关系且与所述智能体的空间距离最近的智能体;所述最临近竞争智能体为与所述智能体的异质关系为竞争关系且与所述智能体的空间距离最近的智能体;将智能体的所述局部态势信息融合向量输入到智能体的对抗策略生成模型中,得到智能体的对抗策略;所述对抗策略生成模型为对所有智能体的初始对抗策略生成模型和所有智能体的初始联合策略评估模型进行集中训练后得到的模型;所述联合策略评估模型用于根据智能体的全局态势信息融合向量对联合对抗策略向量进行评分;所述联合对抗策略向量为联合所有智能体的对抗策略生成模型作出的对抗策略得到的向量。
全文数据:
权利要求:
百度查询: 上海大学 基于异质关系的多智能体对抗策略生成方法及相关装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。