买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种面向足球对战的数据驱动强化学习方法_南京信息工程大学;中科南京人工智能创新研究院_202410217870.8 

申请/专利权人:南京信息工程大学;中科南京人工智能创新研究院

申请日:2024-02-28

公开(公告)日:2024-04-02

公开(公告)号:CN117807894A

主分类号:G06F30/27

分类号:G06F30/27;G06N3/092;G06N3/045;A63B69/00;A63B71/06

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.19#实质审查的生效;2024.04.02#公开

摘要:本发明公开了一种面向足球对战的数据驱动强化学习方法,包括:1、在网络平台上采集足球博弈所需的数据;2、对步骤1的数据进行预处理,得到预处理数据;3、构建离线强化学习网络模型;4、基于预处理数据,对离线强化学习网络模型进行训练及测试,得到训练完成的模型;5、基于训练完成的模型,解决谷歌足球环境中各智能体的决策问题。本发明使用离线强化学习的思想解决谷歌足球环境,使用Transformer强大的预测能力来增加算法效果,不仅可以增加训练速度,对比当前的离线强化学习算法在稀疏环境的效果也有不错的提升。

主权项:1.一种面向足球对战的数据驱动强化学习方法,其特征在于,包括如下步骤:步骤1、在网络平台上采集足球博弈所需的数据集;步骤2、对步骤1的数据进行预处理,得到预处理数据;步骤3、构建离线强化学习网络模型;步骤4、基于预处理数据,对离线强化学习网络模型进行训练及测试,得到训练完成的模型;步骤5、基于训练完成的模型,解决谷歌足球环境中各智能体的决策问题。

全文数据:

权利要求:

百度查询: 南京信息工程大学;中科南京人工智能创新研究院 一种面向足球对战的数据驱动强化学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。