申请/专利权人:北京鸿途信达科技股份有限公司
申请日:2024-01-02
公开(公告)日:2024-04-09
公开(公告)号:CN117839220A
主分类号:A63F13/60
分类号:A63F13/60;G06N3/092;G06N3/084
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.26#实质审查的生效;2024.04.09#公开
摘要:本发明提供了一种基于强化学习的游戏引擎优化方法及装置,涉及游戏技术领域。该游戏引擎优化方法包括:利用预训练的游戏环境模型对游戏环境数据进行预测,并基于预测的结果利用强化学习算法中的价值网络更新游戏环境模型中的参数,然后通过策略梯度算法对更新后的游戏环境模型进行求解,得到目标控制策略,以根据目标控制策略对游戏引擎进行优化。根据本发明实施例的基于强化学习的游戏引擎优化方法,根据预测结果更新模型参数,减少了对真实游戏环境的依赖性,且通过价值网络及策略梯度算法对游戏环境模型的参数进行更新,可以提高游戏环境模型的学习效率以准确反应游戏环境和用户行为。
主权项:1.一种基于强化学习的游戏引擎优化方法,其特征在于,包括:获取游戏环境数据,并根据所述游戏环境数据训练预构建的游戏环境模型,得到初始游戏环境模型,其中,所述游戏环境模型基于强化学习框架构建;将当前时刻的所述游戏环境数据输入到所述初始游戏环境模型中进行预测,基于预测的结果并利用强化学习算法中的价值网络更新所述初始游戏环境模型中的参数;利用策略梯度算法对更新后的所述初始游戏环境模型进行求解,得到目标控制策略,以根据所述目标控制策略对所述游戏引擎进行优化。
全文数据:
权利要求:
百度查询: 北京鸿途信达科技股份有限公司 基于强化学习的游戏引擎优化方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。