买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】用于利用课程和技能来训练人工智能代理的方法_索尼集团公司;美国索尼公司_202280051668.1 

申请/专利权人:索尼集团公司;美国索尼公司

申请日:2022-07-13

公开(公告)日:2024-03-15

公开(公告)号:CN117716374A

主分类号:G06N20/00

分类号:G06N20/00

优先权:["20220125 US 63/267,136","20220208 US 17/650,295"]

专利状态码:在审-实质审查的生效

法律状态:2024.04.02#实质审查的生效;2024.03.15#公开

摘要:用于训练代理的方法使用被设计为教导在更大领域中有帮助的特定技能的场景的混合,诸如混合通用比赛和非常特定的战术比赛场景。方法的各方面可以包括以下的一个或多个:1通过使一个或多个汽车分散在赛道上,将代理训练为非常擅长于计时赛;2在具有可变数量的对手、在赛道周围按照不同配置开始的各种比赛场景中运行代理;3通过使用游戏提供的代理、根据本发明的各方面训练的代理或被控制以遵循特定行驶路线的代理来改变对手;4利用特定成功准则在各种比赛情况下设置具有对手的特定短场景;以及5基于代理在各种评估场景中表现如何,具有动态课程。

主权项:1.一种利用混合场景训练来训练强化学习代理的方法,包括:在具有一个或多个预定场景属性的环境中提供推出工作者;在专注于一个或多个特定技能的同时,在所述环境中操作所述推出工作者;对于成功地实现所述一个或多个特定技能提供奖励;以及为所述推出工作者创建用于优化奖励的策略。

全文数据:

权利要求:

百度查询: 索尼集团公司;美国索尼公司 用于利用课程和技能来训练人工智能代理的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。