买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】学习装置、信息处理装置、及完成学习的控制模型_乐天集团股份有限公司_202080007830.0 

申请/专利权人:乐天集团股份有限公司

申请日:2020-09-25

公开(公告)日:2024-04-26

公开(公告)号:CN113892070B

主分类号:G05D1/495

分类号:G05D1/495;G05D1/46;G05D101/15;G05D109/20

优先权:["20200430 JP PCT/JP2020/018278"]

专利状态码:有效-授权

法律状态:2024.04.26#授权;2022.01.21#实质审查的生效;2022.01.04#公开

摘要:本发明的学习系统SY1通过向控制模型M输入包含无人飞机P的周边环境、或无人飞机P的预定飞行区域环境的气象信息的环境信息而取得从控制模型M输出的控制信息,使用表示无人飞机P采取基于所述控制信息的行动的情况下所述行动的结果评价的奖励r而进行控制模型M的强化学习。

主权项:1.一种学习装置,其特征在于,进行输出控制信息的控制模型的强化学习,该控制信息用于进行可无人飞行的飞机的飞行控制,且所述学习装置具备:环境信息取得部,取得关于所述飞机的周边环境与所述飞机的预定飞行区域的环境的至少任一环境的环境信息;控制信息取得部,通过向所述控制模型输入所述环境信息而取得从所述控制模型输出的所述控制信息;奖励指定部,指定表示所述飞机采取基于所述控制信息的行动的情况下所述行动的结果评价的奖励;及学习控制部,使用利用所述奖励指定部指定的所述奖励来控制所述控制模型的强化学习;且所述奖励指定部根据所述飞机采取所述行动的情况下向所述飞机的累积降水量与对应于所述飞机的防水性能的阈值的关系来指定不同的所述奖励。

全文数据:

权利要求:

百度查询: 乐天集团股份有限公司 学习装置、信息处理装置、及完成学习的控制模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。