买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于增量学习的飞行器智能避障决策优化方法_天津大学_202311198865.9 

申请/专利权人:天津大学

申请日:2023-09-15

公开(公告)日:2024-04-12

公开(公告)号:CN117873153A

主分类号:G05D1/495

分类号:G05D1/495;G05D1/46;G05D101/15;G05D109/20

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:本申请公开了一种基于增量学习的飞行器智能避障决策优化方法,包括如下步骤:建立面向飞行器避障任务的智能避障决策博弈模型;采用多任务融合训练的方式进行飞行器避障决策算法预训练;基于新增任务,更新新增任务下飞行器决策网络与飞行器评价网络的权值,获得新增任务下飞行器决策网络与飞行器评价网络的权值,通过迭代更新的方式实现飞行器避障决策算法的在线优化;从而提升了智能避障算法的适应性,实现了飞行器对多种环境的智能自主避障,有利于保障飞行器的安全性,同时在面临新的障碍物时,通过网络权值的迭代更新,便可以实现对智能避障算法的在线优化,从而加快了训练速度,降低了计算时间和计算资源的消耗。

主权项:1.一种基于增量学习的飞行器智能避障决策优化方法,其特征在于,包括如下步骤:1建立面向飞行器避障任务的智能避障决策博弈模型,包括设置约束条件、奖惩制度和性能指标;2采用多任务融合训练的方式进行飞行器避障决策算法预训练,包括更新不同任务下飞行器决策网络与飞行器评价网络的权值,获得预训练后的多任务飞行器决策网络权值和飞行器评价网络权值并实现飞行器的智能避障决策;3基于新增任务,更新新增任务下飞行器决策网络与飞行器评价网络的权值,获得新增任务下飞行器决策网络与飞行器评价网络的权值,将新增任务下飞行器决策网络与飞行器评价网络的权值迭代更新预训练后的多任务飞行器决策网络权值和飞行器评价网络权值,获得适应当前任务的飞行器决策网络权值和飞行器评价网络权值,实现飞行器避障决策算法在线优化。

全文数据:

权利要求:

百度查询: 天津大学 一种基于增量学习的飞行器智能避障决策优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。