买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种无人机自主寻径模型训练方法及装置_中国航空工业集团公司沈阳飞机设计研究所_202110904669.3 

申请/专利权人:中国航空工业集团公司沈阳飞机设计研究所

申请日:2021-08-07

公开(公告)日:2024-04-12

公开(公告)号:CN113705777B

主分类号:G06N3/0499

分类号:G06N3/0499;G06N20/00;G05D1/24

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2021.12.14#实质审查的生效;2021.11.26#公开

摘要:本申请公开一种无人机自主寻径模型训练方法及装置。所述无人机自主寻径模型训练方法包括:获取多个训练样本数据,每个训练样本数据包括当面状态信息、底层机动决策信息、下一时刻状态信息、综合激励信息以及云机动决策信息;获取无人机自主寻径模型;根据所述训练样本数据对所述无人机自主寻径模型进行训练。本申请的无人机自主寻径模型训练方法通过训练样本数据中的底层机动决策信息、综合激励信息以及云机动决策信息对无人机自主寻径模型进行训练,能够较好地解决激励信息稀疏场景下的路径规划任务,并且在训练过程中可以对仿真环境进行充分的探索,提高无人机任务规划中路径规划策略的鲁棒性。

主权项:1.一种无人机自主寻径模型训练方法,其特征在于,所述无人机自主寻径模型训练方法包括:获取多个训练样本数据,每个训练样本数据包括当面状态信息、底层机动决策信息、下一时刻状态信息、综合激励信息以及元机动决策信息;获取无人机自主寻径模型;根据所述训练样本数据对所述无人机自主寻径模型进行训练;其中,所述综合激励信息采用如下方法获取:获取外部激励信息;获取基于互信息理论计算的内部激励信息;将所述外部激励信息以及所述内部激励信息进行融合从而获取综合激励信息,采用如下公式:r=ro+αri;其中,所述内部激励信息采用如下公式获取:ri=Hz-Hz|s;其中,外部激励信息为ro、内部激励信息为ri、α是权重超参;r为综合激励信息,Hz为最大化元机动决策分布的散度、Hz|s为最小化条件熵,s为当面状态信息,z为元机动决策;其中,所述元机动决策信息采用如下方式获取:获取无人机综合状态信息;获取高层决策网络;将所述无人机综合状态信息输入至所述高层决策网络,从而获取元机动决策信息;所述底层机动决策信息采用如下方法获取:获取无人机自身状态信息以及所述元机动决策信息;获取底层决策网络;将所述无人机自身状态信息以及所述元机动决策信息输入至底层决策网络从而获取底层机动决策信息。

全文数据:

权利要求:

百度查询: 中国航空工业集团公司沈阳飞机设计研究所 一种无人机自主寻径模型训练方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。