【发明公布】基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统_扬州大学;沈阳飞机设计研究所扬州协同创新研究院有限公司_202311726576.1

申请/专利权人：扬州大学;沈阳飞机设计研究所扬州协同创新研究院有限公司

申请日：2023-12-15

公开（公告）日：2024-03-05

公开（公告）号：CN117647996A

主分类号：G05D1/46

分类号：G05D1/46;G05D1/495;G05D101/15;G05D109/20

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.03.22#实质审查的生效;2024.03.05#公开

摘要：本发明公开了一种基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统，方法包括：根据飞行器相关系数和飞行器运动参考轨迹，建立不确定性变后掠飞行器增量模型；通过确定性策略梯度算法，设计变后掠飞行器的动作空间和状态空间；基于参考轨迹，根据变后掠飞行器设计稀疏奖励函数和非稀疏奖励函数相结合得到复合奖励函数；将LSTM融入强化学习算法，建立IDDPG算法对变后掠飞行器轨迹进行跟踪控制。本发明基于参考轨迹，得到的增量模型和动作空间，可以减小动作的探索空间，从而加快收敛速度；加入LSTM的IDDPG算法相对于传统DDPG算法能够更快地收敛到一个更大的平均奖励，结果更加稳定，并且避免在变掠角飞行器的爬升阶段进行不必要的探索。

主权项：1.基于强化学习的变后掠飞行器轨迹跟踪控制方法，其特征在于，包括：根据飞行器的机翼掠角变化、气动力和力矩系数变化、附加惯性力和飞行器运动参考轨迹，建立不确定性变后掠飞行器增量模型；基于所述不确定性变后掠飞行器增量模型，通过确定性策略梯度算法，设计变后掠飞行器的动作空间和状态空间；基于所述参考轨迹，根据变后掠飞行器的飞行任务状态设计稀疏奖励函数，根据变后掠飞行器飞行过程的动作和状态设计非稀疏奖励函数，将所述稀疏奖励函数和非稀疏奖励函数相结合得到复合奖励函数；将长短周期记忆神经网络融入强化学习算法，建立IDDPG算法对变后掠飞行器轨迹进行跟踪控制。

全文数据：

权利要求：

百度查询：扬州大学;沈阳飞机设计研究所扬州协同创新研究院有限公司基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

下一篇：电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

相关技术

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

一种便携式放线架_高炜精密电子(东莞)有限公司_202322772571.4

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种人参肽粉研磨设备_上海中盈经济发展(集团)有限公司_202322368406.2

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

一种车载冰箱移动组件_一汽解放汽车有限公司_202322605238.4

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

一种危废行业可快速更换的水封出渣系统_渤瑞环保股份有限公司_202322016372.0

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

龙图腾网&IPTOP

【发明公布】基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统_扬州大学;沈阳飞机设计研究所扬州协同创新研究院有限公司_202311726576.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务