买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统_扬州大学;沈阳飞机设计研究所扬州协同创新研究院有限公司_202311726576.1 

申请/专利权人:扬州大学;沈阳飞机设计研究所扬州协同创新研究院有限公司

申请日:2023-12-15

公开(公告)日:2024-03-05

公开(公告)号:CN117647996A

主分类号:G05D1/46

分类号:G05D1/46;G05D1/495;G05D101/15;G05D109/20

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.22#实质审查的生效;2024.03.05#公开

摘要:本发明公开了一种基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统,方法包括:根据飞行器相关系数和飞行器运动参考轨迹,建立不确定性变后掠飞行器增量模型;通过确定性策略梯度算法,设计变后掠飞行器的动作空间和状态空间;基于参考轨迹,根据变后掠飞行器设计稀疏奖励函数和非稀疏奖励函数相结合得到复合奖励函数;将LSTM融入强化学习算法,建立IDDPG算法对变后掠飞行器轨迹进行跟踪控制。本发明基于参考轨迹,得到的增量模型和动作空间,可以减小动作的探索空间,从而加快收敛速度;加入LSTM的IDDPG算法相对于传统DDPG算法能够更快地收敛到一个更大的平均奖励,结果更加稳定,并且避免在变掠角飞行器的爬升阶段进行不必要的探索。

主权项:1.基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,包括:根据飞行器的机翼掠角变化、气动力和力矩系数变化、附加惯性力和飞行器运动参考轨迹,建立不确定性变后掠飞行器增量模型;基于所述不确定性变后掠飞行器增量模型,通过确定性策略梯度算法,设计变后掠飞行器的动作空间和状态空间;基于所述参考轨迹,根据变后掠飞行器的飞行任务状态设计稀疏奖励函数,根据变后掠飞行器飞行过程的动作和状态设计非稀疏奖励函数,将所述稀疏奖励函数和非稀疏奖励函数相结合得到复合奖励函数;将长短周期记忆神经网络融入强化学习算法,建立IDDPG算法对变后掠飞行器轨迹进行跟踪控制。

全文数据:

权利要求:

百度查询: 扬州大学;沈阳飞机设计研究所扬州协同创新研究院有限公司 基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。