买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于LQR近视距的无人机空战攻击方法_南通大学_202310951344.X 

申请/专利权人:南通大学

申请日:2023-07-31

公开(公告)日:2024-04-16

公开(公告)号:CN117130379B

主分类号:G05D1/495

分类号:G05D1/495;G05D1/46;G05D101/15;G05D109/20

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2023.12.15#实质审查的生效;2023.11.28#公开

摘要:本发明提供了一种基于LQR近视距的无人机空战攻击方法,属于无人机技术领域;解决了无人机在复杂动态环境下易丧失稳定性的技术问题。其技术方案为:包括以下步骤:S1、使用深度强化学习算法在离线环境中对无人机进行训练;S2、基于系统模型和目标跟踪信息,计算出最优的控制输入,根据近视距内的目标信息,选择合适的攻击策略。本发明的有益效果为:本发明能够令无人机更好地应对空战中的高机动性和快速变化的场景,使无人机能够在实时空战中寻找最优或接近最优的战术和决策,有利于提升无人机作战能力。

主权项:1.一种基于LQR近视距的无人机空战攻击方法,其特征在于,包括以下步骤:S1、使用深度强化学习算法在离线环境中对无人机进行训练;S2、基于系统模型和目标跟踪信息,计算出最优的控制输入,根据近视距内的目标信息,选择合适的攻击策略;所述步骤S1包括如下步骤:S11:使用深度强化学习算法在离线环境中对无人机进行训练,使用Q-learning算法学习无人机在不同状态下采取的最佳动作;S12:使用函数逼近方法拟合Q值函数,定义动作向量sb,其中sb=[throttle,pitch,roll],throttle表示油门控制,pitch表示俯仰角控制,roll表示横滚角控制,定义Q值函数为Qsa,sb,它估计在状态sa下,采取动作sb的长期累积奖励;S13:通过自身传感器系统周期性感知我方无人机的态势信息sa,敌方态势信息sc,其中,sc为我方无人机通过摄像头传感器获得的基于视频图像的敌方态势信息,根据Minimumjerk算法进行轨迹跟踪,生成追击路径;所述步骤S2包括如下步骤:S21:将无人机的水平位置和速度设为状态量:X=[pv]T,将加速度设为输入量:u=a,则得到离散时间系统方程:Xdk+1=AXdk+Badk,其中,A为4*4离散时间状态转移矩阵,B为2*4离散时间输入矩阵,S22:将步骤S1所得到的Q值函数作为LQR控制器的成本函数,Q值函数在强化学习中表示了在状态sa采取动作sb时的长期累积奖励,视为状态的权重sa,将Qsa,sb作为Q矩阵;S23:设定权重矩阵R,R为2*2矩阵,用于表示控制输入的权重,R矩阵用于平衡状态误差和控制输入的代价,控制输入的权重根据实际控制需求进行调整;S24:LQR的优化目标为: 用线性规划方法求解最小代价函数:P=Q+ATPA-ATPBR+BTPB-1BTPA得到最优的控制增益矩阵K:K=R-1*BT*P;S25:在实时控制过程中,持续观测无人机的当前状态sa,计算状态误差e=satarget-sa,其中satarget是期望的目标状态,根据控制增益矩阵K和状态误差e计算最优的控制输入u:u=-K*eS26:将计算得到的最优控制输入u施加到无人机系统中,以实现控制目标,无人机将根据LQR控制输入调整其动作和状态,持续观测状态并进行控制;S27:无人机持续调整动作和状态,当实时位置满足近视距,敌方无人机在我方无人机的规划路径上时,采取碰撞形式击落敌方无人机。

全文数据:

权利要求:

百度查询: 南通大学 一种基于LQR近视距的无人机空战攻击方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。