买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】面向多辐射源追踪的无人机群飞行轨迹优化方法_中国人民解放军陆军工程大学_202111676592.5 

申请/专利权人:中国人民解放军陆军工程大学

申请日:2021-12-31

公开(公告)日:2024-04-02

公开(公告)号:CN114337875B

主分类号:H04B17/318

分类号:H04B17/318;H04B17/391;G05D1/46;G06N3/092

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2022.04.29#实质审查的生效;2022.04.12#公开

摘要:一种面向多辐射源追踪的无人机群飞行轨迹优化方法,包括建立模块、估计模块、匹配模块、定位模块以及追踪模块。建立模块用于建立多约束条件下无人机群轨迹优化问题;估计模块采用深度神经网络得到接收信号强度和距离之间的映射关系;匹配模块采用交互式矩阵生成方法得到无人机与辐射源匹配方案;定位模块采用多球交会定位方法得到辐射源的参考位置;追踪模块采用深度强化学习方法设计无人机群的飞行轨迹优化算法。相对于传统方法,所提方法在平均追踪时间、任务完成率以及收敛速度等指标方面都具有明显的优势。

主权项:1.一种面向多辐射源追踪的无人机群飞行轨迹优化方法,其特征在于,包括如下步骤:步骤1:提出一个多约束条件下的无人机群飞行轨迹优化问题,构建多约束条件下的无人机群轨迹优化模型;包括:建立多架巡逻无人机协同对多个辐射源目标进行追踪,其中,辐射源的位置是未知且动态变化的;考虑无人机具有辐射源个体识别能力,用于识别辐射源的类别以及辐射源的发射功率;在此基础上,无人机之间通过交互进行任务分配,即一个无人机只选择一个的辐射源进行跟随;随后,无人机通过接收到的信号强度对辐射源进行搜索,当接收到的信号强度值达到设定的阈值时,即完成了追踪任务;具体内容包括:假设有K个辐射源,在t时刻,0≤t≤T,第k个辐射源的位置表示为假设有N个无人机,N≥K,第n个无人机的位置表示为在进行追踪任务之前,无人机按照预定的轨迹在空中进行巡查,第n个无人机的初始位置表示为采用时间离散法,将时间段T离散为M个等长的时隙δt,T=Mδt,时隙δt需要满足在一个时隙内无人机的位置近似看作不变;设置集合在第m个时隙,第k个辐射源的位置表示为无人机n的位置表示为对指定的区域进行搜索,即一个三维立方体空间RLU=[xL,xU]×[yL,yU]×[zL,zU],其中L和U分别表示三维空间的最低界限和最高界限;无人机的位置需要满足建立以下优化问题一: 式中,优化目标为所有无人机追踪时间最小化;优化变量一为无人机与辐射源的匹配系数an,k,即一个无人机只对一个辐射源进行追踪;优化变量二为无人机的飞行速度矢量包含飞行的方向和飞行的步长;约束条件C1给出了第n架无人机的飞行时间表达式,如果在第I时刻,无人机首次接收到的信号强度大于等于设定的阈值γ,则表示无人机任务完成,计时结束;如果在第I时刻,无人机首次接收到的信号强度小于设定的阈值γ,则继续追踪,直到首次接收到的信号强度大于或等于设定的阈值;约束条件C2表示匹配系数的取值范围为0或者1;约束条件C3表示一个无人机至多与一个辐射源进行匹配,即存在K个匹配对;约束条件C4表示无人机的飞行范围;约束条件C5表示无人机的能量有限,其中En,total表示第n架无人机飞行消耗的总能量,是一个与速度和步长成正相关的函数,Emax表示每架无人机携带的最大能耗;约束条件C6和C7表示无人机应该满足速度约束,其中Vmax为无人机的最大飞行速度;步骤2:采用深度神经网络来估计信道模型,得到接收信号强度和距离之间的映射关系;步骤3:采用交互式方法生成接收信号强度矩阵,计算出相应的距离矩阵并得到无人机与辐射源匹配方案;步骤4:采用多球交会定位方法,结合接收信号强度和距离之间的映射关系计算出辐射源的参考位置;步骤5:将原始优化问题转换为马尔科夫决策过程,并将辐射源的位置信息引入强化学习中,设计高效的无人机群飞行轨迹优化算法;包括如下步骤:5.1初始化最大回合数目Mepi,每回合最大步数Mstep,探索率ε0,衰减率α1,出界惩罚pout,位置重复惩罚pagain,任务完成门限容量为C的回放记忆序列D;5.2根据公式4,获取辐射源参考坐标,并计算无人机与参考坐标距离,对网络进行初始训练,更新网络参数θ-←θ以及ε←ε0;5.3重复步骤5.3到步骤5.6;a初始化一个容量为M1的滑动窗序列W,设置时间步数m←0;b重复步骤c到步骤k;c根据ε-greedy从动作空间中选择动作其中 类总和;d执行动作根据约束C6得到智能体的下一个状态sm+1,并计算出实时奖励Rm;e将sm,vm,Rm,sm+1保存在滑动窗序列W中;f如果m≥M1,计算M1步累计奖励并且将储存在回放记忆池D中;g从回放记忆池D中随机采样h令式中i在上关于网络参数θ执行梯度下降;j更新m←m+1,ε←εα1;k直到m=Mstep;5.4mepi←mepi+1;5.5每Nepi个回合之后更新一次目标网络的参数θ-←θ;5.6直到mepi=Mepi。

全文数据:

权利要求:

百度查询: 中国人民解放军陆军工程大学 面向多辐射源追踪的无人机群飞行轨迹优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。