【发明授权】一种基于强化学习的空地网络协同覆盖方法_香港中文大学(深圳);中国移动通信集团广东有限公司_202311292173.0

申请/专利权人：香港中文大学(深圳);中国移动通信集团广东有限公司

申请日：2023-10-08

公开（公告）日：2024-04-12

公开（公告）号：CN117082536B

主分类号：H04L41/16

分类号：H04L41/16;H04W16/18;H04W16/22

优先权：

专利状态码：有效-授权

法律状态：2024.04.12#授权;2023.12.05#实质审查的生效;2023.11.17#公开

摘要：本发明公开了一种基于强化学习的空地网络协同覆盖方法，包括以下步骤：S1.获取基站的地理位置和基站参数域;所述地理位置即基站的经纬度信息；所述基站参数域包括基站参数种类和每一种基站参数的范围；S2.基于无人机实测数据，获得基站在不同基站参数下的低空和地面的覆盖情况，并形成三维天线方向图；S3.将空地网络协同问题建模成强化学习任务,并基于强化学习得到寻找基站参数配置最佳状态，从而实现空地网络协同覆盖。本发明通过通过获取基站配置参数与基站覆盖的关系，继而构建强化学习任务在基站参数域中寻找最佳的基站配置，实现低空与地面的协同覆盖。

主权项：1.一种基于强化学习的空地网络协同覆盖方法，其特征在于：包括以下步骤：S1.获取基站的地理位置和基站参数域；所述地理位置即基站的经纬度信息；所述基站参数域包括基站参数种类和每一种基站参数的范围；S2基于无人机实测数据，获得基站在不同基站参数下的低空和地面的覆盖情况，并形成三维天线方向图；S3.将空地网络协同问题建模成强化学习任务,并基于强化学习得到寻找基站参数配置最佳状态，从而实现空地网络协同覆盖；所述步骤S3包括：S301.建立强化学习任务，任务包含以下场景环境信息：基站周边地图M；多基站坐标PBS＝{P1...Pn}；各基站天线配置SBS＝{S1...Sn},Si＝{zSSBi,hi,bi,ai,vi}，bi为波束具体配置，包括3dB波束宽度，ai为天线水平方向角；vi为天线下倾角；同时，在无人机实测信号质量时采集的基站周边三维地理信息，通过三维点云重建各基站周边三维场景G＝{x1,y1,z1,n1,...,xi,yi,zi,ni}，xi,yi,zi,ni为场景中各点坐标以及该坐标点的底噪；环境信息建立完成后，在强化学习任务中建立一个与环境相互作用的智能体，基于上述建立的强化学习任务，该智能体为目标航线段内的所有服务基站，智能体的行动空间A为目标航线段内所有基站的可调参数空间的组合；at∈A为智能体当前时刻t基于下一状态的预期函数所采取的行动，即基站参数调整策略；状态空间S为基于天线配置的基站覆盖分布，st∈S为当前智能体状态，即基站参数配置，空间大小为8*N*K*J，st+1为采取at后的智能体状态，即调整后的基站参数配置；强化学习智能体建立后，需要进行奖惩函数的设置，强化学习任务最终目标为最大化累积折扣奖励为：折扣因子γ∈[0,1]在此强化学习任务策略中，任务目标为对目标航线段上所有位置x的最大化平均覆盖质量，Kavg为在目标航线段上的N个采样点的低空与地面网络覆盖质量和的平均值，同时也为此强化学习任务的即时奖励r’：其中KGx，KAx分别表示地面与低空网络在x位置的覆盖质量，由当前智能体当前时刻t的状态st所对应的所有基站小区的参数配置所生成的天线方向图仿真得到，RSRP为x位置的信号强度，s为x位置的主服务基站小区，N0x为x位置环境噪声，为其他基站小区对当前位置信号的干扰；为低空采样点由于地面用户上行信号而产生的信号干扰；Ps，Pb与Pu分别为服务小区发射功率，邻区发射功率以及地面干扰终端发射功率；采样点x的信号衰减由以下公式生成，其中gix为天线i在位置x的信号强度，由所述天线方向图仿真方法生成，Lfc,d为载波频率fc，传播距离d后的传播衰减： S302.基于步骤S301中的强化学习任务，建立DQN网络，以计算拟合智能体在一种状态s下可采取的各种行动a对应的折扣奖励rs,a，折扣奖励r通过目标航线段上的N个采样点的低空与地面网络覆盖质量和的平均值乘Kavg折扣因子γ得到，DQN网络建立与训练方法具体如下：建立结构相同的DQN主网络与DQN目标网络，使用全连接层作为网络的隐藏层，对网络权值进行初始化，同时初始状态采用均匀随机行动，并以概率参数ε的贪婪算法进行策略选择；对网络权值进行初始化，同时初始状态采用均匀随机行动，并以概率参数ε的贪婪算法进行策略选择；初始化回放缓存区，放入已知的转移参数样本st,at,rt,st+1并保存，由当前系统状态，当前状态采取的行动，当前状态的即时回报，系统下一个状态四个参数组成，当作DQN网络的已知经验；S303.训练DQN网络，从回放缓存区中以均匀分布随机抽取转移参数样本计算两种Q值：直接计算目标Q值Qtarget＝r+γ·maxQst+1,at+1；w，其中r为状态st采取at的回报，at+1为状态st+1时能获得最大Q值的行动；训练拟合预测Q值，计算过程为：Qpredict＝Qst,at；w，Qmain为在st状态下采取at行动，DQN网络在w权值下的通过神经网络拟合的Q值；采用Qtarget和Qpredict均方差损失函数计算，利用反向传播算法训练DQN主网络，把每次训练得到的新转移参数样本st,at,rt,st+1存入回放缓存区，并随机清理回放缓存区；每经过一定数量的迭代训练之后将DQN主网络权重w赋给DQN目标网络，然后继续从回放缓存区中以均匀分布随机抽取转移参数样本用于DQN主网络训练，直到DQN目标网络收敛，停止更新，输出DQN目标网络，得到近似每一状态的最佳行动值，继而采取最优贪婪策略寻找基站参数配置最佳状态，因为已经训练得到了每一状态的最佳行动值，所以采用最优贪婪策略，只考虑当前状态s下的能得到最大Q值的最佳行动a。

全文数据：

权利要求：

百度查询：香港中文大学(深圳);中国移动通信集团广东有限公司一种基于强化学习的空地网络协同覆盖方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：数据传输方法、装置以及系统_华为技术有限公司_202180102041.X

下一篇：用于齿部加工的设备、刀具头和齿部加工机器_雷肖尔股份公司_202280062247.9

相关技术

数据传输方法、装置以及系统_华为技术有限公司_202180102041.X

用于齿部加工的设备、刀具头和齿部加工机器_雷肖尔股份公司_202280062247.9

一种卫星高频次海面风估测方法_国家卫星气象中心(国家空间天气监测预警中心)_202410120101.6

燃料电池的增压系统_IHI供应系统国际有限责任公司_202280062700.6

一种从沉积型黏土锂矿中综合回收锂、硅、铝的方法_中南大学_202410120181.5

一种齿轮啮合润滑装置_北京理工大学_202410123562.9

用于UV上光机网纹辊的均料装置_本溪九星印刷包装有限公司_202410212043.X

一种数据传输系统及方法、电子设备和存储介质_摩尔线程智能科技(北京)有限责任公司_202410338917.6

一种LED电源的电流自适应调节电路及调节方法_珠海市圣昌电子有限公司_202410339666.3

车辆管理系统_日立建机株式会社_202280061821.9

一种超低摩擦选择性氢化的织构化超薄非晶碳薄膜及制备方法_中国矿业大学_202410035030.X

一种高效吸附氟离子的羟基磷灰石及其制备方法_江苏省海洋资源开发研究院(连云港)_202410126507.5

网络相关技术

一种网络云Overlay网络与Underlay网络叠加的方法及装置_中盈优创资讯科技有限公司_202311788114.2

适配总线型网络和交换型网络的系统_中国航空研究院_202011490399.8

网络切片管理方法、系统及通信网络_广州爱浦路网络技术有限公司_202410069924.0

用于监测基于链的网络的通信网络_泰科电子英国有限公司_201980066396.0

网络的选择方法、选择装置和网络选择系统_南方电网科学研究院有限责任公司_202410099224.6

网络功能的控制_诺基亚通信公司_201980100557.3

网络失步重连方法及网络失步重连系统_芯翼信息科技(南京)有限公司_202110129983.9

一种基于网络补丁的神经网络遗忘学习方法及装置_浙江大学杭州国际科创中心_202311835375.5

基于蜂窝网络的网络选择方法、设备以及存储介质_浙江大华技术股份有限公司_202311788208.X

用于5G网络的跨区域网络切片对等_华为技术有限公司_201880099840.4

空地相关技术

一种面向车联网的空地协同移动边缘计算方法及系统_广东工业大学_202410139914.X

基于无人机位置优化的空地协同增量联邦学习方法_南京航空航天大学_202410098883.8

一种基于机器学习的空地无人系统作战效能评估方法_中国人民解放军陆军装甲兵学院_202211446133.2

一种装配式架空地面结构及其施工方法_山东省建筑设计研究院有限公司_202410020085.3

空地一体的高压燃气管线巡检系统及巡检方法_南京港华燃气有限公司_202311768794.1

一种空地协同下的全局环境地图构建及定位方法_电子科技大学_202410027957.9

面向脑控空地协同无人系统的脑机接口和脑机控制方法_北京理工大学_202410041474.4

星空地一体化承灾体风险预测系统及方法_伟志股份公司_202410039955.1

一种高速公路空地检测协同布设方法、设备及介质_山东高速股份有限公司_202410308854.X

基于神经网络的公路沿线灾害天空地一体化监测系统_中国公路工程咨询集团有限公司_202311271446.3

协同相关技术

基于云链协同的数据共享系统_奇点数联(北京)科技有限公司_202410120144.4

多组智能灯镜协同照明控制方法和系统_东莞莱姆森科技建材有限公司_202410148565.8

人机协同上下料系统及其上料装置_浙江德源智能科技股份有限公司_202322790408.0

利用微藻协同处理烟气和废水的方法_国家能源集团新能源技术研究院有限公司_202311673690.2

空中基站部署方法、协同系统及相关设备_北京中电飞华通信有限公司_202410179685.4

一种烟草打塘协同施肥装置_云南省烟草公司丽江市公司_202322732504.X

基于动作分解的多轴协同控制方法及系统_深圳市太控科技有限公司_202410057248.5

一种双机器人协同定位精度的标定方法_南京航空航天大学_202410334586.9

基于云边协同的边缘服务网关系统及方法_绿城科技产业服务集团有限公司_202410179058.0

一种矩形板材组批排样高效协同方法_中南大学_202211443774.2

龙图腾网&IPTOP

【发明授权】一种基于强化学习的空地网络协同覆盖方法_香港中文大学(深圳);中国移动通信集团广东有限公司_202311292173.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务