【发明授权】一种深度确定性策略梯度的下行NOMA功率分配方法_辽宁工程技术大学_202011344394.4

导航：龙图腾网> 最新专利技术> 一种深度确定性策略梯度的下行NOMA功率分配方法_辽宁工程技术大学_202011344394.4

申请/专利权人：辽宁工程技术大学

申请日：2020-11-26

公开（公告）日：2024-03-26

公开（公告）号：CN112492691B

主分类号：H04W72/044

分类号：H04W72/044;H04W72/50;G06N3/045;G06N3/092

优先权：

专利状态码：有效-授权

法律状态：2024.03.26#授权;2021.04.23#实质审查的生效;2021.03.12#公开

摘要：本发明公开了一种深度确定性策略梯度算法的下行NOMA系统中功率分配方法，方法采用双神经网络结构及经验池回放机制，可以有效处理涉及大规模状态‑动作空间的问题，且降低训练样本之间的相关性，同时，采取确定性策略来选择动作，可以在连续的动作空间中选择动作。算法使用状态信息作为神经网络的输入，并对状态空间、动作空间及奖赏函数根据仿真下行NOMA系统情境进行了相应的设计，其中将上一时刻的信干噪比信息及速率信息作为当前时刻状态信息的组成部分，可以使得智能体更加有效的学习并利用所学习到信息来改进行为策略，经过多次迭代后，得到最优的功率分配策略。该方法可以有效解决下行NOMA系统中多用户的功率分配问题，且在不同的用户数量及基站的发射功率级别下均具备良好的泛化性能，可以有效提升功率分配的合理性，同时运算耗时少，有效提高功率分配的效率。

主权项：1.一种深度确定性策略梯度的下行NOMA功率分配方法，其特征在于使用深度确定性策略梯度算法实现下行NOMA系统的功率分配，其包括如下：初始化NOMA系统网络环境设置；初始化经验池；初始化当前演员网络，初始化当前目标演员网络，初始化当前评论家网络，初始化当前目标评论家网络；初始化深度确定性策略梯度的下行NOMA功率分配方法训练相关参数；接收初始状态；智能体根据当前状态，通过当前演员神经网络选择动作，执行所选择的动作，改变子信道中的功率分配比例值，得到当前时隙的奖赏值，智能体到达下一个状态，存储经验到经验池，进行神经网络训练，将下一个状态作为当前的状态；初始化NOMA系统网络环境设置，设置小区中的用户数量，用户之间的最小距离，用户与基站的最小距离的参数，包含基站及多个终端用户，其中单个子信道上包含两个用户，初始化状态作为神经网络的输入；初始化经验池，使用双端队列，在经验池中存储的样本数量达到经验池容量后，自动删除队列前端的元素，新生成的经验样本添加到队列的后端；初始化当前演员网络权重θu，当前演员网络使用us,a|θu表示；目标演员网络权重目标演员网络使用表示；初始化当前评论家网络权重θQ，当前评论家网络使用Qs,a|θQ表示；目标评论家网络权重目标评论家网络使用表示；其中s表示状态，a表示所选择的动作，四个神经网络均使用全连接神经网络构建；初始化深度确定性策略梯度的下行NOMA功率分配方法的训练相关参数，包括设置初始学习率、总的迭代次数、折扣因子；接收初始状态；对状态空间进行设计，其状态信息包含四个部分，第一个部分是上一时隙智能体所达到的和速率，第二部分是上一时隙智能体对应两个用户各自的SINR信息，第三部分是上一时隙智能体对应两个用户各自所达到的传输速率，第四部分是当前时隙智能体所采取的功率分配比例因子，状态空间信息表示为：其中，表示上一时隙智能体所达到的和速率，表示上一时隙智能体上两个用户各自的SINR信息，表示上一时隙智能体上两个用户各自所达到的传输速率，表示当前时隙智能体所采取的功率分配比例因子；的计算公式为，设定用户1的信道条件好于用户2： SINR1,n和SINR2,n分别表示用户1与用户2的SINR；用户i的SINR的计算公式为：其中，pi,n表示用户i所分配到的功率，hi,n表示用户i的信道增益，表示信道的噪声；hi,n的计算公式为：hi,n＝gi,n·PL-1d其中，gi,n为小尺度衰落，PL-1d表示基站与用户i之间的路径损耗函数；智能体根据当前状态，通过当前演员神经网络选择动作，动作为子信道上两个用户之间的功率分配比例因子，表示为一个连续值集合，取值范围从0到1，但不包含0和1，其集合表示为：A＝0,...,βn,...,1其中，βn表示子信道上两个用户之间的功率分配比例因子，系统中总的功率均分给每个子信道，通过功率分配因子，将子信道的功率分配给两个用户；当前评论家网络的损失函数为：其中表示当前评论家网络的目标Q值，Qst,at|θQ表示当前评论家网络的输出值，θQ表示其参数，N表示一次训练的批次样本数据大小，通过最小化损失函数来更新参数；当前演员网络的损失函数为：其中Qst,at|θQ表示当前评论家神经网络的输出值，θQ表示其参数，通过最小化损失函数来更新参数；对奖赏函数进行设计，使用总和传输速是对智能体所采取的动作进行反馈，将当前时隙的总和传输速率作为奖赏函数，并为所有的智能体所共享，计算公式为：

全文数据：

权利要求：

百度查询：辽宁工程技术大学一种深度确定性策略梯度的下行NOMA功率分配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：低轨移动堆栈星座卫星解锁分配器_北京中科宇航技术有限公司_202211457744.7

下一篇：一种铸造铝合金中第二相空间分布均匀性的表征方法_华南理工大学_202210274792.6

相关技术

低轨移动堆栈星座卫星解锁分配器_北京中科宇航技术有限公司_202211457744.7

一种铸造铝合金中第二相空间分布均匀性的表征方法_华南理工大学_202210274792.6

估计浓度的装置和方法以及生成浓度估计模型的装置_三星电子株式会社_201910738775.1

一种核素治疗后使用的自动水化治疗系统_中国人民解放军空军军医大学_202111466443.6

一种滚筒式壁纸自动切割的设备_金华市海洋包装有限公司_202111415330.3

一种适应智能化测斜的测斜管装置及其施工方法_中国建筑第二工程局有限公司_202211243629.X

一种双级节能水冷式平衡系统_麦克斯流体科技(江苏)有限公司_202210852648.6

一种多功能土壤用缓释剂及其制备方法_海南大学_202211273266.4

一种液压冲击装置及其控制系统_广东三水合肥工业大学研究院_202110623149.5

一种具有孤立脱氢和氧化双活性位点的催化剂及其制备和应用_中国科学院大连化学物理研究所_202110110249.8

一种智能动态数据库管理系统_上海齐屹信息科技有限公司_202111612314.3

一种立式镗铣床加工用除杂装置_蚌埠市富瑞达机床机械制造有限公司_202011602435.5

下行相关技术

下行信号处理方法、装置及基站_中兴通讯股份有限公司_201911377265.2

下行传输的方法、终端及网络侧设备_维沃移动通信有限公司_202211261770.2

上下行失步检测电路和通信设备_京信网络系统股份有限公司_201910703655.8

下行链路相位跟踪参考信号资源映射_苹果公司_201980068738.2

利用下行链路半持久调度的针对多个物理下行链路共享信道的混合自动重传请求反馈_瑞典爱立信有限公司_202080031749.6

一种水下行走的机器人底座_上海宇鹤自动化科技有限公司_201911425229.9

新无线电未许可频带中的下行链路控制信道监测_欧芬诺有限责任公司_202080083742.9

一种临近空间平台到无人机下行多径信道估计方法_北京航空航天大学_202410338643.0

基于规避角的低轨星载动中通抗下行干扰方法_中国人民解放军31007部队_202311257820.4

交换准同位信息和确认下行链路控制信息_高通股份有限公司_201980066238.5

NOMA相关技术

一种基于RIS的非线性携能NOMA网络协作传输方法_西安科技大学_202410046423.0

一种基于IRS和NOMA的双向通信方法_安徽师范大学_202210536067.1

上行NOMA系统的自适应频谱感知方法、系统、存储介质及用户端_中国科学院上海高等研究院_202211228402.8

一种信息时效性保障的NOMA网络任务处理方法及系统_鹏城实验室_202210826644.0

一种MIMO-NOMA系统在近场场景下的物理层安全优化方法及系统_湖北理工学院_202410032324.7

一种基于麻雀搜索算法的NOMA-VLC功率分配方法_中煤能源研究院有限责任公司_202410022639.3

一种基于强化学习的NOMA多波束卫星通信系统多维资源分配方法_南京控维通信科技有限公司_202410233541.2

NOMA中的频率跳变_华为技术有限公司_202180101094.X

一种RIS辅助NOMA系统中多变量联合优化方法_电子科技大学_202410200431.6

基于NOMA-MEC强化学习资源分配与任务卸载方法_南京信息工程大学滨江学院_202110756466.4

梯度相关技术

一种湿度梯度控制电路、湿度梯度控制装置及电子设备_深圳汉威物联有限公司_202322836534.5

一种梯度滤波器_西门子(深圳)磁共振有限公司_202322338556.9

多层梯度结构涂层及其制备方法_烟台大学_202210530248.3

用于产生双梯度CdSeTe薄膜结构的方法_中国建材国际工程集团有限公司_201980098784.7

一种单精子冷冻梯度降温简易装置_浙江大学_202322782485.1

基于扩散模型的梯度反演攻击方法_云南大学_202311657759.2

梯度组织Ti-Nb合金薄膜及其制备方法_西安理工大学_202210043689.0

一种用于梯度组合墙体的膨胀混凝土及其制备方法_中交四航工程研究院有限公司_202410020070.7

一种梯度Si_p/Al复合材料轧制成型方法_中科复材(滨州)新材料有限公司_202410146108.5

梯度正极材料及其制备方法和锂离子电池_陕西红马科技有限公司_202311822564.9

龙图腾网&IPTOP

【发明授权】一种深度确定性策略梯度的下行NOMA功率分配方法_辽宁工程技术大学_202011344394.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务