【发明授权】基于深度强化学习优化Volterra均衡器结构的方法和系统_上海交通大学_202111572693.8

导航：龙图腾网> 最新专利技术> 基于深度强化学习优化Volterra均衡器结构的方法和系统_上海交通大学_202111572693.8

申请/专利权人：上海交通大学

申请日：2021-12-21

公开（公告）日：2023-07-25

公开（公告）号：CN114338309B

主分类号：H04L25/03

分类号：H04L25/03;G06N3/0442;G06N3/092

优先权：

专利状态码：有效-授权

法律状态：2023.07.25#授权;2022.04.29#实质审查的生效;2022.04.12#公开

摘要：本发明提供了一种基于深度强化学习优化Volterra均衡器结构的方法和系统，包括：初始化智能体Agent、经验回放池、Volterra均衡器的记忆长度状态；对Agent随机产生动作，Volterra均衡器更新其记忆长度状态直至结束状态，根据Volterra均衡器的复杂度和对信号均衡后的误码率计算奖励值，并将转移过程作为经验，存入经验回放池；从经验回放池中采样经验，对Agent进行训练和软更新；根据收敛值确定Volterra均衡器的各阶记忆长度。本发明实现了在给定计算资源的情况下，不同类型Volterra均衡器最优结构的自动搜索方法，相比传统贪心搜索，不仅可以进一步提升均衡效果，而且大幅降低了均衡器的复杂度。

主权项：1.一种基于深度强化学习优化Volterra均衡器结构的方法，其特征在于，包括：步骤S1：初始化智能体Agent，初始化经验回放池，初始化Volterra均衡器的记忆长度状态并定义状态转移过程；步骤S2：从Volterra均衡器的初始记忆长度状态开始，对Agent随机产生动作，Volterra均衡器更新其记忆长度状态直至结束状态，根据Volterra均衡器的复杂度和对信号均衡后的误码率计算奖励值，并将转移过程作为经验，存入经验回放池中，再次从初始状态循环，直至产生指定数量的经验；步骤S3：从经验回放池中采样经验，对Agent进行训练，然后每隔预设步数，对Agent进行软更新；步骤S4：对更新后的Agent从Volterra均衡器的初始记忆长度状态开始产生确定性动作，直至状态转移过程结束，计算奖励值并将转移过程存入经验回放池，然后重复步骤S3和步骤S4，直至奖励值和Agent输出的动作收敛，最后根据收敛值确定Volterra均衡器的各阶记忆长度；所述步骤S1包括：步骤S11：定义Agent中的四个神经网络：Actor网络μθ，Critic网络Qw，TargetActor网络和TargetCritic网络使用随机参数θ,w初始化Actor网络μθ和Critic网络Qw，使用随机参数初始化TargetActor网络和TargetCritic网络Qw，其中，设置的初始值等于θ，设置的初始值等于w；步骤S12：初始化经验回放池，其存储经验的格式为si,ai,ri,si+1,done，其中，si表示当前Volterra均衡器的记忆长度状态；ai表示Agent根据当前状态si产生的动作，为每一阶记忆长度占最大记忆长度限制的比例；ri表示Agent面对状态si时采取动作ai获得的奖励；si+1表示Agent采取动作ai后，Volterra均衡器更新后的记忆长度状态；done是整个状态转移过程是否结束的标志；步骤S13：根据Volterra均衡器的类型来初始化Volterra均衡器的记忆长度状态并定义状态转移过程；所述步骤S2包括：步骤S21：根据Volterra均衡器类型选定状态转移过程，Agent从初始状态开始，产生服从[0，1]上均匀分布的随机动作，更新Volterra均衡器的记忆长度状态，Agent继续根据当前状态产生随机动作，直到Volterra均衡器的记忆长度状态更新至结束状态；步骤S22：计算奖励值，根据Volterra均衡器各阶最大记忆长度限制和Agent的动作确定各阶记忆长度，对信号数据做2折交叉验证，用当前均衡器的复杂度和均衡后的平均误码率计算奖励值；步骤S23：将状态转移过程si,ai,ri,si+1,done作为经验，存入经验回放池中；步骤S24：重复步骤S21至步骤S23，直至产生预设数量的经验；所述步骤S4包括：更新后的Agent从Volterra均衡器的初始状态开始产生动作，更新Volterra均衡器的记忆长度状态，Agent继续根据当前状态产生动作，直到Volterra均衡器的记忆长度状态更新至结束状态，Agent每次产生的动作都要添加服从均值为0，方差为σ2的高斯分布的探索噪声e；根据Volterra均衡器各阶最大记忆长度限制和Agent的动作确定各阶记忆长度，对信号数据做2折交叉验证，用当前均衡器的复杂度和均衡后的平均误码率计算奖励值；将状态转移过程si,ai,ri,si+1,done作为经验存入经验回放池中；然后执行步骤S3；每次更新结束后，对探索噪声e的方差进行衰减：σ2←σ2ξn，式中ξ为衰减率，n为更新次数；重复上述操作，直至当前奖励值与上一次奖励值之差的绝对值小于χ1，当前Agent输出动作与上一次Agent输出动作之差的绝对值小于χ2，则判断训练结果已经收敛，其中，χ1≥0，χ2≥0为设定的判决阈值，最后根据Agent输出动作的收敛值和各位置的最大记忆长度限制来确定Volterra均衡器各位置的记忆长度，完成对Volterra均衡器最优结构的确定。

全文数据：

权利要求：

百度查询：上海交通大学基于深度强化学习优化Volterra均衡器结构的方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种富氦气藏区带的评价方法、装置、设备及介质_中国石油天然气股份有限公司_202311208279.8

下一篇：高速公路隧道边墙二次衬砌模板支座、结构及使用方法_中铁十四局集团建筑工程有限公司_202111210321.0

相关技术

一种富氦气藏区带的评价方法、装置、设备及介质_中国石油天然气股份有限公司_202311208279.8

高速公路隧道边墙二次衬砌模板支座、结构及使用方法_中铁十四局集团建筑工程有限公司_202111210321.0

一种基于动网格模拟隧道列车运动的结构网格划分方法_天津大学_202111426137.X

具有高吞吐量的多反射质谱仪_莱克公司_202011284023.1

光催化装置嵌入沉砂池协同降解辣椒素污水与除砂_山东建筑大学_202111505610.3

双电源双炉体切换开关的自动化控制系统_苏州振湖电炉有限公司_202111432710.8

一种直径与中继协作的信号空间分集传输方法_山东交通学院_202110011021.3

一种沉香GC-MS指纹图谱的构建方法_莆田海关综合技术服务中心_202111293274.0

一种外导体压接装置_江苏博之旺自动化设备有限公司_202111235070.1

一种处理DMS红外光反射导致亮斑的系统_钧捷智能(深圳)有限公司_202310101483.3

车载电动轮椅装载装置_洛阳和合电子科技有限公司_202111539605.4

面向建筑工地具体作业场景的施工适宜度气象预报方法_广东省气象服务中心(广东气象影视宣传中心)_202311186968.3

均相关技术

一种均温板_深圳市英维克科技股份有限公司_202322761181.7

峰均功率比整形技术_高通股份有限公司_202180019345.X

一种气体均布装置_青岛海纳化工环保设备有限公司_202322774659.X

电子产品散热用均温板_深圳莹帆科技有限责任公司_202322395245.6

一种化妆品均质进料装置_湖州恩纳化妆品有限公司_202322615014.1

一种稀介混合稀释均料器_河南永锦能源有限公司_202322499769.X

一种均方根图信息滤波方法_哈尔滨工程大学_202311838236.8

充电桩充电模块均流方法以及充电桩_深圳市丁旺科技有限公司_202410181642.X

一种钢化玻璃均质实验炉_重庆肯莱特机械设备有限公司_202322699118.5

一种单向循环的均温板_惠州市龙成五金电子有限公司_202410074878.3

Volterra相关技术

一种Volterra双参协同智能优化混沌控制方法_上海应用技术大学_202311545317.9

一种基于Volterra级数滤波器的洪水预报误差校正方法_浙江水利水电学院_202310387278.8

类Volterra的神经网络均衡器构建方法及系统_上海交通大学_202210719826.8

一种应用于DML/DD系统的Volterra滤波器建立方法、装置及系统_华中科技大学_202211688527.9

基于深度强化学习优化Volterra均衡器结构的方法和系统_上海交通大学_202111572693.8

一种应用于DML/DD系统的Volterra滤波器建立方法、装置及系统_华中科技大学_202211688527.9

一种简化的二阶Volterra非线性均衡算法与器件_复旦大学_202211441206.9

一种Volterra非线性均衡方法及系统_复旦大学_202211535437.6

一种基于MIMO-Volterra非线性均衡器的QAM调制格式均衡方法_复旦大学_202211365227.7

基于Volterra级数的行为模型建模及实现方法_中国工程物理研究院电子工程研究所_201910410450.0

衡器相关技术

一种基于HTCC技术的新型增益均衡器_电子科技大学_202410253591.7

双极性直流微电网电压平衡器的控制器设计方法_陕西理工大学_202311415692.1

一种基于人工神经网络的并行化均衡器及其应用方法_湖南大学_202410120960.5

模拟辅助前馈均衡器_联发科技股份有限公司_202311411492.9

具有动态范围控制的自适应均衡方法、均衡器和系统_苏州至盛半导体科技有限公司_202410405087.4

一种衡器检测装置_北京优量云产业计量技术创新研究院有限公司_202410137708.5

一种衡器自动检测设备_常州市富月砝码有限公司_202410084584.9

一种内耳平衡器演示教具_江苏省人民医院(南京医科大学第一附属医院)_201910352791.7

一种衡器检定吊装机构_遂平县产品质量检验检测中心_202322557379.3

一种车载音响的自适应均衡器补偿方法及系统_浙江越扬电子有限公司_202211189206.4

龙图腾网&IPTOP

【发明授权】基于深度强化学习优化Volterra均衡器结构的方法和系统_上海交通大学_202111572693.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务