【发明授权】基于QMIX的分布式网内拥塞控制方法_北京邮电大学_202110370309.X

导航：龙图腾网> 最新专利技术> 基于QMIX的分布式网内拥塞控制方法_北京邮电大学_202110370309.X

申请/专利权人：北京邮电大学

申请日：2021-04-07

公开（公告）日：2024-01-05

公开（公告）号：CN113315715B

主分类号：H04L47/12

分类号：H04L47/12

优先权：

专利状态码：有效-授权

法律状态：2024.01.05#授权;2021.10.26#实质审查的生效;2021.08.27#公开

摘要：本发明涉及一种基于QMIX的分布式网内拥塞控制方法，本发明通过直接将相关方法部署在网内的三层交换机中，进行数据包的调度与拥塞控制来克服上述传统技术的缺点，同时进一步提升了拥塞控制效果。本发明受到近年来，多智能体系统控制领域中的分布式强化学习方法的启发，采用多智能体强化学习方法中的集中式训练，分布式执行的算法框架，将QMIX算法直接在交换机内部实现，在快速响应毫秒级流量波动的同时，又做到了各交换机之间的协调控制，从而达到稳定的全局最优系统状态，进行网络拥塞控制。利用日趋成熟的多智能体深度强化学习方法来解决传统网络拥塞问题。

主权项：1.基于QMIX的分布式网内拥塞控制方法，其特征在于，包括：一、系统模型的构建，采用三层交换机作为基本组件进行建模；每个交换机rt都有一组输入端口和一组输出端口因此每个输入端口和输出端口都唯一对应一个源-目的对路径i，规定每个交换机都有且只有两个输出端口；在此基础上，每个输入端口都对应着到达速率，记为每个输出端口都对应着服务速率，记为同时规定每个交换机都有一个“去尾”队列，其容量为认为所有交换机缓冲队列的最大容量均为设交换机缓存队列当前容量与最大容量的比值为二、优化目标的公式化表述，优化目标包括两方面：1减少所有交换机的全部输入端口的到达速率随时间变化而产生的均方差；2减小平均队列长度的均方差；三、多智能体深度强化学习算法的设计，采用QMIX算法进行网内拥塞控制；采用一个混合网络对单智能体局部值函数进行合并，使其整体的联合动作值函数与各个智能体的局部动作值函数单调性相同，因此对各个智能体局部值函数取最大，也能使联合动作值函数最大，主要体现在对联合动作值函数取argmax得到的联合动作，等价于对每个局部动作值函数取argmax得到的各智能体动作集合，其公式如下：其中，τall表示各智能体集合，aall表示各动作体集合；而每个智能体的分布式策略，就是基于贪心思想选取局部Q值最大对应的动作，QMIX算法将其转化为一种单调性约束，其公式表述如下：四、算法与系统模型的交互，所述系统模型对每个智能体的状态空间定义如下：对每个智能体的状态动作空间定义如下：对当前交换机rt而言，代表经过第一个输出端口向下游相邻交换机发送的数据包数量，而代表经过其第二个输出端口向下游相邻交换机发送的数据包数量；而分别代表其第一、二个输出端口的服务周期，即服务速率的倒数，此处采用服务周期；首先，环境根据当前系统状态St，为智能体提供联合状态智能体获取各自的状态基于各自的决策函数选择动作形成联合动作上述动作会影响环境，产生新的系统状态St+1以及新的联合观测状态同时还会在python端生成单步联合奖励值元组形成一条经验，存储在经验库中；最后，集中式的训练中心对离线经验库进行批量为b的随机采样，通过全局Q值，根据下列更新公式进行神经网络参数更新：QMIX算法的参数的更新公式如下：训练过程中b是离线经验库的批量采样大小，其具体误差函数为：

全文数据：

权利要求：

百度查询：北京邮电大学基于QMIX的分布式网内拥塞控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：为放大器操作进行的平台资源的选择_超威半导体公司_202280065509.7

下一篇：一种助力外骨骼辅助运动装置_中国人民解放军总医院第四医学中心_202311762144.6

相关技术

为放大器操作进行的平台资源的选择_超威半导体公司_202280065509.7

一种助力外骨骼辅助运动装置_中国人民解放军总医院第四医学中心_202311762144.6

一种非均匀大气波导修正折射率的测算方法及系统_南京信息工程大学_202410123152.4

一种快速安装的超声波水表及其安装方法_尚宏仪表科技(江苏)有限公司_202311847412.4

全氟异丁腈的合成方法_天津市长芦化工新材料有限公司_202410424719.1

热解油提质为BTEX的两级催化方法_沙特阿拉伯石油公司_202280065181.9

用于制造一次性杯状件的机器_MS2责任有限公司_202280065197.X

保护开关设备和方法_西门子股份公司_202280065501.0

一种新型射灯天线_摩比天线技术(深圳)有限公司_202410125372.0

一种矿井提升机防止跑车的控制方法与装置_洛阳九亿重工集团有限公司_202410421104.3

锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

一种数控机械加工用车削打磨装置_安庆师范大学_202311648983.5

网相关技术

导线封网防护装置_广西送变电建设有限责任公司_202321905522.7

纤维网的制造方法_凯米拉公司_202080083408.3

一种隔离网_苏州奥格瑞玛仓储设备有限公司_202322424963.1

一种用于网版钢网去除的激光处理装置_美尚精密制造(南通)有限公司_202410394096.8

呼叫方法、装置、第一核心网设备及第三核心网设备_维沃移动通信有限公司_202211394379.X

网带式干燥机快速更换网带装置_西华大学_202321910215.8

环连网离散元模拟方法_西南交通大学_202310449193.8

一种可调式防沙网_中铁西北科学研究院有限公司_202321553334.2

丝印网版的制版方法_大族激光科技产业集团股份有限公司_202010005803.1

电网环网图生成方法_南方电网数字电网科技(广东)有限公司_202111413966.4

控制相关技术

继电器控制方法及其控制结构_联创汽车电子有限公司_202011231842.X

显示系统、控制装置及控制方法_松下汽车电子系统株式会社_202080037307.2

控制装置、控制方法、存储介质_丰田自动车株式会社_202311323501.9

控制电路及控制方法_上海艾为电子技术股份有限公司_201811306909.4

设备控制方法及控制器_珠海格力电器股份有限公司_202311834540.5

控制方法以及控制系统_爱知制钢株式会社_202280064755.0

一种控制方法、控制装置、控制设备和增程器_东风汽车集团股份有限公司_202410318804.X

压裂作业的控制方法、控制设备和压裂作业控制系统_烟台杰瑞石油装备技术有限公司_202410340610.X

记录控制装置、记录控制方法和存储介质_JVC建伍株式会社_202080081420.0

环境控制系统以及环境控制方法_松下知识产权经营株式会社_202311464950.5

方法相关技术

制造方法_意法半导体(克洛尔2)公司_202311475458.8

训练数据生成方法、图像检测方法、图像分类方法及装置_第四范式(北京)技术有限公司_202211345497.1

编码方法、解码方法和处理比特流的方法_松下电器(美国)知识产权公司_202410304249.5

控制棒组件的安装方法、取出方法以及更换方法_中国原子能科学研究院_202111129136.9

增殖方法_花王株式会社_202080014224.1

排烟机拖车及其掉头方法、自行行走方法_苏州瑞奇安机电科技有限公司_202410210474.2

视频处理方法、影视视频处理方法及装置_阿里巴巴集团控股有限公司_202010147566.2

半导体结构及其制备方法、晶圆切割方法_北京弘图半导体有限公司_202410157714.7

喷墨记录方法及层合体的制造方法_富士胶片株式会社_202280064929.3

分类模型训练方法、分类方法、装置和设备_海通证券股份有限公司_202410186760.X

龙图腾网&IPTOP

【发明授权】基于QMIX的分布式网内拥塞控制方法_北京邮电大学_202110370309.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务