【发明公布】基于深度强化学习的云集群资源调度方法_陕西师范大学_202311544111.4

导航：龙图腾网> 最新专利技术> 基于深度强化学习的云集群资源调度方法_陕西师范大学_202311544111.4

申请/专利权人：陕西师范大学

申请日：2023-11-20

公开（公告）日：2024-02-13

公开（公告）号：CN117555683A

主分类号：G06F9/50

分类号：G06F9/50;G06N3/092

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.03.01#实质审查的生效;2024.02.13#公开

摘要：一种基于深度强化学习的云集群资源调度方法，由构建作业资源需求向量、构建奖励函数、构建资源调度智能体网络、训练资源调度智能体网络步骤组成。本发明针对云计算集群的现有的资源调度方法法存在的实时性差、适应度低、调度性能低等问题，提出了以最小化作业平均带权周转时间为目标，通过将集群的系统状态s表示为图像并输入到资源调度智能体网络产生调度决策，将云集群的资源调度问题建模为深度强化学习问题，通过使用同步演员‑评论家深度强化学习方法，使智能体的训练过程更稳定，训练后的智能体具有实时性强、适应度高等优点，可用于云集群资源调度。

主权项：1.一种基于深度强化学习的云集群资源调度方法，其特征在于，由以下步骤组成：1构建作业资源需求向量按下式确定作业资源需求向量rj：rj＝rj,1,rj,2,…,rj,d其中，rj,d表示作业j对第d种资源的需求量，j和d的取值为有限的正整数；2构建奖励函数按式1确定带权周转时间W：W＝CT1其中，C是作业的周转时间，T表示作业的持续时间；按式2确定平均带权周转时间其中，Wi表示作业i的带权周转时间，N为作业个数，N取值为有限的正整数；按式3确定每段时间步t的奖励函数rt：其中，Tj表示作业j的要求服务时间；3构建资源调度智能体网络用同步演员-评论家深度强化学习方法构建资源调度智能体网络，该网络包含用于执行调度动作的演员网络和用于估计状态价值的评论家网络；所述的演员网络由输入层1与隐藏层1、输出层1依次串联构成；所述的评论家网络由输入层2与隐藏层2、输出层2依次串联构成；4训练资源调度智能体网络1构建目标函数的梯度按式5构建目标函数的梯度其中，πθat|st表示资源调度智能体神经网络πθ在t时刻系统状态st的输入下输出动作at的概率，γk表示折扣因子，rst+k,at+k表示在t+k时刻系统状态st+k下执行动作at+k获得的奖励，Vst表示评论家网络对t时刻的系统状态st的价值估计；2训练资源调度智能体网络使用调度过程中的系统状态s，资源调度智能体输出动作a，As,a，训练资源调度智能体网络；在不同的云集群仿真环境中使用不同的作业序列，通过同时使用20个资源调度智能体和仿真环境交互，按式5确定每一个智能体的目标函数的梯度并汇总为全局梯度：使用均方根传播方法作为优化器，按式6更新神经网络的参数：g＝α×g+1-α×Δθ26 其中，α是衰减率，取值为0.99，g是指数加权平均，η是学习率，取值为0.001，θ是神经网络的参数，Δθ是参数的梯度，迭代10000次后，得到云集群资源调度智能体。

全文数据：

权利要求：

百度查询：陕西师范大学基于深度强化学习的云集群资源调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

下一篇：一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

相关技术

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

键合劈刀_有研(广东)新材料技术研究院_202322391831.3

一种盒式包装机输送机构_安徽从仁堂生物科技有限公司_202322459283.3

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种叠瓦电池片检测用工装_江苏龙恒新能源有限公司_202322351795.8

一种籽晶自动熔接结构_四川永祥光伏科技有限公司_202322431204.8

一种打印机线路板加工用吸附输送轨道_威海光大光电有限公司_202322481598.8

一种用于土地规划用测量装置_西安市城市发展资源信息有限公司_202322290527.X

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

一种玉米种植用病虫害防治装置_黄金双_202322446508.1

龙图腾网&IPTOP

【发明公布】基于深度强化学习的云集群资源调度方法_陕西师范大学_202311544111.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务