【发明公布】一种基于深度强化学习的信息系统弹性适变策略求解方法_重庆大学_202410036059.X

导航：龙图腾网> 最新专利技术> 一种基于深度强化学习的信息系统弹性适变策略求解方法_重庆大学_202410036059.X

申请/专利权人：重庆大学

申请日：2024-01-10

公开（公告）日：2024-04-09

公开（公告）号：CN117852914A

主分类号：G06Q10/0637

分类号：G06Q10/0637;G06N3/092

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.26#实质审查的生效;2024.04.09#公开

摘要：本发明涉及一种基于深度强化学习的信息系统弹性适变策略求解方法，属于计算机技术领域。从环境信息系统中提取各功能模块的运行状态特征，构成运行系统状态，同时选择合适的价值函数和状态转移概率，并以此基础，构建系统软件功能模块动态弹性适变的马尔科夫决策模型，进一步，本发明基于Actor‑Critic策略求解系统弹性适变操作策略，完成系统弹性适变操作。信息系统弹性性化适变过程是一个连续的动态适应信息系统模块和等运行状态特征的优化过程。本发明利用深度强化学习在动态优化上的优势，实现信息系统最优适变策略方法求解以使信息系统的总体运行负载和处理效率得到提升，实现信息系统的最优运维。

主权项：1.一种基于深度强化学习的信息系统弹性适变策略求解方法，其特征在于：该方法包括以下步骤：S1：从信息系统各个软件功能模块的日志数据中获取该功能模块的运行特征，确定系统弹性适变过程的马尔科夫决策模型M＝{S,A,Psa,R}涉及以下要素：S表示信息系统当前状态集合，为构成信息系统各个软件功能模块的运行状态信息，通过对该功能模块的日志信息进行处理后得到；A表示信息系统软件功能模块弹性适变动作集合；该适变动作为对系统各个模块的操作，通过以上操作以此为基础构成了系统弹性适变策略；Psa为系统状态转移概率，即信息系统当前状态经适变动作a∈A转移到下一状态的概率分布情况；R为回报函数，是评价系统软件功能模块弹性适变操作的效果优劣；Rs',a表示状态s'时执行动作a得到的回报；信息系统弹性适变的决策问题描述为：寻找一个策略，使得在信息系统在运行的过程中，执行T次弹性适变动作后累计奖励最大；S2：决策网络训练：针对信息系统模型构建强化学习架构，初始阶段在信息系统模型运行过程中收集日志信息，获取日志数据集，并将其转化为系统输入状态St；评价网络根据每一个状态执行动作获取的奖励对历史状态进行评估，之后根据环境状态选定动作，由评价网络对选定的动作进行评估，并将评估的结果作为动作网络的反馈更新，在不断的迭代学习中改进动作网络的决策能力；深度强化学习方法基于预期回报来评价各动作的优劣；通过使预期回报最大的策略选择信息系统弹性适变动作序列，得到弹性适变的最优策略；S3：针对S3中的强化学习架构，搭建Actor-Critic架构进行决策网络的模型建立；Actor网络完成资源调度行为决策，Critic网络实现对Actor执行动作后状态评估，指导Actor网络下一阶段的动作；首先采集信息系统的初始状态St，并将其送入Critic评价网络，根据评价网络产生的评价输出奖励Rt到Actor网络，Actor网络根据奖励Rt选择适当的弹性适变动作作用与信息系统；如此循环往复直至信息系统达到预设的目标，即网络训练完成，深度强化学习过程完毕；S4：实时弹性适变决策应用；根据决策网络训练过程中得到的动作网络和评估网络，在信息系统日志环境下获取每一时刻的运行状态特征及信息系统的状态特征，并将其作为网络输入，由网络输出下一个时刻的弹性适变方案，统计全时刻输出制定信息系统设备全时刻的弹性适变动作方案；以使信息系统的总体运行负载和处理效率得到提升，实现信息系统的最优运维。

全文数据：

权利要求：

百度查询：重庆大学一种基于深度强化学习的信息系统弹性适变策略求解方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

下一篇：一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

相关技术

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种轴承游隙检测装置_无锡凌拓智能装备有限公司_202322468779.7

一种注塑机新型泵罩门板_恩格尔注塑机械(常州)有限公司_202322227242.1

一种冷渣机料渣前置破碎防卡料机构_青岛奥利斯电力设备有限公司_202322163598.3

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种基于区块链技术的危险废物监管装置_上海博优环境科技发展有限公司_202322288382.X

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

一种现调机用消毒装置_中粮可口可乐饮料(山西)有限公司_202322565837.8

一种高效散热电源_广州市力为电子有限公司_202322175013.X

一种膏贴剂生产用传输装置_河南上恒医药科技有限公司_202322307134.5

适相关技术

一种适老化多功能储物柜_四川亚度智慧康养科技有限公司_202322551432.9

一种适老型住宅空间布局自动生成方法及系统_华中科技大学_202111025167.X

一种普适煤矿地下水库及其建造方法_清华大学_201810982995.4

一种可拆装式适老化桌具结构_杭州颐邻嘉实业有限公司_202321714774.1

一种超声机普适外接数据自动预处理方法_哈尔滨晓芯科技有限公司_202110427026.4

一种高适海性、短距低速起降的水面飞行器_中国特种飞行器研究所_202311872487.8

一种用于磁共振成像的具有适形能力的射频线圈结构_上海辰光医疗科技股份有限公司_202110728203.2

一种普适性转向架构架关键部位应力实时监测系统_中车长春轨道客车股份有限公司_202322456078.1

高精导航图线状要素智能自适追索生成方法、装置及设备_航天宏图信息技术股份有限公司_202410095904.0

一种适老化卧室_乐宜适老化健康科技(江苏)有限公司_202321591073.3

弹性相关技术

聚酯弹性体树脂组合物_东洋纺MC株式会社_202180016681.9

一种座椅海绵弹性测试平台_湖北恒源宇交通科技有限公司_202322607671.1

用于滚轮导靴的弹簧和/或限位弹性元件的距离测量装置_迅达(中国)电梯有限公司_202322762212.0

可生物降解的生物基热塑性聚氨酯弹性体及其制备方法_山东一诺威聚氨酯股份有限公司_202311846509.3

一种胰岛素注射笔的弹性调节结构_肯多科技(浙江)有限公司_202322095621.X

一种抗菌、防螨、防霉弹性海绵及其制备方法_佛山市惠安家居用品有限公司_202310548743.1

一种聚烯烃弹性体微孔发泡材料及其制备方法_宁波致微新材料科技有限公司_202211596184.3

一种碳酸盐岩骨架弹性因子计算模型的建立方法_中国石油化工股份有限公司_202211295815.8

一类功能化聚烯烃弹性体及其制备方法_大连万慷工业科技有限公司_202211377990.1

一种氧气瓶弹性固定装置_山东康纳斯医疗科技有限公司_202322384118.6

变相关技术

一种变径黄油枪泵头_陈军明_201710148381.1

重构型塔式多级变挡减速装置_武汉市精华减速机制造有限公司_202110574213.5

考虑形态变化的肌肉时变力学建模方法、装置、电子设备_中国人民解放军军事科学院国防科技创新研究院_202111456321.9

一种便于操作的变电站主变油色谱监控设备_南京贝塞尔电力科技有限公司_202322374680.0

一种MGT-CCHP变工况动态能效优化控制方法_上海电力大学_202111549370.7

一种宠物自动开门冷暖箱变温装置_深圳市安服优智能互联科技有限公司_202322631476.2

海上风电变桨故障远程复位系统、方法、装置及设备_三峡新能源海上风电运维江苏有限公司_202311184348.6

一种金属件局部交变温度载荷模拟设备_上海海事大学_202410146040.0

偏航变桨减速器下机体偏心加工工装_银川威力传动技术股份有限公司_202322598212.1

一种关节轴承变径滚铆安装工具_鹰领航空高端装备技术秦皇岛有限公司_202111621663.1

龙图腾网&IPTOP

【发明公布】一种基于深度强化学习的信息系统弹性适变策略求解方法_重庆大学_202410036059.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务