【发明公布】一种基于DQN的信息系统弹性适变策略求解方法_重庆大学_202410036060.2

导航：龙图腾网> 最新专利技术> 一种基于DQN的信息系统弹性适变策略求解方法_重庆大学_202410036060.2

申请/专利权人：重庆大学

申请日：2024-01-10

公开（公告）日：2024-04-09

公开（公告）号：CN117852915A

主分类号：G06Q10/0637

分类号：G06Q10/0637;G06N3/092

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.26#实质审查的生效;2024.04.09#公开

摘要：本发明涉及一种基于DQN的信息系统弹性适变策略求解方法，属于计算机技术领域。本方法从环境软件信息系统中提取系统各功能模块的运行状态特征，构成运行系统状态，同时选择合适的价值函数和状态转移概率，构建系统软件功能模块动态弹性适变的马尔科夫决策模型，进一步，本发明基于Q最大策略求解系统弹性适变操作策略，完成系统弹性适变操作。软件信息系统弹性性化适变过程是一个连续的动态适应软件信息系统软件功能模块等运行状态特征的优化过程。本发明利用深度强化学习在动态优化上的优势，实现软件信息系统最优适变策略方法求解，以使信息系统的总体运行负载和处理效率得到提升，实现信息系统的最优运维。

主权项：1.一种基于DQN的信息系统弹性适变策略求解方法，其特征在于：该方法包括以下步骤：S1：从信息系统各个软件功能模块的日志数据中该模块的运行特征，确定系统弹性适变过程的马尔科夫决策模型M＝{S,A,Psa,R}涉及以下要素：S表示信息系统当前状态集合，为构成软件信息系统各个软件功能模块的运行状态信息，通过对该模块的日志信息进行处理后得到；A表示信息系统软件功能模块弹性适变动作集合；该适变动作为对系统各个模块的操作，通过以上操作以此为基础构成了系统弹性适变策略；Psa为系统状态转移概率，即信息系统当前状态经适变动作a∈A转移到下一状态的概率分布情况；R为回报函数，是评价系统软件功能模块弹性适变操作的效果优劣；Rs',a表示状态s'时执行动作a得到的回报；S2：根据S1中确定的软件信息系统弹性适变过程的马尔科夫决策模型中的回报函数R，确定弹性适变动作序列的Q值：Qs,a＝EπRt|st,at＝Eπrt+1+γrt+2+γ2rt+2+…|st,at以反映软件信息系统各个模块的状态、信息系统弹性适变动作组合的回报值期望；S3：不断根据信息系统运行场景和状态，执行相应动作a，使Qs,a值最大，以上动作序列即为系统动态适变策略；Qs,a值是对信息系统状态以及弹性适变动作的累积评估，也即根据信息系统各个模块的状态、信息系统弹性适变动作组合的回报值期望；根据软件信息系统每一个时刻的状态，计算不同适变动作对应的Q值，构建Q值表，以便于通过Q值表由信息系统状态确定系统弹性适变策略；S4：针对S3中的系统弹性适变策略，利用神经网络代替S3中算法中的动作值函数Q值表，对Q值的计算过程进行拟合，计算不同动作对应的Q值；DQN深度强化学习方法基于预期回报来评价各动作的优劣；通过使预期回报最大的策略选择信息系统弹性适变动作序列，得到弹性适变的最优策略；S5：S4中用于软件信息系统弹性适变的DQN深度强化学习方法包括训练和计算两个过程；其中训练过程为：首先利用信息系统软件功能模块日志信息得到特征，初始策略神经网络和目标神经网络初始状态值，循环生成经验数据，并存入经验回放池；即系统初始状态s通过策略网络得到该状态s下不同动作的Q值，基于Q最大策略或随机策略选取对应的动作a，该动作作用于信息系统软件功能模块弹性适变，包括启动或者停止相应功能模块，信息系统进入一个新的状态，同时返回回报值r；循环得到若干组经验值；然后，将经验池数据中的状态值S按照一定策略输入策略网络，得到策略网络动作值Q，用对应的经验数据输入目标网络得到下一时刻目标网络动作值Q值，将两个网络输出的差按照梯度下降策略训练策略网络，并早一段时间后更新目标网络；循环直至训练轮数或平均回报性能指标达到一定阈值，完成训练，此时得到的策略网络就是用于求解弹性适变的策略网络；计算过程为：在信息系统软件功能模块的弹性适变中，利用训练好的策略网络，实现信息系统进行弹性适变操作。

全文数据：

权利要求：

百度查询：重庆大学一种基于DQN的信息系统弹性适变策略求解方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

下一篇：一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

相关技术

一种双卧轴连续式混凝土搅拌装置_广安金都混凝土有限公司_202322291527.1

一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

一种注塑机新型泵罩门板_恩格尔注塑机械(常州)有限公司_202322227242.1

一种钻井液生产粉尘收集装置_新乡市隆驰化学有限责任公司_202322388957.5

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种钢带波纹螺旋管接头防护模具_吉林建工集团有限公司_202322063597.1

一种吸尘器高密封过滤网_苏州佳奇克电子有限公司_202322293337.3

一种电池叠放平台_济源市万洋绿色能源有限公司_202322480402.3

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

一种醋酸钠生产用搅拌装置_安徽海逸生物科技有限公司_202322412726.3

适相关技术

一种适老化多功能储物柜_四川亚度智慧康养科技有限公司_202322551432.9

一种适老型住宅空间布局自动生成方法及系统_华中科技大学_202111025167.X

一种普适煤矿地下水库及其建造方法_清华大学_201810982995.4

一种可拆装式适老化桌具结构_杭州颐邻嘉实业有限公司_202321714774.1

一种超声机普适外接数据自动预处理方法_哈尔滨晓芯科技有限公司_202110427026.4

一种高适海性、短距低速起降的水面飞行器_中国特种飞行器研究所_202311872487.8

一种用于磁共振成像的具有适形能力的射频线圈结构_上海辰光医疗科技股份有限公司_202110728203.2

一种普适性转向架构架关键部位应力实时监测系统_中车长春轨道客车股份有限公司_202322456078.1

高精导航图线状要素智能自适追索生成方法、装置及设备_航天宏图信息技术股份有限公司_202410095904.0

一种适老化卧室_乐宜适老化健康科技(江苏)有限公司_202321591073.3

变相关技术

一种变径黄油枪泵头_陈军明_201710148381.1

重构型塔式多级变挡减速装置_武汉市精华减速机制造有限公司_202110574213.5

考虑形态变化的肌肉时变力学建模方法、装置、电子设备_中国人民解放军军事科学院国防科技创新研究院_202111456321.9

一种便于操作的变电站主变油色谱监控设备_南京贝塞尔电力科技有限公司_202322374680.0

一种MGT-CCHP变工况动态能效优化控制方法_上海电力大学_202111549370.7

一种宠物自动开门冷暖箱变温装置_深圳市安服优智能互联科技有限公司_202322631476.2

海上风电变桨故障远程复位系统、方法、装置及设备_三峡新能源海上风电运维江苏有限公司_202311184348.6

一种金属件局部交变温度载荷模拟设备_上海海事大学_202410146040.0

偏航变桨减速器下机体偏心加工工装_银川威力传动技术股份有限公司_202322598212.1

一种关节轴承变径滚铆安装工具_鹰领航空高端装备技术秦皇岛有限公司_202111621663.1

弹性相关技术

聚酯弹性体树脂组合物_东洋纺MC株式会社_202180016681.9

一种座椅海绵弹性测试平台_湖北恒源宇交通科技有限公司_202322607671.1

用于滚轮导靴的弹簧和/或限位弹性元件的距离测量装置_迅达(中国)电梯有限公司_202322762212.0

可生物降解的生物基热塑性聚氨酯弹性体及其制备方法_山东一诺威聚氨酯股份有限公司_202311846509.3

一种胰岛素注射笔的弹性调节结构_肯多科技(浙江)有限公司_202322095621.X

一种抗菌、防螨、防霉弹性海绵及其制备方法_佛山市惠安家居用品有限公司_202310548743.1

一种聚烯烃弹性体微孔发泡材料及其制备方法_宁波致微新材料科技有限公司_202211596184.3

一种碳酸盐岩骨架弹性因子计算模型的建立方法_中国石油化工股份有限公司_202211295815.8

一类功能化聚烯烃弹性体及其制备方法_大连万慷工业科技有限公司_202211377990.1

一种氧气瓶弹性固定装置_山东康纳斯医疗科技有限公司_202322384118.6

龙图腾网&IPTOP

【发明公布】一种基于DQN的信息系统弹性适变策略求解方法_重庆大学_202410036060.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务