【发明公布】一种改进PPO算法离散参数辨识方法_上海电力大学_202311608435.X

导航：龙图腾网> 最新专利技术> 一种改进PPO算法离散参数辨识方法_上海电力大学_202311608435.X

申请/专利权人：上海电力大学

申请日：2023-11-28

公开（公告）日：2024-03-22

公开（公告）号：CN117744750A

主分类号：G06N3/092

分类号：G06N3/092;G06N3/045;G06N3/047;G06F30/27;G06F119/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明属于深度强化学习和模型参数辨识优化领域，本发明公开了一种改进PPO算法离散参数辨识方法，改进PPO算法包括状态、状态转移策略、动作和奖励；包括以下步骤：基于改进PPO算法对待辨识参数模型进行预设定义，分别定义状态、动作空间、奖励；根据经验对改进PPO算法的预设定义进行动作空间范围设定，并对每个参数进行离散划分多个离散值；基于算法最大迭代次数或奖励值满足需求后停止待辨识参数模型的参数辨识过程，以终止时训练得到的Acotr网络参数输出值采样获得动作值，将动作值作为最终的辨识参数结果。

主权项：1.一种改进PPO算法离散参数辨识方法，其特征在于，改进PPO算法包括状态state、状态转移策略π、动作action和奖励reward；包括以下步骤：步骤S1：基于改进PPO算法对待辨识参数模型进行预设定义，分别定义状态、动作空间、奖励；步骤S2：根据经验对改进PPO算法的预设定义进行动作空间范围设定，并对每个参数进行离散划分nd个离散值；步骤S3：基于算法最大迭代次数或奖励值满足需求后停止待辨识参数模型的参数辨识过程，以终止时训练得到的Acotr网络参数输出值采样获得动作值actiond，将动作值作为最终的辨识参数结果。

全文数据：

权利要求：

百度查询：上海电力大学一种改进PPO算法离散参数辨识方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：管带纠偏装置_武汉巨沣工程技术有限公司_202322765867.3

下一篇：一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

相关技术

管带纠偏装置_武汉巨沣工程技术有限公司_202322765867.3

一种高速直驱转台_江苏心力量智能科技有限公司_202322229050.4

一种滑套式HDMI数据线_深圳市海鑫达连接线有限公司_202322633970.2

一种纸箱生产用贴标机_浙江华信科技发展有限公司_202322178698.3

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种机柜_珠海冠宇动力电源有限公司_202322495779.6

电子设备_深圳市嘉晋实业有限公司_202322601396.2

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

配备可拆固定式导纸嘴的打印装置_长城信息股份有限公司_202322616485.4

龙图腾网&IPTOP

【发明公布】一种改进PPO算法离散参数辨识方法_上海电力大学_202311608435.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务