买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于深度强化学习的原水系统调度与风险预警方法_同济大学;银川中铁水务集团有限公司_202311838386.9 

申请/专利权人:同济大学;银川中铁水务集团有限公司

申请日:2023-12-28

公开(公告)日:2024-03-29

公开(公告)号:CN117787631A

主分类号:G06Q10/0631

分类号:G06Q10/0631;G06Q10/0635;G06N3/006;G06N3/0499;G06Q50/06

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明涉及一种基于深度强化学习的原水系统调度与风险预警方法,包括以下步骤:建立水厂取水泵站总能耗最小化与取水含沙量最小化问题的马尔可夫博弈模型,并设计相应的状态空间、动作空间和奖励函数;获取历史运行数据和水文数据,基于预设的水力模型和MLP神经网络,构建调度环境模型;通过调度环境模型和智能体PPO算法,对深度强化学习智能体进行训练,并基于域随机化提升泛化性能,得到智能体策略;构建seq2seq模型,基于历史运行数据,分别对河流泥沙含量和水库供水量进行多步预测,结合训练得到的智能体策略,生成风险预警模型。与现有技术相比,本发明具有泛化性能强,具备风险预警功能等优点。

主权项:1.一种基于深度强化学习的原水系统调度与风险预警方法,其特征在于,包括以下步骤:S1:建立水厂取水泵站总能耗最小化与取水含沙量最小化问题的马尔可夫博弈模型,约束条件为水量平衡、蓄水库液位在安全范围,并设计相应的状态空间、动作空间和奖励函数;S2:获取历史运行数据和水文数据,基于预设的水力模型和MLP神经网络,构建调度环境模型;S3:通过调度环境模型和智能体PPO算法,基于马尔可夫博弈模型、状态空间、动作空间和奖励函数,对深度强化学习智能体进行训练,并基于域随机化提升泛化性能,得到智能体策略;S4:构建seq2seq模型,基于历史运行数据,分别对河流泥沙含量和水库供水量进行多步预测,结合训练得到的智能体策略,生成风险预警模型;S5:将训练得到的智能体策略和风险预警模型部署到实际系统中。

全文数据:

权利要求:

百度查询: 同济大学;银川中铁水务集团有限公司 一种基于深度强化学习的原水系统调度与风险预警方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。