买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】权衡个性化热舒适与HVAC能耗的强化学习方法及装置_清华大学_202311568306.2 

申请/专利权人:清华大学

申请日:2023-11-22

公开(公告)日:2024-02-27

公开(公告)号:CN117606133A

主分类号:F24F11/89

分类号:F24F11/89;G05B13/04;F24F7/007;F24F11/47;F24F1/0018;F24F1/0035;F24F11/64;F24F11/74;F24F11/80

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.15#实质审查的生效;2024.02.27#公开

摘要:本说明书实施例涉及智能建筑节能优化领域,尤其涉及一种权衡个性化热舒适与HVAC能耗的强化学习方法及装置。该方法的实现步骤如下:1构建基于机理的HVAC系统能耗模型;2构建基于热平衡法的房间传热机理模型;3构建基于PMV指标的用户个性化舒适度模型;4构建个性化舒适度与能耗权衡优化问题及基于Q学习的强化学习求解算法框架。通过本说明书实施例,能够充分满足不同冷热偏好、不同消费习惯的用户的热舒适需求,避免不必要的能源浪费,通过预冷机制充分利用低电价优势实现节能,通过用户实时反馈及时调整运行策略,鲁棒性强。

主权项:1.一种权衡个性化热舒适与HVAC能耗的强化学习方法,其特征在于,所述方法包括:将由室内温度、墙体温度与所述室内温度之间的差异、时间变量构成的状态变量,以及由HVAC系统中FCU风机的出风温度与所述室内温度之间的差异、所述FCU风机的出风量构成的动作变量作为输入数据;利用具有预定参数的强化学习算法针对多个预定的新陈代谢率对所述输入数据进行训练,得到每一所述新陈代谢率对应的决策库,所述决策库中包括多个状态变量和多个动作变量两两之间对应的决策值,所述决策值是根据奖励函数值以及多个决策阶段对应的状态变量和动作变量计算得到的;当前决策阶段对应的状态变量是利用预先构建的基于热平衡法的房间传热机理模型对上一个决策阶段的状态变量和动作变量进行迭代计算得到的,动作变量是通过ε贪心策略选择得到的;奖励函数值是利用所述状态变量计算的舒适度指标,和所述状态变量和动作变量计算的所述HVAC系统的能耗,以及根据用户节能潜力、用户敏感程度、用户消费习惯计算的权重系数计算得到的;在对目标用户所在的目标室内的所述FCU风机的出风量、所述FCU风机的出风温度进行决策时,根据所述目标用户的新陈代谢率确定目标决策库,根据所述目标室内的实际空气温度、实际墙体温度利用所述目标决策库进行决策,得到多个决策阶段对应的所述FCU风机的目标出风量、所述FCU风机的目标出风温度,以便于利用各决策阶段的所述目标出风量、目标出风温度在所述决策阶段对应的时间对所述目标室内的所述FCU风机进行控制,从而使得所述目标室内的室内温度满足所述目标用户的舒适度。

全文数据:

权利要求:

百度查询: 清华大学 权衡个性化热舒适与HVAC能耗的强化学习方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。