南京邮电大学余亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利基于个性化联邦强化学习的智慧家庭能量管理方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119903767B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510407482.0,技术领域涉及:G06F30/27;该发明授权基于个性化联邦强化学习的智慧家庭能量管理方法及系统是由余亮;何佳栋;陈志强;岳东;石尚;李杨设计研发完成,并于2025-04-02向国家知识产权局提交的专利申请。
本基于个性化联邦强化学习的智慧家庭能量管理方法及系统在说明书摘要公布了:本发明公开了基于个性化联邦强化学习的智慧家庭能量管理方法及系统,属于智慧家庭能量管理领域,包括以下步骤:建模多个异质智慧家庭能量成本最小化问题并设计对应马尔可夫决策过程的环境状态、动作和奖励函数;N个异质智慧家庭环境的边缘端智能体在本地利用深度强化学习算法优化策略,并借助云端中心服务器进行联邦学习,获得一个训练性能稳定的预训练全局模型;对各个异质智慧家庭环境的边缘端智能体进行后训练微调,得到适用于N个异质智慧家庭环境的N种个性化能量管理策略;将微调得到的个性化能量管理策略部署在实际环境中运行,本发明可在充分保障住户热舒适性的前提下,有效降低系统能量成本。
本发明授权基于个性化联邦强化学习的智慧家庭能量管理方法及系统在权利要求书中公布了:1.基于个性化联邦强化学习的智慧家庭能量管理方法,其特征在于,包括如下步骤:步骤1:建模多个异质智慧家庭能量成本最小化问题并设计对应马尔可夫决策过程的环境状态、动作和奖励函数;步骤2:N个异质智慧家庭环境的边缘端智能体在本地利用深度强化学习算法优化策略,并借助云端中心服务器进行联邦学习,获得一个训练性能稳定的预训练全局模型;步骤3:对各个异质智慧家庭环境的边缘端智能体进行后训练微调,得到适用于N个异质智慧家庭环境的N种个性化能量管理策略;所述步骤3的后训练微调过程中,各个节点停止上传边缘端智能体参数至中心服务器,停止从中心服务器获取全局模型参数,限制自身边缘端智能体网络模型与预训练全局模型的参数距离,减小学习率,在自身所处异质环境中进行个性化微调直至性能达到稳定后停止,通过各个节点在自身边缘端智能体网络损失函数中增加惩罚项来约束模型与全局模型的参数距离,表达式如下: 其中:表示增加距离惩罚项之后的新损失函数,表示原损失函数,α表示一个比例因子,表示任意一种距离计算方式,ωn代表第n个边缘端智能体的网络参数,ω代表全局模型参数;个性化能量管理策略学习过程如下:第一部分,预训练全局模型的训练过程如下:1初始化N个异质智慧家庭的边缘端智能体网络参数ωn以及经验缓存区2在每个异质智慧家庭中,边缘端智能体与环境交互收集经验元组存入经验缓存区3从经验缓存区中采样经验元组,利用深度确定性策略梯度算法对边缘端智能体进行独立训练;4边缘端智能体上传网络参数ωn至云端中心服务器,经其聚合后得到全局模型参数ω;5云端中心服务器下发全局模型参数ω到各个边缘节点的边缘端智能体;6重复进行上述步骤2-步骤5,直至获得训练性能稳定的预训练全局模型;第二部分,后训练微调过程步骤如下:1边缘端智能体加载训练好的预训练全局模型参数ω,并停止上传参数至中心服务器;2通过增加惩罚项来软约束本地模型与预训练全局模型的参数距离,即边缘端智能体损失函数计算方式从更新为3边缘端智能体减小学习率至原来的继续与环境交互收集经验,并抽样经验元组利用深度确定性策略梯度算法对边缘端智能体参数进行微调,直至性能达到稳定;4N个异质智慧家庭环境重复上述步骤1-步骤3,得到分别适应N个异质智慧家庭环境的N种个性化能量管理策略;步骤4:将微调得到的个性化能量管理策略部署在实际环境中运行。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。