买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于LSTM栈式自编码多模型荷预测方法及系统_沈阳工业大学;国网辽宁省电力有限公司电力科学研究院;国网辽宁省电力有限公司_202010571376.3 

申请/专利权人:沈阳工业大学;国网辽宁省电力有限公司电力科学研究院;国网辽宁省电力有限公司

申请日:2020-06-22

公开(公告)日:2024-03-22

公开(公告)号:CN112016734B

主分类号:H02J3/00

分类号:H02J3/00;G06Q50/06;G06N3/0442;G06N3/0455;G06N3/084;G06N3/0985;G06N20/20;G06N5/01

优先权:["20200407 CN 202010265829X"]

专利状态码:有效-授权

法律状态:2024.03.22#授权;2020.12.18#实质审查的生效;2020.12.01#公开

摘要:本发明属于负荷预测技术领域,具体涉及基于LSTM栈式自编码多模型荷预测方法及系统。该方法包括获取数据集,对数据集进行预处理;建立电动汽车充电开始时间的概率模型并重构数据集;构建LSTM栈式自编码结构并训练;利用XGBoost模型预测短期负荷,并进行指标评价。该系统包括获取数据集模块,预处理模块,概率模型和重构模块,LSTM栈式自编码结构的构建和训练模块,预测模块,指标评价模块。本发明提出的方法能够考虑电动汽车充电负荷的影响,最大程度利用原始数据,深度学习其内部特征,有效提高短期负荷预测精度。

主权项:1.基于LSTM栈式自编码多模型荷预测方法,其特征在于:该方法包括:步骤1:获取数据集,对数据集进行预处理;步骤2:建立电动汽车充电开始时间的概率模型并重构数据集;步骤3:构建LSTM栈式自编码结构并训练;步骤4:利用XGBoost模型预测短期负荷,并进行指标评价;数据集的获取包括采集负荷数据、电价数据、温度、湿度、待测日一周前负荷数据、星期类型、法定节日,采样周期为15min,按时间序列排列,构建数据集;时间序列分为两列,第一列为年-月-日-小时-时刻,第二列为历史数据值;对数据集进行预处理,对于在时间上有连续性的变量历史负荷数据、温度、湿度,基于格拉布斯准则法判断异常值并清理,采用Lagrange三次样条插值补全残缺数据,最后对数据集归一化处理;格拉布斯准则法如下: 其中,G1,G2分别为判断最小、最大值是否异常;为均值,S为标准差;若G1,G2分别大于对应的判据G则表示该最小、最大值为异常值;其中,判据G依据格拉布斯的临界值表选取;考虑到是时序性变量在时间上的连续性,将异常值修正为其前后两值的均值,该方式在数据集上迭代进行,直到无异常值为止;Lagrange完备三次样条插值法如下:已知函数y=fx在区间[a,b]上的值yi=fxii=0,1,2,…n,其中:a=x0<x1<…<xn-1<xn=b;插值函数Sx满足:Sxi=yii=0,1,2,…n;Sx在每个小区间[xi,xi+1]i=0,1,2,…n上均为三次多项式,记作Six;Sx在[a,b]上二阶连续可微;因此,记为: 进而得: 选取的边界条件为:S'a=y'0,S'b=y'n5其中,y0′表示函数fx在x0处的导数,yn′表示函数fx在xn处的导数;归一化流程:对于具有时序性的连续变量,标准化公式为: 其中,X表示实际值,Xmin表示样本中最小值,Xmax表示样本中最大值,X'表示归一化处理后的值,应使归一化处理后的值在0~1间;对于离散型变量,规定晴好天气影响因子为1,雾霾多云天气影响因子为0.5,雨雪天气影响因子为0.1,极端天气影响因子为0,规定工作日影响因子为1,休息日影响因子为0;建立电动汽车充电开始时间的概率模型并重构数据集:从数据时序性角度考虑电动汽车的充电负荷对短期负荷预测的影响;从电动汽车用户行为角度建立概率模型,以日出行结束时刻作为充电需求开始时刻,拟合电动汽车用户日出行结束时刻概率分布: 其中,t表示日出行结束时刻,σ和μ分别表示电动汽车日出行结束时刻统计数据的标准差和均值;通过蒙特卡洛法建立电动汽车充电需求的时间概率模型,并在处理后作为时序性输入插入数据集;构建LSTM栈式自编码结构并训练:采用LSTM栈式自编码提取数据特征,堆栈的LSTM编码层作为隐藏层,自动编码器由三层组成,分别为输入层、隐藏层和输出层;训练过程包括编码阶段和译码阶段;给定未标记的输入数据集,其中n=1,2,...,N且xn∈Rm,两个阶段表示为:hx=fW1x+b18 其中,hx表示从输入向量x计算得出的隐藏编码向量,是输出层的译码器向量;f为编码函数,g为解码函数,W1和W2分别为编码器和解码器的权矩阵,b1和b2分别为各相位的偏置向量;输入与重构输入或输出之间的差异称为重构误差,在训练期间模型使最小化;LSTM网络模块具有三个门结构:遗忘门、输入门、输出门;采用sigmoid和tanh函数,用σ表示sigmoid函数变化;遗忘门:ft=σWfxxt+Wfhht-1+bf10当前时刻的输入xt与前一时刻状态记忆单元Ct-1、中间输出ht-1共同决定状态记忆单元遗忘部分;输入门:it=σWixxt+Wihht-1+bi11gt=tanhWgxxt+Wghht-1+bg12 其中,Ct-1表示前一时刻状态记忆单元的保留向量;输入xt和中间输出ht-1分别经过sigmoid和tanh函数变化后共同决定状态记忆单元中保留向量;输出门:ot=σWoxxt+Wohht-1+bo14 输出ht由更新后的Ct与输出ot共同决定;上式中,ft,it,gt,ot,ht和Ct分别为遗忘门、输入门、输入节点、输出门、中间输出和状态记忆单元的状态;Wfx,Wfh,Wix,Wih,Wgx,Wgh,Wox和Woh分别为相应门与输入xt和中间输出ht-1相乘的矩阵权重;bf,bi,bg,bo分别为相应门的偏置项;表示向量中元素按位相乘;表示矩阵加法;在Python3.7下通过Keras库搭建LSTM网络,利用Adam算法优化;利用XGBoost模型预测短期负荷和评价指标:XGBoost模型将LSTM栈式自编码提取的特征作为输入序列,XGBoost模型采用贪心算法,通过集合方式防止过拟合现象,且泛化能力强;XGBoost模型作为一种提升树模型,实现了多种树模型的集成,这些树模型为CART回归树模型;XGBoost模型如下所示: 为第i个样本的模型预测值;K为树的数量;F为树的集合空间;xi表示第i个数据点的特征向量;fk对应第k棵独立的树的结构q和叶子权重w相关状况;损失函数L: 其中,为预测值和目标值yi之间的训练误差之和;为树的复杂度之和,用于控制模型复杂度的正则项: 其中γ和λ为模型的惩罚系数;w表示叶子权重,T表示叶子结点数量,损失函数在序列最小化过程中,每一轮加入的增量函数ftxi尽可能使损失函数最大程度减小;第t轮的目标函数表示为: 采用二阶泰勒展开的方式近似目标函数;设第j个叶子结点的样本集合为Ij={i|qxi=j};其中和分别为损失函数的一、二阶导数;得: 设Gj表示叶子结点j所包含样本的一阶偏导数累加之和,是一个常量;Hj表示叶子结点j所包含样本的二阶偏导数累加之和,是一个常量,得: wj表示叶子结点j的权重,Lt表示第t轮损失函数,对w求偏导得到: 将权值代入目标函数得到: 损失函数越小表示模型越好;采用贪心算法对子树划分,每次对已有的叶子增加新划分,计算最大增益: 其中和分别表示左、右子树分裂后产生的增益,为不进行子树分裂的增益;XGBoost的泛化能力较强,通过集合的方式防止过拟合,XGBoost模型输出预测结果后,选择平均误差,平均相对误差和相对均方误差作为评价指标: 其中,n为预测点个数,xt表示t时刻实际观测的负荷值,yt表示t时刻负荷预测值;ME反映整体预测值平均偏差的情况,值越小偏差越小;MAPE能够反映相对平均偏离程度,值越小表明模型预测精度越高;RMSE反映预测模型的可靠性,值越小则模型越可靠。

全文数据:

权利要求:

百度查询: 沈阳工业大学;国网辽宁省电力有限公司电力科学研究院;国网辽宁省电力有限公司 基于LSTM栈式自编码多模型荷预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。