买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种铁路和风电场环境风速机器学习预测方法_中南大学_201811643479.5 

申请/专利权人:中南大学

申请日:2018-12-29

公开(公告)日:2020-11-20

公开(公告)号:CN109726802B

主分类号:G06N3/04(20060101)

分类号:G06N3/04(20060101);G06Q10/04(20120101);G06Q50/06(20120101)

优先权:

专利状态码:有效-授权

法律状态:2020.11.20#授权;2019.05.31#实质审查的生效;2019.05.07#公开

摘要:本发明公开了一种铁路和风电场环境风速机器学习预测方法,该方法选择多种神经网络模型,建立多种风速预测特征预选模型各100个,通过均方误差分析和相关性分析,选取性能好以及特征独立性强的模型各10个,然后建立多个风速预测集成模型,对风速预测特征进行集成处理,最后建立风速预测归一模型,对风速集成值进行归一处理,并计算预测风速向量与训练样本的风速向量之间的相关性,利用相关性强的对应时刻的风速噪声还原预测风速值,该方法能有效预测非平稳风速,对复杂,非线性风速值具有精准的预测效果。

主权项:1.一种铁路和风电场环境风速机器学习预测方法,其特征在于,包括以下步骤:步骤1:建立测风站获取原始风速数据;在铁路沿线或风电场待测风点设置测风站,设置指定采样时间间隔,采集原始风速数据集;所述原始风速数据集为时间序列集,且包含Q个采样时刻的风速,所述Q至少大于500;步骤2:构建风速模型训练样本和风速模型筛选样本;使用无迹卡尔曼方程对原始风速数据集进行滤波,得到处理后的风速数据集和风速噪声集;将风速数据集按照时间连续滚动规则分为多个长度为5的风速训练向量;其中12时间连续的风速训练向量组成风速模型训练样本,剩余12时间连续的风速训练向量组成风速模型筛选样本;步骤3:选择N种不同神经网络,对每种神经网络的参数随机设置100种不同取值,构建N种基于神经网络的风速预测特征预选模型组;依次将风速模型训练样本中所有风速训练向量内前4个时刻的风速值作为输入数据,第5个时刻的风速值作为输出数据,训练N种神经网络,每种神经网络的参数取100种不同取值,得到N种基于神经网络的风速预测特征预选模型组,每种神经网络的风速预测特征预选模型组包括100个基于相同神经网络的风速预测特征预选模型;所述风速预测特征预选模型输出值命名为风速特征预选值;步骤4:基于均方误差分析和相关性分析模型筛选方法,将每种100个基于相同神经网络的风速预测特征预选模型筛选至10个,筛选后的模型命名为风速预测特征模型,得到N种基于神经网络的风速预测特征模型组,每种神经网络的风速预测特征模型组包括10个基于相同神经网络的风速预测特征模型;所述风速预测特征模型输出值命名为风速特征值;步骤5:基于风速模型训练样本和风速模型筛选样本输入至10*N个风速预测特征模型得到的输出数据,构建针对N种神经网络的N个风速预测集成模型训练样本;依次将风速模型训练样本和风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型中,获得每个风速预测特征模型输出的第5个时刻的风速特征值;利用每种基于相同神经网络的10个风速预测特征模型每次共输出10个风速特征值组成风速特征列向量,所有风速特征列向量组成10*M维数的矩阵,N种基于神经网络的风速预测特征模型组共得到N个10*M维数的矩阵;将所述N个10*M维数的矩阵定义为针对N种神经网络的N个风速预测集成模型训练样本;其中,M为风速预测特征模型运行次数;步骤6:将步骤5得到的针对N种神经网络的N个风速预测集成模型训练样本中长度为10的风速特征列向量作为输入数据,风速模型训练样本和风速模型筛选样本中对应时刻的风速值作为输出数据,分别训练N个灰色神经网络,得到N个基于灰色神经网络的风速预测集成模型;所述风速预测集成模型输出值命名为风速集成值;步骤7:构建风速预测归一模型;所述构建风速预测归一模型具体过程如下:步骤B1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入到所有的风速预测特征模型,得到针对N种神经网络的N个10*P维数的矩阵,其中P为风速预测特征模型运行次数,进入步骤B2;步骤B2:依次将步骤B1得到的N个10*P维数的矩阵中每个长度为10的列向量作为输入数据,输入至对应神经网络的N个风速预测集成模型,输出得到N个长度为P的风速集成行向量,进入步骤B3;步骤B3:将N个长度为P的风速集成行向量作为行向量组成N*P维数的矩阵;依次将N*P维数的矩阵中每个长度为N的列向量作为输入数据,风速模型筛选样本中对应时刻的风速值作为输出数据,训练小波神经网络,得到基于小波神经网络的风速预测归一模型;所述风速预测归一模型中的小波神经网络在训练时设置输入层节点个数为N,隐含层节点个数为2*N,输出层节点个数为1,最大迭代次数设置为500,训练学习率为0.02,阈值为0.05;步骤8:实时预测风速;设置和步骤1中原始风速数据集相同的采样时间间隔,通过测风站实时采集获取当前以及近期风速,获取长度至少为200的原始风速时间序列向量,然后进行实时预测风速,具体过程如下:步骤C1:设置预测风速目标时间T,进入步骤C2;步骤C2:对原始风速时间序列向量进行无迹卡尔曼滤波得到滤波后的风速时间序列向量,进入步骤C3;步骤C3:将风速时间序列向量中与目标时间T最接近的4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型,得到N个长度为10的风速特征列向量,进入步骤C4;步骤C4:依次将N个长度为10的风速特征列向量输入至对应的风速预测集成模型,得到N个风速集成值,进入步骤C5;步骤C5:将N个风速集成值作为输入数据,输入至风速预测归一模型,得到风速归一值,进入步骤C6;步骤C6:判断风速归一值所在时刻是否超过设置的预测风速目标时间T,若是,进入步骤C8,否则,进入步骤C7;步骤C7:将步骤C5得到的风速归一值按时间顺序插入到风速时间序列向量中,更新风速时间序列向量,返回步骤C3;步骤C8:计算风速时间序列向量中与目标时间T最接近的100个时刻风速值组成的向量与步骤2中的风速数据集任意时间连续的100个风速值组成的向量之间的皮尔逊相关系数,得到皮尔逊相关系数矩阵,找到皮尔逊相关系数最高的100个风速数据集中的风速值组成的向量,将其对应时刻的风速噪声集中100个连续噪声附加到风速时间序列向量中与目标时间T最接近的100个时刻风速值中,获得目标时间的实时风速预测值。

全文数据:一种铁路和风电场环境风速机器学习预测方法技术领域本发明属于风速预测领域,特别涉及一种铁路和风电场环境风速机器学习预测方法。背景技术近年来,风速预测受到铁路相关安全部门和风电场领域越来越多的关注。风速具有随机多变、复杂非线性等特点,实现对风速超步长、超精准的预测能为恶劣大风环境下的列车运行提供更多提前预警处理时间,保证行车安全;同时风速精准预测能为风电场执行调度方案提供有力的数据支持,稳定发电功率,保证发电安全。诸多学者投入了大量的精力研究风速变化规律,由于其复杂非线性特点,传统的统计方法和物理方法对风速预测具有较大局限性,很难准确找出风速变化特征,从而无法进行精准的风速预测。机器学习方法由于其较强的非线性数据处理能力被越来越多人使用,将其与风速预测相结合能更为准确地找出风速特征,发现风速变化规律,是风速预测的重要方法。本发明提供了一种铁路和风电场环境风速机器学习预测方法,选择多种神经网络算法,建立多种风速预测特征预选模型各100个,通过均方误差分析和相关性分析,选取性能好以及特征独立性强的模型各10个,然后建立多个风速预测集成模型,对风速预测特征进行集成处理,最后建立风速预测归一模型,对风速集成值进行归一处理,并计算预测向量与训练样本之间的相关性,利用相关性强的对应时刻的风速噪声还原预测风速值,从而达到精准,有效的预测。发明内容本发明提供了一种铁路和风电场环境风速机器学习预测方法,其目的在于,依据机器学习算法,建立多种机器学习模型,找到铁路和风电场环境下的复杂、非平稳风速的风速特征,根据风速的不同特征对非平稳风速进行准确有效的预测。一种铁路和风电场环境风速机器学习预测方法,包括以下步骤:步骤1:建立测风站获取原始风速数据;在铁路沿线或风电场待测风点设置测风站,设置指定采样时间间隔,采集原始风速数据集;所述原始风速数据集为时间序列集,且包含Q个采样时刻的风速,所述Q至少大于500;步骤2:构建风速模型训练样本和风速模型筛选样本;使用无迹卡尔曼方程对原始风速数据集进行滤波,得到处理后的风速数据集和风速噪声集;将风速数据集按照时间连续滚动规则分为多个长度为5的风速训练向量;其中12时间连续的风速训练向量组成风速模型训练样本,剩余12时间连续的风速训练向量组成风速模型筛选样本;步骤3:选择N种不同神经网络,对每种神经网络的参数随机设置100种不同取值,构建N种基于神经网络的风速预测特征预选模型组;依次将风速模型训练样本中所有风速训练向量内前4个时刻的风速值作为输入数据,第5个时刻的风速值作为输出数据,训练N种神经网络,每种神经网络的参数取100种不同取值,得到N种基于神经网络的风速预测特征预选模型组,每种神经网络的风速预测特征预选模型组包括100个基于相同神经网络的风速预测特征预选模型,即共得到100*N个风速预测特征预选模型;所述风速预测特征预选模型输出值命名为风速特征预选值;步骤4:基于均方误差分析和相关性分析模型筛选方法,将每种100个基于相同神经网络的风速预测特征预选模型筛选至10个,筛选后的模型命名为风速预测特征模型,得到N种基于神经网络的风速预测特征模型组,每种神经网络的风速预测特征模型组包括10个基于相同神经网络的风速预测特征模型;所述10个基于相同神经网络的风速预测特征模型是由100个基于相同神经网络的风速预测特征预选模筛选后重新命名得来的;所述风速预测特征模型输出值命名为风速特征值;步骤5:基于风速模型训练样本和风速模型筛选样本输入至10*N个风速预测特征模型得到的输出数据,构建针对N种神经网络的N个风速预测集成模型训练样本;依次将风速模型训练样本和风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型中,获得每个风速预测特征模型输出的第5个时刻的风速特征值;利用每种基于相同神经网络的10个风速预测特征模型每次共输出10个风速特征值组成风速特征列向量,所有风速特征列向量组成10*M维数的矩阵,N种基于神经网络的风速预测特征模型组共得到N个10*M维数的矩阵;将所述N个10*M维数的矩阵定义为针对N种神经网络的N个风速预测集成模型训练样本;其中,M为风速预测特征模型运行次数;步骤6:将步骤5得到的针对N种神经网络的N个风速预测集成模型训练样本中长度为10的风速特征列向量作为输入数据,风速模型训练样本和风速模型筛选样本中对应时刻的风速值作为输出数据,分别训练N个灰色神经网络,得到N个基于灰色神经网络的风速预测集成模型;所述N个灰色神经网络在训练时所使用的样本分别为N个风速预测集成模型训练样本,每1个风速预测集成模型训练样本只用来训练1个灰色神经网络;所述风速预测集成模型输出值命名为风速集成值;步骤7:构建风速预测归一模型;所述构建风速预测归一模型具体过程如下:步骤B1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入到所有的风速预测特征模型,得到针对N种神经网络的N个10*P维数的矩阵,其中P为风速预测特征模型运行次数,进入步骤B2;步骤B2:依次将步骤B1得到的N个10*P维数的矩阵中每个长度为10的列向量作为输入数据,输入至对应神经网络的N个风速预测集成模型,输出得到N个长度为P的风速集成行向量,进入步骤B3;步骤B3:将N个长度为P的风速集成行向量作为行向量组成N*P维数的矩阵;依次将N*P维数的矩阵中每个长度为N的列向量作为输入数据,风速模型筛选样本中对应时刻的风速值作为输出数据,训练小波神经网络,得到基于小波神经网络的风速预测归一模型;所述风速预测归一模型中的小波神经网络在训练时设置输入层节点个数为N,隐含层节点个数为2*N,输出层节点个数为1,最大迭代次数设置为500,训练学习率为0.02,阈值为0.05;步骤8:实时预测风速;设置和步骤1中原始风速数据集相同的采样时间间隔,通过测风站实时采集获取当前以及近期风速,获取长度至少为200的原始风速时间序列向量,然后进行实时预测风速,具体过程如下:步骤C1:设置预测风速目标时间T,进入步骤C2;步骤C2:对原始风速时间序列向量进行无迹卡尔曼滤波得到滤波后的风速时间序列向量,进入步骤C3;步骤C3:将风速时间序列向量中与目标时间T最接近的4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型,得到N个长度为10的风速特征列向量,进入步骤C4;步骤C4:依次将N个长度为10的风速特征列向量输入至对应的风速预测集成模型,得到N个风速集成值,进入步骤C5;步骤C5:将N个风速集成值作为输入数据,输入至风速预测归一模型,得到风速归一值,进入步骤C6;步骤C6:判断风速归一值所在时刻是否超过设置的预测风速目标时间T,若是,进入步骤C8,否则,进入步骤C7;步骤C7:将步骤C5得到的风速归一值按时间顺序插入到风速时间序列向量中,更新风速时间序列向量,返回步骤C3;步骤C8:计算风速时间序列向量中与目标时间T最接近的100个时刻风速值组成的向量与步骤2中的风速数据集任意时间连续的100个风速值组成的向量之间的皮尔逊相关系数,得到皮尔逊相关系数矩阵,找到皮尔逊相关系数最高的100个风速数据集中的风速值组成的向量,将其对应时刻的风速噪声集中100个连续噪声附加到风速时间序列向量中与目标时间T最接近的100个时刻风速值中,获得目标时间的实时风速预测值。进一步地,所述时间连续滚动规则指的是时间序列数据中为每个时刻代表的数据都将作为一次分解向量的开始值,取连续5个时刻的风速值作为一个风速训练向量;例如,时间序列数据集[a1,a2,a3,…,an]按照时间连续滚动规则分解成长度为5的向量则得到[a1,a2,a3,a4,a5],[a2,a3,a4,a5,a6],[a3,a4,a5,a6,a7],…,[an-4,an-3,an-2,an-1,an]共n-4个向量。进一步地,所述N种基于神经网络的风速预测特征预选模型组至少包括:基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组。进一步地,所述基于Elman神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的Elman神经网络在训练时设置输入层节点个数为3,隐含层节点个数为7,输出层节点个数为2,承接层节点个数为7;隐含层函数采用Sigmoid函数,最大迭代次数设置为900,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];所述基于BP神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的BP神经网络在训练时设置输入层节点个数为3,隐含层节点个数取值范围为[5,10],输出层节点个数为2,最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];所述基于小波神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的小波神经网络在训练时输入层节点个数为3,隐含层小波元个数取值范围为[5,10],输出层节点个数为2;隐层小波神经元采用MexicanHat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1]。进一步地,所述均方误差分析和相关性分析模型筛选方法具体过程如下:步骤A1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,输入到所有的风速预测特征预选模型,输出第5个时刻的风速特征预选值,进入步骤A2;步骤A2:将每个风速预测特征预选模型输出的风速特征预选值按时间次序排列作为风速特征预选向量,进入步骤A3;步骤A3:计算每个模型的风速特征预选向量与风速模型筛选样本中对应风速值时间序列向量的均方误差,N种基于神经网络的风速预测特征预选模型组内分别淘汰均方误差较大的风速预测特征预选模型30个,每种基于神经网络的风速预测特征预选模型组内剩余70个风速预测特征预选模型,即剩余共70*N个风速预测特征预选模型,进入步骤A4;步骤A4:分别计算N种基于神经网络的风速预测特征预选模型组内剩余的70个风速预测特征预选模型输出的风速特征预选向量两两之间的皮尔逊相关性系数,得到N个皮尔逊相关性系数矩阵,每个皮尔逊相关系数矩阵分别代表每种基于神经网络的风速预测特征预选模型组输出的风速特征预选向量两两之间的皮尔逊相关系数,进入步骤A5;步骤A5:分别计算N种基于神经网络的风速预测特征预选模型组内每个风速预测特征预选模型输出的风速特征预选向量与其他模型输出的风速特征预选向量之间的皮尔逊相关系数的累加值,逐步淘汰皮尔逊相关系数累加值最大的模型,直到N种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,进入步骤A6;步骤A6:每种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,命名为风速预测特征模型,将N种基于神经网络的风速预测特征预选模型组重新命名为N种基于神经网络的风速预测特征模型组。进一步地,所述N个基于灰色神经网络的风速预测集成模型在训练时均设置输入层节点个数为10,隐含层节点个数为20,输出层节点个数为1,最大迭代次数设置为800,训练学习率为0.01,阈值为0.001。有益效果本发明提供了一种铁路和风电场环境风速机器学习预测方法,该方法针对铁路和风电场环境下的复杂、非线性、非平稳风速,选择多种神经网络算法,设立100组参数值,建立多种风速预测特征预选模型各100个,依据模型效果,为每种神经网络算法筛选出效果好的10个模型,对风速进行初步预测,然后建立10个风速预测集成模型,将每种神经网络的10个模型输出值集成为1个值,建立风速预测归一模型,将每种神经网络的集成值进行归一,最后通过相关性分析,还原风速的真实性;该方法利用多种不同神经网络和神经网络参数的多种取值的模型对不同风速值进行预测,选择预测效果好的模型,可以避免风速值突然出现的非平稳变化而引起预测精度不准确的问题,能有效针对多种不同类型风速进行预测,提高预测精度,提高风速预测的泛化能力。附图说明图1为本发明所述方法的流程示意图。具体实施方式下面将结合附图和实例对本发明做进一步的说明。如图1所示,一种铁路和风电场环境风速机器学习预测方法,包括以下步骤:步骤1:建立测风站获取原始风速数据;在铁路沿线或风电场待测风点设置测风站,设置指定采样时间间隔采集数量为Q的原始风速数据集wt=[wt=Δt,wt=2*Δt,…,wt=Q*Δt];所述原始风速数据集为时间序列集,且包含Q个采样时刻的风速,所述Q至少大于500;步骤2:构建风速模型训练样本和风速模型筛选样本;使用无迹卡尔曼方程对原始风速数据集进行滤波,得到处理后的风速数据集w′t=[w′t=Δt,w′t=2*Δt,…,w′t=Q*Δt]和风速噪声集not=[not=Δt,not=2*Δt,…,not=Q*Δt];将风速数据集按照时间连续滚动规则分为多个长度为5的风速训练向量;其中12时间连续的风速训练向量组成风速模型训练样本,剩余12时间连续的风速训练向量组成风速模型筛选样本;所述时间连续滚动规则指的是时间序列数据中为每个时刻代表的数据都将作为一次分解向量的开始值,取连续5个时刻的风速值作为一个风速训练向量;例如,时间序列数据集[a1,a2,a3,…,an]按照时间连续滚动规则分解成长度为5的向量则得到[a1,a2,a3,a4,a5],[a2,a3,a4,a5,a6],[a3,a4,a5,a6,a7],…,[an-4,an-3,an-2,an-1,an]共n-4个向量;所述风速模型训练样本A表达为:所述风速模型筛选样本B表达为:步骤3:选择Elman神经网络、BP神经网络和小波神经网络共3种神经网络,对每种神经网络的参数随机设置100种不同取值,构建3种基于神经网络的风速预测特征预选模型组;依次将风速模型训练样本A中所有风速训练向量内前4个时刻的风速值作为输入数据,第5个时刻的风速值作为输出数据,分别训练Elman神经网络、BP神经网络和小波神经网络,每种神经网络的参数取100种不同取值,分别得到基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组,每种风速预测特征预选模型组包括100个风速预测特征预选模型,即共得到300个风速预测特征预选模型;所述基于Elman神经网络的风速预测特征预选模型组表达为:EL={el1γ1,…,eliγi,…,el100γ100},其中,EL为基于Elman神经网络的风速预测特征预选模型组,eliγi为第i个训练参数设置为γi的基于Elman神经网络的风速预测特征预选模型;所述基于BP神经网络的风速预测特征预选模型组表达为:BP={bp1ε1,…,bpiεi,…,bp100ε100},其中,BP为基于BP神经网络的风速预测特征预选模型组,bpiεi为第i个训练参数设置为εi的基于BP神经网络的风速预测特征预选模型;所述基于小波神经网络的风速预测特征预选模型组表达为:WA={wa1∈1,…,wai∈i,…,wa100∈100},其中,WA为基于小波神经网络的风速预测特征预选模型组,wai∈i为第i个训练参数设置为∈i的基于小波神经网络的风速预测特征预选模型;所述风速预测特征预选模型输出值命名为风速特征预选值;所述基于Elman神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的Elman神经网络在训练时设置输入层节点个数为3,隐含层节点个数为7,输出层节点个数为2,承接层节点个数为7;隐含层函数采用Sigmoid函数,最大迭代次数设置为900,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];所述基于BP神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的BP神经网络在训练时设置输入层节点个数为3,隐含层节点个数取值范围为[5,10],输出层节点个数为2,最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];所述基于小波神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的小波神经网络在训练时输入层节点个数为3,隐含层小波元个数取值范围为[5,10],输出层节点个数为2;隐层小波神经元采用MexicanHat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];步骤4:基于均方误差分析和相关性分析模型筛选方法,分别将3种风速预测特征预选模型组内的风速预测特征预选模型筛选至10个,筛选后的剩余的模型重新命名为风速预测特征模型,分别组合得到基于Elman神经网络的风速预测特征模型组、基于BP神经网络的风速预测特征模型组和基于小波神经网络的风速预测特征模型组,每种风速预测特征模型组包括10个风速预测特征模型;所述基于Elman神经网络的风速预测特征模型组表达为:EL′={el1′γ1′,…,li′γi′,…,l10′γ10′},其中,EL′为基于Elman神经网络的风速预测特征模型组,eli′γi′为第i个训练参数设置为γi′的基于Elman神经网络的风速预测特征模型;所述基于BP神经网络的风速预测特征模型组表达为:BP′={bp1′ε1′,…,piεi′,…,bp10′ε10′},其中,BP′为基于BP神经网络的风速预测特征模型组,bpi′εi′为第i个训练参数设置为εi′的基于BP神经网络的风速预测特征模型;所述基于小波神经网络的风速预测特征模型组表达为:WA′={wa1′∈1′,…,ai′∈i′,…,wa10′∈10′},其中,WA′为基于小波神经网络的风速预测特征模型组,wai′∈i′为第i个训练参数设置为∈i′的基于小波神经网络的风速预测特征模型;所述风速预测特征模型输出值命名为风速特征值;所述均方误差分析和相关性分析模型筛选方法具体过程如下:步骤A1:依次将风速模型筛选样本B中所有风速训练向量内前4个时刻的风速值作为输入数据,输入到所有的风速预测特征预选模型,输出第5个时刻的风速特征预选值,进入步骤A2;步骤A2:将每个风速预测特征预选模型输出的风速特征预选值按时间次序排列作为风速特征预选向量,进入步骤A3;步骤A3:计算每个模型的风速特征预选向量与风速模型筛选样本B中对应风速值时间序列向量的均方误差,3种风速预测特征预选模型组内分别淘汰均方误差较大的风速预测特征预选模型30个,每种风速预测特征预选模型组内均剩余70个风速预测特征预选模型,即剩余共70*3=210个风速预测特征预选模型,进入步骤A4;步骤A4:分别计算3种风速预测特征预选模型组内剩余的70个风速预测特征预选模型输出的风速特征预选向量两两之间的皮尔逊相关性系数,得到3个皮尔逊相关性系数矩阵,每个皮尔逊相关系数矩阵分别代表每种基于神经网络的风速预测特征预选模型组输出的风速特征预选向量两两之间的皮尔逊相关系数,进入步骤A5;所述3个皮尔逊相关性系数矩阵分别为PCCEL,PCCBP,PCCWA,表示为:PCCπ=[pij]70*70其中,π取值为EL,BP,WA得到的PCCEL,PCCBP,PCCWA分别表示基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组的皮尔逊相关系数,pij为第i个风速预测特征预选模型输出的风速特征预选向量和第j个风速预测特征预选模型输出的风速特征预选向量之间的皮尔逊相关系数;步骤A5:分别计算3种风速预测特征预选模型组内每个风速预测特征预选模型输出的风速特征预选向量与其他模型输出的风速特征预选向量之间的皮尔逊相关系数累加值,逐步淘汰皮尔逊相关系数累加值最大的模型,直到3种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,进入步骤A6;所述皮尔逊相关系数累加值计算方式为:其中,π取值为EL,BP,WA分别表示基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组,Pπi为基于π神经网络的风速预测特征预选模型组内第i个风速预测特征预选模型的皮尔逊相关系数累加值,pij为第i个风速预测特征预选模型输出的风速特征预选向量和第j个风速预测特征预选模型输出的风速特征预选向量之间的皮尔逊相关系数;步骤A6:每种风速预测特征预选模型组内均剩余10个风速预测特征预选模型,重新命名为风速预测特征模型,将3种风速预测特征预选模型组重新命名为基于Elman神经网络的风速预测特征模型组、基于BP神经网络的风速预测特征模型组和基于小波神经网络的风速预测特征模型组;步骤5:基于风速模型训练样本A和风速模型筛选样本B输入至10*3=30个风速预测特征模型得到的输出数据,构建针对3种神经网络的3个风速预测集成模型训练样本;依次将风速模型训练样本A和风速模型筛选样本B中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型中,获得每个风速预测特征模型输出的第5个时刻的风速特征值;每种风速预测特征模型组每次输出10个风速特征值组成风速特征列向量,所有风速特征列向量组成10*M维数的矩阵,3种风速预测特征模型组共得到3个10*M维数的矩阵;将所述3个10*M维数的矩阵定义为针对3种神经网络的3个风速预测集成模型训练样本;其中,M为风速预测特征模型运行次数;所述3个风速预测集成模型训练样本分别为CEL,CBP,CWA,表示为:Cπ=[y1,…,yi,…,yM]其中,π取值为EL,BP,WA得到的CEL,CBP,CWA分别表示针对基于Elman神经网络的风速预测特征预选模型组的风速预测集成模型训练样本、针对基于BP神经网络的风速预测特征预选模型组的风速预测集成模型训练样本和针对基于小波神经网络的风速预测特征预选模型组的风速预测集成模型训练样本,yi为风速预测特征预选模型组第i次输出的长度为10的风速特征列向量,M为风速预测特征模型运行次数;步骤6:将步骤5得到的针对3种神经网络的3个风速预测集成模型训练样本中长度为10的风速特征列向量[y1,…,yi,…,yM]作为输入数据,风速模型训练样本A和风速模型筛选样本B中对应时刻的风速值作为输出数据,分别训练3个灰色神经网络,得到3个基于灰色神经网络的风速预测集成模型;所述3个灰色神经网络在训练时所使用的样本分别为3个风速预测集成模型训练样本,每1个风速预测集成模型训练样本只用来训练1个灰色神经网络;所述风速预测集成模型输出值命名为风速集成值;所述3个风速预测集成模型中的灰色神经网络在训练时均设置输入层节点个数为10,隐含层节点个数为20,输出层节点个数为1,最大迭代次数设置为800,训练学习率为0.01,阈值为0.001;步骤7:构建风速预测归一模型;所述构建风速预测归一模型具体过程如下:步骤B1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入到所有的风速预测特征模型,得到针对3种神经网络的3个10*P维数的矩阵,其中P为风速预测特征模型运行次数,进入步骤B2;步骤B2:依次将步骤B1得到的3个10*P维数的矩阵中每个长度为10的列向量作为输入数据,输入至对应神经网络的3个风速预测集成模型,输出得到3个长度为P的风速集成行向量,进入步骤B3;步骤B3:将3个长度为P的风速集成行向量作为行向量组成3*P维数的矩阵;依次将3*P维数的矩阵中每个长度为3的列向量作为输入数据,风速模型筛选样本B中对应时刻的风速值作为输出数据,训练小波神经网络,得到基于小波神经网络的风速预测归一模型;所述风速预测归一模型中的小波神经网络在训练时设置输入层节点个数为3,隐含层节点个数为6,输出层节点个数为1,最大迭代次数设置为500,训练学习率为0.02,阈值为0.05;步骤8:实时预测风速;设置和步骤1中原始风速数据集相同的采样时间间隔,通过测风站实时采集获取当前以及近期风速,获取长度至少为200的原始风速时间序列向量,然后进行实时预测风速,具体过程如下:步骤C1:设置预测风速目标时间T,进入步骤C2;步骤C2:对原始风速时间序列向量进行无迹卡尔曼滤波得到滤波后的风速时间序列向量,进入步骤C3;步骤C3:将风速时间序列向量中与目标时间T最接近的4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型,得到3个长度为10的风速特征列向量,进入步骤C4;步骤C4:依次将3个长度为10的风速特征列向量输入至对应的风速预测集成模型,得到3个风速集成值,进入步骤C5;步骤C5:将3个风速集成值作为输入数据,输入至风速预测归一模型,得到风速归一值,进入步骤C6;步骤C6:判断风速归一值所在时刻是否超过设置的预测风速目标时间T,若是,进入步骤C8,否则,进入步骤C7;步骤C7:将步骤C5得到的风速归一值按时间顺序插入到风速时间序列向量中,更新风速时间序列向量,返回步骤C3;步骤C8:计算风速时间序列向量中与目标时间T最接近的100个时刻风速值组成的向量与步骤2中的风速数据集w′t中任意时间连续的100个风速值组成的向量之间的皮尔逊相关系数,得到皮尔逊相关系数矩阵,找到皮尔逊相关系数最高的100个风速数据集中的风速值组成的向量,将其对应时刻的风速噪声集not中100个连续噪声附加到风速时间序列向量中与目标时间T最接近的最近100个时刻风速值中,还原风速真实性,完成目标时间的实时风速预测。以上所述仅是本发明技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

权利要求:1.一种铁路和风电场环境风速机器学习预测方法,其特征在于,包括以下步骤:步骤1:建立测风站获取原始风速数据;在铁路沿线或风电场待测风点设置测风站,设置指定采样时间间隔,采集原始风速数据集;所述原始风速数据集为时间序列集,且包含Q个采样时刻的风速,所述Q至少大于500;步骤2:构建风速模型训练样本和风速模型筛选样本;使用无迹卡尔曼方程对原始风速数据集进行滤波,得到处理后的风速数据集和风速噪声集;将风速数据集按照时间连续滚动规则分为多个长度为5的风速训练向量;其中12时间连续的风速训练向量组成风速模型训练样本,剩余12时间连续的风速训练向量组成风速模型筛选样本;步骤3:选择N种不同神经网络,对每种神经网络的参数随机设置100种不同取值,构建N种基于神经网络的风速预测特征预选模型组;依次将风速模型训练样本中所有风速训练向量内前4个时刻的风速值作为输入数据,第5个时刻的风速值作为输出数据,训练N种神经网络,每种神经网络的参数取100种不同取值,得到N种基于神经网络的风速预测特征预选模型组,每种神经网络的风速预测特征预选模型组包括100个基于相同神经网络的风速预测特征预选模型;所述风速预测特征预选模型输出值命名为风速特征预选值;步骤4:基于均方误差分析和相关性分析模型筛选方法,将每种100个基于相同神经网络的风速预测特征预选模型筛选至10个,筛选后的模型命名为风速预测特征模型,得到N种基于神经网络的风速预测特征模型组,每种神经网络的风速预测特征模型组包括10个基于相同神经网络的风速预测特征模型;所述风速预测特征模型输出值命名为风速特征值;步骤5:基于风速模型训练样本和风速模型筛选样本输入至10*N个风速预测特征模型得到的输出数据,构建针对N种神经网络的N个风速预测集成模型训练样本;依次将风速模型训练样本和风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型中,获得每个风速预测特征模型输出的第5个时刻的风速特征值;利用每种基于相同神经网络的10个风速预测特征模型每次共输出10个风速特征值组成风速特征列向量,所有风速特征列向量组成10*M维数的矩阵,N种基于神经网络的风速预测特征模型组共得到N个10*M维数的矩阵;将所述N个10*M维数的矩阵定义为针对N种神经网络的N个风速预测集成模型训练样本;其中,M为风速预测特征模型运行次数;步骤6:将步骤5得到的针对N种神经网络的N个风速预测集成模型训练样本中长度为10的风速特征列向量作为输入数据,风速模型训练样本和风速模型筛选样本中对应时刻的风速值作为输出数据,分别训练N个灰色神经网络,得到N个基于灰色神经网络的风速预测集成模型;所述风速预测集成模型输出值命名为风速集成值;步骤7:构建风速预测归一模型;所述构建风速预测归一模型具体过程如下:步骤B1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,分别输入到所有的风速预测特征模型,得到针对N种神经网络的N个10*P维数的矩阵,其中P为风速预测特征模型运行次数,进入步骤B2;步骤B2:依次将步骤B1得到的N个10*P维数的矩阵中每个长度为10的列向量作为输入数据,输入至对应神经网络的N个风速预测集成模型,输出得到N个长度为P的风速集成行向量,进入步骤B3;步骤B3:将N个长度为P的风速集成行向量作为行向量组成N*P维数的矩阵;依次将N*P维数的矩阵中每个长度为N的列向量作为输入数据,风速模型筛选样本中对应时刻的风速值作为输出数据,训练小波神经网络,得到基于小波神经网络的风速预测归一模型;所述风速预测归一模型中的小波神经网络在训练时设置输入层节点个数为N,隐含层节点个数为2*N,输出层节点个数为1,最大迭代次数设置为500,训练学习率为0.02,阈值为0.05;步骤8:实时预测风速;设置和步骤1中原始风速数据集相同的采样时间间隔,通过测风站实时采集获取当前以及近期风速,获取长度至少为200的原始风速时间序列向量,然后进行实时预测风速,具体过程如下:步骤C1:设置预测风速目标时间T,进入步骤C2;步骤C2:对原始风速时间序列向量进行无迹卡尔曼滤波得到滤波后的风速时间序列向量,进入步骤C3;步骤C3:将风速时间序列向量中与目标时间T最接近的4个时刻的风速值作为输入数据,分别输入至所有风速预测特征模型,得到N个长度为10的风速特征列向量,进入步骤C4;步骤C4:依次将N个长度为10的风速特征列向量输入至对应的风速预测集成模型,得到N个风速集成值,进入步骤C5;步骤C5:将N个风速集成值作为输入数据,输入至风速预测归一模型,得到风速归一值,进入步骤C6;步骤C6:判断风速归一值所在时刻是否超过设置的预测风速目标时间T,若是,进入步骤C8,否则,进入步骤C7;步骤C7:将步骤C5得到的风速归一值按时间顺序插入到风速时间序列向量中,更新风速时间序列向量,返回步骤C3;步骤C8:计算风速时间序列向量中与目标时间T最接近的100个时刻风速值组成的向量与步骤2中的风速数据集任意时间连续的100个风速值组成的向量之间的皮尔逊相关系数,得到皮尔逊相关系数矩阵,找到皮尔逊相关系数最高的100个风速数据集中的风速值组成的向量,将其对应时刻的风速噪声集中100个连续噪声附加到风速时间序列向量中与目标时间T最接近的100个时刻风速值中,获得目标时间的实时风速预测值。2.根据权利要求1所述的方法,其特征在于,所述时间连续滚动规则指的是时间序列数据中为每个时刻代表的数据都将作为一次分解向量的开始值,取连续5个时刻的风速值作为一个风速训练向量。3.根据权利要求1所述的方法,其特征在于,所述N种基于神经网络的风速预测特征预选模型组至少包括:基于Elman神经网络的风速预测特征预选模型组、基于BP神经网络的风速预测特征预选模型组和基于小波神经网络的风速预测特征预选模型组。4.根据权利要求3所述的方法,其特征在于:所述基于Elman神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的Elman神经网络在训练时设置输入层节点个数为3,隐含层节点个数为7,输出层节点个数为2,承接层节点个数为7;隐含层函数采用Sigmoid函数,最大迭代次数设置为900,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];所述基于BP神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的BP神经网络在训练时设置输入层节点个数为3,隐含层节点个数取值范围为[5,10],输出层节点个数为2,最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1];所述基于小波神经网络的风速预测特征预选模型组内的所有风速预测特征预选模型中的小波神经网络在训练时输入层节点个数为3,隐含层小波元个数取值范围为[5,10],输出层节点个数为2;隐层小波神经元采用MexicanHat小波函数,输出层节点采用Sigmoid函数,训练过程中的最大迭代次数设置为800,训练学习率取值范围为[0.001,0.05],阈值取值范围为[0.001,0.1]。5.根据权利要求1所述的方法,其特征在于,所述均方误差分析和相关性分析模型筛选方法具体过程如下:步骤A1:依次将风速模型筛选样本中所有风速训练向量内前4个时刻的风速值作为输入数据,输入到所有的风速预测特征预选模型,输出第5个时刻的风速特征预选值,进入步骤A2;步骤A2:将每个风速预测特征预选模型输出的风速特征预选值按时间次序排列作为风速特征预选向量,进入步骤A3;步骤A3:计算每个模型的风速特征预选向量与风速模型筛选样本中对应风速值时间序列向量的均方误差,N种基于神经网络的风速预测特征预选模型组内分别淘汰均方误差较大的风速预测特征预选模型30个,即剩余共70*N个风速预测特征预选模型,进入步骤A4;步骤A4:分别计算N种基于神经网络的风速预测特征预选模型组内剩余的70个风速预测特征预选模型输出的风速特征预选向量两两之间的皮尔逊相关性系数,得到N个皮尔逊相关性系数矩阵,进入步骤A5;步骤A5:分别计算N种基于神经网络的风速预测特征预选模型组内每个风速预测特征预选模型输出的风速特征预选向量与其他模型输出的风速特征预选向量之间的皮尔逊相关系数的累加值,逐步淘汰皮尔逊相关系数累加值最大的模型,直到N种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,进入步骤A6;步骤A6:每种基于神经网络的风速预测特征预选模型组内均剩余10个风速预测特征预选模型,命名为风速预测特征模型,将N种基于神经网络的风速预测特征预选模型组重新命名为N种基于神经网络的风速预测特征模型组。6.根据权利要求1所述的方法,其特征在于,所述N个基于灰色神经网络的风速预测集成模型在训练时均设置输入层节点个数为10,隐含层节点个数为20,输出层节点个数为1,最大迭代次数设置为800,训练学习率为0.01,阈值为0.001。

百度查询: 中南大学 一种铁路和风电场环境风速机器学习预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。