【发明授权】基于无限混合高斯和样条回归的风电功率曲线拟合方法_天津大学_201810023362.0

导航：龙图腾网> 最新专利技术> 基于无限混合高斯和样条回归的风电功率曲线拟合方法_天津大学_201810023362.0

申请/专利权人：天津大学

申请日：2018-01-10

公开（公告）日：2020-10-09

公开（公告）号：CN108090323B

主分类号：G06F30/27(20200101)

分类号：G06F30/27(20200101);G06Q50/06(20120101)

优先权：

专利状态码：有效-授权

法律状态：2020.10.09#授权;2018.06.22#实质审查的生效;2018.05.29#公开

摘要：本发明公开了一种基于无限混合高斯和样条回归的风电功率曲线拟合方法，包括进行数据预处理、构造鲁棒的样条回归模型、利用变分贝叶斯优化鲁棒的样条回归模型、得出功率曲线以及概率功率曲线的步骤，本发明的风电功率曲线拟合方法只需要设置一些初始化参数，方法简单，能够容忍训练数据中存在一些非一致样本，精度高、误差小，可以进一步提高风电预报的精度。

主权项：1.一种基于无限混合高斯和样条回归的风电功率曲线拟合方法，其特征在于，包括以下步骤：1数据预处理：根据实际的风速和功率数据画出经验功率曲线，然后将明显的异常数据去除，处理后的样本表示为所述的xi，yi分别表示风速和功率值，N表示训练样本的长度；2构造鲁棒的样条回归模型：构造鲁棒样条回归模型yi＝Zixiβ+ei，所述的Zixi表示根据样条基计算出的输入向量，β表示回归系数，ei表示服从无限混合高斯模型的回归误差：所述的表示第k个高斯分布的方差；所述的回归系数β服从一个高斯分布；所述的πk表示第k个高斯分布的权值，且πk是关于的一个函数，表示为所述的参数是一个变量，满足一个参数为v的Beta分布超参数v为满足参数为e0、f0的Gamma分布，ν＝Gammaν|e0，f0，所述的e0、f0的初始值设置为0.0001并根据变分贝叶斯得到的参数的后验分布来更新e0、f0的值；3利用变分贝叶斯优化鲁棒的样条回归模型：根据步骤2中对鲁棒样条回归模型中各个参数的先验分布，构造最终的似然函数：所述p·是变量的概率分布；令根据变分贝叶斯的原理，求出鲁棒样条回归模型中的所有参数的后验分布，所述的·是期望运算；4得出功率曲线以及概率功率曲线：根据步骤3得到的参数的后验分布，给定一个新样本x*，y*，所述x*、y*分别表示未知风速值和待预测的真实功率，通过下式来推断y*的概率分布：所述μβ、Σβ分别表示参数β的后验分布中的期望和方差，Z*表示的是根据样条基计算的与风速x*相对应的输入向量，y*的预测分布是混合高斯模型，所述的Z*μβ是y*的点预测值；根据y＝Zxμβ得到预测的功率曲线；根据每个预测值所相应的概率分布，求出相应的概率功率曲线。

全文数据：基于无限混合高斯和样条回归的风电功率曲线拟合方法技术领域[0001]本发明涉及新能源领域和机器学习领域，特别涉及一种基于无限混合高斯和样条回归的风电功率曲线拟合方法。背景技术[0002]当前，随着全球的能源危机的出现以及使用传统能源如煤，石油等带来的日趋严峻的环境问题，找到替代原有的传统能源的任务越来越紧迫。风电作为一种清洁、可再生的能源受到了越来越多的关注。大规模的风电并网将会在一定程度上缓解能源危机，并且能带来经济效益和减少缓解污染。然而，由于风电本身的随机性和间歇性，从而导致在大规模风电并网后对整个电力系统的完全性和稳定性产生巨大影响。因此，从风电并网的角度来说，准确的功率预报是很有必要的，此外还可以减少电力系统的运行成本。[0003]由于风速和功率之间的关系可以用功率曲线来表示。因此风电预报常用两步法，第一步先得到风速的预报值，第二步是利用功率曲线得到功率的预报。通常情况下，功率曲线是由风机的生产厂商提供的。然而，该功率曲线是一条理论的功率曲线，没有考虑环境等因素如气温和湿度等）的影响。在实际中，随着地理环境和气候的不同，实际功率曲线会产生变化。因此，直接利用理论功率曲线来实现功率预报会带来额外的预报误差。因此，很多学者也研究如何去得到一个准确的实际功率曲线来进一步提高风电预报的精度。除此以夕卜，准确的功率曲线还能够在线监测风机的运行状态和减少风机的运行和维护成本等。[0004]目前，可以将风电功率曲线建模技术分成两大类：参数模型和非参数模型。一般地，参数模型主要由带有几个参数的数学表达式构成，主要包括线性分割法、多项式功率曲线、理想功率曲线、概率模型、动态功率曲线、4参数、5参数logistics模型以及修正的双曲正切模型等。对于多项式模型而言，常用三次功率曲线、二次功率曲线、6阶以及9阶多项式模型来拟合功率曲线。参数模型的缺点是在描述功率曲线的动态特性上其性能有限。与参数模型不同，非参数模型不需要利用一些数学表达式也不需要对功率曲线的形状有先验知识，仅仅利用历史的功率以及风速数据就可以拟合出各种各样的功率曲线。非参数模型主要包括样条回归，人工神经网络法，模糊法和一些数据挖掘的方法如支持向量机，随机森林和K近邻等。尽管非参数模型比参数模型灵活，但是其计算量也相对较大。[0005]除了功率曲线的建模方法外，另一个影响我们获得一个精确的功率曲线的因素是数据的质量。然而，在实际中，获得的风速与功率的数据中经常会存在很多不一致的样本。造成以上现象的原因包括传感器误差、停机维护、弃风限电以及环境因素如结冰等。不一致样本的特性是在给定一个风速，真实的功率数据远离功率曲线。为了提高数据的质量，通常用提前去除这些不一致样本，然后再利用处理后的数据构建功率曲线模型。然而，此类方法的缺陷在于我们无法保证所有的不一致样本都能被检测到。[0006]在数据中存在一些非一致样本时，由于实际功率与功率曲线上的功率距离较远，因此此处的误差较大，误差分布呈现出非高斯特性，具有长尾现象。此种情况下高斯分布很难描述以上特性的误差分布。然而，当前的一些模型如样条回归、多项式模型等都假设误差服从高斯分布，在训练数据中存在一些非一致样本时，真实的误差分布特性与假设的误差分布之间并不一致。因次，在存在非一致样本的情况下，假设误差服从高斯分布的功率曲线模型并不合适。发明内容[0007]本发明的目的是解决现有风电功率曲线的精度较低误差较大的技术问题，本发明提供一种基于无限混合高斯和样条回归的风电功率曲线拟合方法。[0008]本发明解决技术问题采用如下技术方案：[0009]—种基于无限混合高斯和样条回归的风电功率曲线拟合方法，包括以下步骤：[0010]1数据预处理：[0011]根据实际的风速和功率数据画出经验功率曲线，然后将明显的异常数据去除，处理后的样本表示为，，所述的Xl，yi分别表示风速和功率值，N表示训练样本的长度；[0012]2构造鲁棒的样条回归模型：[0013]构造鲁棒样条回归模型yi=ZiXiβ+ei，所述的ZiXi表示根据样条基计算出的输入向量，β表示回归系数，ei表示服从无限混合高斯模型的回归误差：[0014][0015]所述的s表示第k个高斯分布的方差;所述的回归系数β服从一个高斯分布;所述的:表不第k个高斯分布的权值'，且3¾是关于的一个函数，表不为[0016][0017]所述的参数是一个变量，满足一个参数为V的Beta分布_,超参数V为满足参数为eo、fo的Gamma分布，V=GammaVIeo，fo，所述的eo、fo的初始值设置为0.0001并根据变分贝叶斯得到的参数的后验分布来更新eQ、fQ的值；[0018]3利用变分贝叶斯优化鲁棒的样条回归模型：[0019]根据步骤2中对鲁棒样条回归模型中各个参数的先验分布，构造最终的似然函数:PR，0，W，P，τ，νIY，z=PYIR，Z，P，τPτpR|WPβ|ppPpwIVpV，所述P·是变量的概率分布；[0020]令©=出，队¥^，1，¥}，根据变分贝叶斯的原理，求出鲁棒样条回归模型中的所有参数的后验分布，[0021][0022]所述的〈·是期望运算；[0023]4得出功率曲线以及概率功率曲线：[0024]根据步骤3得到的参数的后验分布，给定一个新样本x'y，，所述X'，分别表示未知风速值和待预测的真实功率，通过下式来推断的概率分布：[0025][0026]所述μρ,Σρ分别表示参数邱勺后验分布中的期望和方差，表示的是根据样条基计算的与风速相对应的输入向量，f的预测分布是混合高斯模型，所述的2%是的点预测值；[0027]根据y=ZX以^得到预测的功率曲线；[0028]根据每个预测值所相应的概率分布，求出相应的概率功率曲线。[0029]本发明具有如下有益效果:本发明的风电功率曲线拟合方法由于采用了无限混合高斯分布，理论上能拟合任意复杂的分布，因此能够容忍训练数据中存在一些非一致样本，而无需采用一些其他的算法将非一致样本全部去除;采用变分贝叶斯的优化方法，不仅能得到确定的功率曲线，也可以得到概率功率曲线，进而可以利用概率功率曲线去识别出数据中的非一致样本;本发明的风电功率曲线拟合方法只需要设置一些初始化参数即可，没有任何待优化的参数，方法简单、精度高、误差小，可进一步提高风电预报的精度。附图说明[0030]图1为本发明基于无限混合高斯和样条回归的风电功率曲线拟合方法的流程图；[0031]图2为本发明实施例中的原始的风速与功率数据；[0032]图3为本发明实施例中不同模型得到的数据集C的功率曲线图；[0033]图4为本发明实施例中不同数据集的概率功率曲线。具体实施方式[0034]下面结合实施方式和实施例对本发明的技术方案作进一步阐述。[0035]具体实施方式:本实施方式是一种基于无限混合高斯和样条回归的风电功率曲线拟合方法，如图1所示，具体步骤如下：[0036]1数据预处理：[0037]根据实际的风速和功率数据画出经验功率曲线，然后将明显的异常数据去除，处理后的样本表示为，所述的^^:分别表示风速和功率值，N表示训练样本的长度；[0038]2构造鲁棒的样条回归模型：[0039]构造鲁棒样条回归模型yi=ZiXiβ+ei，所述的ZiXi表示根据样条基计算出的输入向量，β表示回归系数，ei表示服从无限混合高斯模型的回归误差：[0040][0041]所述的表示第k个高斯分布的方差;所述的回归系数β服从一个高斯分布;所述的：表不第k个高斯分布的权值，，且3¾是关于的一个函数，表不为[0042][0043]所述的参数是一个变量，满足一个参数为V的Beta分布：，超参数V为满足参数为eo、fo的Gamma分布，V=GammavIeo，fo，所述的eo、fo的初始值设置为0.0001并根据变分贝叶斯得到的参数的后验分布来更新eQ、fQ的值；[0044]3利用变分贝叶斯优化鲁棒的样条回归模型：[0045]根据步骤2中对鲁棒样条回归模型中各个参数的先验分布，构造最终的似然函数:PR，0，W，P，τ，νIY，z=PYIR，Z，P，τPτpR|WPβ|ppPpwIVpV，所述P·是变量的概率分布；[0046]令©=出，队¥^，1，¥}，根据变分贝叶斯的原理，求出鲁棒样条回归模型中的所有参数的后验分布，[0047][0048]所述的〈·是期望运算；[0049]4得出功率曲线以及概率功率曲线：[0050]根据步骤3得到的参数的后验分布，给定一个新样本x'y，，所述χ'γ分别表示未知风速值和待预测的真实功率，通过下式来推断的概率分布：[0051][0052]所述μρ,Σρ分别表示参数邱勺后验分布中的期望和方差，表示的是根据样条基计算的与风速相对应的输入向量，f的预测分布是混合高斯模型，所述的2%是的点预测值；[0053]根据y=ZX以^得到预测的功率曲线；[0054]根据每个预测值所相应的概率分布，求出相应的概率功率曲线。[0055]下面通过具体实施例，对本发明做进一步详细说明，应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。[0056]实施例采用以下三个数据集:数据集A来自于宁夏风电场，其中包含10000对样本风速S和相应的风功率P。在进行实验之前，我们将数据集分成2部分，前8000个样本作为训练样本，剩余的2000个样本作为测试样本。另外两个数据集B和C是来自同一风电场的两个不同风机上的数据。数据集B中包含6000对样本，其中前5000作为训练样本，剩余的1000样本作为测试样本。数据集C中包含7500对样本，前6000作为训练样本，剩余的1500样本作为测试样本。以上三个数据集的的样本采样频率为l〇min，原始风速和功率数据如图2所示。[0057]在实际中，为了降低非一致样本对功率曲线建模的影响，通常情况下需要将这些非一致样本点剔除。然而，由于当前用于识别非一致样本的算法能力限制，我们并不能确保所有的非一致样本点都能剔除。为了模拟此种情况，我们首先采用简单的方法剔除原始数据中的非一致样本点。[0058]在数据集A中，风速大于10ms且功率小于HOOOkW时的样本被认为是非一致样本，且直接去除。在数据集B中，当风速大于6ms且功率小于50kW的样本，风速大于13ms功率小于700kW的样本，都被视为非一致样本且被去除。在数据集C中，风速大于6ms功率小于50，风速大于12ms功率小于600kW中的样本被去除。上述简单的方法只能去除较为明显的非一致样本，因此处理后的数据中仍然存在一些异常点。[0059]为了说明本发明所提出的方法的有效性，我们对比以下功率曲线拟合方法常用的模型：四种参数模型（4参数logistic模型、5参数logistic模型、6阶和9阶多项式回归模型），一个非参数模型样条回归模型和两个基于学习的模型神经网络法和支持向量机）。为了表述方便，上述对比模型分别简写为4-?1^、5-?1^、6-?1«1、9-?1«1、51«^顺和3¥]\1。本发明采用的模型简写为RSRM。为了定量的刻画各个模型的性能，一般采用以下两个指标，即平均绝对误差MAE和均方根误差RMSE，计算公式为[0060][0061]其中yi，分别表示为真实的功率和预测的功率。[0062]本发明所提出的基于鲁棒回归模型的功率曲线拟合方法能容忍一些非一致样本点在样本中。不同模型的功率曲线拟合方法的拟合结果如表1所示，利用不同模型的功率曲线方法得到的数据集C的功率曲线如图3所示。[0063]表1基于各种模型的功率曲线拟合方法的性能对比[0064][0065]从表1可以看出，四个参数模型的性能较为有限，两个基于学习的模型MU^PSVM的性能大体上要优于参数模型。本发明所提出的方法RSRM在数据中存在非一致样本时得到的功率曲线要好于参数模型和基于学习的模型。从图3也可以看到RSRM的功率曲线能够更好的拟合原始的功率数据。[0066]本发明提出的方法不仅能提供确定性的功率曲线，也能够提供概率功率曲线。我们可以利用概率功率曲线去识别原始数据中的非一致样本点。用前面所述的简单方法从数据集A、B和C中识别出的非一致样本点分别为144、309和931个。在95%的置信度下，用本发明提出的方法能从数据集A、B和C中识别出445、401和1102个非一致样本，如图4中不同数据集的概率功率曲线所示。从上述结果可以看出，本发明提出的方法能够识别出更多的非一致样本。[0067]最后应说明的是：以上实施方式和实施例仅用以说明本发明的技术方案，而非对其限制;尽管参照前述实施方式和实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可以对前述实施方式和实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明实施方式和实施例技术方案的精神和范围。

权利要求：1.一种基于无限混合高斯和样条回归的风电功率曲线拟合方法，其特征在于，包括以下步骤：1数据预处理：根据实际的风速和功率数据画出经验功率曲线，然后将明显的异常数据去除，处理后的样本表示为，所述的^^:分别表示风速和功率值，N表示训练样本的长度；2构造鲁棒的样条回归模型：构造鲁棒样条回归模型yi=ZiXiβ+ei，所述的ZiXi表示根据样条基计算出的输入向量，β表示回归系数，ei表示服从无限混合高斯模型的回归误差：所述的表示第k个高斯分布的方差;所述的回归系数β服从一个高斯分布;所述的Jik表不第k个高斯分布的权值，且:是关于的一个函数，表不为所述的参数_是一个变量，满足一个参数为V的Beta分布：超参数V为满足参数为eo、fο的Gamma分布，V=GammaIvIeo，fo，所述的eo、fο的初始值设置为0.0001并根据变分贝叶斯得到的参数的后验分布来更新eQ、fo的值；3利用变分贝叶斯优化鲁棒的样条回归模型：根据步骤2中对鲁棒样条回归模型中各个参数的先验分布，构造最终的似然函数:pR，0，w，p，t，vIY，Z=pY|R，Z，P，tpτpR|wpβ|ppPpw|VpV，所述p·是变量的概率分布；令Θ={R，i3，w，p，T，v}，根据变分贝叶斯的原理，求出鲁棒样条回归模型中的所有参数的后验分布，所述的〈·是期望运算；4得出功率曲线以及概率功率曲线：根据步骤3得到的参数的后验分布，给定一个新样本X%，），所述X'，分别表示未知风速值和待预测的真实功率，通过下式来推断的概率分布：所述μρ,Σβ分别表示参数β的后验分布中的期望和方差，表示的是根据样条基计算的与风速相对应的输入向量，的预测分布是混合高斯模型，所述的^^是的点预测值；根据y=ZX以4导到预测的功率曲线；根据每个预测值所相应的概率分布，求出相应的概率功率曲线。

百度查询：天津大学基于无限混合高斯和样条回归的风电功率曲线拟合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于磁声非线性相互作用的自旋波频率梳_电子科技大学_202410002762.9

下一篇：一种弯管结构模块化设计方法和系统_浙江阿斯克建材科技股份有限公司_202311873791.4

相关技术

基于磁声非线性相互作用的自旋波频率梳_电子科技大学_202410002762.9

一种弯管结构模块化设计方法和系统_浙江阿斯克建材科技股份有限公司_202311873791.4

一种工业蒸汽清洗设备及清洗方法_宁波荣宜达电器有限公司_202410023612.6

电荷泵电路_思瑞浦微电子科技(上海)有限责任公司_202311870614.0

标签融合方法、装置、电子设备以及存储介质_北京沃东天骏信息技术有限公司_202211175842.1

一次粒子有序排列的四氧化三钴及其制备方法和应用_厦门厦钨新能源材料股份有限公司_202311873287.4

高通量卫星指向测量方法及业务波束标校系统_中国空间技术研究院_202410002384.4

蓄电系统_本田技研工业株式会社_202311254988.X

一种国土空间规划用地理信息勘测采集设备_武汉永业赛博能规划勘测有限公司_202410226338.2

一种脚本代码生成方法、装置及相关设备_星际控股集团有限公司_202311848813.1

巡检动画生成方法、装置、计算机设备及存储介质_浙江中控信息产业股份有限公司_202410004969.X

一种基于国产MCU的嵌入式软件功能验证装置及验证方法_西安超越申泰信息科技有限公司_202311849257.X

风相关技术

风电叶片安装方法及风电叶片_株洲时代新材料科技股份有限公司_202410008000.X

燃气配风器_烟台龙源电力技术股份有限公司_201710983333.4

风电臂安装方法_山西电建华鼎机械工程有限公司_202311854501.1

排风防进水器_昆山华莞绅喷砂机械设备有限公司_202321717336.0

一种风筒发热架及风筒发热架的装配方法_深圳市奋达科技股份有限公司_201910008227.3

一种出风结构、出风结构的控制方法和空调器_珠海格力电器股份有限公司_202311710484.4

集风式风扇的改良结构_萨摩亚商晋锋国际科技股份有限公司台湾分公司_202321839192.6

风电主变高效事故油池_中国电建集团核电工程有限公司_202322110858.0

MEMS麦克风及其制备方法_瑶芯微电子科技(上海)有限公司_202210418883.2

双风幕冷藏展示柜_浙江星星冷链集成股份有限公司_201910349782.2

电功率相关技术

用于智能设备的充电功率自适应调整方法_深圳市鸿达顺科技开发有限公司_202410032475.2

一种基于时空相关性的短期风电功率预测方法_南京师范大学_202410235440.9

储能设备的充放电功率分配方法、装置、设备和存储介质_宁德时代新能源科技股份有限公司_202410224312.4

一种降低电机用电功率的节电设备_新疆菏合环保科技有限公司_202322311850.0

一种分布式光伏发电功率预测方法、系统、设备及介质_国家电网有限公司_202311863688.1

一种分解平抑风电功率波动混合储能系统控制方法及系统_国网甘肃省电力公司电力科学研究院_202311311740.2

一种基于板温和倾斜角的光伏发电功率计算方法及系统_中国电力科学研究院有限公司_202311658486.3

激光功率监测装置及高功率激光器_西安炬光科技股份有限公司_202322490088.7

功率单元、功率箱及变频器_西门子(上海)电气传动设备有限公司_202321656629.2

功率放大电路_株式会社村田制作所_202190000735.8

回归相关技术

逻辑回归模型的可视化解释方法及装置_第四范式(北京)技术有限公司_202110336353.9

一种融合深度学习和分位数回归的风速区间预测方法_天津大学_201910995994.8

基于目标检测和热图回归的宫颈念珠菌感染筛查方法_江苏迪赛特医疗科技有限公司_202210908698.1

一种基于孪生网络核回归的侵入式脑机接口解码方法_浙江大学_202110890264.9

一种救生伞动态开伞仿真数据多元回归与拟合的方法、装置及终端_湖北文理学院_202211246589.4

高斯过程回归模型多扩展目标PMBM跟踪方法_兰州理工大学_202311803816.3

回归测试方法、电子设备及存储介质_上海概伦电子股份有限公司_202311827027.3

一种基于线性回归的燃料电池算法_北京大华无线电仪器有限责任公司_202311656457.3

回归测试的用例生成方法、装置、介质及设备_广州高新兴机器人有限公司_202311838787.4

基于向量自回归水煤比寻优直流炉给水控制方法及系统_中国大唐集团科学技术研究院有限公司西北电力试验研究院_202210192664.7

龙图腾网&IPTOP

【发明授权】基于无限混合高斯和样条回归的风电功率曲线拟合方法_天津大学_201810023362.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务