买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于田纳西伊斯曼过程的先验知识故障诊断方法_东北大学_201710284568.4 

申请/专利权人:东北大学

申请日:2017-04-25

公开(公告)日:2017-09-05

公开(公告)号:CN107133642A

主分类号:G06K9/62(2006.01)I

分类号:G06K9/62(2006.01)I

优先权:

专利状态码:失效-发明专利申请公布后的撤回

法律状态:2020.05.05#发明专利申请公布后的撤回;2017.09.29#实质审查的生效;2017.09.05#公开

摘要:本发明涉及一种基于田纳西伊斯曼过程的先验知识故障诊断方法,步骤为:采集田纳西伊斯曼过程的离线历史数据;选择调节参数矩阵U∈Rn×n和KNN算法中的k;在已有的加权无向图上构建邻接矩阵W,在此基础上算出矩阵D,定义拉普拉斯矩阵L=D‑W,根据拉普拉斯正则化算法,计算拉普拉斯正则项根据局部正则化算法,计算局部正则项I‑ATI‑A,;根据计算标签矩阵;根据来标记未标记样本,归一化后得到工业过程的故障分类信息。本发明充分挖掘和利用标记样本和未标记样本特征信息建立故障诊断模型,用田纳西伊斯曼过程数据进行验证,其中在最后分类阶段,对分类器进行了改进,提高了分类的精度,同时对样本的错分率及样本分离度等验证标准都有所改进。

主权项:一种基于田纳西伊斯曼过程的先验知识故障诊断方法,其特征在于包括以下步骤:1采集田纳西伊斯曼过程的离线历史数据X=[x1,x2,...,xl,xl+1,...,xn]∈Rm×n,其中xii=1,2,...,l为已经通过专家先验知识标记的数据,xii=l+1,l+2,...,n是未标记数据,l为已标记故障状态类别的数目,n为历史数据故障状态类别的总数目;初始化矩阵Y∈Rn×c,其中c表示故障状态类别,Rm×n、Rn×c均代表数据规模大小;2选择调节参数矩阵U∈Rn×n和KNN算法中的k;其中,U∈Rn×n表示对角阵,k为近邻样本个数;3在已有的加权无向图上构建邻接矩阵W,在此基础上算出矩阵D,定义拉普拉斯矩阵L=D‑W,根据拉普拉斯正则化算法,计算拉普拉斯正则项4根据局部正则化算法,计算局部正则项I‑ATI‑A,其中,I为n×n的单位矩阵,A为参数矩阵;5根据计算标签矩阵,为对角阵;6根据来标记未标记样本,归一化后得到工业过程的故障分类信息,fi为使得F最大的最优输出,为标签矩阵F中的元素,i为从1到n的任意数,j为故障的种类,取值从1~c,c为故障种类数目。

全文数据:一种基于田纳西伊斯曼过程的先验知识故障诊断方法技术领域[0001]本发明涉及一种故障检测与诊断技术,具体地说是一种基于田纳西伊斯曼过程的先验知识故障诊断方法。背景技术[0002]基于图的半监督分类算法是先验知识学习中应用最多的一类算法。通过对数据集中所有样本包括有标记样本和无标记样本转化成一个定义了代表样本的结点和代表结点之间权值的边的连通加权无向图。结点与结点的边代表了两个样本间的某种关系,称之为相似性。最后在连通加权无向图中进行训练。这里指出,这类算法只对具有一定规律的样本有效,可以实现有标记样本对整个数据集的样本分布预测。如果整个数据集的样本是杂乱无章的,那么有标记样本就算再多对样本的分类也不会有什么效果。如果给的数据毫无规律,那么标记样本在总样本中的比重再大也没有用,分类没有意义效果也不会好。[0003]已知训练样本[0004]T={xi,yi,...xi,yj,...xi,yi}U{χι+ι,..,xn}[0005]其中:XieRd,i=l,...,n表示输入数据,对于二类故障问题来说,yiG{-1,+1},i=1,...,1;对于多类故障问题来说,yie{1,2,...,c},i=l,...,1。其中c表示故障状态类另|J,然后基于这个方法识别与输入xi+1,...,χη对应的故障状态类别yi+1,...,yn。[0006]基于图的半监督学习算法通过在加权无向图上估计出一个函数f,要求该函数需要满足以下两个条件:(1策函数需要与有标记的样本的实际标记相近,能够在一定程度上表现有标记样本的分布;(2策函数需要在样本分布的无向加权图上光滑。[0007]在设计一个二分类问题决策函数的过程中,可能遇到划分曲线虽然充分考虑了训练集上的有标记样本,却未考虑决策函数的泛化能力。在训练集中可以有效的将两类有标记的样本分开,但用于对测试集进行分类是出现了错误分类。[0008]为了解决之前考虑的问题,即在设计决策函数时单单考虑经验损失会带来过拟合的问题,需要在决策函数中加入合适的正则项使其具有一定的泛化能力。因而基于图的半监督学习算法就转化成了一个正则化问题。[0009]基于图的半监督学习算法的正则化问题可以总结为下面的数学问题:[0010][0011]其中:f表示实值函数,H表示Hibert空间,目标函数丨表示经验损失,列表示正则项,V是调整系数。因而基于图的半监督学习算法的正则化问题就转化成了一个求解最优解的问题。[0012]基于图的半监督学习算法有很多,Belkin等人首次提出一种基于全局的流行正则化方法来学习未标记样本的类标记的学习算法。朱晓进等人提出的基于图的拉普拉斯正则化方法,通过学习高斯场和谐波函数来实现半监督学习。通过聚类假设定义能量函数,之后在加权无向图上求解最优值来标记未标记样本,此方法目前是基于图的半监督学习方法中非常重要且有效的一个方法。[0013]田纳西伊斯曼-伊斯曼过程是基于名为TenesseeEastman的化学公司的真实化学工业过程设计出来的真实化学工业过程,A、C、D、E代表四个进料气体、惰性成分B进去反应器,在相应的催化剂催化下,G、H作为生成物,F则表示副产品,整个化学反应过程是稳定的、放热的、不可逆的。冷凝器存在于反应器的内部,将反应过程中的热量传递出来,中间反应过程的生成物通过冷凝器进行冷却,并在后面的分离器中将液态和气态产物分离出来。其中气态产物以蒸汽的形式进入离心式压缩机,在其作用下循环后并最终送回反应器的进料口位置。为了避免反应的副产品以及惰性气体出现积聚现象,一部分的气态物会被排入循环流。而液态产物则会以液体的形式进入汽提塔,生成主要以A、C作为主要成分的流股,并作为气提流股,而未反应的残存物则会分离出各个组分,从汽提塔的最下面来到位于界区外的精致处理工段。此外,汽提塔最下面的生成品G、H会进行后续过程的处理,副产品和惰性气体则会在分离器中以气液分离的方法转移出系统。田纳西伊斯曼-伊斯曼过程共计有12个控制变量和41个测量变量。其中41个测量变量是由对各类浓度进行测量得到的19个成分测量值和连续测量的22个连续测量值构成的。详细的变量名称以及过程Chiang.等人给出了十分详尽的介绍,这里指出全部的过程都有高斯噪声成分。田纳西伊斯曼-伊斯曼过程仿真系统中用来作为故障诊断的数据都是来自http:brahms.scs.uiuc.edu,整个仿真数据包中的测量值是由11个控制变量值以及41个数据测量值组成的(这里未涉及反应器的搅拌速率),共计有52个变量观测值。在每一类数据包内都存在600个一组的采样训练数据和600个一组共计三组的采样含故障测试数据,各自的故障训练数据对应各自的故障测试数据,不能相互代替,否则离线建模等一系列操作的准确度都将受到影响,甚至会出现故障检测无效或者故障检测不出的问题。[0014]传统在线故障监测流程图如图1所示,局部学习思想就是每一个样本点Xi都可以由其局部邻域Ni内的样本点估计,与传统的基于解析模型的方法有别,基于知识点的方法并没有准确的解析模型要求,它是通过故障诊断领域内的专家学者在不断分析归纳基础上总结出可以作为故障诊断方法的经验来进行故障处理的方法。它能够从大方向上定性的分析实际工业过程的数据,用经验方法实现对工业故障有效迅速的检测和诊断。基于半监督学习的方法显然在实际工业过程中具有更强的适应性,如何设计更好的分类器或者提高分类器的性能成为半监督学习领域的热点问题。在过去基于知识的模型中,往往知识在构造算法模型时对其施加一个约束,比如一个拉普拉斯正则项,在过去的仿真当中往往很难获得切实有效的决策函数。发明内容[0015]针对现有技术中采用先验知识故障检测方法很难获得切实有效的决策函数等不足,本发明要解决的问题是提供一种具有更好的故障检测效果的基于田纳西伊斯曼过程的先验知识故障诊断方法。[0016]为解决上述技术问题,本发明采用的技术方案是:[0017]本发明一种基于田纳西伊斯曼过程的先验知识故障诊断方法,包括以下步骤:[0018]1采集田纳西伊斯曼过程的离线历史数据X=[X1,X2,...,X1,X1+1,...,Xn]eRmXn,其中Xii=l,2,...,1为已经通过专家先验知识标记的数据,Xii=l+l,1+2,...,n是未标记数据,1为已标记故障状态类别的数目,η为历史数据故障状态类别的总数目;初始化矩阵YeRnX%其中c表示故障状态类别,RmXn、均代表数据规模大小;[0019]2选择调节参数矩阵UGRnxn和KNN算法中的k;其中,UGRnxn表示对角阵,k为近邻样本个数;[0020]3在已有的加权无向图上构建邻接矩阵W,在此基础上算出矩阵D,定义拉普拉斯矩阵L=D-W,根据拉普拉斯正则化算法,计算拉普拉斯正则项[0021]4根据局部正则化算法,计算局部正则项(I-ATI-A,其中,I为nXn的单位矩阵,A为参数矩阵;[0022]5根据,计算标签矩阵为对角阵;[0023]6根据来标记未标记样本,归一化后得到工业过程的故障分类信息,A为使得F最大的最优输出,1¾为标签矩阵F中的元素,i为从1到η的任意数,j为故障的种类,取值从1〜c,c为故障种类数目。[0024]步骤4中,计算局部正则项(I-ATI-A为:[0025]在局部区域中,对于输入的各个Xi都对应有一个fi值,同时,在其邻域样本集上学习得到的决策函数gX也有一个输出值gX1,将二者之间的差[0026]距转化为最优化问题的正则项IIF-GlI2,其矩阵形式为:[0027][0028]其中输出函数gX借助线性形式表达为:[0029][0030]其中^£1^,1^£1?,化为11的邻域,1=1,2,...,11,它的解通过计算以下最优化问题获得:[0031][0032]其中:λ为调节系数,λ〇,权重向量WieRn,bi为R偏差项,bieR,线性形式中对于每个输入X1,要有训练数据Xht,Xj、t分别为训练数据的输入和输出;[0033]对输入Xi,i=1,2,...,η,Ni为Xi的邻域,ni代表Ni中样本个数,记作I为niXni的单位矩阵,则并且[0034][0035]由公式可知Ct1仅和X1有关,而与乜无关,将Ct1扩展成矩阵A=aijGRnxn^xpN1时,aij=aij;当ΊΛζ'时,aij=0,于是G=AF;[0036]IF-GII2=FtI-ATI-AF[0037]I为nXn的单位矩阵,(I-ATI-A即为局部正则项的正则项因子。[0038]步骤5中,根据计算标签矩阵为:通过拉格朗日函数求两次偏导求解,结果转化成局部正则化固定形式,形成可行的标签传播算法,计算出F值。[0039]本发明具有以下有益效果及优点:[0040]1.本发明方法在决策函数中加入拉普拉斯正则项的同时加入局部正则项,尽可能的利用两类约束条件的优点,使得的算法具有更好的故障检测效果,充分挖掘和利用标记样本和未标记样本特征信息建立故障诊断模型,同时用田纳西伊斯曼过程数据进行验证,其中在最后分类阶段,对分类器进行了改进,提高了分类的精度,同时对样本的错分率及样本分离度等验证标准都有所改进。附图说明[0041]图1为现有技术中基于先验知识的在线故障监测流程图;[0042]图2为本发明中半监督学习局部信息示意图;[0043]图3a为本发明具体实施方式中单一故障样本标记训练、单一故障测试样本标记百分比为5%时仿真效果图;[0044]图3b为本发明具体实施方式中单一故障样本标记训练、单一故障测试样本标记百分比为10%时仿真效果图;[0045]图3c为本发明具体实施方式中单一故障样本标记训练、单一故障测试样本标记百分比为15%时仿真效果图;[0046]图4a为本发明具体实施方式中两种故障样本标记训练、第一种故障测试样本标记百分比为5%时仿真效果图;[0047]图4b为本发明具体实施方式中两种故障样本标记训练、第一种故障测试样本标记百分比为10%时仿真效果图;[0048]图4c为本发明具体实施方式中两种故障样本标记训练、第一种故障测试样本标记百分比为15%时仿真效果图;[0049]图5a为本发明具体实施方式中两种故障样本标记训练、第二种故障测试样本标记百分比为5%时仿真效果图;[0050]图5b为本发明具体实施方式中两种故障样本标记训练、第二种故障测试样本标记百分比为10%时仿真效果图;[0051]图5c为本发明具体实施方式中两种故障样本标记训练、第二种故障测试样本标记百分比为15%时仿真效果图。具体实施方式[0052]下面结合说明书附图对本发明作进一步阐述。[0053]本发明基于田纳西伊斯曼过程的先验知识故障诊断方法包括以下步骤:[0054]1采集田纳西伊斯曼过程的离线历史数据X=[X1,X2,…,X1,X1+1,…,Xn]eRmXn,其中Xii=l,2,...,1为已经通过专家先验知识标记的数据,Xii=l+l,1+2,...,n是未标记数据,1为已标记故障状态类别的数目,η为历史数据故障状态类别的总数目;初始化矩阵YeRnX%其中c表示故障状态类别,RmXn、均代表数据规模大小;[0055]2选择调节参数矩阵UeRnxn和KNN算法中的k;其中,UeRnxn表示对角阵,k为近邻样本个数;(KNN,S卩K近邻算法。是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似即特征空间中最邻近的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。是自己取值的,取3或5,一般小于20;[0056]3在已有的加权无向图上构建邻接矩阵W,在此基础上算出矩阵D,定义拉普拉斯矩阵L=D-W,根据拉普拉斯正则化算法,计算拉普拉斯正则项][0057]4根据局部正则化算法,计算局部正则项(I-ATI-A,其中,I为nXn的单位矩阵,A为参数矩阵;[0058]在定理1的推导中,推出决策函数的输出值G=AF,进一步可得IIF-GII2=FtI-AτI-AF[0059]5根据'计算标签矩阵为对角阵;在普拉5-斯矩阵项的计算过程中,定义表示对角阵,它的对角元素,[0060]6根据来标记未标记样本,归一化后得到工业过程的故障分类信息,F为标签矩阵,表示它的其中元素,i为从1到η的任意数,j为故障的种类,取值从1〜c,c为故障种类数目。[0061]步骤1中,初始化矩阵YeRnx^Y示标签数据的标记信息,为nXc阶矩阵。初始化矩阵Y的元素定义为:[0062][0063]步骤2中,选择调节参数矩阵UeRnxn和KNN算法中的k是基于半监督学习算法的故障检测方案:[0064][0065]并定义[0066][0067]将上式改写为矩阵形式[0068][0069]其中UeRnxn表示对角阵,它们的对角元素叫表示一个正的调节参数,本步骤选择适当的调节参数矩阵UeRnxn和KNN算法中的LJF函数里面的参数U1组成的矩阵,是定义在里面的调节系数。[0070]步骤3中,在已有的加权无向图上构建邻接矩阵W,W=WijGRnxn表示一个对称半正定矩阵,Wij表示样本Xi与Xj的相似度,计算公式是[0071][0072]其中:σ2表示一个调节参数,N1表示x^k个最近邻居集合,N谦示x^k个最近邻居集合;在此基础上算出矩阵D,D表示度矩阵,是对角矩阵,对角元素[0073]最终定义拉普拉斯矩阵L=D_W,并对拉普拉斯矩阵正则化,得到拉普拉斯正则项[0074][0075]其中,!为ηXη的单位矩阵。[0076]步骤4中,如图2所示,半监督学习问题中,在局部区域,对于输入的各个X1都对应有一个fi值,同时,在其邻域样本集上学习得到的决策函数gX也有一个输出值gXi,这两个值理论上应该相近或相同。基于这一点,为了让二者之间的差距足够小,即足够小,同样将其转化为最优化问题的正则项I|F-G||2。其矩阵形式为[0077][0078]其中决策函数gX借助线性形式来表达[0079][0080]其中1#1^,1^£1?,心为11的邻域,1=1,2,...,11。它的解可以通过计算以下的最优化问题获得[0081][0082]其中:λ为线性模型的系数,λ〇。[0083]定理1对输入Xi,i=1,2,...,η,Ni为Xi的邻域,ru代表Ni中样本个数,记作,:[为niXni的单位矩阵,则并且[0084][0085]证明:已知最优化问题[0086][0087]令[0088][0089]L与Wi和bi有关,分别令[0090][0091]于是[0092][0093]同理[0104]进一步对公式进行简化有[0094][0095][0096][0097][0098][0099][0100][0101][0102][0103][0105][0106]其证明如下:[0107]证明:已知I[0108][0109][0110]由公式可知Ct1仅和X1有关,而与fi无关,将Ct1扩展成矩阵A=ayGRnxn^yeN1时,aij=aij;当七隹义时,aij=0,于是G=AF。[0111]通过上述一系列证明,得到I|F-G||2=FTI-ATI-AF,I为nXn的单位矩阵,因此,(I-ATI-A即为局部正则项的正则项因子。[0112]步骤5中,根据\算出数据的预测标签矩阵F,即本发明中基于半监督学习故障监测算法所转化问题的最优解。[0113]步骤6:根据[0114][0115]来标记未标记样本,归一化后得出Xi的每个故障分类情况。[0116]经过田纳西伊斯曼过程过程数据的仿真实验,可以看出本发明在处理情况一,即单一故障样本标记训练、单一故障测试。训练样本为标记了一部分故障1的训练数据,观察测试故障1的效果。[0117]故障一为田纳西伊斯曼过程中的进料B成分改变,AC比值保持不变管道4,属于阶跃故障)时,采样数据的训练样本的故障信息标记应保证在百分之十及其以上经过分别观察附图3a〜3c发现,已标识故障类型的样本占总体训练样本大于百分之十时,分类效果十分明显),如图3a〜3c所示;[0118]在处理情况二两种故障样本标记训练、第一种故障测试)。[0119]故障二为田纳西伊斯曼过程中的冷凝器冷却水入口温度发生变化管道13,属于阶跃故障,采样数据的训练样本的故障信息标记应保证在百分之十及其以上经过分别观察附图4a〜4c发现,已标识故障类型的样本占总体训练样本大于百分之十时,分类效果十分明显),如图4a〜4c所示;[0120]在处理情况三两种故障样本标记训练、第二种故障测试),训练样本为部分标记出故障1和故障2的数据,只观察测试故障2的效果。故障一为田纳西伊斯曼过程中的进料B成分改变,AC比值保持不变管道4,属于阶跃故障;故障二为田纳西伊斯曼过程中的冷凝器冷却水入口温度发生变化管道13,属于阶跃故障),采样数据的训练样本的故障信息标记应保证在百分之十以上,经过分别观察附图5a〜5c发现,已标识故障类型的样本占总体训练样本大于百分之十时,分类效果十分明显,如图5a〜5c所示。[0121]经上这比较,可以得出经本方案实施的故障识别效果更显著的结论。

权利要求:1.一种基于田纳西伊斯曼过程的先验知识故障诊断方法,其特征在于包括以下步骤:1采集田纳西伊斯曼过程的离线历史数据:,其中xii=l,2,...,1为已经通过专家先验知识标记的数据,xii=l+l,l+2,...,n是未标记数据,1为已标记故障状态类别的数目,η为历史数据故障状态类别的总数目;初始化矩阵Y其中c表示故障状态类别均代表数据规模大小;2选择调节参数矩阵1和KNN算法中的k;其中,表示对角阵,k为近邻样本个数;3在已有的加权无向图上构建邻接矩阵W,在此基础上算出矩阵D,定义拉普拉斯矩阵L=D-W,根据拉普拉斯正则化算法,计算拉普拉斯正则项4根据局部正则化算法,计算局部正则项(I-ATI-A,其中,I为nXn的单位矩阵,A为参数矩阵;5根据计算标签矩阵为对角阵;6根据,ft标记未标记样本,归一化后得到工业过程的故障分类信息,fi为使得F最大的最优输出,为标签矩阵F中的元素,i为从1到η的任意数,j为故障的种类,取值从1〜c,c为故障种类数目。2.按权利要求1所述的基于田纳西伊斯曼过程的先验知识故障诊断方法,其特征在于:步骤4中,计算局部正则项(I-ATI-A为:在局部区域中,对于输入的各个X1都对应有一个6值,同时,在其邻域样本集上学习得到的决策函数gX也有一个输出值gX1,将二者之间的差距转化为最优化问题的正则项F-G|12,其矩阵形式为:其中输出函数gX借助线性形式表达为:其中:为Xi的邻域,i=l,2,...,n,它的解通过计算以下最优化问题获得:其中:λ为调节系数,λ〇,权重向量WieRn,bi为偏差项,线性形式中对于每个输Ax1,要有训练数据0^、6,山分别为训练数据的输入和输出;对输入xi,i=l,2,...,n,Ni为Xi的邻域,m代表Ni中样本个数,记作.I为ruXni的单位矩阵,则,并且由公式可知Ct1仅和X1有关,而与A无关,将Ct1扩展成矩阵当时,=Qij;当.时,aij=0,于是G=AF;I为nXn的单位矩阵,(I-ATI-A即为局部正则项的正则项因子。3.按权利要求1所述的基于田纳西伊斯曼过程的先验知识故障诊断方法,其特征在于:步骤5中,根据计算标签矩阵为:通过拉格朗日函数求两次偏导求解,结果转化成局部正则化固定形式,形成可行的标签传播算法,计算出F值。

百度查询: 东北大学 一种基于田纳西伊斯曼过程的先验知识故障诊断方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术