买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】信息处理装置及信息处理方法_三菱电机株式会社_201780075997.9 

申请/专利权人:三菱电机株式会社

申请日:2017-07-31

公开(公告)日:2021-02-23

公开(公告)号:CN110352389B

主分类号:G05B23/02(20060101)

分类号:G05B23/02(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.02.23#授权;2019.11.12#实质审查的生效;2019.10.18#公开

摘要:信息处理装置10的特征在于,具有:数据取得部101,其取得作为时序数据的输入数据;标本误差上限计算部102,其在从作为时序数据的学习数据提取出的子序列即多个学习子序列中对类似的学习子序列进行整合而生成标本子序列时,使用从输入数据取出的数据,计算所整合的多个学习子序列之间的相异度的上限即标本误差上限;以及标本子序列生成部103,其使用标本误差上限,根据学习数据生成标本子序列。

主权项:1.一种信息处理装置,其特征在于,具有:数据取得部,其取得作为时序数据的输入数据;标本误差上限计算部,其在从作为时序数据的学习数据提取出的子序列即多个学习子序列中对相异度落在预定范围内的类似的所述学习子序列进行整合而生成标本子序列时,使用从所述输入数据取出的数据,计算所整合的多个所述学习子序列之间的所述相异度的上限即标本误差上限;以及标本子序列生成部,其使用所述标本误差上限,根据所述学习数据生成所述标本子序列,所述数据取得部对所述输入数据进行分割而生成所述学习数据和试验数据,所述标本误差上限计算部基于所述试验数据和所述学习数据之间的所述相异度,计算所述标本误差上限。

全文数据:信息处理装置及信息处理方法技术领域本发明涉及使用预定的数据对时序数据进行诊断的信息处理装置及信息处理方法。背景技术存在以下方法,即,预先定义正常的数据作为学习数据,基于在学习数据中是否存在与诊断对象数据类似的波形,对诊断对象数据是否正常进行诊断。例如,如果将在生产设备正常运转时取得的传感器数据作为学习数据,将运转中的生产设备的传感器数据作为诊断对象数据,则能够检测生产设备的异常。在学习数据中是否存在与诊断对象数据类似的波形能够使用从学习数据以及诊断对象数据分别提取出的子序列彼此的相异度来判断。将从学习数据提取子序列的范围一点点地滑动,对全部的子序列和从诊断对象数据提取出的子序列的相异度进行计算,将最低的相异度作为从该诊断对象数据提取出的子序列的相异度。但是,在该方法中,由于需要针对诊断对象数据的子序列和学习数据的全部的子序列之间的全部组合计算相异度,所以存在计算量大,相异度的计算耗费时间的问题。与上述方法相对,在专利文献1记载的方法中,对学习数据的子序列进行分群clustering,生成子序列间的相异度落在预定的标本误差上限以内的多个群,针对每个群对子序列进行整合而生成标本子序列。然后,对标本子序列和诊断对象数据的子序列进行比较,从而能够减少计算量而缩短在相异度的计算上耗费的时间。专利文献1:国际公开第2016117086号发明内容但是,在专利文献1中,没有记载对整合的子序列间的相异度的上限即标本误差上限进行计算的方法的详情。如果标本误差上限过大,则诊断对象数据的诊断精度降低,如果标本误差上限过小,则计算量大而耗费处理时间。存在难以生成取得了诊断精度和处理时间的平衡的适当的标本子序列的问题。本发明是鉴于上述问题而提出的,目的在于得到能够容易地生成适当的标本子序列的信息处理装置。为了解决上述课题而达成目的,本发明的特征在于,具有:数据取得部,其取得作为时序数据的输入数据;标本误差上限计算部,其使用从输入数据取出的数据来计算标本误差上限;以及标本子序列生成部,其使用标本误差上限,根据学习数据生成标本子序列。标本误差上限是,在从学习数据提取出的子序列即多个学习子序列中对类似的学习子序列进行整合而生成标本子序列时所整合的多个学习子序列间的相异度的上限。发明的效果本发明涉及的信息处理装置获得如下效果,即,能够容易地生成适当的标本子序列。附图说明图1是表示本发明的实施方式涉及的信息处理装置的结构的图。图2是表示图1所示的信息处理装置进行的诊断对象数据的诊断的概要的图,在该诊断中使用了学习数据。图3是用于说明为了判断在图2所示的学习数据中是否存在与诊断对象数据类似的波形而使用的最近搜索的概要的图。图4是表示图1所示的信息处理装置生成的标本子序列和标本误差上限的关系的图。图5是用于说明图1所示的数据取得部的功能的图。图6是表示图1所示的信息处理装置在进行诊断之前进行的处理的概要的图。图7是表示图1所示的标本误差上限计算部使用的计算式的妥当性的图。图8是表示图1所示的标本子序列生成部进行的第1整合处理的概要的图。图9是表示图1所示的标本子序列生成部进行的第2整合处理的概要的图。图10是表示图1所示的信息处理装置执行的处理的整个流程的流程图图11是表示图10所示的步骤S12的详细动作的流程图。图12是表示图11所示的步骤S121的详细动作的流程图。图13是表示图10所示的步骤S13的详细动作的流程图。图14是表示图13所示的步骤S132的第1整合处理的详情的流程图。图15是表示图13所示的步骤S133的第2整合处理的详情的流程图。图16是表示图10所示的步骤S14的详细动作的流程图。图17是表示图16所示的步骤S141的详细动作的流程图。具体实施方式下面,基于附图详细地说明本发明的实施方式涉及的信息处理装置以及信息处理方法。此外,本发明不受该实施方式限定。实施方式图1是表示本发明的实施方式涉及的信息处理装置10的结构的图。信息处理装置10具有数据取得部101、标本误差上限计算部102、标本子序列生成部103、统计值计算部104、存储部105、阈值计算部106和诊断部107。信息处理装置10具有基于与诊断对象数据D1类似的波形是否存在于后述的学习数据D2中对诊断对象数据D1进行诊断的功能。图2是表示图1所示的信息处理装置10进行的诊断对象数据D1的诊断的概要的图,在该诊断中使用了学习数据D2。诊断对象数据D1是作为诊断对象的数据。学习数据D2是作为上述诊断的基准而使用的数据,是预先定义为正常数据的数据,例如是传感器数据等时序数据。诊断对象数据D1是与学习数据D2相同种类的时序数据,在学习数据D2是温度数据的情况下,诊断对象数据D1也是温度数据。在学习数据D2中存在与诊断对象数据D1类似的波形的情况下,信息处理装置10判断为该诊断对象数据D1正常。在学习数据D2中不存在与诊断对象数据D1类似的波形的情况下,信息处理装置10判断为该诊断对象数据D1异常。在生产设备产生了异常的情况下,大多输出包含与生产设备正常运转时取得的传感器数据不同的波形的传感器数据。在这种情况下,如果将生产设备正常运转时取得的传感器数据作为学习数据D2,将运转中的生产设备的传感器数据作为诊断对象数据D1,则能够检测生产设备的异常。信息处理装置10依次反复进行取得运转中的生产设备的传感器数据的处理和将取得的传感器数据作为诊断对象数据D1的诊断处理,由此,能够实时地检测生产设备的异常。图3是用于说明为了判断在图2所示的学习数据D2中是否存在与诊断对象数据D1类似的波形而使用的最近搜索的概要的图。在学习数据D2中是否存在与诊断对象数据D1类似的波形是使用子序列间的相异度来判断的。子序列间的相异度是表示子序列彼此不同的程度的指标,相异度越低,子序列的波形的一致度越高。子序列间的相异度例如能够以距离表示,在将子序列由距离空间中的点表示的情况下,子序列间的相异度是点和点之间的距离。最近搜索是在距离空间中的点的集合中搜索与特定的点距离最近的点的方法,在本实施方式中,将子序列看作点,在子序列的集合中搜索与特定的子序列最近、即相异度最低的子序列。从学习数据D2提取出的子序列即学习子序列SS2是一边将具有预定的固定值的宽度下面,将该宽度的大小称为窗口尺寸的提取范围一点点地滑动一边进行提取的。然后,针对以与学习子序列SS2的提取范围相同的窗口尺寸的提取范围从诊断对象数据D1提取出的子序列即诊断对象子序列SS1,分别进行最近搜索而计算与学习数据D2的相异度。诊断对象子序列SS1和学习数据D2之间的相异度由在从学习数据D2提取出的多个学习子序列SS2中与作为对象的诊断对象子序列SS1最类似的波形的学习子序列SS2相对于诊断对象子序列SS1的相异度来表示。在将相异度由子序列之间的距离表示的情况下,提取出的全部的学习子序列SS2和诊断对象子序列SS1之间的距离中的最短距离成为诊断对象子序列SS1的相异度。例如,考虑提取了3个学习子序列SS2的情况。在诊断对象子序列SS1#01和学习子序列SS2#01之间的距离是30.1、诊断对象子序列SS1#01和学习子序列SS2#02之间的距离是1.5、诊断对象子序列SS1#01和学习子序列SS2#03之间的距离是15.2的情况下,诊断对象子序列SS1#01的相异度是1.5。在诊断对象子序列SS1的相异度小于或等于阈值的情况下,判断为在学习数据D2中包含与诊断对象子序列SS1类似的波形。这里,在针对全部的学习子序列SS2和全部的诊断对象子序列SS1的组合计算相异度的情况下,计算量增大,耗费时间。因此,在本实施方式中,对类似的学习子序列SS2进行整合,生成后述的标本子序列SS3,使用标本子序列SS3进行最近搜索。由此,能够减少用于计算相异度的计算量,能够缩短在相异度的计算上耗费的时间。图4是表示图1所示的信息处理装置10生成的标本子序列SS3和标本误差上限ε的关系的图。信息处理装置10将多个学习子序列SS2分类为群CL,针对每个群CL,生成代表性的子序列即标本子序列SS3。标本子序列SS3也可以说是对类似的多个学习子序列SS2进行了整合的子序列。整合的多个学习子序列SS2之间的相异度即距离d的上限称为标本误差上限ε。标本误差上限ε也可以说是分类为同一群CL的学习子序列SS2之间的相异度的上限,被设定为用于判断多个学习子序列SS2是否是类似的子序列的判断基准。根据标本误差上限ε的大小,整合的学习子序列SS2的范围发生变化。如果标本误差上限ε过大,则为了生成标本子序列SS3而整合的学习子序列SS2间的相异度变高,因此,诊断对象数据D1的诊断精度降低。如果标本误差上限ε过小,则进行诊断时使用的标本子序列SS3的数量变多,计算量大,耗费处理时间。因此,谋求容易地得到取得使诊断精度和处理时间之间平衡的适当的标本误差上限ε的方法。返回图1的说明。信息处理装置10具有基于预先定义为正常的时序数据即正常数据D3来计算适当的标本误差上限ε的功能。例如,能够将生产设备正常运转时取得的数据定义为正常的数据。数据取得部101取得正常数据D3,从正常数据D3取得学习数据D2和诊断的试验用数据即试验数据D4。图5是用于说明图1所示的数据取得部101的功能的图。数据取得部101如果取得了正常数据D3,则将正常数据D3按记录数分割为二分之一,将一方作为学习数据D2,将另一方作为试验数据D4。数据取得部101将取得的学习数据D2输入至标本误差上限计算部102和标本子序列生成部103,将取得的试验数据D4输入至标本误差上限计算部102、标本子序列生成部103以及统计值计算部104。图6是表示图1所示的信息处理装置10在进行诊断之前进行的处理的概要的图。在数据取得部101取得学习数据D2以及试验数据D4之后,信息处理装置10的标本误差上限计算部102使用试验数据D4和从学习数据D2提取出的全部的学习子序列SS2进行最近搜索,计算标本误差上限ε。在计算出标本误差上限ε之后,标本子序列生成部103使用计算出的标本误差上限ε来生成标本子序列SS3。然后,统计值计算部104使用试验数据D4和所生成的标本子序列SS3进行最近搜索,计算学习数据D2和试验数据D4之间的相异度和相异度的统计值。统计值包含相异度的平均值m以及相异度的标准偏差σ。阈值计算部106使用利用标本误差上限ε计算出的相异度的统计值,对诊断部107使用的阈值进行计算。下面,说明这些处理的详情。返回图1的说明。标本误差上限计算部102使用输入数据即学习数据D2以及试验数据D4,计算标本误差上限ε。具体而言,标本误差上限计算部102使用从输入数据取出的数据即学习子序列SS2以及试验子序列SS4,计算标本误差上限ε。标本误差上限计算部102针对学习子序列SS2和试验子序列SS4的全部组合计算相异度,对于试验子序列SS4的每一个,将最小的相异度作为该试验子序列SS4的相异度。标本误差上限计算部102基于各个试验子序列SS4的相异度,计算相异度的统计值。具体而言,相异度的统计值是相异度的平均值m_0以及相异度的标准偏差σ_0。在将试验子序列SS4的数量设为n、将第i个试验子序列SS4的相异度设为a_i的情况下,使用全部的学习子序列SS2计算出的相异度的平均值m_0以下述的公式1表示,相异度的标准偏差σ_0以下述的公式2表示。【算式1】【算式2】标本误差上限计算部102能够使用这些统计值和预定的计算式,计算标本误差上限ε。在k为正实数的情况下,预定的计算式是下述的公式3。ε=km_0+3σ_0…3公式3表示在向相异度的平均值m_0加上相异度的标准偏差σ_0的实数倍例如3倍得到的值与标本误差上限ε之间存在线性关系。图7是表示图1所示的标本误差上限计算部102使用的计算式的妥当性的图。图7的横轴是“m_0+3σ_0”,纵轴是最佳的标本误差上限ε。这里,最佳的标本误差上限ε定义为使得使用从学习数据D2提取出的全部的学习子序列SS2计算出的相异度和使用标本子序列SS3计算出的相异度的差小于或等于预定比例的值。使用学习数据D2和试验数据D4在各种条件下求出相异度的结果如图7所示,能够确认“m_0+3σ_0”的值和最佳的标本误差上限ε的值之间存在线性关系。标本误差上限计算部102将计算出的标本误差上限ε输入至标本子序列生成部103,存储于存储部105。标本子序列生成部103使用输入来的标本误差上限ε、学习数据D2和试验数据D4,生成标本子序列SS3。标本子序列SS3是对类似的学习子序列SS2进行了整合的子序列。在学习数据D2中时间相近的学习子序列SS2成为类似的子序列的可能性高,类似的子序列反复出现的可能性高。因此,标本子序列生成部103首先进行第1整合处理,该第1整合处理是从学习数据D2将时间相近的学习子序列SS2中相异度落在预定的值以内的学习子序列SS2分类至相同的群CL。然后,标本子序列生成部103基于群CL的相异度,进行对多个群CL进行整合的第2整合处理。图8是表示图1所示的标本子序列生成部103进行的第1整合处理的概要的图。标本子序列生成部103对时间相近的学习子序列SS2中相异度落在预定范围内的学习子序列SS2进行整合。这里,相异度由距离表示。具体而言,标本子序列生成部103对特定的学习子序列SS2、例如学习子序列SS2#1和学习子序列SS2#2之间的距离d进行计算,在d≤ε2的关系成立的情况下,将学习子序列SS2#1和学习子序列SS2#2分类至相同的群CL#1。同样地,标本子序列生成部103对学习子序列SS2#1和学习子序列SS2#3之间的距离d进行计算,在d≤ε2的关系成立的情况下,将学习子序列SS2#3分类至群CL#1。在学习子序列SS2#1和学习子序列SS2#4之间的距离d是d>ε2的情况下,标本子序列生成部103将学习子序列SS2#4分类至新的群CL#2。如果分类的群CL发生变化,则标本子序列生成部103沿时间轴依次计算分类至新的群CL#2的学习子序列SS2#4和其他学习子序列SS2之间的距离d,同样地对学习子序列SS2进行分群。标本子序列生成部103生成第1整合处理的结果即群CL的列表。图9是表示图1所示的标本子序列生成部103进行的第2整合处理的概要的图。标本子序列生成部103基于第1整合处理的结果即群CL的列表,使用分类至各个群CL的多个学习子序列SS2,生成各群CL的标本子序列SS3-1。具体而言,标本子序列生成部103在分类至各个群CL的多个学习子序列SS2中,求出相对于学习子序列SS2所包含的值的索引index相同的多个值的平均值,将由平均值的序列构成的子序列作为各群CL的标本子序列SS3-1。标本子序列生成部103将标本子序列SS3-1的列表按相对于标本子序列SS3-1的平均值进行排序。然后,标本子序列生成部103针对排序后的标本子序列SS3-1的列表,与第1整合处理同样地求出子序列之间的距离d,对标本子序列SS3-1之间的距离d小于或等于ε2的群CL进行整合。标本子序列生成部103使用分类至整合后的每一个群CL的标本子序列SS3-1,生成标本子序列SS3。具体而言,标本子序列生成部103在标本子序列SS3-1中求出相对于标本子序列SS3-1所包含的值的索引相同的多个值的平均值,将由平均值的序列构成的子序列作为标本子序列SS3。标本子序列生成部103也可以求出相对于生成了标本子序列SS3-1的各群CL所包含的学习子序列SS2中包含的值的索引相同的值的平均值,将由平均值的序列构成的子序列作为标本子序列SS3。标本子序列生成部103将所生成的标本子序列SS3输入至统计值计算部104,并且存储于存储部105。另外,标本子序列生成部103也可以求出各标本子序列SS3的平均值,与所生成的标本子序列SS3一起存储于存储部105。返回图1的说明。统计值计算部104使用试验数据D4和所生成的标本子序列SS3,计算学习数据D2和试验数据D4之间的相异度的统计值。统计值计算部104使用标本子序列SS3以试验数据D4执行最近搜索,求出相异度。统计值计算部104计算相异度的平均值m以及标准偏差σ,存储于存储部105。阈值计算部106使用统计值计算部104计算出的相异度的平均值m以及标准偏差σ,计算阈值Th,该阈值Th用于诊断部107诊断在学习数据D2中是否存在与诊断对象数据D1类似的波形。诊断部107使用阈值计算部106计算出的阈值Th,诊断在学习数据D2中是否存在与诊断对象数据D1类似的波形。诊断部107在学习数据D2中存在与诊断对象数据D1类似的波形的情况下,判断为诊断对象数据D1正常,在学习数据D2中不存在与诊断对象数据D1类似的波形的情况下,判断为诊断对象数据D1异常。图10是表示图1所示的信息处理装置10执行的处理的整个流程的流程图。信息处理装置10的数据取得部101从正常数据D3取得学习数据D2和试验数据D4步骤S11。标本误差上限计算部102使用通过数据取得部101取得的学习数据D2和试验数据D4,计算标本误差上限ε步骤S12。标本误差上限ε的计算方法的详情在后面叙述。标本子序列生成部103使用学习数据D2和计算出的标本误差上限ε,生成标本子序列SS3步骤S13。标本子序列SS3的生成方法的详情在后面叙述。阈值计算部106使用所生成的标本子序列SS3,计算用于诊断对象数据D1的诊断的阈值Th步骤S14。阈值Th的计算方法的详情在后面叙述。诊断部107进行诊断对象数据D1的诊断步骤S15。图10所示的处理的流程不需要一定连续地执行。例如,步骤S11至步骤S13的处理也可以作为事前的准备作业来执行。另外,步骤S14的阈值计算处理在执行步骤S15的诊断处理之前进行即可。下面,说明图10所示的各步骤的详细动作。图11是表示图10所示的步骤S12的详细动作的流程图。标本误差上限计算部102使用从学习数据D2提取出的全部学习子序列SS2,进行试验数据D4的最近搜索处理,计算相异度步骤S121。图12是表示图11所示的步骤S121的详细动作的流程图。标本误差上限计算部102从试验数据D4提取试验子序列SS4步骤S201。具体而言,标本误差上限计算部102一边使提取区域一点点滑动,一边从长度p的试验数据D4提取预定窗口尺寸w的波形数据作为试验子序列SS4。标本误差上限计算部102将距离的最小值min_i设定为作为初始值的无限大步骤S202。标本误差上限计算部102从长度q的学习数据D2提取窗口尺寸w的波形数据作为学习子序列SS2步骤S203。标本误差上限计算部102计算试验子序列SS4和学习子序列SS2之间的距离d_ij步骤S204。在将试验子序列SS4的时序数据设为S[i:i+w-1]i=1,2,3,...,p-w+1、将学习子序列SS2的时序数据设为T[j:j+w-1]j=1,2,3,...,q-w+1的情况下,距离d_ij能够通过下面的公式4求出。【算式3】在d_ij<min_i的关系成立的情况下,标本误差上限计算部102将最小值min_i的值更新为距离d_ij的值步骤S205。标本误差上限计算部102在步骤S203中,一边使提取的学习子序列SS2的范围一点点滑动,一边反复进行步骤S203至步骤S205的处理直至全部的学习子序列SS2的评估完成为止。如果全部的学习子序列SS2的评估完成,则标本误差上限计算部102将最小值min_i设为这里作为对象的试验子序列SS4的相异度步骤S206。标本误差上限计算部102一边使在步骤S201提取出的试验子序列SS4的范围一点点滑动,一边反复进行步骤S201至步骤S206的处理直至全部的试验子序列SS4的评估完成为止。通过步骤S121所示的处理,标本误差上限计算部102能够取得各个试验子序列SS4的相异度。返回图11的说明,标本误差上限计算部102如果取得了各个试验子序列SS4的相异度,则计算所取得的相异度的统计值即相异度的平均值m_0以及标准偏差σ_0步骤S122。标本误差上限计算部102使用相异度的统计值和预定的计算式,计算标本误差上限ε步骤S123。图13是表示图10所示的步骤S13的详细动作的流程图。标本子序列生成部103从学习数据D2提取多个学习子序列SS2步骤S131。标本子序列生成部103将学习子序列SS2按时间顺序进行分群,分类至多个群CL步骤S132。之后,标本子序列生成部103对群CL进行整合,生成每个群CL的标本子序列SS3步骤S133。图14是表示图13所示的步骤S132的第1整合处理的详情的流程图。首先,标本子序列生成部103将表示学习子序列SS2的位次的序数即i以及j设定为i=1、j=i+1步骤S301。标本子序列生成部103计算第i个学习子序列SS2和第j个学习子序列SS2之间的距离步骤S302。标本子序列生成部103判断计算出的距离是否小于或等于ε2步骤S303。在距离小于或等于ε2的情况下步骤S303:Yes,标本子序列生成部103将第j个学习子序列SS2与第i个学习子序列SS2分类至相同的群CL,设j=j+1步骤S304。在距离超过ε2的情况下步骤S303:No,标本子序列生成部103将群CL确定下来,追加至群CL的列表。另外,标本子序列生成部103将第j个学习子序列SS2分类至新的群CL步骤S305。标本子序列生成部103设定为i=j、j=j+1步骤S306。在进行了步骤S304的处理之后,或进行了步骤S306的处理之后,标本子序列生成部103判断是否是最后的学习子序列SS2步骤S307。在不是最后的学习子序列SS2的情况下步骤S307:No,标本子序列生成部103从步骤S302起重复处理。在是最后的学习子序列SS2的情况下步骤S307:Yes,标本子序列生成部103结束处理。如果执行了图14所示的处理,则如图8所示,在时间相近的学习子序列SS2中将距离小于或等于ε2的学习子序列SS2分类至群CL。图15是表示图13所示的步骤S133的第2整合处理的详情的流程图。标本子序列生成部103根据在步骤S132生成的各群CL内的学习子序列SS2,生成各群CL的标本子序列SS3-1步骤S311。标本子序列生成部103将标本子序列SS3-1的列表按标本子序列SS3-1的平均值进行排序步骤S312。标本子序列生成部103将表示标本子序列SS3-1的顺序的序数设定为l=1、m=l+1步骤S313。标本子序列生成部103计算第l个标本子序列SS3-1和第m个标本子序列SS3-1之间的距离d步骤S314。标本子序列生成部103判断计算出的距离d是否小于或等于ε2步骤S315。在距离d小于或等于ε2的情况下步骤S315:Yes,标本子序列生成部103对群CL进行整合,从列表删除第m个标本子序列SS3-1步骤S316。在距离d超过ε2的情况下步骤S315:No,标本子序列生成部103将群CL确定下来,生成整合后的群CL的标本子序列SS3步骤S317。标本子序列生成部103从列表删除第l个标本子序列SS3-1,将列表中的最小索引设定为l步骤S318。如果步骤S316的处理或步骤S318的处理结束,则标本子序列生成部103设定为m=m+1步骤S319。标本子序列生成部103判断是否是最后的标本子序列SS3-1步骤S320。在不是最后的标本子序列SS3-1的情况下步骤S320:No,标本子序列生成部103从步骤S314起重复处理。在是最后的标本子序列SS3-1的情况下步骤S320:Yes,标本子序列生成部103生成整合后的各群CL的标本子序列SS3步骤S321。标本子序列生成部103计算标本子序列SS3的平均值,按平均值进行排序步骤S322。通过上述动作,生成标本子序列SS3。图16是表示图10所示的步骤S14的详细动作的流程图。统计值计算部104使用所生成的标本子序列SS3,进行试验数据D4的最近搜索,计算相异度步骤S141。统计值计算部104对计算出的相异度的统计值进行计算步骤S142。统计值是平均值m以及标准偏差σ。阈值计算部106基于计算出的相异度的统计值,计算阈值Th步骤S143。图17是表示图16所示的步骤S141的详细动作的流程图。这里,使用下限计算,使最近搜索处理高速化。统计值计算部104从试验数据D4提取试验子序列SS4步骤S401。将距离的最小值min_i设定为作为初始值的无限大步骤S402。统计值计算部104从标本子序列SS3中选择1个未评估的标本子序列SS3步骤S403。统计值计算部104使用提取出的试验子序列SS4和选择出的标本子序列SS3,求出平均下限步骤S404。如果将窗口尺寸设为w、将时序数据T、S的平均值分别设为在T、S分别附加横线的符号,则平均下限能够以下面的公式5表示。【算式4】统计值计算部104判断求出的平均下限是否比距离的最小值min_i大步骤S405。在平均下限比距离的最小值min_i大的情况下步骤S405:Yes,统计值计算部104省略下面的处理,将距离的最小值min_i设为相异度步骤S410。在平均下限小于或等于距离的最小值min_i的情况下步骤S405:No,统计值计算部104求出平均偏差下限步骤S406。如果将时序数据T、S的标准偏差分别设为StdT、StdS,则平均偏差下限能够以下面的公式6表示。【算式5】统计值计算部104判断求出的平均偏差下限是否比距离的最小值min_i大步骤S407。在平均偏差下限比距离的最小值min_i大的情况下步骤S407:Yes,统计值计算部104结束作为对象的标本子序列SS3的处理,在未完成全部的标本子序列SS3的评估的情况下,返回步骤S403的处理。在平均偏差下限小于或等于距离的最小值min_i的情况下步骤S407:No,统计值计算部104计算试验子序列SS4和标本子序列SS3之间的距离d_ij步骤S408。在将诊断对象子序列设为S、将标本子序列设为Tj的情况下,距离d_ij能够以下面的公式7表示。【算式6】在计算出的距离d_ij比距离的最小值min_i小的情况下,统计值计算部104将距离的最小值min_i以距离d_ij的值进行更新步骤S409。统计值计算部104反复进行步骤S403至步骤S409的处理,直至全部的标本子序列SS3的评估完成为止。如果全部的标本子序列SS3的评估完成,则统计值计算部104将距离的最小值min_i作为相异度步骤S410。统计值计算部104反复进行步骤S401至步骤S410的处理,直至全部的试验子序列SS4的评估完成为止。在通过使用平均下限以及平均偏差下限,无需计算子序列间的距离,就能够判断为子序列间的距离比距离的最小值min_i大的情况下,能够省略计算子序列间的距离的处理。平均下限以及平均偏差下限的计算处理比计算子序列间的距离的处理的计算量少,因此,能够使最近搜索处理高速化。此外,步骤S141所示的最近搜索处理不限于使用如图17所示的下限计算,也可以如图12所示,不使用下限计算。在这种情况下,将学习子序列SS2置换为标本子序列SS3,将从学习数据D2提取学习子序列SS2的处理置换为从标本子序列SS3选择1个的处理即可。此外,根据上述的信息处理装置10,即使是应判断为正常的诊断对象数据D1,有时也会在学习数据D2中不存在类似的波形而判断为异常。在这种情况下,优选将判断为异常的诊断对象数据D1追加至学习数据D2。因此,数据取得部101如果接收到将非类似数据追加至学习数据D2的指示,则将非类似数据追加至学习数据D2,该非类似数据是诊断部107判定为在学习数据D2中不存在类似的波形的诊断对象数据D1。在诊断对象数据D1是对生产设备的状态进行检测的传感器数据的情况下,应判断为正常的诊断对象数据D1是在生产设备未产生应检测出的异常时取得的传感器数据。在这种情况下,将非类似数据追加至学习数据D2的指示是即使诊断部107判断为在生产设备产生了异常,也表示出在生产设备未产生异常的消息。例如,将非类似数据追加至学习数据D2的指示也可以通过信息处理装置10的使用者的输入操作而输入至信息处理装置10。或者,将非类似数据追加至学习数据D2的指示也可以通过对生产设备的异常进行诊断的其他系统生成而输入至信息处理装置10。如果非类似数据被追加至学习数据D2,则标本误差上限计算部102使用追加了非类似数据后的学习数据D2来计算标本误差上限ε。另外,标本子序列生成部103使用追加了非类似数据后的学习数据D2和利用追加了非类似数据后的学习数据D2计算出的标本误差上限ε,生成标本子序列SS3。然后,统计值计算部104使用试验数据D4和利用追加了非类似数据后的学习数据D2生成的标本子序列SS3进行最近搜索,计算学习数据D2和试验数据D4之间的相异度、以及相异度的统计值。阈值计算部106使用利用追加了非类似数据后的学习数据D2生成的标本子序列SS3,计算阈值Th。诊断部107使用追加了非类似数据后的学习数据D2进行诊断处理。因此,即使将应判断为正常的诊断对象数据D1判断为是异常,在下次的诊断处理以后,追加的非类似数据也会被判断为是正常。如以上说明所示,根据本发明的实施方式,在从学习数据D2提取出的子序列即多个学习子序列SS2中对类似的学习子序列进行整合而生成标本子序列SS3时,整合的多个学习子序列SS2之间的相异度的上限即标本误差上限ε是基于作为时序数据的输入数据计算出的。然后,使用计算出的标本误差上限ε,根据学习数据D2生成标本子序列SS3。因此,使用信息处理装置10的使用者即使没有进行试误,仅仅是输入时序数据,就能够容易地设定取得了诊断精度和处理时间的平衡的适当的标本误差上限ε,能够容易地生成适当的标本子序列SS3。另外,通过生成适当的标本子序列SS3,能够进行确保诊断精度并且高速的诊断处理。以上的实施方式所示的结构表示的是本发明的内容的一个例子,也能够与其他的公知技术进行组合,还能够在不脱离本发明的主旨的范围对结构的一部分进行省略、变更。标号的说明10信息处理装置,101数据取得部,102标本误差上限计算部,103标本子序列生成部,104统计值计算部,105存储部,106阈值计算部,107诊断部,D1诊断对象数据,D2学习数据,D3正常数据,D4试验数据,SS1诊断对象子序列,SS2学习子序列,SS3、SS3-1标本子序列,SS4试验子序列,CL群,ε标本误差上限,d距离,m、m_0平均值,σ、σ_0标准偏差。

权利要求:1.一种信息处理装置,其特征在于,具有:数据取得部,其取得作为时序数据的输入数据;标本误差上限计算部,其在从作为所述时序数据的学习数据提取出的子序列即多个学习子序列中对类似的所述学习子序列进行整合而生成标本子序列时,使用从所述输入数据取出的数据,计算所整合的多个所述学习子序列之间的相异度的上限即标本误差上限;以及标本子序列生成部,其使用所述标本误差上限,根据所述学习数据生成所述标本子序列。2.根据权利要求1所述的信息处理装置,其特征在于,所述时序数据是从运转中的生产设备取得的数据。3.根据权利要求1或2所述的信息处理装置,其特征在于,还具有:阈值计算部,其使用所述标本子序列,计算用于诊断在所述学习数据中是否存在与诊断对象数据类似的波形的阈值。4.根据权利要求3所述的信息处理装置,其特征在于,还具有:诊断部,其使用所述标本子序列和所述阈值,诊断在所述学习数据中是否存在与所述诊断对象数据类似的波形。5.根据权利要求1至4中任一项所述的信息处理装置,其特征在于,所述数据取得部对所述输入数据进行分割而生成所述学习数据和试验数据,所述标本误差上限计算部基于所述试验数据和所述学习数据之间的所述相异度,计算所述标本误差上限。6.根据权利要求5所述的信息处理装置,其特征在于,所述标本误差上限计算部使用所述试验数据和所述学习数据之间的所述相异度的统计值和预定的计算式,计算所述标本误差上限。7.根据权利要求6所述的信息处理装置,其特征在于,所述计算式表示所述标本误差上限是向所述相异度的平均值和所述相异度的标准偏差的正实数倍之和乘以正实数得到的。8.根据权利要求5所述的信息处理装置,其特征在于,所述标本误差上限计算部基于所述试验数据和所述学习数据之间的所述相异度的统计值,计算所述标本误差上限,所述标本误差上限是向所述相异度的平均值和所述相异度的标准偏差的正实数倍之和乘以正实数得到的。9.根据权利要求6或7所述的信息处理装置,其特征在于,所述试验数据和所述学习数据之间的所述相异度是对应于从所述试验数据提取出的子序列即试验子序列的每一个而求出的,与多个所述试验子序列的每一个对应的所述相异度是一边挪动提取范围一边从所述学习数据提取出的多个子序列即学习子序列的每一个与所述试验子序列之间的所述相异度中的最小值。10.根据权利要求4所述的信息处理装置,其特征在于,所述数据取得部如果接收到将非类似数据追加至所述学习数据的指示,则将所述非类似数据追加至所述学习数据,所述非类似数据是所述诊断部判定为在所述学习数据中不存在类似波形的所述诊断对象数据。11.根据权利要求4所述的信息处理装置,其特征在于,所述时序数据是对设备的状态进行检测的传感器数据,所述诊断部在所述学习数据中不存在与所述诊断对象数据类似的波形的情况下,判断为在所述设备产生异常。12.根据权利要求11所述的信息处理装置,其特征在于,所述数据取得部如果接收到即使所述诊断部判断为在所述设备产生异常,也表示出在所述设备未产生异常的消息,则将检测到所述异常的所述诊断对象数据即非类似数据追加至所述学习数据。13.一种信息处理方法,其是信息处理装置执行的方法,该信息处理方法的特征在于,包含以下步骤:取得作为时序数据的输入数据;在从作为所述时序数据的学习数据提取出的子序列即多个学习子序列中对类似的所述学习子序列进行整合而生成标本子序列时,使用所述输入数据,计算所整合的多个所述学习子序列之间的相异度的上限即标本误差上限;以及使用所述标本误差上限,根据所述学习数据生成所述标本子序列。

百度查询: 三菱电机株式会社 信息处理装置及信息处理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。