【发明授权】模式识别装置、模式识别方法以及记录介质_株式会社东芝;东芝数字解决方案株式会社_201580078044.9 

申请/专利权人:株式会社东芝;东芝数字解决方案株式会社

申请日:2015-05-11

发明/设计人:小野聪一郎;水谷博之

公开(公告)日:2021-02-23

代理机构:永新专利商标代理有限公司

公开(公告)号:CN107533671B

代理人:房永峰

主分类号:G06K9/34(20060101)

地址:日本东京都

分类号:G06K9/34(20060101);G06K9/62(20060101);G10L25/45(20130101);G06K9/46(20060101);G10L25/03(20130101);G06K9/48(20060101);G06N7/00(20060101);G10L25/27(20130101);G06N20/00(20190101)

优先权:

专利状态码:有效-授权

法律状态:2021.02.23#授权;2018.01.26#实质审查的生效;2018.01.02#公开

摘要:将被输入的信号分割成多个要素,将各要素转换成特征向量来生成特征向量的集合,使用识别字典来评价特征向量的集合。识别字典包括与各个类对应的模型,各模型具有与应被分类为对应于该模型的类的信号能取得的分割模式对应的子模型,子模型具有与用对应于该子模型的分割模式被分割出的各要素对应的状态,该状态是通过特征向量以及表示该状态的标签的函数来表现的状态。识别部将标签或者标签的集合作为识别结果输出,该标签表现具有与特征向量的集合符合的子模型的模型,该标签的集合表现具有与特征向量的集合符合的子模型的模型的集合。

主权项:1.一种模式识别装置,其特征在于,具备:分割部,将被输入的信号分割成多个要素;特征提取部,将被分割出的各要素分别转换成相同维数的特征向量来生成特征向量的集合;以及识别部,使用识别字典来评价上述特征向量的集合,并输出表示被输入的信号所属的类或者类的集合的识别结果,上述识别字典包括与各个类对应的模型,上述模型具有与在应被分类为对应于该模型的类的信号被分割成多个要素时能取得的分割模式的各个模式对应的子模型,上述子模型具有与通过对应于该子模型的分割模式而被分割出的各要素各自对应的状态,该状态是通过上述特征向量以及表示该状态的标签的函数来表现的状态,上述识别部将如下标签或者如下标签的集合作为上述识别结果输出,该标签表现具有与上述特征向量的集合符合的上述子模型的模型,该标签的集合表现具有与上述特征向量的集合符合的上述子模型的模型的集合。

全文数据:模式识别装置、模式识别方法以及程序技术领域[0001]本发明的实施方式涉及模式识别装置、模式识别方法以及程序。背景技术[0002]在模式识别的领域中,作为用于对识别单位之间不明确的输入信号进行模式识别的方法,已知有以下的2个方法。第1个方法是将输入信号分割成多个要素后按照规定的基准进行结合,分别单独地对各个要素进行识别的方法(以下,将该方法称为“解析的方法”。)。第2个方法是使用隐马氏模型HMM:HiddenMarkovModel等概率模型,作为输入信号的分割位置一边考虑所有可能性一边同时进行识别和分割的方法(以下,将该方法称为“整体的方法”。[0003]但是,在解析的方法中,由于通过直观推断的方法对暂时分割的要素进行结合,因此,具有不能充分确保识别的精度的情况。另一方面,在整体的方法中,由于一边考虑所有分割位置的可能性一边进行处理,因此,计算量大,要求高规格的硬件资源。由此,在解析的方法和整体的方法中分别具有缺点,因此,希望提供消除了这些缺点的新技术。[0004]现有技术文献[0005]非专利文献[0006]非专利文献1:村濑洋等、“言語情報旮導入Lfc手書含文字列如b⑥文字仍切19出L七認識”、信学伦⑶、J69-D9、ρρ·1292-1301、1986[0007]非专利文南犬2:F·Camastraetal.“MachineLearningforAudio,ImageandVideoAnalysis:TheoryandApplications’,,Springer-Verlag,2007发明内容[0008]发明所要解决的问题[0009]本发明所要解决的问题是提供一种模式识别装置、模式识别方法以及程序,能够对识别单位之间不明确的输入信号以较少的计算量进行高精度的识别。[0010]用于解决问题的手段[0011]实施方式的模式识别装置具备分割部、特征提取部以及识别部。分割部将被输入的信号分割成多个要素。特征提取部将被分割出的各要素分别转换成相同维数的特征向量来生成特征向量的集合。识别部使用识别字典来评价上述特征向量的集合,并输出表示被输入的信号所属的类或者类的集合的识别结果。上述识别部使用的上述识别字典包括与各个类对应的模型,上述模型具有与在应被分类为对应于该模型的类的信号被分割成多个要素时能取得的分割模式的各个模式对应的子模型,上述子模型具有与通过对应于该子模型的分割模式而被分割出的各要素各自对应的状态,该状态是通过上述特征向量以及表示该状态的标签的函数来表现的状态。上述识别部将标签或者标签的集合作为上述识别结果输出,该标签表现具有与上述特征向量的集合符合的上述子模型的模型,该标签的集合表现具有与上述特征向量的集合符合的上述子模型的模型的集合。附图说明[0012]图1是表示实施方式的模式识别装置的功能的构成例的框图。[0013]图2是将被输入的信号分割成多个要素的处理的概念图。[00M]图3是识别字典所含有的模型的概念图。[0015]图4是识别字典所含有的模型的概念图。[0016]图5是表示由实施方式的模式识别装置进行的处理顺序的一个例子的流程图。[0017]图6是说明以往的解析的方法的概念图。[0018]图7是包括噪声状态的模型的概念图。[0019]图8是将韩国语字符分割成要素的处理的概念图。[0020]图9是表示韩国语字符的分割模式的一个例子的图。[0021]图10是表示实施方式的模式识别装置的硬件构成例的框图。具体实施方式[0022]以下,参照附图对实施方式的模式识别装置、模式识别方法以及程序进行说明。[0023]本实施方式的模式识别装置通过将以往的解析的方法和整体的方法组合而成的新的方法,来进行相对识别单位之间不明确的输入信号的模式识别。即,基本概念是将被输入的信号分割成多个要素并求出要素的特征向量的集合,使用概率模型,将表示符合特征向量的集合的类或者该集合的识别结果进行输出。[0024]在此,将被输入的信号分割成多个要素时的分割的方式分割模式一般来说对于各个类并不是1种。例如,在被输入的信号为手写字符的图像时,由于手写的习惯等会成为不同的形式,因此,具有即使是应该分类到相同的类的信号,也会以不同的分割模式被分割的情况。而且,在应该分类到相同的类的信号以不同的分割模式被分割时,从被分割后的各个要素提取的特征向量的分布以及个数较大地不同,因此,在隐马氏模型中的left—to—right模型参照非专利文献2等标准的模型中,不能正确地识别被输入的信号。[0025]于是,在本实施方式中,对于各个类,将应该分类到该类的信号能取得的分割模式分别设为子模型,将对这些子模型全部进行结合后得到的模型作为与该类对应的模型来使用。[0026]图1是表示本实施方式的模式识别装置的功能的构成的框图。如图1所示,本实施方式的模式识别装置具备信号输入部1、分割部2、特征提取部3以及识别部4。[0027]信号输入部1接受成为识别对象的信号的输入。成为识别对象的信号例如是作为图像表示的字符、字符串、其他图像、以及作为波形表示的音声信号、各种的传感器信号等,这些数字信息或者根据需要而实施二值化等前处理后的数字信息被输入到信号输入部1。[0028]分割部2将输入到信号输入部1的信号分割成多个要素。具体地讲,在输入到信号输入部1的信号为字符串图像的情况下,分割部2的处理能够通过应用例如下述的参考文献1所记载的投影以及连结成分分析、或者非专利文献1所记载的“到基本段的分割”的方法等来实现。[0029]A.Rosenfeld等、“夕少画像処理”(长尾真监译)、近代科学社、1978年[0030]图2是将被输入的信号分割成多个要素的处理的概念图,示出了“水7”这样的字符串图像通过分割部2被分割成5个要素的情况。在该图2所示的例子中,分割字符串图像的方向是单向,但不限于此,还可以以二维的分割模式将信号分割成多个要素。[0031]另外,在输入到信号输入部1的信号为音声信号、各种传感器信号等那样以时间序列的波形来表示的信号的情况下,分割部2的处理能够通过应用例如将信号的功率变成阈值以下的状态持续了一定时间以上的位置设为分割位置的方法等来实现。[0032]对分割后的各要素分别赋予顺序。各要素的顺序是,在原始信号为图像时,能够以图像中的水平方向的坐标为基准,在原始信号为音声信号、传感器信号等时间序列的波形时,能够以时刻等为基准,来决定分割后的各要素的顺序。此时,还可以使分割后的各要素具有序列等构造,并赋予构造内的位置信息。作为具体的例子,考虑有对于从图2示出的字符串图像所分割的各要素,从左开始按顺序赋予编号作为位置信息的方法、或对于从音声信号、各种传感器信号等时间序列的波形所分割的各要素,按照时刻早的顺序赋予编号作为位置信息的方法。另外,在对分割的方向不是单向的图像进行处理的情况下,如后述所示,考虑有按照每个分割模式预先设定以该分割模式分割的各要素的记号参照图8,并赋予该记号作为位置信息的方法等。[0033]特征提取部3将通过分割部2被分割后的各要素分别转换成相同维数的特征向量,生成特征向量的集合。具体地讲,特征提取部3首先对成为被分割后的各个要素的信号实施对长度、量子化能级进行标准化等的前处理。而且,特征提取部3输出以对该前处理后的值或前处理后的信号进一步实施高斯滤波等滤波处理、傅里叶变换等转换处理后的值作为成分的特征向量,来作为该要素的特征向量。此时,还可以对各要素的特征向量以所有范数成为1的方式进行标准化。特征提取部3以上述的方式从各个要素将特征向量1个个提取,生成特征向量集合。[0034]作为将要素转换成特征向量的处理的具体例,具有例如对音声信号的要素各自的时间进行标准化后,提取如下述的参考文献2所记载的梅尔频率倒谱系数特征,并将这些值保持原样地排列作为特征向量的方法。另外,具有从图像的要素分别提取如下述的参考文献3所记载的加权方向指数直方图特征的方法。[0035]古井贞熙,“新音响音声工学”,近代科学社,2006年[0036]鹤冈信治等,“加权方向指数直方图法信学论⑶,J70-D⑵,PP.1390-1397,1987[0037]识别部4使用识别字典10来评价由特征提取部3生成的特征向量的集合,并将表示被输入到信号输入部1的信号所属的类或者类的集合的识别结果输出。[0038]识别字典10是包括本实施方式的模式识别装置作为信号的分类目的地进行处理的与各个类对应的模型的数据库,被保持于本实施方式的模式识别装置的内部或者外部。识别字典10所保持的各类的模型是概率模型,能够使用包括隐马氏模型的任意的图形模型参照下述的参考文献4。[0039]C.M.Bishop对应日语:)等,“模式识别i机械学習”(村田升监译),SpringerJapan对应日语:),2007年[0040]识别部4对该识别字典10包含的模型单独地或者以后述那样进行组合地,探索出与由特征提取部3生成的特征向量的集合之间的最佳的对应。而且,识别部4将表现与特征向量的集合符合的模型的标签、或者表现与特征向量的集合符合的模型的集合的标签的集合作为识别结果进行输出。[0041]图3以及图4是识别字典10所含有的模型M的概念图。图3是与“水”这样的字符图像应被分类的类对应的模型M的例子,图4是与“东京都”的音声信号应被分类的类对应的模型M的例子。[0042]在本实施方式中进行处理的模型M如图3以及图4所示,是将应被分类成与该模型M对应的类的信号通过分割部2被分割成多个要素时所取得的分割模式分别设为子模型m,将这些子模型m全部结合的模型。各个子模型m被选择的概率在预先准备的学习数据中,与对应的分割模式各自的出现率一致。或者,对模型M以及子模型m被选择的概率赋予同样分布等事前分布,基于此能够对模型M以及子模型m被选择的概率进行MAP估计(参照参考文献4〇[0043]各模型M的子模型m例如构成为在节点具有状态s的定向图,该状态s是与通过对应于该子模型m的分割模式而被分割出的各要素分别对应的状态。在这种状态下,子模型m还可以如隐马氏模型中的left—to—right模型那样,设置成状态s只能单向地转变。也就是说,子模型m还可以是各状态s被线形地排序,从上一级的状态s向下一级的状态s的转变被禁止的构成。图3以及图4示出的例子例示出将状态s只能单向地转变的子模型m结合后的模型M。通过将子模型m如上述方式构成,从而,能够在将被分类的类或者类的集合预先知道的学习数据传递到分割部2时,决定性地赋予与子模型m的各状态s相对的、被分割的各要素的分配。[0044]子模型m的各自的状态s通过特征向量和表示该状态s的标签的函数来表现,例如能够将该函数设为高斯分布的概率密度函数,将特征向量的对数似然设为函数的输出。此时,分布的参数如上述所示,能够使用被分类的类或者类的集合预先知道的学习数据,例如以参考文献4所记载的EM算法、变分的贝叶斯方法、梯度法等方法进行估计。[0045]在此,对使用了以上那样的模型M的识别部4的处理的具体例进行说明。另外,以下的说明假设出输入信号作为多个类的序列被分类的例子,但是,对于输入信号被分类为1个类的情况也应用相同的说明。[0046]对于从输入信号得到的特征向量列特征向量的集合X1,……,χη的长度η以下的个数允许重复,对模型M进行排序并选择,设为M1,……,Mp。进而,从各自的模型M—个一个地选择子模型m,设为mi,……,mP,合计的长度变得与特征向量列相等。而且,将这样得到的子模型m的状态设为S1,……,sn,以下述数式(1的形式赋予特征向量的评价函数。[0047]【数式1】[0048][0049]但是,心是?^元N-gram参照下述的参考文献5的概率等由模型M的列自身决定的评价函数,f21是子模型m的选择概率等伴随着在模型M1中选择子模型m的评价函数,f3ω是状态Sj的概率密度函数等伴随着对状态Sj分配特征向量的评价函数。[0050]北研二,“概率的言语模型”(语言和计算5,东京大学出版会,1999年[0051]此时,在将子模型m构成为如上述所示状态s只能单向地转变的情况下,将其最大化的Μι,......,MP以及mi,......,mP如非专利文献2所示,能够通过Viterbi的算法高效地计算。而且,输出将其最大化的M1,……,MP作为识别结果。[0052]随后,按照图5对由本实施方式的模式识别装置进行的处理的概要进行说明。图5是表示由本实施方式的模式识别装置进行的处理顺序的一个例子的流程图。[0053]首先,信号输入部1接受成为识别对象的信号的输入步骤S101。被输入到信号输入部1的信号被传递到分割部2。[0054]随后,分割部2从信号输入部1收取在步骤SlOl中被输入的信号,将该信号分割成多个要素步骤S102。由分割部2分割出的各要素分别被传递到特征提取部3。[0055]随后,特征提取部3从分割部2收取在步骤S102中被分割出的各要素,对这些各要素,通过上述的方法求出特征向量,生成特征向量的集合步骤S103。由特征提取部3生成的特征向量的集合被传递到识别部4。[0056]随后,识别部4从特征提取部3收取在步骤S103中被生成的特征向量的集合,使用识别字典10来评价特征向量的集合,将表示在步骤SlOl中被输入的信号所属的类或者类的集合的识别结果输出(步骤S104。[0057]以上,如边列举具体的例子边说明的那样,在本实施方式中,作为信号的成为分类目的地的各个类所对应的模型M,定义出将模型M与应被分类的信号的各式各样的分割模式所对应的子模型m结合后的概率模型。而且,使用包括这样的每个类的模型M的识别字典10,来评价从被输入的信号得到的特征向量的集合,将表示被输入的信号所属的类或者类的集合的识别结果输出。由此,根据本实施方式的模式识别装置,能够消除以往的解析的方法和整体的方法各自的缺点,能够对识别单位之间不明确的输入信号,以较少的计算量进行高精度的识别。[0058]在以往的解析的方法中,如图6所示,在将被输入的信号分割成多个要素后,与成为识别对象的单位在图6的例子中为字符结合地进行基于模式匹配等的识别,但是,要素的结合以例如对字符的平均的大小进行假设来决定分割等直观推断的方法来进行。因此,在图6的例子中,例如具有将A的要素和B的要素、C的要素和D的要素分别作为1个识别对象进行了处理的情况,这种情况下不能充分地确保识别的精度。对此,在本实施方式的模式识别装置中,使用信号的作为分类目的地进行处理的各个类所对应的概率模型即模型M,探索与从被输入的信号得到的特征向量的集合符合的模型M或者其集合,输出表示被输入的信号所属的类或者类的集合的识别结果,因此,能够对识别单位之间不明确的输入信号进行精度良好的识别。[0059]另外,在以往的整体的方法中,使用隐马氏模型等的概率模型进行输入信号的模式识别,但是,由于边考虑各种各样的分割位置的可能性边进行处理,因此,计算量大,要求高规格的硬件资源。对此,在本实施方式的模式识别装置中,使用与按照每个类而预先假设的分割模式所对应的子模型m结合后的模型M,探索与从被输入的信号得到的特征向量的集合符合的模型M或者其集合,输出表示被输入的信号所属的类或者类的集合的识别结果,因此,能够以较少的计算量进行识别。[0060]如以上所示,根据本实施方式的模式识别装置,能够消除以往的解析的方法和整体的方法的各自的缺点,能够对识别单位之间不明确的输入信号,以较少的计算量进行高精度的识别。[0061]另外,在本实施方式中使用的识别字典10还可以包括与信号的成为分类目的地的任意类均不对应的拒绝模型。作为该拒绝模型,能够使用例如仅提取其他模型M的一部分的子模型m作为1个模型的模型、或与随机地设定参数值后的模型连结后的模型。在这种状态下,识别部4在例如上述的式(1中的施,……Mp的包括拒绝模型的情况下,将其作为拒绝进行处理,输出表示无法得到识别结果的信息。由此,在错误记载的手写字符的图像被输入的情况等,能够在被输入的信号自身不正确的情况下,将该内容传递给用户。[0062]另外,假设输入信号所含有的噪声错误地作为1个要素被处理的情况,作为以上那样的拒绝模型之一,设置仅由1个状态构成的仅具有1个子模型的模型(噪声模型),该噪声模型中的仅1个状态所对应的评价函数还可以返回值0,或者是随机地决定参数值的函数。[0063]另外,识别字典10所含有的模型M之中的至少1个如图7所示,还可以构成为具有应被分类为与该模型M对应的类的信号所含有的要素的任意要素均不对应的状态即噪声状态s’。通过这样构成模型M,从而,即使输入信号所含有的噪声错误地作为1个要素进行处理,也能够将该要素作为噪声而正确地识别,能够有效地抑制由噪声的混入引起的识别精度的降低。[0064]另外,以上的说明只要是假设了在将被输入的信号分割成要素时的分割的方向是单向的情况,但是,即使分割的方向不是单向的情况下,只要是预先决定其分割模式,也能够进行相同的处理。例如,韩国语字符等希望以二维的分割模式分割成要素,本实施方式的模式识别装置也能够有效地应用于这样的韩国语字符的识别。[0065]图8是将韩国语字符分割成要素的处理的概念图。在作为成为识别对象的信号而输入了韩国语的字符串的图像的情况下,例如,如图8a所示,首先,通过纵向的投影将字符串的图像分割成字符单位。而且,对各字符进行连结成分分析,将连结成分中邻接的组选出一个并将其沿纵向综合,反复进行该操作直到与图8b那样预先决定的分割模式的任意模式一致。而且,对于由以上的操作得到的要素分别赋予按照每个分割模式而预先决定的各要素的记号作为位置信息。[0066]图8a所示的韩国语字符串中最左的字符如图9所示,具有以图8b的分割模式中用〇,2,4表示的分割模式来分割的可能性。于是,该字符应被分类的类所对应的模型M设为将与该图9所示的分割模式分别对应的子模型m结合后的模型。由此,通过与上述的方法相同的方法,能够进行高精度的模式识别。[0067]本实施方式的模式识别装置例如如图10所示,能够采用具备了CPUCentralProcessingUnit101等处理器、ROMReadOnlyMemory102、RAMRandomAccessMemory103等存储装置、HDDHardDiskDrive104等辅助存储装置、与网络连接进行通信的通信IF105、将各部连接的总线106等的、利用通常的计算机的硬件构成。在这种状态下,上述的各功能的构成要素能够通过在计算机上执行规定的模式识别程序来实现。[0068]该模式识别程序以能够安装的形式或者能够执行的形式的文件被记录于CD—ROMCompactDiskReadOnlyMemory、软盘(FD、CD—RCompactDiskRecordable、DVDDigitalVersatileDisc等能够用计算机读取的记录介质,来作为计算机程序产品被提供。[0069]另外,还可以构成为将该模式识别程序存储在与因特网等网络连接的其他计算机上,通过经由网络被下载来进行提供。另外,还可以构成为经由因特网等网络来提供或者发布该模式识别程序。[0070]另外,还可以构成为将该模式识别程序预先装入R0M102等进行提供。[0071]该模式识别程序设为包括本实施方式的模式识别装置的各处理部信号输入部1、分割部2、特征提取部3以及识别部4的模块构成,作为实际的硬件设置为,例如CPUlOl处理器从上述记录介质中读出程序并执行,由此,上述的各处理部被加载到RAM103主存储)上,上述的各处理部在RAM103主存储上被生成。另外,本实施方式的模式识别装置还能够使用ASICApplicationSpecificIntegratedCircuit、FPGAField-ProgrammableGateArray等专用的硬件来实现上述的各处理部的一部分或者全部。[0072]以上,对本发明的实施方式进行了说明,但这些实施方式是作为例子而提出的,并没有意图限定发明的范围。在此说明的新的实施方式可以以其他各种方式进行实施,在不超出发明主旨的范围内,可进行各种省略、调换以及变更。在此说明的实施方式及其变形包括在发明的范围和主旨内,同样,也包括在专利请求所记载的发明和与其等同的范围内。

权利要求:1.一种模式识别装置,其特征在于,具备:分割部,将被输入的信号分割成多个要素;特征提取部,将被分割出的各要素分别转换成相同维数的特征向量来生成特征向量的集合;以及识别部,使用识别字典来评价上述特征向量的集合,并输出表示被输入的信号所属的类或者类的集合的识别结果,上述识别字典包括与各个类对应的模型,上述模型具有与在应被分类为对应于该模型的类的信号被分割成多个要素时能取得的分割模式的各个模式对应的子模型,上述子模型具有与通过对应于该子模型的分割模式而被分割出的各要素各自对应的状态,该状态是通过上述特征向量以及表示该状态的标签的函数来表现的状态,上述识别部将标签或者标签的集合作为上述识别结果输出,该标签表现具有与上述特征向量的集合符合的上述子模型的模型,该标签的集合表现具有与上述特征向量的集合符合的上述子模型的模型的集合。2.如权利要求1所述的模式识别装置,其特征在于,上述子模型的各状态线形地排序,并且从上一级的状态向下一级的状态的转变被禁止。3.如权利要求1或2所述的模式识别装置,其特征在于,上述识别字典包括与任意的类均不对应的模型即拒绝模型,上述识别部在上述特征向量的集合符合上述拒绝模型的情况下,输出表示不能得到上述识别结果的信息。4.如权利要求1〜3中任一项所述的模式识别装置,其特征在于,上述识别字典所含有的上述模型中至少1个模型还具有噪声状态,该噪声状态是与应被分类为对应于该模型的类的信号所含有的要素的任意要素均不对应的状态。5.如权利要求1〜4中任一项所述的模式识别装置,其特征在于,上述子模型具有的状态为,通过在将成为学习数据的信号输入到上述模式识别装置时成为向该状态的输入的上述特征向量的集合以及被输入的概率,来决定该状态保持的函数。6.—种模式识别方法,该方法在模式识别装置中执行,其特征在于,包括:分割步骤,由上述模式识别装置将被输入的信号分割成多个要素;特征提取步骤,由上述模式识别装置将被分割的各要素分别转换成相同维数的特征向量来生成特征向量的集合;以及识别步骤,由上述模式识别装置使用识别字典来评价上述特征向量的集合,并输出表示被输入的信号所属的类或者类的集合的识别结果,上述识别字典包括与各个类对应的模型,上述模型具有与在应被分类为对应于该模型的类的信号被分割成多个要素时能取得的分割模式的各个模式对应的子模型,上述子模型具有与通过对应于该子模型的分割模式而被分割出的各要素各自对应的状态,该状态是通过上述特征向量以及表示该状态的标签的函数来表现的状态,在上述识别步骤中,将标签或者标签的集合作为上述识别结果输出,该标签表现具有与上述特征向量的集合符合的上述子模型的模型,该标签的集合表现具有与上述特征向量的集合符合的上述子模型的模型的集合。7.—种程序,其特征在于,使计算机实现如下功能:分割部的功能,将被输入的信号分割成多个要素;特征提取部的功能,将被分割出的各要素分别转换成相同维数的特征向量来生成特征向量的集合;以及识别部的功能,使用识别字典来评价上述特征向量的集合,并输出表示被输入的信号所属的类或者类的集合的识别结果,上述识别字典包括与各个类对应的模型,上述模型具有与在应被分类为对应于该模型的类的信号被分割成多个要素时能取得的分割模式的各个模式对应的子模型,上述子模型具有与通过对应于该子模型的分割模式而被分割出的各要素各自对应的状态,该状态是通过上述特征向量以及表示该状态的标签的函数来表现的状态,上述识别部将标签或者标签的集合作为上述识别结果输出,该标签表现具有与上述特征向量的集合符合的上述子模型的模型,该标签的集合表现具有与上述特征向量的集合符合的上述子模型的模型的集合。

百度查询: 株式会社东芝;东芝数字解决方案株式会社 模式识别装置、模式识别方法以及记录介质