买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于集成的快速谱聚类方法_西安交通大学_201711278376.9 

申请/专利权人:西安交通大学

申请日:2017-12-06

公开(公告)日:2020-07-28

公开(公告)号:CN108154157B

主分类号:G06K9/46(20060101)

分类号:G06K9/46(20060101);G06K9/62(20060101)

优先权:

专利状态码:有效-授权

法律状态:2020.07.28#授权;2018.07.06#实质审查的生效;2018.06.12#公开

摘要:本发明公开了一种基于集成的快速谱聚类方法,输入图片,然后划定移动窗口,使移动窗口在水平或者垂直方向上平移,将输入的每张图片划分为若干块;对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量;将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色向量的label值;使用BIRCH分类树对步骤3中被label值标记的颜色特征向量分类;使用BIRCH分类树结果对谱聚类的结果进行集成;将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。本方法通过BIRCH分类树,将谱聚类的结果修正,得到的聚类效果更好。

主权项:1.一种基于集成的快速谱聚类方法,其特征在于,包括以下步骤:步骤1:输入图片,然后划定移动窗口,使移动窗口在水平或者垂直方向上平移,将输入的每张图片划分为若干块;步骤2:对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量;步骤3:将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色特征向量的label值;步骤4:使用BIRCH分类树对步骤3中被label值标记的颜色特征向量分类;步骤5:使用BIRCH分类树结果对谱聚类的结果进行集成;步骤6:将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。

全文数据:一种基于集成的快速谱聚类方法技术领域[0001]本发明属于物体识别技术领域,具体涉及一种基于集成的快速谱聚类方法。背景技术[0002]在自主式机器人系统里仍在继续解决的问题就是,物体识别问题,即如何使机器人感知系统能够识别出其中的物体,从而进行相应的环境建模功能的实现。传统谱聚类存在着它自身的问题:1相关参数及相似度矩阵构建并不能通过统一方式确定;2由于要对数据集中的所有数据进行两两之间的距离计算来构建距离矩阵时间与空间复杂度都不容忽视,当数据规模上升时,数据不能一次载入内存;3构造一个数据集大小为Q的相似度矩阵并计算它的特征值与特征向量带来的计算复杂度通常为〇η3,在实际应用中,在数量级超过千级的时候,谱聚类就开始逐渐不可使用了。[0003]DonghuiYan等人提出一种快速谱聚类方法。首先对输入数据使用K-means算法进行聚类,得到k个簇,计算得到所有簇的聚类中心;然后建立数据与簇中心的对应表;最后使用谱聚类算法对得到的聚类中心进行聚类,得到相应的label值,并通过对应表,将label值标记到每条数据,此方法虽然加快了谱聚类的聚类速度,但是导致了聚类精度的下降。发明内容[0004]本发明的目的在于提供一种基于集成的快速谱聚类方法,以克服现有技术的缺陷,本发明运行时间更短,资源占用更小,准确率更高,相对于KASP方法,本方法通过BIRCH分类树,将谱聚类的结果修正,得到的聚类效果更好。[0005]为达到上述目的,本发明采用如下技术方案:[0006]—种基于集成的快速谱聚类方法,包括以下步骤:[0007]步骤1:输入图片,然后划定移动窗口,使移动窗口在水平或者垂直方向上平移,将输入的每张图片划分为若干块;[0008]步骤2:对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量;[0009]步骤3:将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色向量的label值;[0010]步骤4:使用BIRCH分类树对步骤3中被Iabe1值标记的颜色特征向量分类;[0011]步骤5:使用BIRCH分类树结果对谱聚类的结果进行集成;[0012]步骤6:将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。[0013]进一步地,步骤1中移动窗口的尺寸为10X10。[0014]进一步地,步骤2具体为:将HSV颜色空间的色度H均匀地分割为15个区间,而将饱和度S和亮度V均匀地分割为4个区间,则每一个色彩都被分成了三部分:15个取值的色度,4个取值的饱和度与4个取值的亮度,所有区间的排列组合能够生成240种不同的颜色组合,然后将移动窗口中的所有像素分配到对应的组合中,得到一个高度稀疏的特征向量f。[0015]进一步地,步骤3具体包括:[0016]步骤3.1:计算得到的特征向量的相似度矩阵S,由相似度矩阵S构建度矩阵D和邻接矩阵W;[0017]步骤3.2:根据公式L=D-1L=卜D_1W,计算拉普拉斯矩阵L;[0018]步骤3.3:求解拉普拉斯矩阵L的特征值,并从小到大排序,取前k小的特征值并存储与之对应的特征向量V1,V2,V3,...,Vk;[0019]步骤3.4:将前k小特征值对应的特征向量依次排列,组成ηXk的矩阵F,其中η为提取到的特征向量的总数,k为前k小特征值对应特征向量的个数,即矩阵的维度;[0020]步骤3.5:利用K-means聚类算法将步骤3.4中得到的矩阵F中数据聚成k簇Ci,C2,C3,···,Ck〇[0021]进一步地,步骤4具体包括:[0022]步骤4.1:从通过谱聚类得到的label值标记过的特征向量中扫描一条,从根节点起按照最小距离原则递归下降至叶结点;[0023]步骤4.2:判断该叶结点中与步骤4.1中得到的特征向量最近的CF条目是否能吸收该数据点,具体是判断CF条目与新数据点CF条目的直径D是否小于阈值T;[0024]步骤4.3:如果CF条目与新数据点CF条目的直径D小于阈值,且该叶结点仍有空间接受该CF条目,即该叶结点的CF数目小于分支因子B,分支因子B表示树节点容纳的最大CF数,则添加该CF至该叶结点的CF列表,更新从根节点到该叶结点路径上所有的CF信息;如果CF条目与新数据点CF条目的直径D小于阈值,该叶结点的CF数目小于分支因子B,则分裂该叶结点:选取该叶结点的所有CF条目和新数据点CF中最远的两个CF条目作为种子结点,将这两个结点作为原结点的父结点的新子结点,再将剩余CF条目按距离最小原则重新分配到新的叶结点中,删除原叶结点,并更新树,当根节点分裂时,树高增加一层,如果CF条目与新数据点CF条目的直径D大于阈值,则重复进行步骤4.1;[0025]步骤4.4:将得到叶结点结果作为分类结果;[0026]其中CF为聚类特征,是总结一个簇的信息的三元组,定义如下:给定处于同一簇的η个d维数据点{χι,X2,X3,…,xn}组成的集合X,聚类特征向量:,其中η是簇中数据点的数量,是簇内所有数据点的线性和,即^是簇内所有数据点的平方和,即[0027]对应的簇中心XQ,半径R,直径D的公式如下:[0031]其中,SS1代表;的第i维数值,LS1代表Ig的第i维数值。[0032]进一步地,步骤5具体为:根据步骤4BIRCH分类树得到的label值对谱聚类的结果进行修正和集成,将特征向量依次插入BIRCH树中时,通过特征向量之间的距离与阈值T的比较,如果特征向量之间的距离小于阈值T,则与已有簇合并,否则,得到新的类。[0033]进一步地,阈值T的确定步骤为:[0034]A、对于每张图片提取到的特征向量数#FV为:[0038]B、计算每个图像中提取的特征向量与特征向量搜索树中的近似最近邻之间的距离dFV,j,通过下式确定阈值:[0040]其中1为读取的图片数量,dFV,j为第j个特征向量与其近似最近邻之间的距离。[0041]进一步地,步骤6具体包括:[0042]步骤6.1:设定一个包含RGB颜色值的数组;[0043]步骤6.2:将不同的RGB值赋值给不同的label值;[0044]步骤6.3:使用Iabe1对应的RGB值标记出图片不同的物体,得到分割结果。[0045]与现有技术相比,本发明具有以下有益的技术效果:[0046]本发明方法首先将大规模数据集分解成单个计算机能够接受的处理单元,并对各处理单元依次进行谱聚类,最终通过BIRCH算法对聚类结果进行合并,使得单个计算机可以对大规模数据集实施谱聚类算法,极大地降低了谱聚类算法对内存大小的要求,明显地提升了谱聚类算法的速度和准确度。附图说明[0047]图1是本发明方法流程图;[0048]图2是本发明方法第一对比图;[0049]图3是本发明方法第二对比图;[0050]图4是本发明方法第三对比图;[0051]图5是本发明方法第四对比图;[0052]图6是本发明方法第五对比图;[0053]图7是本发明方法第六对比图;[0054]图8是本发明方法第七对比图;[0055]图9是本发明方法第八对比图;[0056]图10是本发明方法第九对比图;[0057]图11是本发明方法第十对比图;[0058]图12是本发明方法第十一对比图;[0059]图13是本发明方法第十二对比图;[0060]图14是本发明方法第十三对比图;[0061]图15是本发明方法第十四对比图;[0062]图16是本发明方法第十五对比图;[0063]图17是本发明方法第十六对比图;[0064]图18是本发明方法第十七对比图;[0065]图19是本发明方法第十八对比图;[0066]图20是本发明方法第十九对比图;[0067]图21是本发明方法第二十对比图;[0068]图22是本发明方法第二十一对比图;[0069]图23是本发明方法第二十二对比图;[0070]图24是本发明方法第二十三对比图;[0071]图25是本发明方法第二十四对比图;[0072]图26是本发明方法第二十五对比图。[0073]其中,图2-图26中(a均为原图,(b均为本发明方法结果图,(c均为对比方法KASP结果图。具体实施方式[0074]下面对本发明作进一步详细描述:[0075]如图1所示,本方法运行环境为:[0076]系统环境:WindowslO专业版[0077]硬件环境:Inteli5-7300HQ2.5GHZ,8GBRAM[0078]开发环境:Python3.5.2,Pycharm2017.1[0079]输入:自行采集的图片数据集。[0080]1划定10X10的移动窗口,窗口在水平或者垂直方向上平移将输入的每张图片划分为多个小块:[0081]2对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量:[0082]步骤2具体为:[0083]色度H被均匀地分割为15个区间,而饱和度S和亮度V被均匀地分割为4个区间。至此,每一个色彩都被分成了三部分:有15个取值的色度,有4个取值的饱和度与同样有4个取值的亮度,所有区间的排列组合可以生成240种不同的颜色可能。然后将移动窗口中的所有像素分配到对应的可能中,得到一个高度稀疏的特征向量f颜色直方图)。[0084]3将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色向量的Iabe1值;[0085]步骤3具体为:[0086]A、计算得到的特征向量的相似度矩阵S,由相似度矩阵S构建度矩阵D,邻接矩阵W;[0087]B、根据公式L=D_1L=卜D、,计算拉普拉斯矩阵;[0088]其中L为拉普拉斯矩阵,D为度矩阵,W为邻接矩阵[0089]C、求解拉普拉斯矩阵L的特征值,并从小到大排序,取前k小的特征值并存储与之对应的特征向量V1,V2,V3,...,Vk;[0090]D、将前k小特征值对应的特征向量依次排列,组成nXk的矩阵F其中η为提取到的特征向量的总数,k为前k小特征值对应特征向量的个数,即矩阵的维度;[0091]E、利用K-means聚类算法将步骤3.4中得到的矩阵F中数据聚成k簇Cl,C2,C3,...,Cko[0092]4使用BIRCH分类树对步骤3中被label值标记的颜色向量进行分类;[0093]步骤4具体为:[0094]A、从通过谱聚类得到的label值标记过的的特征向量中扫描一条,从根节点起按照最小距离原则递归下降至叶结点;[0095]B、判断该叶结点中与新的数据最近的CF条目是否能吸收该数据点(判断该CF条目与新数据点CF条目的指标是否小于T,如直径D是否小于阈值T;[0096]C、如果CF条目与新数据点CF条目的直径D小于阈值,且该叶结点仍有空间接受该CF条目,即该叶结点的CF数目小于分支因子B,分支因子B表示树节点容纳的最大CF数,则添加该CF至该叶结点的CF列表,更新从根节点到该叶结点路径上所有的CF信息;如果CF条目与新数据点CF条目的直径D小于阈值,该叶结点的CF数目小于分支因子B,则分裂该叶结点:选取该叶结点的所有CF条目和新数据点CF中最远的两个CF条目作为种子结点,将这两个结点作为原结点的父结点的新子结点,再将剩余CF条目按距离最小原则重新分配到新的叶结点中,删除原叶结点,并更新树,当根节点分裂时,树高增加一层,如果CF条目与新数据点CF条目的直径D大于阈值,则重复进行步骤A;[0097]D、将得到叶子结点结果作为分类结果。[0098]其中CF为聚类特征,是总结一个簇的信息的三元组,定义如下:给定处于同一簇的η个d维数据点{xi,X2,X3,...,xn}组成的集合X,聚类特征向量其中η是簇中数据点的数量,是簇内所有数据点的线性和,即是簇内所有数据点的平方和,即[0099]对应的簇中心XQ,半径R,直径D的公式如下:[0103]其中,SSi代表的第i维数值,LSi代表的第i维数值。[0104]5使用BIRCH分类树结果对谱聚类的结果进行集成;[0105]步骤5具体为:[0106]A、获取到步骤1和步骤4中的label值;[0107]B、根据步骤4BIRCH分类树得到的label值对谱聚类的结果进行修正和集成,将特征向量依次插入BIRCH树中时,通过特征向量之间的距离与阈值T的比较,判断对于之前已插入特征向量的新的特征向量是否与已有簇合并,从而决定得到新的类还是并入已有类中。如果特征向量之间的距离小于阈值T,则与已有簇合并,否则,得到新的类。[0108]其中阈值的确定步骤为:[0109]a、对于每张图片提取到的特征向量数#FV为:[0113]其中Width为图片宽度,Height为图片长度,M为移动窗口的移动值。[0114]b、对于阈值的确定,我们计算每个图像中提取的特征向量与特征向量搜索树中的近似最近邻之间的距离dFV,j,通过下式确定阈值:[0115][0116]其中1为读取的图片数量,dFV,j为第j个特征向量与其近似最近邻之间的距离,阈值为特征向量与最近邻之间距离的均值与1.5个标准差之和。[0117]6将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。[0118]步骤6具体为:[0119]A、设定一个包含RGB颜色值的数组;[0120]B、将不同的RGB值赋值给不同的label值;[0121]使用label对应的RGB值标记出图片不同的物体,得到分割结果。[0122]下面对本发明的实施过程作进一步描述:[0123]如图2至26,通过对比图,可以看出,本方法的聚类准确度更高。[0124]对于图6、7、10,本方法对于树荫部分的聚类效果更好,KASP方法将树荫部分分为了两类,本方法将树荫分为一类,更符合实际情况。[0125]对于图11、12,本方法对于路面上的井盖识别更加准确,KASP没有标记出路面上的井盖,而本方法将路面上的井盖较为准确地标记出来。[0126]对于Berkeley数据集,图17、18,对于图中的建筑,本方法得到的建筑结果轮廓更加清晰,建筑中的柱子都准确地分割出来;图22中,本方法得到圆顶建筑的中具体的子建筑的分割结果,而对比方法KASP没有将具体的子建筑分割出来;图23中,本方法将天空中的白云准确地分割出来,KASP没有达到这个效果;对于图19、图20、图21以及图24至图26,本方法得到的结果轮廓更加清晰,在对于天空、地面等面积较大的物体的聚类结果更加准确;KASP对于天空、地面等面积较大的物体,得到了多个类,结果并不准确。[0127]本方法通过摄像头采集关于场景的多张图像,并进而在计算机上对图像进行颜色特征提取及基于谱聚类算法的分割处理,以便对目标物体进行自主识别。与传统的聚类算法相比,谱聚类算法不仅能够对非凸分布的样本空间聚类,而且对数据的维度不敏感,因而极大地丰富了聚类分析的研究内容,然而谱聚类算法对数据集的大小非常敏感,为了对大量提取的特征进行谱聚类,面临的问题是此算法的高时间及空间复杂度。本方法通过摄像头采集关于场景的多张图像,并进而在计算机上对图像进行颜色特征提取及基于谱聚类算法的分割处理,以便对目标物体进行自主识别。与传统的聚类算法相比,本发明的谱聚类算法不仅能够对非凸分布的样本空间聚类,而且对数据的维度不敏感,因而极大地丰富了聚类分析的研究内容。

权利要求:1.一种基于集成的快速谱聚类方法,其特征在于,包括以下步骤:步骤1:输入图片,然后划定移动窗口,使移动窗口在水平或者垂直方向上平移,将输入的每张图片划分为若干块;步骤2:对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量;步骤3:将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色向量的Iabe1值;步骤4:使用BIRCH分类树对步骤3中被label值标记的颜色特征向量分类;步骤5:使用BIRCH分类树结果对谱聚类的结果进行集成;步骤6:将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。2.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤1中移动窗口的尺寸为10X10。3.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤2具体为:将HSV颜色空间的色度H均匀地分割为15个区间,而将饱和度S和亮度V均匀地分割为4个区间,则每一个色彩都被分成了三部分:15个取值的色度,4个取值的饱和度与4个取值的亮度,所有区间的排列组合能够生成240种不同的颜色组合,然后将移动窗口中的所有像素分配到对应的组合中,得到一个高度稀疏的特征向量f。4.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤3具体包括:步骤3.1:计算得到的特征向量的相似度矩阵S,由相似度矩阵S构建度矩阵D和邻接矩阵W;步骤3.2:根据公式L=T1L=I-D4W,计算拉普拉斯矩阵L;步骤3.3:求解拉普拉斯矩阵L的特征值,并从小到大排序,取前k小的特征值并存储与之对应的特征向量V1,V2,V3,...,Vk;步骤3.4:将前k小特征值对应的特征向量依次排列,组成ηXk的矩阵F,其中η为提取到的特征向量的总数,k为前k小特征值对应特征向量的个数,即矩阵的维度;步骤3.5:利用K-means聚类算法将步骤3.4中得到的矩阵F中数据聚成k簇Ci,C2,C3,···,Ck〇5.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤4具体包括:步骤4.1:从通过谱聚类得到的Iabe1值标记过的特征向量中扫描一条,从根节点起按照最小距离原则递归下降至叶结点;步骤4.2:判断该叶结点中与步骤4.1中得到的特征向量最近的CF条目是否能吸收该数据点,具体是判断CF条目与新数据点CF条目的直径D是否小于阈值T;步骤4.3:如果CF条目与新数据点CF条目的直径D小于阈值,且该叶结点仍有空间接受该CF条目,即该叶结点的CF数目小于分支因子B,分支因子B表示树节点容纳的最大CF数,则添加该CF至该叶结点的CF列表,更新从根节点到该叶结点路径上所有的CF信息;如果CF条目与新数据点CF条目的直径D小于阈值,该叶结点的CF数目小于分支因子B,则分裂该叶结点:选取该叶结点的所有CF条目和新数据点CF中最远的两个CF条目作为种子结点,将这两个结点作为原结点的父结点的新子结点,再将剩余CF条目按距离最小原则重新分配到新的叶结点中,删除原叶结点,并更新树,当根节点分裂时,树高增加一层,如果CF条目与新数据点CF条目的直径D大于阈值,则重复进行步骤4.1;步骤4.4:将得到叶结点结果作为分类结果;其中CF为聚类特征,是总结一个簇的信息的三元组,定义如下:给定处于同一簇的η个d维数据点{xi,X2,X3,...,χη}组成的集合X,聚类特征向量1其中η是簇中数据点的数量是簇内所有数据点的线性和,即是簇内所有数据点的平方和,即I对应的簇中心XQ,半径R,直径D的公式如下:其中,3代表的第i维数值,!^,代表的第i维数值。6.根据权利要求5所述的一种基于集成的快速谱聚类方法,其特征在于,步骤5具体为:根据步骤4BIRCH分类树得到的label值对谱聚类的结果进行修正和集成,将特征向量依次插入BIRCH树中时,通过特征向量之间的距离与阈值T的比较,如果特征向量之间的距离小于阈值T,则与已有簇合并,否则,得到新的类。7.根据权利要求6所述的一种基于集成的快速谱聚类方法,其特征在于,阈值T的确定步骤为:A、对于每张图片提取到的特征向量数#FV为:width=Width-NM+lheight=Height-NM+1#FV=widthXheight;B、计算每个图像中提取的特征向量与特征向量搜索树中的近似最近邻之间的距离dFV,j,通过下式确定阈值:其中1为读取的图片数量,dFq为第j个特征向量与其近似最近邻之间的距离。8.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤6具体包括:步骤6.1:设定一个包含RGB颜色值的数组;步骤6.2:将不同的RGB值赋值给不同的Iabe1值;步骤6.3:使用label对应的RGB值标记出图片不同的物体,得到分割结果。

百度查询: 西安交通大学 一种基于集成的快速谱聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。