申请/专利权人:北京工业大学
申请日:2021-08-10
公开(公告)日:2024-04-26
公开(公告)号:CN113807393B
主分类号:G06F18/23
分类号:G06F18/23;G06F17/16
优先权:
专利状态码:有效-授权
法律状态:2024.04.26#授权;2022.01.04#实质审查的生效;2021.12.17#公开
摘要:本发明公开了基于多属性非负矩阵分解的聚类方法,该方法将希尔伯特施密特准则和图正则化同时引入到单视图非负矩阵分解领域。对原始数据进行多属性分解,多方面理解数据,得到不同降维后的数据矩阵。利用希尔伯特施密特准则增加不同属性分解之间的多样性,减少冗余特征,每个低维表示都保持独立,并且对应数据特定的属性,以求能够得到更加准确的原始数据的低维表示。许多低维表示仅仅是对高维数据进行降维,但是原始的数据往往存在着某种几何结构,这对聚类有很大的帮助,也是极其重要的信息,利用图正则化项能够保持数据的局部几何结构。最后,在聚类阶段直接采取多视图下k‑means方法来整合不同属性的低维表示,充分利用了来自各个属性的信息。
主权项:1.基于多属性非负矩阵分解的聚类方法,其特征在于:选取四个不同的图像数据集作为输入对象,以增加本实验的可靠性;再选择五个不同的聚类方法做对比,以体现本方法的优越性,增加可信度;选择四个不同的实验度量方法,用不同的评估标准度量聚类效果;然后再对模型使用拉格朗日乘法更新法则进行求解;最后用得到的系数矩阵进行后续的聚类,并记录评价指标做对比;其具体步骤如下:步骤一:构建样本点首先使用四个经典的数据库ORL,PIE,Yale和ExtendedYaleB来构建输入样本点,任选一个数据库其中xi是一个样本点;步骤二:数据降维根据得到的数据库X,利用所提出的方法对数据进行降维处理: 其中,λ1和λ2是平衡多样性项和图正则化项的参数,取值范围为{10-4,10-3,10-2,10-1,100,101,102,103,104};k是分解出的不同低维表示V的数量;Tr是矩阵的迹;W是度量两个点距离的邻接矩阵;D是度矩阵,并且L=D-W是拉普拉斯矩阵;本方法的更新规则如下; 步骤三、后续聚类根据上述步骤及其更新规则得到多属性解,得到的多个Vi相当于多视图的多个输入,所以直接利用多视图k-means方法对多个解Vi进行聚类,聚类方法具体介绍如下: 其中,表示第i个视图的特征;是第i个视图的质心矩阵;是第i个视图的聚类指标;给出M种异构特征,i=1,2,...M;αi是第i个视图的权重因子;γ是控制权重分布的参数;根据公式3对多属性分解得到的不同系数矩阵进行聚类。
全文数据:
权利要求:
百度查询: 北京工业大学 基于多属性非负矩阵分解的聚类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。