买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于视图内子特征异质性和视图兼容性的聚类方法_陕西师范大学_202410119676.6 

申请/专利权人:陕西师范大学

申请日:2024-01-29

公开(公告)日:2024-04-16

公开(公告)号:CN117893782A

主分类号:G06V10/762

分类号:G06V10/762;G06V10/74

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.03#实质审查的生效;2024.04.16#公开

摘要:一种基于视图内异构性和视图间兼容性的聚类方法,构建多视图数据集得到视图的相似度矩阵,初始化视图的特征权重,构建基于视图内子特征异质性和视图间兼容性的多视图聚类模型,根据一致性相似度矩阵S和样本标签矩阵G及视图的特征权重矩阵Wv的初始值,采用迭代交替法求解步骤3优化后的多视图聚类模型,直至得到最终的样本标签矩阵G,得到聚类结果;本发明自动的为每个视图中的子特征赋予权重,使每个属性获得更精准的权重;此外,所提方法通过学习局部流形结构得到数据相似性图,并在构建相似性图的同时通过施加秩约束进行聚类划分,解决了传统基于图的聚类严重依赖于相似性图的问题,从而获得更好的聚类结果。

主权项:1.一种基于视图内子特征异质性和视图兼容性的聚类方法,其特征在于,由以下步骤组成:步骤1、构建多视图数据集得到视图的相似度矩阵构建多视图样本数据集X={X1,X2,...,XV},V为视图的总数,为第v个视图的特征,v=1,2,…,V,n为样本点总数,dv为第v个视图特征的维数,为第v个视图中第i个样本点,定义多视图样本数据集的类别数目为c;根据得到第v视图中第i个样本点与第j个样本点之间的欧式距离,i,j=1,2,...,n;对于同一视图中的每一个样本点,将其他样本点与它的欧式距离按照从小到大进行排序,选择前k个距离最小的样本点作为它的邻域点,按照下式得到第i个样本点与第j个样本点之间的相似度 式中,为距离样本点第k+1个近样本点与样本点之间的欧式距离,为第i个样本点与第j个样本点之间的欧式距离,当i=j时,相似度以相似度作为矩阵的第i行j列元素值,得到第v个视图的相似度矩阵Sv∈Rn×n,v=1,2,...,V;步骤2、初始化视图的特征权重步骤2.1、将所有V个视图的相似度矩阵相加后取平均值,得到初始的一致性相似度矩阵S,按照L=D-ST+S2得到初始化的拉普拉斯矩阵L,其中D为度矩阵,是对角矩阵,其第i个对角元素为sij为一致性相似度矩阵S的第i行j列元素;步骤2.2、按照下式初始化视图的特征权重矩阵Wv∈Rdv×dv,v=1,2,...,V, 式中,是第v个视图的对角矩阵Hv中第i个对角元素,是第v个视图的对角矩阵Hv中第j个对角元素,为视图内第i个子特征所对应的权重,diag*为对角矩阵;步骤3、构建基于视图内子特征异质性和视图间兼容性的初始多视图聚类模型如下: 式中,s.t.表示目前函数受约束条件的限制,I表示单位向量,si表示一致性相似度矩阵S的第i行向量,T表示转置符号,wv表示第v个视图的权重向量,γ表示正则化参数,rankL=n-c表示秩约束,用于确保S对应的相似图具有精准的c个连通分量;在KyFan定理的激励下,优化多视图聚类模型,得到优化后的多视图聚类模型如下: 式中,‖*‖F为F的范数,Tr为矩阵的迹,λ为正则化参数,G为样本标签矩阵;步骤4、根据一致性相似度矩阵S和样本标签矩阵G及视图的特征权重矩阵Wv的初始值,采用迭代交替法求解步骤3优化后的多视图聚类模型,直至得到最终的样本标签矩阵G;所述迭代交替法为:步骤1、固定一致性相似度矩阵S和样本标签矩阵G,得到下式: Hv为第v个视图的对角矩阵,其第i个对角元素是的第i个对角元素,求解下式更新视图的特征权重矩阵Wv: 步骤2、固定样本标签矩阵G和视图的特征权重矩阵Wv,得到下式: 式中,gi和gj分别为固定样本标签矩阵G的第i行和第j行向量,i,j=1,2,...,n;令向量中的第j个元素为得到通过拉格朗日函数和KKT条件式得到并求解更新一致性相似度矩阵S,μ∈R为拉格朗日乘子,*+=max*,0;步骤3固定一致性相似度矩阵S和视图的特征权重矩阵Wv,按照下式求解更新样本标签矩阵G: 样本标签矩阵G的最优解由L的c个最小特征值所对应的的特征向量构成;步骤4、迭代停止判断分别将一致性相似度矩阵S和样本标签矩阵G及特征权重矩阵Wv的上次值和此次更新得到的值代入下式目标函数Obj: 若得到的两个目标函数值Obj的差值≤设定的阈值,则停止迭代,得到的G为最终的标签矩阵;若超出设定的阈值,则返回步骤1继续迭代更新;步骤5、按照下式得到聚类结果:yi=argmax1≤j≤cGij,i=1,2,...,n式中yi为第i个样本的标签,Gij是步骤4得到的最终的样本标签矩阵G的第i行j列元素。

全文数据:

权利要求:

百度查询: 陕西师范大学 基于视图内子特征异质性和视图兼容性的聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。