买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于数据物理特征和隐含风格特征的分类方法_常州工业职业技术学院_201910205905.5 

申请/专利权人:常州工业职业技术学院

申请日:2019-03-18

公开(公告)日:2023-11-10

公开(公告)号:CN109977150B

主分类号:G06F16/2458

分类号:G06F16/2458;G06F18/214;G06F18/2413;G06Q50/00

优先权:

专利状态码:有效-授权

法律状态:2023.11.10#授权;2019.07.30#实质审查的生效;2019.07.05#公开

摘要:本发明涉及模式识别与人工智能、机器学习技术领域,具体地说,是一种基于数据物理特征和隐含风格特征的分类方法,包括以下步骤:1利用K近邻算法将数据集映射成包含C个子网络的社交网络;2在构建的社交网络中挖掘数据隐含风格特征—权威性和影响力;3根据数据距离特征和权威性风格特征计算每一个测试样本与社交网络中每个节点之间的双层结构效率确定测试样本每个子网络的允许连接集;4根据允许连接集计算每个允许连接集中所有节点的影响力之和;5将测试样本标签类型判别为与具有最大节点影响力之和对应的子网络标签类型。

主权项:1.一种基于数据物理特征和隐含风格特征的分类方法,其特征在于,包括以下步骤:步骤一:对于给定数据集X=[x1,x2,…,xN]T,其中xi∈Rd,标签集为Y=[y1,y2,…,yN]T利用K近邻算法将给定数据集X映射成社交网络G,所述给定数据集为癫痫脑电信号或手写体数据集或元音识别数据集;步骤二:构建的社交网络G中挖掘数据权威性和数据影响力两种数据暗含风格特征;步骤三:对于测试集T=[t1,t2,…,tM]T,其中tm∈Rd,根据数据物理特征和数据暗含风格特征计算测试集中每个测试样本与社交网络G中每个子网络之间的允许连接集;步骤四:根据步骤三中生成的允许连接集计算每个允许连接集中节点的影响力之和;步骤五:根据步骤四计算出的每个允许连接集中节点的影响力之和,将测试样本的标签类型判别为与具有最大节点影响力之和对应的子网络标签类型;构建的社交网络G中挖掘数据权威性和数据影响力两种数据暗含风格特征,进一步地:在上述构建的社交网络G中首先挖掘每个节点vi的权威性ai以及子网络gq的权威性所述节点即为数据集X中的每一个数据样本,所述子网络即为数据集X中的每一个数据类;所述节点vi的权威性ai来源于所述社交网络G中节点vi的入度、出度以及度以充分计算所述节点权威性,所述节点vi的权威性ai计算公式为 其中,以及计算公式分别为 上述公式中,以及Di分别代表所述节点vi的出度、入度以及度,ξ代表一非常小的正值使得数据集X中的离群样本或噪声样本不影响所述分类方法的分类性能;利用模糊化方法对所述节点vi的权威性进行模糊化得到节点vi的模糊权值ωi,其计算公式为 其中,N代表数据集X包含的样本总数;当任一节点权威性确定后,计算子网络gq权威性,其计算公式为 其中,代表子网络gq包含的节点个数,即与子网络gq相对应的数据类包含的样本个数,vm代表子网络gq包含的第m个节点;当任一节点vi的模糊权值确定后,计算节点vi的影响力,其计算公式为 其中,代表第i个节点vi在第h次迭代过程中的影响力,α代表社交网络阻尼系数,取值为α=0.85;ρj代表社交网络G的节点密度,其计算公式为 其中,djk代表节点vj和vk之间的距离,所选距离为欧氏距离,dc代表截断距离,其值人为设置,使得节点vj周围的节点个数占社交网络G中所有节点个数的1~2%;χ·代表一判断函数,即如果djk-dc<0,则有χ·=1,反之χ·=0;当公式7中的迭代循环次数达到最大值H或满足以下条件,迭代循环将终止; 其中,||·||2代表2范式,θ代表一阈值。

全文数据:一种基于数据物理特征和隐含风格特征的新颖分类方法技术领域本发明涉及模式识别与人工智能、机器学习技术领域,具体地说,是一种基于数据物理特征和隐含风格特征的新颖分类方法。背景技术数据分类技术在机器学习、模式识别以及数据挖掘等领域一直都是研究的热点问题,尤其将数据分类技术与实际应用相结合,如智能医疗、人脸识别、智能交通监控、市场动态分析等,更是深远推动了数据分类技术的发展,拓宽了数据分类技术在军工业、民生等领域的运用前景。数据分类技术的关键就在于选取合适的数据特征通过分类方法构建具有高精度性能的数据分类模型。传统分类方法,如支持向量机、K近邻、随机森林、贝叶斯、决策树、人工神经网络以及Takagi-Sugeno-KangTSK模糊分类器等,利用数据物理特征如距离、颜色以及相似性等训练数据分类模型。然而,大多数实际数据集中的数据样本之间暗含着关联,每一类数据样本呈现独特的隐含风格特征,典型的数据集包括:1癫痫脑电信号:正常人群的脑电信号波形明显不同于患有癫痫人群的脑电信号;2手写体数据集:每一位作者的字体风格明显不同于其他作者;3元音识别:英文中的每个元音发音互不相同。目前,传统分类方法在训练数据分类模型的过程中仅考虑数据物理特征,并没有涉及数据隐含风格特征,在国内外发表的文献中未见有一种数据分类方法能够挖掘数据隐含风格特征,并同时利用数据物理特征和数据隐含风格特征训练数据分类模型。因而,现有的数据分类方法并不符合数据集包含数据隐含风格特征的事实。发明内容本发明的目的旨在提供一种落脚于社交网络的基于数据物理特征和隐含风格特征的新颖分类方法,能够符合大多数实际数据集包含数据隐含风格特征的事实,并通过社交网络挖掘数据隐含风格特征用于改善数据分类行为,提高数据分类精度。而且,该方法在训练阶段不需要生成数据分类模型,确定社交网络中节点隐含风格特征后便可进入分类阶段。为实现上述目的,本发明的实例提出了一种基于数据物理特征和隐含风格特征的新颖分类方法,包括以下步骤:利用K近邻算法将数据集映射成包含C个子网络的社交网络;在构建的社交网络中挖掘数据隐含风格特征—权威性和影响力;根据数据距离特征和权威性风格特征计算每一个测试样本与社交网络中每个节点之间的双层结构效率确定测试样本每个子网络的允许连接集;根据允许连接集计算每个允许连接集中所有节点的影响力之和;将测试样本标签类型判别为与具有最大节点影响力之和对应的子网络标签类型。在上述技术方案中,对于给定数据集X=[x1,x2,…,xN]T,其中xi∈Rd,标签集为Y=[y1,y2,…,yN]T,利用K近邻算法将给定数据集X映射成社交网络G,进一步包括:利用K近邻算法将给定数据集X映射成社交网络G={g1,g2,…,gQ},其中Q等于数据集X中包含的类别数,数据集X中的每个样本xi对应社交网络G的节点vi;根据K近邻算法,社交网络G中的任意两个节点vi和vj满足以下两个条件:1节点vj为节点vi的邻居节点及2节点vj与节点vi具有相同的标签,则在节点vi和vj之间建立以vi为起点、vj为结点的有向边eij;根据所述所建社交网络G,每个子网络与数据集X中的每一个数据类对应,任意两个子网络gp和gq之间相互独立,子网络中每个节点具有相同的标签且与对应的数据类标签相同。本发明的进一步改进,在上述构建的社交网络G中挖掘数据权威性和数据影响力两种数据暗含风格特征,进一步包括:在上述构建的社交网络G中首先挖掘每个节点vi的权威性ai以及子网络gq的权威性所述节点即为数据集X中的每一个数据样本,所述子网络即为数据集X中的每一个数据类。所述节点vi的权威性ai来源于所述社交网络G中节点vi的入度、出度以及度以充分计算所述节点权威性。据此,在所述社交网络G中,如果有更多的其他节点连接某一节点,那么该节点具有较高的权威性;如果某一节点连接更多的其他节点,那么该节点同样具有较高的权威性。所述节点vi的权威性ai计算公式为其中,以及计算公式分别为公式1~4中,以及Di分别代表所述节点vi的出度、入度以及度。ξ代表一非常小的正值使得数据集X中的离群样本或噪声样本不影响所述分类方法的分类性能。利用模糊化方法对所述节点vi的权威性进行模糊化得到节点vi的模糊权值ωi,其计算公式为其中,N代表数据集X包含的样本总数。由公式2可知,所述模糊权值ωi的范围为0,1,且对于所述节点vi的权威性,如果其值越高,那么相应的模糊权值也越高。当所述任一节点权威性确定后,可计算子网络gq权威性,其计算公式为其中,代表子网络gq包含的节点个数,即与子网络gq相对应的数据类包含的样本个数,vm代表子网络gq包含的第m个节点。当所述任一节点vi的模糊权值确定后,可计算节点vi的影响力,其计算公式为其中,代表第i个节点vi在第h次迭代过程中的影响力,α代表社交网络阻尼系数,一般取值为α=0.85。ρj代表社交网络G的节点密度,其计算公式为其中,djk代表节点vj和vk之间的距离,所选距离为欧氏距离,dc代表截断距离,其值可人为设置,使得节点vj周围的节点个数占社交网络G中所有节点个数的1~2%。χ·代表某一判断函数,即如果djk-dc<0,则有χ·=1,反之χ·=0。当公式4中的迭代循环次数达到最大值H或满足以下条件,迭代循环将终止。其中,||·||2代表2范式,θ代表某一较小阈值,可人为设置,如θ=10-4。由公式8可知,利用社交网络G中节点的密度计算所述节点影响力,即根据数据集中样本的实际分布情况计算所述节点影响力。且在迭代过程中不断传播节点密度,使得所述节点影响力具有动态的特性。另外,利用节点模糊权值将所述节点权威性与节点影响力两种所述数据隐含风格特征相关联,使得所述节点权威性与所述节点影响力之间呈正相关关系,即节点权威性越高,所述节点影响力也越高。对于测试集T=[t1,t2,…,tM]T,其中tm∈Rd,根据数据物理特征和数据暗含风格特征计算测试集中每个测试样本与社交网络G中每个子网络之间的允许连接集,进一步包括:当向所述社交网络G嵌入测试集T中的某一测试样本t时,首先计算双层结构效率Λt,j,其计算公式为其中,vj代表子网络gq中的第j个节点,即与子网络gq相对应的数据类中的第j个样本,dtj代表所述测试样本t与节点vj之间的距离,所述距离为欧式距离。γ代表平衡系数,其值越高,代表所述节点权威性起的作用越大,反之,代表数据物理特征起的作用越大。由公式10可知,所述双层结构效率Λt,j由数据物理特征和数据隐含风格特征共同决定。利用所述双层结构效率可确定所述允许连接集以用于计算所述测试样本t与各子网络之间的允许连接集影响力之和,所述允许连接集确定标准表达如下其中,所述双层结构效率Λt,j为所述测试样本t与所述节点vj之间的函数,以用于检验当所述测试样本t与所述节点vj之间建立连接边时是提高所述双层结构效率Λt,j值还是降低所述双层结构效率Λt,j值。据此,可生成所述允许连接集描述如下1如果存在节点vj使得Λt,j≥1,即双层结构效率被提高,则将节点vj加入到允许连接集2如果不存在节点vj满足1,即双层结构效率被降低,则将最接近于Λt,j=1情况下的节点加入到允许连接集此时所述允许连接集只包含一个节点。本发明的进一步改进,根据所述生成的允许连接集计算每个允许连接集中节点的影响力之和,进一步包括:根据所述允许连接集计算各个允许连接集中节点的影响力之和以用于确定最大的影响力之和。各个允许连接集中节点的影响力之和计算公式为本发明的进一步改进,根据所述每个允许连接集中节点的影响力之和,将测试样本的标签类型判别为与具有最大节点影响力之和对应的子网络标签类型,进一步包括:根据所述每个允许连接集中节点的影响力之和,确定最大的影响力之和其计算公式为根据所述最大的影响力之和将测试样本的标签类型判别为与具有最大节点影响力之和对应的子网络标签类型。本发明的有益效果:本发明能够符合大多数实际数据集包含数据隐含风格特征的事实,并通过社交网络挖掘数据隐含风格特征用于改善数据分类行为,提高数据分类精度。附图说明图1是本发明的流程图;图2是本发明的算法流程图;图3是本发明包含两个数据类数据集映射的社交网络的示意图;图4是本发明中社交网络中节点属性展示图;图5是本发明中社交网络中节点权威性示意图;图6是本发明中社交网络中节点影响力示意图;图7是本发明根据双层结构效率生成的允许连接集示意图;图8是本发明根据允许连接集最大节点影响力之和预测测试样本标签类型的示意图。具体实施方式为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。下面结合具体实施例以及附图对本发明的技术方案做进一步详细、完整地描述。显然,所述具体实施例可在以下附图中展示,且仅仅用作解释本发明的技术方案,而不是对本发明具体用途的限制。如图1所示,根据一种社交网络的基于数据物理特征和隐含风格特征的新颖分类方法,包括以下步骤:步骤一,对于给定数据集X=[x1,x2,…,xN]T,其中xi∈Rd,标签集为Y=[y1,y2,…,yN]T,利用K近邻算法将给定数据集X映射成社交网络G={g1,g2,…,gQ},其中Q等于数据集X中包含的类别数,数据集X中的每个样本xi对应社交网络G的节点vi。进一步地,在上述步骤一中,根据K近邻算法,社交网络G中的任意两个节点vi和vj满足以下两个条件:节点vj为节点vi的邻居节点及节点vj与节点vi具有相同的标签,则在节点vi和vj之间建立以vi为起点、vj为结点的有向边eij。进一步地,在上述步骤一中,根据所述所建社交网络G,每个子网络与数据集X中的每一个数据类对应,任意两个子网络gp和gq之间相互独立,子网络中每个节点具有相同的标签且与对应的数据类标签相同。步骤二,对步骤一构建的社交网络G中挖掘数据权威性和数据影响力两种数据暗含风格特征,具体地,对步骤1构建的社交网络G中首先挖掘每个节点vi的权威性ai以及子网络gq的权威性所述节点即为数据集X中的每一个数据样本,所述子网络即为数据集X中的每一个数据类。所述节点vi的权威性ai来源于所述社交网络G中节点vi的入度、出度以及度以充分计算所述节点权威性。据此,在所述社交网络G中,如果有更多的其他节点连接某一节点,那么该节点具有较高的权威性;如果某一节点连接更多的其他节点,那么该节点同样具有较高的权威性。所述节点vi的权威性ai计算公式为其中,以及计算公式分别为在上述公式中,以及Di分别代表所述节点vi的出度、入度以及度。ξ代表一非常小的正值使得数据集X中的离群样本或噪声样本不影响所述分类方法的分类性能。利用模糊化方法对所述节点vi的权威性进行模糊化得到节点vi的模糊权值ωi,其计算公式为其中,N代表数据集X包含的样本总数。由公式5可知,所述模糊权值ωi的范围为0,1,且对于所述节点vi的权威性,如果其值越高,那么相应的模糊权值也越高。当所述任一节点权威性确定后,可计算子网络gq权威性,其计算公式为其中,代表子网络gq包含的节点个数,即与子网络gq相对应的数据类包含的样本个数,vm代表子网络gq包含的第m个节点。当所述任一节点vi的模糊权值确定后,可计算节点vi的影响力,其计算公式为其中,代表第i个节点vi在第h次迭代过程中的影响力,α代表社交网络阻尼系数,一般取值为α=0.85。ρj代表社交网络G的节点密度,其计算公式为其中,djk代表节点vj和vk之间的距离,所选距离为欧氏距离,dc代表截断距离,其值可人为设置,使得节点vj周围的节点个数占社交网络G中所有节点个数的1~2%。χ·代表某一判断函数,即如果djk-dc<0,则有χ·=1,反之χ·=0。当公式4中的迭代循环次数达到最大值H或满足以下条件,迭代循环将终止。其中,||·||2代表2范式,θ代表某一较小阈值,可人为设置,如θ=10-4。由公式7可知,利用社交网络G中节点的密度计算所述节点影响力,即根据数据集中样本的实际分布情况计算所述节点影响力。且在迭代过程中不断传播节点密度,使得所述节点影响力具有动态的特性。另外,利用节点模糊权值将所述节点权威性与节点影响力两种所述数据隐含风格特征相关联,使得所述节点权威性与所述节点影响力之间呈正相关关系,即节点权威性越高,所述节点影响力也越高。步骤三,对于测试集T=[t1,t2,…,tM]T,其中tm∈Rd,根据数据物理特征和数据暗含风格特征计算测试集中每个测试样本与社交网络G中每个子网络之间的允许连接集,具体地,当向所述社交网络G嵌入测试集T中的某一测试样本t时,首先计算双层结构效率Λt,j,其计算公式为其中,vj代表子网络gq中的第j个节点,即与子网络gq相对应的数据类中的第j个样本,dtj代表所述测试样本t与节点vj之间的距离,所述距离为欧式距离。γ代表平衡系数,其值越高,代表所述节点权威性起的作用越大,反之,代表数据物理特征起的作用越大。所述双层结构效率Λt,j由数据物理特征和数据隐含风格特征共同决定。利用所述双层结构效率可确定所述允许连接集以用于计算所述测试样本t与各子网络之间的允许连接集影响力之和,所述允许连接集确定标准表达如下其中,所述双层结构效率Λt,j为所述测试样本t与所述节点vj之间的函数,以用于检验当所述测试样本t与所述节点vj之间建立连接边时是提高所述双层结构效率Λt,j值还是降低所述双层结构效率Λt,j值。据此,可生成所述允许连接集描述如下1如果存在节点vj使得Λt,j≥1,即双层结构效率被提高,则将节点vj加入到允许连接集2如果不存在节点vj满足1,即双层结构效率被降低,则将最接近于Λt,j=1情况下的节点加入到允许连接集此时所述允许连接集只包含一个节点。步骤四,根据所述允许连接集计算各个允许连接集中节点的影响力之和以用于确定最大的影响力之和。各个允许连接集中节点的影响力之和计算公式为步骤五,根据所述每个允许连接集中节点的影响力之和,确定最大的影响力之和其计算公式为进一步地,根据所述最大的影响力之和将测试样本的标签类型判别为与具有最大节点影响力之和对应的子网络标签类型。如图2所示,当输入数据集X以及测试数据集T时,在训练阶段,首先利用K紧邻算法将数据集X通过上述步骤1映射成社交网络G,其次,利用上述步骤二挖掘社交网络G中每个节点的权威性和影响力以及子网络权威性,具体地,利用上述步骤二中公式8计算社交网络G中每个节点的浓度,利用上述步骤二中公式1-4计算每个节点及子网络权威性,利用上述步骤二中公式7和公式9计算每个节点的影响力。在分类阶段,当输入某一个测试样本t时,首先根据上述步骤三中的公式10和公式11建立测试样本t与各个子网络之间的允许连接集,然后根据上述步骤四中公式12计算每个允许连接集中节点影响力之和,最后根据上述步骤五中公式13确定具有最大节点影响力之和的允许连接集,将测试样本的标签类型判别为与具有最大节点影响力之和允许连接集相对应的标签类型。如图3所示,输入的数据集X包含两类数据,标签分别为0和1,因此,将数据集X映射成社交网络G后包含两个相互独立的子网络,分别用和“■”来表示,且子网络对应的标签类型也分别为0和1。如图4所示,在社交网络G中展示了部分节点的度以及部分节点之间的距离,所述距离为欧氏距离。节点的入度和出度可通过节点之间建立的有向边来确定。如图5所示,在社交网络G中展示了所有节点和子网络的权威性,其中子网络的权威性根据该子网络中所有节点的权威性计算而得。如图6所示,在社交网络G中展示了所有节点的影响力,其中,在迭代计算节点影响力的过程中,通过传播社交网络中每个节点的浓度,即根据数据集中每个样本的实际分布情况,使得节点影响力具有动态的特性。如图7所示,当向建好的社交网络G嵌入某个测试样本时,通过双层结构效率确定测试样本与每个子网络的允许连接集。其中,测试样本用“◇”来表示,双层结构效率中数据的物理特征和隐含风格特征通过平衡系数共同起作用。如图8所示,由于测试样本与子网络之间的允许连接集节点影响力之和大于测试样本与子网络“■”之间的允许连接集节点影响力之和,因此,将测试样本的标签类型确定为“0”。以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

权利要求:1.一种基于数据物理特征和隐含风格特征的新颖分类方法,其特征在于,包括以下步骤:步骤一:对于给定数据集X=[x1,x2,…,xN]T,其中xi∈Rd,标签集为Y=[y1,y2,…,yN]T利用K近邻算法将给定数据集X映射成社交网络G;步骤二:在上述构建的社交网络G中挖掘数据权威性和数据影响力两种数据暗含风格特征;步骤三:对于测试集T=[t1,t2,…,tM]T,其中tm∈Rd,根据数据物理特征和数据暗含风格特征计算测试集中每个测试样本与社交网络G中每个子网络之间的允许连接集;步骤四:根据步骤三中生成的允许连接集计算每个允许连接集中节点的影响力之和;步骤五:根据步骤四计算出的每个允许连接集中节点的影响力之和,将测试样本的标签类型判别为与具有最大节点影响力之和对应的子网络标签类型。2.根据权利要求1所述的基于数据物理特征和隐含风格特征的新颖分类方法,其特征在于,对于给定数据集X=[x1,x2,…,xN]T,其中xi∈Rd,标签集为Y=[y1,y2,…,yN]T,利用K近邻算法将给定数据集X映射成社交网络G,进一步地,利用K近邻算法将给定数据集X映射成社交网络G={g1,g2,…,gQ},其中Q等于数据集X中包含的类别数,数据集X中的每个样本xi对应社交网络G的节点vi;根据K近邻算法,社交网络G中的任意两个节点vi和vj满足以下条件:节点vj为节点vi的邻居节点及节点vj与节点vi具有相同的标签,则在节点vi和vj之间建立以vi为起点、vj为结点的有向边eij。3.根据权利要求2所述的基于数据物理特征和隐含风格特征的新颖分类方法,其特征在于,所述社交网络G,每个子网络与数据集X中的每一个数据类对应,任意两个子网络gp和gq之间相互独立,子网络中每个节点具有相同的标签且与对应的数据类标签相同。4.根据权利要求3所述的基于数据物理特征和隐含风格特征的新颖分类方法,其特征在于,在上述构建的社交网络G中挖掘数据权威性和数据影响力两种数据暗含风格特征,进一步地:在上述构建的社交网络G中首先挖掘每个节点vi的权威性ai以及子网络gq的权威性所述节点即为数据集X中的每一个数据样本,所述子网络即为数据集X中的每一个数据类;所述节点vi的权威性ai来源于所述社交网络G中节点vi的入度、出度以及度以充分计算所述节点权威性,所述节点vi的权威性ai计算公式为其中,以及计算公式分别为上述公式中,以及Di分别代表所述节点vi的出度、入度以及度,ξ代表一非常小的正值使得数据集X中的离群样本或噪声样本不影响所述分类方法的分类性能;利用模糊化方法对所述节点vi的权威性进行模糊化得到节点vi的模糊权值ωi,其计算公式为其中,N代表数据集X包含的样本总数;当所述任一节点权威性确定后,可计算子网络gq权威性,其计算公式为其中,代表子网络gq包含的节点个数,即与子网络gq相对应的数据类包含的样本个数,vm代表子网络gq包含的第m个节点;当所述任一节点vi的模糊权值确定后,可计算节点vi的影响力,其计算公式为其中,代表第i个节点vi在第h次迭代过程中的影响力,α代表社交网络阻尼系数,一般取值为α=0.85;ρj代表社交网络G的节点密度,其计算公式为其中,djk代表节点vj和vk之间的距离,所选距离为欧氏距离,dc代表截断距离,其值可人为设置,使得节点vj周围的节点个数占社交网络G中所有节点个数的1~2%;χ·代表某一判断函数,即如果djk-dc<0,则有χ·=1,反之χ·=0;当公式7中的迭代循环次数达到最大值H或满足以下条件,迭代循环将终止;其中,||·||2代表2范式,θ代表某一较小阈值。5.根据权利要求4所述的基于数据物理特征和隐含风格特征的新颖分类方法,其特征在于,对于测试集T=[t1,t2,…,tM]T,其中tm∈Rd,根据数据物理特征和数据暗含风格特征计算测试集中每个测试样本与社交网络G中每个子网络之间的允许连接集,进一步包括:当向所述社交网络G嵌入测试集T中的某一测试样本t时,首先计算双层结构效率Λt,j,其计算公式为其中,vj代表子网络gq中的第j个节点,即与子网络gq相对应的数据类中的第j个样本,dtj代表所述测试样本t与节点vj之间的距离,所述距离为欧式距离;γ代表平衡系数,其值越高,代表所述节点权威性起的作用越大,反之,代表数据物理特征起的作用越大;所述允许连接集确定标准表达如下其中,所述双层结构效率Λt,j为所述测试样本t与所述节点vj之间的函数,以用于检验当所述测试样本t与所述节点vj之间建立连接边时是提高所述双层结构效率Λt,j值还是降低所述双层结构效率Λt,j值。6.根据权利要求5所述的基于数据物理特征和隐含风格特征的新颖分类方法,其特征在于,根据所述生成的允许连接集计算每个允许连接集中节点的影响力之和,进一步包括:根据所述允许连接集计算各个允许连接集中节点的影响力之和以用于确定最大的影响力之和,各个允许连接集中节点的影响力之和计算公式为。7.根据权利要求6所述的基于数据物理特征和隐含风格特征的新颖分类方法,其特征在于,根据所述每个允许连接集中节点的影响力之和,将测试样本的标签类型判别为与具有最大节点影响力之和对应的子网络标签类型,进一步包括:根据所述每个允许连接集中节点的影响力之和,确定最大的影响力之和其计算公式为根据所述最大的影响力之和将测试样本的标签类型判别为与具有最大节点影响力之和对应的子网络标签类型。

百度查询: 常州工业职业技术学院 一种基于数据物理特征和隐含风格特征的分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术