买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于网络度相关性的信息传播领袖节点提取方法_浙江工业大学_201710111922.3 

申请/专利权人:浙江工业大学

申请日:2017-02-28

公开(公告)日:2020-02-21

公开(公告)号:CN106972952B

主分类号:H04L12/24(20060101)

分类号:H04L12/24(20060101)

优先权:

专利状态码:有效-授权

法律状态:2020.02.21#授权;2017.08.15#实质审查的生效;2017.07.21#公开

摘要:一种基于网络度相关性的信息传播领袖节点提取方法,包括以下步骤:S1:导入网络;S2:选择度最大的节点作为首个领袖节点;S3:提取领袖节点周围的所有邻居节点;S4:邻居节点的度值更新,度值计算去除与领袖节点的连边;S5:迭代选点,找到邻居节点中度值最大的节点作为新的领袖节点,并迭代步骤S2、S3,直到网络中的领袖节点数量达到目标数量ρN;S6:领袖节点分配过滤性能;S7:信息级联传播;S8:计算信息传播范围。本发明提供一种基于网络度相关性的信息传播领袖节点提取方法,考虑到网络的结构特征和网络规模,算法具有较小的时间复杂度,良好的信息过滤性能,在大规模网络上表现更为优异。

主权项:1.一种基于网络度相关性的信息传播领袖节点提取方法,其特征在于,所述方法包括如下步骤:S1:导入网络集合G=V,E,其节点集和连边集分别为V={v1,v2,...,vN}和节点总数N;S2:选取全网络中度值最大的节点作为领袖节点集合Vfilter中的第一个节点;S3:寻找邻居节点;对于Vfilter中的节点,找到其所有的不重复邻居节点Vfriend,Vfriend中不包括已经存在于Vfilter中的节点;S4:更新邻居节点度值;对于Vfilter的邻居节点Vfriend中的所有节点,更新其度值;新的度值为去除与领袖节点集合Vfilter中的连边后的度值;S5:迭代选点;对于Vfriend中的节点,按照更新后的度值降序排列,选择度值最大的节点作为新的领袖节点,并加入到Vfilter中;迭代步骤S3,S4,直到Vfilter中节点数量达到所需领袖节点数量|Vfilter|=ρN,算法停止;其中,ρ表示领袖节点占全网络的比例,用户自行设定参数;此时,Vfilter中的节点即为基于网络度相关性的信息传播领袖节点;S6:分配信息筛选性能;网络中每一个节点k都具有分辨信息的能力为Ik,根据网络信息传播模型,对集合Vfilter中的所有领袖节点,赋予其分辨信息的能力为I=1,对于网络中剩余的其他节点,赋予其分辨信息能力为I=0;S7:级联信息传播;网络中已经转发信息的节点集合记为Vreached,初始时只包含信息源节点;节点的邻居节点如果属于Vreached,并且未进行转发询问,初始时为信息源节点的邻居节点,这些节点记为Vnoworked;节点的邻居节点如果属于Vreached,并且已经进行转发询问,这些节点记为Vworked,当某个节点k的邻居节点转发信息后,那么该节点就可以看到信息,同时节点k将以概率Pk转发该信息,具体步骤为:7.1随机选择一个网络中的节点,作为信息传播的源头,转发一个消息真实性为M=01的假消息或者真消息;7.2对选择任意一个Vnoworked中的节点,根据网络信息传播模型,按照公式1计算转发概率Pk: 其中,H表示信息的自然传播率,这里H=0.5,用以保证Pk小于等于1;采用级联模型,每一个节点只有一次机会传播,传播不成功则不再继续传播;7.3产生0~1的随机数,这里每一个节点只有一次机会传播,传播不成功则不再继续传播;如果Pk≥随机数,则节点k进行转发,并将节点k的邻居节点添加到Vnoworked中,再将节点k移除出Vnoworked,加入到Vreached;如果Pk随机数,则节点k不进行转发,节点k进入Vworked;7.4当Vnoworked中不再有节点时,算法停止,表示此时所有看到信息的节点都已经经过处理,Vreached即表示传播到的节点集合;7.5不断重复步骤7.1-7.4,直到迭代次数到达5N,记录传播总次数;7.6更改领袖节点比例ρ,重复步骤2-步骤7.5,记录每个不同比例ρ下的传播总次数;S8:计算信息传播范围指标;计算每个ρ指标下的传播范围平均值,得到传播的最终结果。

全文数据:一种基于网络度相关性的信息传播领袖节点提取方法技术领域[0001]本发明涉及网络信息传播领域和网络结构领域,特别是涉及一种基于网络度相关性的信息传播领袖节点提取方法。背景技术[0002]信息传播在社会网络的传播中扮演重要角色,大量重要研究在最近几年提出用于描述信息传播的重要特征。在社会网络信息传播的研究过程中,一个关键的问题就是:寻找社会网络中最具有一信息传播影响力”的节点集合,通过对该节点集合施加信息控制,可以导致信息更快更全地传播到整个网络,亦或是使得信息被迅速地衰减。[0003]直观地,社会网络中最具有一信息传播影响力”的节点的概念类似于网络的HUB特性(参考文南犬[1]:KleinbergJM.AuthoritativesourcesinahyperIinkedenvironment[J].JournaloftheAcm,1999,465:604-632.即KleinbergJM,超链接环境下的权威源JournaloftheAcm,1999,465:604-632.,是网络中连接良好的实体集合。HUB特性的概念被用于找到WEB网络中的中心节点。然而,信息传播的概念与HUB的概念框架是不同的,它更加依赖于底层网络传播的结构。它既依赖于网络的结构拓扑特征,也依赖于不同连边的传播密度。单独的局部结构测试不能提供全局的中心流动性centralityofflows,更多地,流动中心性既取决于不同节点之间的交互模式,也取决于全局拓扑结构。[0004]Lerman等研究了Digg和Twitter这两个网络中的新闻信息的传播扩散参考文献[2]:LermanK1GhoshR.InformationContagion:anEmpiricalStudyoftheSpreadofNewsonDiggandTwitterSocialNetworks[J].ComputerScience,2010,52:166-176.即LermanK,GhoshR,信息蔓延:一个Digg和Twitter社交网络上新闻传播的经验性学习,ComputerScience,2010,52:166-176.,发现由于两个网络不同的连通性特征,导致了传播结果的显著差异,Digg网络活跃用户之间高度互联,密度大,信息扩散速度快但是范围小;而Twitter网络活跃用户之间的网络密度较Digg稀疏、连通性差,信息开始扩散速度慢但是扩散范围广。网络的小世界特性由于其随机连接,故小世界特性可以促进简单传播,Lil等提出了扩散模型用于之处信息扩散和疾病传播的本质区别,且分析了小世界特性的重要作用(参考文献[3]:LiiL,ChenDB,ZhouT.Smallworldyieldsthemosteffectiveinformationspreading[J].NewJournalofPhysics,2011,abs1107.042912:825-834.即LiiL,ChenDB,ZhouT,小世界网络具有最有效信息传播模式,NewJournalofPhysics,2011,abs1107.042912:825-834.。[0005]虽然已经有各种工作研究网络结构对信息传播的影响,但是在信息传播领域,考虑网络结构的影响下,再提取出那些最具有一信息传播影响力”的节点的工作仍然不全面,在不同度相关性的网络上,单独的基于度值的策略具有局限。同时,在大规模网络下,传统的提取中心性节点方法很多都难有用武之地,需要一种快速的提取信息领袖节点的方法。[0006]因此,本发明受到以往提取网络中心性节点学习的推动,我们旨在解决以下两方面问题:(1考虑网络结构中的度相关性,并针对度相关性提出领袖节点的提取策略2考虑网络的规模大小,节点提取策略时间复杂度不能过高。发明内容[0007]为了克服现有技术时间复杂度较大、信息过滤性能较差、无法适用于大规模网络的不足,本发明提供一种基于网络度相关性的信息传播领袖节点提取方法,考虑到网络的结构特征和网络规模,算法具有较小的时间复杂度,良好的信息过滤性能,在大规模网络上表现更为优异。本发明解决其技术问题所采用的技术方案如下:[0008]—种基于网络度相关性的信息传播领袖节点提取方法,所述方法包括如下步骤:[0009]SI:导入网络集合G=V,E,其节点集和连边集分别为V={V1,V2,...,VN}和五drXr,节点总数N;[0010]S2:选取全网络中度值最大的节点作为领袖节点集合Vfllter中的第一个节点;[0011]S3:寻找邻居节点;对于Vmter中的节点,找到其所有的不重复邻居节点Vfriend,Vfriend中不包括已经存在于Vfilter中的T1点;[0012]S4:更新邻居节点度值;对于Vfiltei•的邻居节点Vfriend中的所有节点,更新其度值;新的度值为去除与领袖节点集合Vfllto中的连边后的度值;[0013]S5:迭代选点;对于Vfriend中的节点,按照更新后的度值降序排列,选择度值最大的节点作为新的领袖节点,并加入到Vfiitei•中;迭代步骤S3,S4,直到VfiitCT中节点数量达到所需领袖节点数量IVfilterI=PN,算法停止。其中,P表示领袖节点占全网络的比例,用户自行设定该参数;此时,Vfllter中的节点即为基于网络度相关性的信息传播领袖节点;[0014]S6:分配信息筛选性能;网络中每一个节点k都具有分辨信息的能力为Ik。根据网络信息传播模型,对集合Vmte3r中的所有领袖节点,赋予其分辨信息的能力为1=1,对于网络中剩余的其他节点,赋予其分辨信息能力为1=0。[0015]S7:级联信息传播;网络中已经转发信息的节点集合记为Vreached,初始时只包含信息源节点;节点的邻居节点如果属于Vr^hed,并且未进行转发询问,初始时为信息源节点的邻居节点,这些节点记为VnClirorked;节点的邻居节点如果属于Vreac^d,并且已经进行转发询问,这些节点记为Virorked,当某个节点k的邻居节点转发信息后,那么该节点就可以看到信息,同时节点k将以概率Pk转发该信息,具体步骤为:[0016]7.1随机选择一个网络中的节点,作为信息传播的源头,转发一个消息真实性为M=01的假消息或者真消息;[0017]7.2对选择任意一个Vnmrorke3d中的节点,根据网络信息传播模型,按照公式⑴计算转发概率Pk:[0019]其中,H表示信息的自然传播率,这里H=O.5,用以保证Pk小于等于1;采用级联模型,每一个节点只有一次机会传播,传播不成功则不再继续传播;[0020]7.3产生0〜1的随机数,这里每一个节点只有一次机会传播,传播不成功则不再继续传播。如果Pk随机数,则节点k进行转发,并将节点k的邻居中添加到Vnmrorke3d中,再将节点k移除出Vnoworked,加入到Vre3ac^d;如果Pk〈随机数,则节点k不进行转发,节点k进入Vworked;[0021]7.4当Vnmrorked中不再有节点时,算法停止,表示此时所有看到信息的节点都已经经过处理。Vreached即表示传播到的节点集合。[0022]7.5不断重复步骤7.1-7.4,直到迭代次数到达5N,记录传播总次数;[0023]7.6更改领袖节点比例P,重复步骤2-步骤4.5,记录每个不同比例P下的传播总次数;[0024]S8:计算信息传播范围指标;计算每个P指标下的传播范围平均值,得到传播的最终结果。[0025]本发明的技术构思为:与传统的信息级联模型不同的是,这里,我们采用的信息传播级联模型认为消息只存在两种状态:真消息、假消息;网络中的领袖节点具有一定的能力来分辨出这两种不同的信息,领袖节点能够按照某种模式来传播真消息,而阻止假消息。网络中存在度相关性,不同度相关性的网络可能具有同一度分布,为了改善基于单独度值特征的节点提取策略缺点,我们提出了一种基于网络度相关性的信息传播领袖节点提取方法。该方法既考虑到时间复杂度,又考虑到网络结构一度相关性,在同配网络上,该方法提取到的领袖节点与单独基于度值的选点策略相比具有显著优势。[0026]本发明的有益效果为:1.考虑到网络结构中的度相关性,对于那些具有相同度分布但是度相关性呈现明显趋势的网络上,提出的选点策略能够比单纯的基于度值的选点策略表现显著优异;2.该方法考虑到了算法的时间复杂度,根据基于度值的策略改进而来,时间复杂度为〇η,该方法在大规模网络上表现的更为优异。附图说明[0027]图1为本发明一种基于网络度相关性的信息传播领袖节点提取方法的算法流程图。[0028]图2为本发明实施例采用的同配化的美国电力网络USposerGricL[0029]图3为本发明实施例在假信息M=O时的传播效果图。[0030]图4为本发明实施例在真信息M=I时的传播效果图。具体实施方式[0031]下面结合说明书附图对本发明的具体实施方式作进一步详细的描述。[0032]参照图1〜图4,一种基于网络度相关性的信息传播领袖节点提取方法,本发明使用美国电力网络USposerGrid的同配化网络作为实验网络,该网络是对原始网络的同配化处理,和原网络具有相同的度分布,但是同配化处理后网络中的大度值节点偏向于大度值节点,这种网络结构对应实际网络中活跃用户之间高度互联,密度大的特点。同时该电力网络节点数量众多,结构复杂,传播效果更有说明性。这里,不同数量的领袖节点迭代实验次数为节点总数5倍,S卩5N使得每个节点有很大可能性被至少随机选择到一次)。[0033]本实施例中,一种基于网络度相关性的信息传播领袖节点提取方法,其具体步骤为:[0034]SI:导入美国电力网络USposerGrid集合,G=V,E,其节点集和连边集分别为V=,节点总数N=4941,边总数IEI=6594;[0035]S2:选取全网络中度值最大的节点作为领袖节点集合Vfllter中的第一个节点。[0036]S3:寻找邻居节点;对于Vmte3冲的节点,找到其所有的不重复邻居节点Vfrie3nd,Vfriend中不包括已经存在于Vfilter中的T1点。[0037]S4:更新邻居节点度值;对于Vfiltei•的邻居节点Vfriend中的所有节点,更新其度值;新的度值为去除与领袖节点集合Vfllto中的连边后的度值。[0038]S5:迭代选点得到VfUte3r;对于Vfrie3nd中的节点,按照更新后的度值降序排列,选择度值最大的节点作为新的领袖节点,并加入到Vfiito中;迭代步骤S3,S4,直到Vmte3r中节点数量达到所需领袖节点数量IVfllterI=PN,算法停止。其中,P表示领袖节点占全网络的比例,用户自行设定该参数,这里我们选定P=1,表示全网络的节点。进一步,所述信息传播领袖节点提取方法还包括:[0039]S6:分配信息筛选性能;网络中每一个节点k都具有分辨信息的能力为Ik。根据网络信息传播模型,对集合Vmte3r中的所有领袖节点,赋予其分辨信息的能力为1=1,对于网络中剩余的其他节点,赋予其分辨信息能力为1=0。[0040]S7:级联信息传播;网络中已经转发信息的节点集合记为Vreached,初始时只包含信息源节点;节点的邻居节点如果属于Vr^hed,并且未进行转发询问,初始时为信息源节点的邻居节点,这些节点记为VnClirorked;节点的邻居节点如果属于Vreac^d,并且已经进行转发询问,这些节点记为Virorked,当某个节点k的邻居节点转发信息后,那么该节点就可以看到信息,同时节点k将以概率Pk转发该信息,具体步骤为:[0041]7.1随机选择一个网络中的节点,作为信息传播的源头,转发一个消息真实性为M=01的假消息或者真消息;[0042]7.2对选择任意一个Vnmrorke3d中的节点,根据网络信息传播模型,按照公式⑴计算转发概率Pk:[0044]其中,H表示信息的自然传播率,这里H=O.5,用以保证Pk小于等于1;采用级联模型,每一个节点只有一次机会传播,传播不成功则不再继续传播;[0045]7.3产生0〜1的随机数,这里每一个节点只有一次机会传播,传播不成功则不再继续传播。如果Pk随机数,则节点k进行转发,并将节点k的邻居中添加到Vnmrorke3d中,再将节点k移除出Vnoworked,加入到Vre3ac^d;如果Pk〈随机数,则节点k不进行转发,节点k进入Vworked;[0046]7.4当Vnmrorked中不再有节点时,算法停止,表示此时所有看到信息的节点都已经经过处理。Vreached即表示传播到的节点集合。[0047]7.5不断重复步骤7.1-7.4,直到迭代次数到达5N,记录传播总次数;[0048]7.6更改领袖节点比例P,重复步骤2-步骤4.5,记录每个不同比例P下的传播总次数;[0049]S8:计算信息传播范围指标;计算每个P指标下的传播范围平均值,得到传播的最终结果。[0050]图2是美国电力网络USpoSerGrid的同配化处理后的网络,可以从图中看到,经过同配化处理后的网络,大度值节点偏向于连接大度值节点,网络呈现一伞状”结构。[0051]图3,4中的实线表示采用随机策略选点下的信息过滤,作为对照的基准;长实线表示单纯的采用度值的策略;点实线表示我们的基于网络度相关性的信息传播领袖节点提取方法。由图3可得,在不良信息的抑制上,我们的基于网络度相关性的信息传播领袖节点,与随机策略作为对比,可以显著地快速抑制不良信息,同时与基于度值的选点策略相比较也可相比。图4表明,在好消息的扩散上我们的选点策略能够显著扩大加快好信息的传播速度,同时与基于度值的策略相比较,我们的选点策略表现的显著优异,这是因为我们的模型考虑到了网络的全局结构特征,而基于度值的特征只考虑局部度值特征。[0052]如上所述为本发明在美国电力网络的同配网络上的实施例介绍,通过网络信息传播扩散的过程,解释了真假信息在电力网络上的传播过程。该方法既考虑到网络结构中的度相关性,也考虑到算法的时间复杂度,该方法在大规模网络上表现的更为优异。

权利要求:1.一种基于网络度相关性的信息传播领袖节点提取方法,其特征在于,所述方法包括如下步骤:SI:导入网络集合G=V,E,其节点集和连边集分别为V={V1,V2,...,VN}和茗仁丨Xί,节点总数N;S2:选取全网络中度值最大的节点作为领袖节点集合Vfllter中的第一个节点;S3:寻找邻居节点;对于Vmte3r中的节点,找到其所有的不重复邻居节点Vfrie3nd,Vfrie3nd中不包括已经存在于Vfilter中的节点;S4:更新邻居节点度值;对于Vfilte3r的邻居节点Vfrimd中的所有节点,更新其度值;新的度值为去除与领袖节点集合Vfllto中的连边后的度值;S5:迭代选点;对于Vfriend中的节点,按照更新后的度值降序排列,选择度值最大的节点作为新的领袖节点,并加入到Vfllte3冲;迭代步骤S3,S4,直到Vfllter^3节点数量达到所需领袖节点数量IVfiiterI=PN,算法停止。其中,P表示领袖节点占全网络的比例,用户自行设定该参数;此时,Vfllter中的节点即为基于网络度相关性的信息传播领袖节点。S6:分配信息筛选性能;网络中每一个节点k都具有分辨信息的能力为Ik。根据网络信息传播模型,对集合Vfllter中的所有领袖节点,赋予其分辨信息的能力为1=1,对于网络中剩余的其他节点,赋予其分辨信息能力为I=〇;S7:级联信息传播;网络中已经转发信息的节点集合记为Vreached,初始时只包含信息源节点;节点的邻居节点如果属于Vr^hed,并且未进行转发询问,初始时为信息源节点的邻居节点,这些节点记为Vn_rked;节点的邻居节点如果属于Vreached,并且已经进行转发询问,这些节点记为Virorked,当某个节点k的邻居节点转发信息后,那么该节点就可以看到信息,同时节点k将以概率Pk转发该信息,具体步骤为:7.1随机选择一个网络中的节点,作为信息传播的源头,转发一个消息真实性为M=O1的假消息或者真消息;7.2对选择任意一个Vnmrorke3d中的节点,根据网络信息传播模型,按照公式⑴计算转发概率Pk:其中,H表示信息的自然传播率,这里H=O.5,用以保证Pk小于等于1;采用级联模型,每一个节点只有一次机会传播,传播不成功则不再继续传播;7.3产生0〜1的随机数,这里每一个节点只有一次机会传播,传播不成功则不再继续传播。如果Pk》随机数,则节点k进行转发,并将节点k的邻居中添加到Vnmrorke3d中,再将节点k移除出Vnmrorked,加入到Vreached;如果Pk〈随机数,则节点k不进行转发,节点k进入Vwcirked;7.4iVn_rked中不再有节点时,算法停止,表示此时所有看到信息的节点都已经经过处理。Vreached即表示传播到的节点集合。7.5不断重复步骤7.1-7.4,直到迭代次数到达5N,记录传播总次数;7.6更改领袖节点比例P,重复步骤2-步骤4.5,记录每个不同比例P下的传播总次数;S8:计算信息传播范围指标;计算每个P指标下的传播范围平均值,得到传播的最终结果D

百度查询: 浙江工业大学 一种基于网络度相关性的信息传播领袖节点提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。