多尺度可视化的小世界网络
- 格式:doc
- 大小:504.50 KB
- 文档页数:10
⼩世界⽹络和⽆标度⽹络锚点的重要性线性⽹络中锚点的识别可以有许多⽤途,例如在具有线性拓扑的社区宽带⽹络中,其中⼀个锚点可以作为因特⽹的⽹关,进⽽优化社区⽹络中的整体传输时间。
⽤于军事或者应急响应场景中时,可以通过将其中⼀个锚点作为中⼼节点来添加⼀些LL,从⽽能够创建具有⼩APL值的⽹络拓扑。
锚点的识别也有利于车间通信。
对于⼀个给定的图,最⼩化APL等价于最⼩化图的总路径长度。
锚点的固定⽐例位置始终为0.2N或者0.8N.基于启发式⽅法的确定性链路添加两种确定性链路添加策略,即最⼤CC差异(MaxCCD),和顺序确定性LL添加。
两个节点之间的接近中⼼性差异CCD定义为两个节点的CC值之间的差。
MaxCCD策略在具有最⼤CCD的节点对之间添加LL。
APL表⽰在整个⽹络上节点对之间的路径长度平均值。
AEL刻画了⽹络上平均每条链路的长度。
节点的BC值表⽰其在⽹络中的重要性。
节点的CC值刻画了该节点与其他节点的接近程度。
平均⽹络时延:(Average Network Delay,ANeD)度量了⼀组数据从源节点传播到⽬的节点所需的平均时间。
ANeD等于传播时延和传输时延之和。
顺序确定性L添加是另⼀种基于启发式的确定LL添加⽅法,它将正则线性⽹络转化为由k条LL构成的⼩世界⽹络。
基于⼩世界特征的平均流容量增强启发式算法ACES布雷斯悖论⼩世界⽹络中的路由路由可以被定义为将⽹络中的特定信息从源节点转发到⽬的节点的过程。
分布式路由算法⾃适应分布式路由算法前瞻式路由算法⼩世界⽹络中的容量⽹络容量定义为可以在单位时间内从⽹络的⼀部分传输到另⼀部分的信息量。
增加⽹络容量是提⾼底层⽹络整体性能的关键挑战之⼀。
可以通过两种变换⽅式将正则⽹络转为⼩世界⽹络:重连现有链路NL;添加新链路LL第五章⽆标度⽹络⾃然界中⼴泛存在的⽆标度⽹络遵循幂律度分布。
多种创建⽆标度⽹络的⽅法:通过偏好连接;通过基于适应度的模型;通过改变内在适应度;通过相似性和流⾏度的局部优化;使⽤度指数1;通过贪⼼的全局优化。
复杂系统的理论模型引言复杂系统是由相互作用的多个元素组成的系统,具有非线性、动态和自适应等特点。
理解和研究复杂系统的行为是许多学科领域的重要课题,例如物理学、生物学、社会学等。
本文将介绍复杂系统的理论模型,包括网络模型、智能体模型和进化模型等。
网络模型小世界网络小世界网络是一种介于规则网络和随机网络之间的模型。
它具有高聚集性和短平均路径的特点,能够很好地模拟许多现实世界中的复杂系统,如社交网络和神经网络等。
小世界网络的生成过程可以通过“重连”机制实现,即在规则网络的基础上,以一定的概率重新连接网络中的节点,使得网络具有更好的小世界性质。
无标度网络无标度网络是一种节点度数遵循幂律分布的网络模型。
在无标度网络中,只有少数节点具有极高的度数,而大多数节点的度数较低。
这种网络模型能够很好地模拟一些实际系统的特点,如互联网和蛋白质相互作用网络等。
无标度网络的生成机制可以通过优先连接机制实现,在每次增加新节点时,倾向于连接已有节点度数较高的节点。
阻尼网络阻尼网络是一种网络模型,节点之间通过连接进行信息传递,但每个节点都有一定的概率遗忘或丢失信息。
这种网络模型可以很好地描述现实世界中某些系统的特性,如人类记忆和信息传递系统等。
阻尼网络的研究可以通过网络传播模型、信息丢失模型等多个方面进行。
智能体模型有限状态机有限状态机是一种常见的智能体模型,它包含一组有限个状态和状态之间的转移规则。
有限状态机模型可以用于描述系统的决策过程和行为变化等,常用于模拟人工智能、自动控制以及计算机算法等领域。
神经网络神经网络是一种模拟人脑神经元结构和功能的模型,它由多个互连的神经元单元组成。
神经网络模型可以进行学习和适应,能够模拟复杂系统中的非线性和动态性质。
神经网络在机器学习、模式识别和数据挖掘等领域得到广泛应用。
进化算法进化算法是一种基于进化过程的智能体模型,它通过选择、交叉和变异等操作对解空间中的个体进行搜索和优化。
进化算法能够自主学习和适应环境,适用于复杂系统中的优化问题,如遗传算法和粒子群优化算法等。
复杂网络中的小世界性质研究随着互联网的普及,我们已经进入了一个高度连通的时代。
如果把所有人、所有物理设备、所有数字设备联结起来形成一个大网络,这就是一个复杂网络,它已经不再是一棵简单的树形网络,而是拥有了各种各样的连接方式,从而形成了一个复杂的结构。
在这个复杂网络中,人们更容易形成自己的小世界。
什么是小世界性质小世界性质是指,在一个复杂网络中,大多数节点可以在很短的时间内通过不多的步骤到达任意其他节点。
这个现象是由于网络中普遍存在着两种链接:一种是“短链接”,即较短距离内的连接;另一种是“长链接”,即较长距离的连接。
在一个小世界网络中,大多数节点都是通过较短的链接连接的,只有少数节点通过较长的链接才能达到其他节点。
小世界网络的构建小世界网络的构建通常采用“随机重连”算法。
具体方法是:在一个有N个节点的圆环模型上,每个节点与相邻的m个节点相连。
随机地选择一个节点,断开它与其相邻的链接,然后随机地选取一个节点与其相连。
在这个过程中,短链接能够被保留下来,而一部分长链接会被替换成短链接。
通过这样的重连过程,原本的环形结构被打乱,形成了一个小世界网络。
小世界性质在现实生活中的应用小世界性质在现实生活中有着广泛的应用。
例如,社交网络中的朋友关系就是一个小世界网络。
在社交网络中,大多数人认识的人都是通过较少的步骤得到的,而每个人所认识的朋友圈也通常分布在全球范围内。
类似地,物理网络中的交通路径、电力系统、道路网络等也可以被视为小世界网络。
在这些系统中,信息传输的速度都非常快,但是网络之间的连接却比较稀疏。
小世界网络的拓扑结构小世界网络的拓扑结构由短链接和长链接构成,其中大量短链接形成了网络中的大部分路径,而只有少量的长链接连接了远离的节点。
对于一个小世界网络,我们通常关心的是三个指标:网络的直径、聚集系数和节点度分布。
网络的直径是指任意两个节点之间最短路径的最大值。
在一个小世界网络中,网络的直径很小,通常只有几个节点的距离。
关于小世界网络的文献综述一、小世界网络概念方面的研究Watts和Strogatz开创性的提出了小世界网络并给出了WS小世界网络模型。
小世界网络的主要特征就是具有比较小的平均路径长度和比较大的聚类系数。
所谓网络的平均路径长度,是指网络中两个节点之间最短路径的平均值。
聚类系数被用来描述网络的局部特征,它表示网络中两个节点通过各自相邻节点连接在一起的可能性,以及衡量网络中是否存在相对稳定的子系统。
规则网络具有大的特征路径长度和高聚类系数,随机网络则有短的特征路径长度和比较小的聚类系数[1]。
Guare于1967年在《今日心理学》杂志上提出了“六度分离”(Six Degrees of Separation) 理论,即“小世界现象”。
该理论认为,在社交网络中存在短路径,即人们只要知道自己认识的人,就能很快地把信息传递到任何远方目标[2]。
.Stanleymilgram的邮件试验,后来的“培根试验”,以及1998年《纽约时代周刊》的关于莱温斯基的讽刺性游戏,都表现出:似乎在庞大的网络中各要素之间的间隔实际很“近”,科学家们把这种现象称为小世界效应[3]。
研究发现,世界上任意两个人可以平均通过6个人联系在一起,人们称此现象为“六度分离”[2]。
二、小世界网络模型方面的研究W-S模型定义了两个特征值:a.特征路径的平均长度L。
它是指能使网络中各个结点相连的最少边长度的平均数,也就是上面说的小世界网络平均距离。
b.集团化系数C。
网络结点倾向于结成各种小的集团,它描述网络局部聚类特征。
稍后,Newman和WattS对上述的WS模型作了少许改动,提出了另一个相近但较好的(NW)小世界网络模型[5],其做法是不去断开原来环形初始网络的任何一条边、而只是在随机选取的节点对之间增加一条边(这时,新连接的边很可能是长程边)。
这一模烈比WS模型容易分析,因为它在形成过程中不会出现孤立的竹点簇。
其次,还有Monasson小世界网络模型[6]以及一些其它的变形模型包括BW 小世界网络模型等等[7]。
课题:WS小世界网络模型构造姓名赵训学号 2班级计算机实验班一、WS 小世界网络简介1998年, Watts和Strogatz 提出了小世界网络这一概念,并建立了WS模型。
实证结果表明,大多数的真实网络都具有小世界特性(较小的最短路径) 和聚类特性(较大的聚类系数) 。
传统的规则最近邻耦合网络具有高聚类的特性,但并不具有小世界特性;而ER 随机网络具有小世界特性但却没有高聚类特性。
因此这两种传统的网络模型都不能很好的来表示实际的真实网络。
Watts 和Strogatz建立的WS小世界网络模型就介于这两种网络之间,同时具有小世界特性和聚类特性,可以很好的来表示真实网络。
二、WS小世界模型构造算法1、从规则图开始:考虑一个含有N个点的最近邻耦合网络,它们围成一个环,其中每个节点都与它左右相邻的各K/2节点相连,K是偶数。
2、随机化重连:以概率p随机地从新连接网络中的每个边,即将边的一个端点保持不变,而另一个端点取为网络中随机选择的一个节点。
其中规定,任意两个不同的节点之间至多只能有一条边,并且每一个节点都不能有边与自身相连。
在上述模型中,p=0对应于完全规则网络,p=1则对应于完全随机网络,通过调节p的值就可以控制从完全规则网络到完全随机网络的过渡,如图a所示。
图a相应程序代码(使用Matlab实现)ws_net.m (位于“代码”文件夹内)function ws_net()disp('WS小世界网络模型')N=input('请输入网络节点数');K=input('请输入与节点左右相邻的K/2的节点数');p=input('请输入随机重连的概率');angle=0:2*pi/N:2*pi-2*pi/N;x=100*cos(angle);y=100*sin(angle);plot(x,y,'r.','Markersize',30);hold on;%生成最近邻耦合网络;A=zeros(N);for i=1:Nif i+K<=Nfor j=i+1:i+KA(i,j)=1;endelsefor j=i+1:NA(i,j)=1;endfor j=1:((i+K)-N)A(i,j)=1;endendif K<ifor j=i-K:i-1A(i,j)=1;endelsefor j=1:i-1A(i,j)=1;endfor j=N-K+i:NA(i,j)=1;endendenddisp(A);%随机化重连for i=1:Nfor j=i+1:Nif A(i,j)==1pp=unifrnd(0,1);if pp<=pA(i,j)=0;A(j,i)=0;b=unidrnd(N);while i==bb=unidrnd(N); endA(i,b)=1;A(b,i)=1;endendend%根据邻接矩阵连线for i=1:Nfor j=1:Nif A(i,j)==1plot([x(i),x(j)],[y(i),y(j)],'linewidth',1); hold on;endendendhold offaver_path=aver_pathlength(A);disp(aver_path);对应输出(取网络节点数N=16,K=2;p分别取0,0.1,1)。
小世界模型平均路径长度小世界模型是网络科学中的一个重要概念,它描述了现实生活中许多网络系统的特征。
其中一个重要指标就是平均路径长度,它衡量了网络中两个节点之间的平均距离。
本文将围绕小世界模型平均路径长度展开讨论,介绍小世界现象、小世界网络的生成机制以及平均路径长度的计算方法。
一、小世界现象小世界现象是指在许多实际网络中,节点之间的平均距离相对较小,远远小于节点总数。
这意味着网络中的节点之间存在着短路径,人们可以通过少数的步骤就能够相互联系。
小世界现象的典型代表是社交网络,比如Facebook、微信等。
在这些社交网络中,我们可以通过共同的朋友或者兴趣爱好迅速找到彼此。
二、小世界网络的生成机制小世界网络的生成机制主要包括随机连接和局部重连两个过程。
首先,随机连接阶段,网络中的节点随机地与其他节点建立连接,形成一个随机网络。
然后,在局部重连阶段,节点会重新连接到与其距离较近的节点,以形成更为紧密的联系。
通过这两个过程的迭代,网络中形成了许多短路径,从而呈现出小世界现象。
三、平均路径长度的计算方法平均路径长度是衡量小世界网络结构特征的一个重要指标。
它表示网络中任意两个节点之间的平均距离。
计算平均路径长度的方法是首先计算网络中每对节点之间的最短路径长度,然后将这些最短路径长度进行平均。
在大型网络中,计算所有节点对之间的最短路径长度是不现实的,因此可以使用一种近似的方法,例如随机选取一部分节点对进行计算,然后将结果进行平均。
四、小世界模型在实际中的应用小世界模型不仅仅是对网络结构的一种描述,它也广泛应用于各个领域。
在社交网络中,小世界模型可以用来解释信息传播的速度和路径选择;在物理学领域,小世界模型可以用来研究粒子之间的相互作用;在生物学领域,小世界模型可以用来研究蛋白质相互作用网络等。
总结:小世界模型平均路径长度是衡量网络中节点之间距离的重要指标。
小世界现象描述了许多实际网络中的特征,而小世界网络的生成机制包括随机连接和局部重连两个过程。
复杂网络中的小世界现象及网络控制在当今互联网高度发达的时代,我们不难发现,网络已经成为了人们生活中不可或缺的一部分。
如此庞大而精密的网络背后,隐藏着一种神秘的现象——小世界现象。
什么是小世界现象呢?在复杂网络中,大部分节点彼此并不直接相连,如果我们通过网络中的某个节点一步一步地寻找与它距离较远的其他节点,那么需要经过很多步才能到达目的地。
但是,当我们通过某一个中间节点来寻找其他节点时,会发现距离往往非常近,这就是小世界现象。
小世界现象最早由美国社会学家斯兰恩(Stanley Milgram)在20世纪60年代进行的一项实验中发现。
他向美国人民邮寄了一些信封,要求收信人将信封转交给他们认为能够使信封尽快送到目的地的人。
通过这个实验,斯兰恩得出了结论:平均情况下,任意两个美国人之间的距离为6个人。
小世界现象的出现原因有很多,其中最重要的一点是网络中存在着不同规模的团簇。
团簇内部节点彼此之间密切相连,形成了高密度的区域,而团簇之间的连接则相对较少。
这样,我们就可以通过从当前节点出发,寻找到它所在团簇的某个节点,进而通过邻近的节点,花费较少的代价就能够到达网络中的其他区域。
小世界现象对于我们的生活有很多启示,尤其在社交网络和信息传播方面。
社交网络中,我们可以通过自己已知的朋友或者关注的人,了解到更多的信息和人脉。
在信息传播方面,小世界现象也为我们提供了更加高效的方式,例如通过社交媒体等渠道传递信息,可以更快地达到更多的人。
然而,小世界现象也存在着一些问题和挑战。
对于网络控制而言,小世界现象往往会导致出现所谓的“蝴蝶效应”,即微小的变化可能会在网络中迅速扩散,引起重大的影响。
这种现象有时会出现在金融市场、社会安全等领域,给人们带来严重的后果。
因此,我们需要认识到小世界现象的复杂性,开展网络控制和安全方面的研究。
如何应对小世界现象对网络控制的影响,是当前互联网发展的一个重要问题。
一方面,我们需要通过加强网络安全防护、提高用户的网络安全意识等手段,降低网络威胁的风险;另一方面,我们也需要进一步研究网络控制的新方法和技术,包括基于机器学习、人工智能等技术的网络安全预测和分析技术,以及分析网络节点的关联性和影响力,制定更加精准有效的网络控制策略等。
复杂网络的小世界性质在当今的信息时代,网络已经成为人们生活中不可或缺的一部分。
在网络中,人们可以进行交流、获取信息、分享知识等。
然而,网络的复杂性也给我们带来了挑战。
近年来,对于复杂网络的研究日益深入,其中一个重要的性质就是小世界性。
什么是小世界性?小世界性是指在一个网络中,任意两个节点之间的最短路径长度相对较短,通常称为“六度分隔理论”。
这意味着,人们通过较少的中间节点就能够建立联系,从而实现信息传递。
小世界网络的存在,使得信息传播更加迅速高效。
那么,为什么复杂网络会呈现出小世界性呢?这主要归功于两个因素:聚类系数和平均路径长度。
聚类系数是指网络中一个节点的邻居节点之间相互连接的概率,衡量了网络的紧密程度。
平均路径长度是指网络中任意两个节点之间的最短路径的平均值,衡量了网络的距离。
在复杂网络中,聚类系数通常较高。
这是因为人们在网络中倾向于与朋友、家人等熟人建立连接,而这些熟人之间通常也是相互连接的,形成了一个相对封闭的群体。
这就增加了网络中节点之间的联系密度,提高了聚类系数。
另一方面,平均路径长度在复杂网络中相对较短。
这是由于网络中存在一些“桥梁节点”,它们连接了不同的社交圈子或利益群体。
这些桥梁节点在网络中起到了关键的作用,它们缩短了任意两个节点之间的距离,使得信息能够更快速地传播。
通过聚类系数和平均路径长度这两个指标,我们可以判断一个网络是否呈现小世界性。
如果聚类系数高,平均路径长度短,那么这个网络就具备小世界性。
例如,社交网络中的朋友圈,人们通常与亲密的朋友相互连接,同时通过共同的朋友或兴趣爱好与其他人形成联系,这使得信息在社交网络中迅速传播。
小世界性在现实中的许多领域都有应用。
例如,在社交媒体中,一个人发布的信息往往能够迅速传播到他的朋友圈,进而传播到更广泛的人群。
在科学研究中,科学家们通过科学合作网络,形成合作关系,分享知识和经验,推动科技进步。
此外,小世界性也对疾病传播、交通流动等方面产生了巨大影响。
网络拓扑知识:小世界网络拓扑的特征与应用网络拓扑是指网络中不同节点之间连接的形式和方式。
小世界网络,又称“六度分隔理论”,是指在一个网络中,任意两个节点之间的距离不到几个步骤,这种网络结构是由多个密集连接在一起的“群集”和少量连接距离较远的“枢纽”节点组成的。
小世界网络拓扑的特征是,这种网络具有密集连接和随机连接两种属性。
密集连接的节点形成群集,枢纽节点则连接不同的群集,从而形成了一个具有高效率和短路径的网络。
小世界网络的应用十分广泛。
在社交网络中,小世界网络的结构可以解释为“六度分隔理论”,即人际之间的关系网相当密切。
在社交网络中,小世界网络的结构可以用来描述人们之间的联系,这样在社交媒体营销中,可以利用这种结构,通过社交网络快速地传达信息和推广产品。
在科学研究领域,小世界网络被广泛应用于描述生物、神经元和蛋白质等巨大的复杂系统之间的联系。
例如在生物网络中,小世界网络可以被应用于描述基因表达及其蛋白质之间的关系;在神经网络中,小世界网络可被利用于描述神经元之间的连接方式,以及神经网络的特性等。
此外,在电力网络、航空网络等大型系统中也可以应用小世界网络的拓扑结构,如在电力网络中,小世界网络可以用来预测电力系统的失效和优化电力传输;在航空网络中,小世界网络可以用来优化航班调度和预测航班延误等。
小世界网络拓扑的发现已经成为了我们更好地理解网络结构的基础。
在当前信息时代,如何从这种拓扑结构中挖掘更多有价值的信息,是一个值得继续探讨的问题。
在小世界网络中,节点间的关系一直在变化,这使得这种网络具有较好的鲁棒性和动态特性。
与其他网络拓扑相比,小世界网络在不同的应用领域具有更好的适应性,因而在未来的研究中,它将发挥着重要的作用。
多尺度小世界网络的可视化摘要有很多在信息可视化领域下研究的网络是”小世界”网络。
这些网络起先出现在对社会网络的研究并且证明是与其他应用领域相关的模型,如软件逆向工程和生物学。
此外,很多这些网络实际上都有多尺度性质:它们可以看做是一组一组的小世界网络。
我们描述一个设计好的用来识别小世界网络里最弱边的度量标准,从而开发出一个简单的低成本的过滤程序(将一个图分割成很小的并且高度关联的部件)。
我们通过一个基于语义缩放的网络交互式的导航来展示这个度量标准是如何被开发的。
一旦网络分解为一系列的子网层次,用户可以很容易地找到演员群的集体和其子团体,从而了解他们的动态。
关键词:小世界网络,多尺度图,聚类度量,语义缩放。
1.小世界网络小世界现象是第一次被Milgram 提出来的,他是研究社会网络结构的。
他进行了一次如今众所周知的实验,每个志愿者将一封信寄给给一个他们认为最有可能将这封信传递给其‘接受者’的朋友,然后他的朋友再把信寄给他认为更接近这名‘接受者’的朋友(‘接受者’是一名工作在波士顿股票经纪人)。
最终,大部分信件都寄到了这名股票经纪人手中,每封信平均经手6.2次到达。
(Milgram认为世界上任意两个人之间建立联系,最多只需要6个人)这个结果表明:所有的信件都可以以这种方式交付,通过一条平均由六个人组成的路径。
这个理论经常引用为“六度分隔”准则。
这种网络的研究获得了重生并且被Watts和Strongatz 推广到很多其他的领域。
小世界网络的典型特点主要停留在两个结构参数上:1.平均的路径长度2、节点的聚簇索引。
大致上,小世界网络使得结点的子集高度聚集,而结点与结点之间只有几步的距离。
更确切的说,在一个小世界网络中的平均路径长度与一个随机图形(拥有相同的边界号码)的路径长度相比,它的结点的聚簇索引平均更大。
很多重要的现实世界的例子是小世界网络。
这些已经被Watts 在观察神经网络时发现了。
小世界网络在这个领域的应用已经被Kashuringagan更深的讨论了。
Adamic 表明小世界的性质适用于从web上提取的站点对应的网络。
来自逆向软件工程的图形为小世界网络提供了进一步的例子。
一个关于小世界网络的著名的例子是从互联网电影数据库获得的。
下边表格中的数据显示了一些网络的小世界的性质。
IMDB的例子包含在演员和电影的IMDB数据库的一小部分。
从一个特定的演员x,我们在删除所有连接x(同时删除x)与这些演员的边之前,可以找到所有其他的与x一起演出的男演员和女演员(有超过35个演员的电影都将被丢弃)。
两个演员如果出演同一部电影就会被一条边连起来(但不是和x,否则这个图就已经完善了)。
最终的图包含419个演员相互之间有5651条边相连。
这个图在Figure 1中说明。
在同一部电影中演出的演员组看做一个小团体(子图拥有最大数量的边:完全子图)并且以一个深蓝色的圆盘表示。
Graph Clusteringindex Ave Path Length Random graph (same number ofnodes and edges)IMDB 0.9666 3.2043 0.0243 2.6694“ResynAssistant“0.9518 3.2847 0.1942 1.8195Mac OS 9 0.3875 2.8608 0.0179 3.3196Web 0.1078 3.1 2.3e-4 -.edu sites 0.156 4.062 0.0012 4.048表一是一些小世界网络的例子显示了它们的群集索引相应的值和平均路径长度。
最后的两列表明相同的统计资料对于随机图有相同的结点和边数。
“Resyn Assistant”网是一个与用来设计化学成分可视化的一个JAVA API关联的图。
结点与java 类相对应,线则连接了类内部的属性和方法,以及同其他类的关联。
Mac OS9 的例子包含一个图:结点对应于头文件而边对应于头文件的物理序列。
证据表明:许多在软件逆向工程中研究的图都可以在小世界网络中找到。
就我们的知识而言,从可视化的角度来看小世界网络的结构特性还没有得到充分利用。
对小世界网络的大部分的研究精力集中在提供理论模型。
对于基于度的分布的小世界网络的很多关键类的定义已经提出了。
最近,算法方面已经引起了很大的注意,强调定义小世界网络分布式算法的可能性。
2.交互可视化的小世界网络当处理一个社会网络的常规任务时在于确定连接演员的链接的模式。
这些模型经常对应于社会团体-----演员集体相互之间紧密相连。
此外,他们可能表明社会地位------演员团体以相同的方式链接到整个社会系统。
其他更直观的问题可能是“是否有一团体与其他所有的团体都有连接?”或者一般来讲“这些团体是以一种特殊的方式组织的吗?”,等等。
一旦一个组被确定,除非这组中的演员相互之间认识,去明白这个特殊的组是如何组织的才有意义,这个小组便成了一个社会网络即:小世界网络。
这些问题在第一阶段大部分可以通过肉眼观察解决。
我们的工作重点放在了对小世界性质的运用来支持可视化进程。
当开发出一个小世界网络后,用户很有可能视觉上忽略各个部件之间的高度连接并且直观的讲注意力集中在各个“小团体网络”的连接上。
这个方案与Scheneiderman 的想法一致。
这个Figture 1支持这个叙述。
我们呈现的这个技术使得我们能够计算出一个小世界网络的分解部分以及它在可视化之前的高度连接的部分并且能够提供给用户一个网络的抽象视图。
这种做法,从某种意义上来说,实行了Schneiderman 提出的过滤阶段。
当处理大型网络时,它可以给用户提供非常有价值的帮助我们将会看到,对一个结构化参数的边的简单的计算可以引导我们对一个小世界网络的高度关联的部分进行有效的划分。
应用用权值并且丢弃低值的边将图分成一个个的小部件(可以用经典算法捕捉)。
因此,基于一个简单并且有效的结构化参数,可以将结点归为一个聚集,从而将网络的平均的组织,变成一个部件。
2.1 多尺度的网络通过对上述案例的研究可以得到以下结论。
很多网络不仅是小世界网络,而且他们内部高度相连的部分也是小世界网络。
因此,小世界网络也可以分解成几个层次的小世界网络(很明显,这个层次的最低级别可能不是小世界网络,而仅仅是一个小团体)。
这观点是由Adamic 从web 中导出来的网络得出的。
对一个由153,127个网址的网络的平均路径长度和聚簇索引的计算使得Adamic 可以表明一个网址是小世界网络。
网站.edu 的子集是与这个网络孤立的,并且已经被证明是小世界网络。
这种现象已经通过从IMDB 中提取的几个子网证实了。
我们认为网络上的相关的信息可以从一个分层的部分推断出来。
更重要的是分层可以有效的用来导航网络。
3.网络模块和之间的边缘强度就像之前所说的,我们的技术需要我们对每个网络的边计算一个值。
我们定义的度量标准首先引入以及概括了瓦特介绍的结点的聚簇索引。
给定一个网络中的结点v ,它的聚簇索引(是通过首先计算出连接结点v 的邻接点的边数r(N(v))---(出度)以及采取比例): C(v)=r(N(v))/(k(k-1)/2)(结点的聚簇索引)来定义的(在这里k 指的是v 的邻接点的个数,请注意分母计算有k 个结点的小团体(完全子图)的边数)。
而图G 的聚簇索引计算公式如下:N v c v C v G /)()(∑= (其中N 表示图G 中结点的个数)小世界网络就是那些拥有高聚簇索引,同时又有较小的路径长度,与有相同结点和边数的随机图相比。
Watts 讨论了一些产生图的模型,同时对这两个属性很满意。
尽管小世界网络的类图非常大,但这也不能说明所有信息可视化中的图是小世界网络。
通过我们对一系列的例子集合的研究,我们有这样一个假设许多信息可视化中重要的例子都是小世界网络。
现在我们将问题转向定义一条边的聚簇索引。
给定一条边(u,v),它的强度是通过将结点u和结点v划分为三个部分来计算的。
其中M(u)是结点u的邻接点的集合而不是结点v的邻接点的集合。
M(v)与之类似。
W(u v)表示u 和v结点的共同的邻接点的集合。
r(A,B)表示连接结合A中的结点与集合B中结点的边数。
比率:s(A B)=r(A, B) / |A|·|B| 计算了连接集合A和B中相互连接结点的边数,占所有可能连接结点的边数的比例。
现在看来,所有连接子集M(u),M(v)或者W(u,v)的边,是一个连接边(u,v)的长度为4的环(如图)。
注意,所有长度为4的环都是以这种方式连接的。
最后我们定义比率:|W(u, v)|/(| M(u)| + |W(u, v)| + |M(v)|)计算了长度为3的环(包括边(u,v))所占的比例。
注意,在集合M(u,v)中有多少结点,就有多少这样的环。
边的强度,是通过下边的公式来计算的:s(M(u), W(u, v)) + s(W(u, v), M(v)) + s(W(u, v))+ s(M(u), M(v)) + |W(u, v)|/(| M(u)| + |W(u, v)| + | M(v)|)(注意:we need to put s(A) = 2r(A)/(|A|·(|A|-1) when computingthe proportion of edges connecting a set to itself)3.1 摒弃弱边一条边的强度指标可以被解释为这条边对其邻边的衔接度的贡献的一个度量标准。
相反,如果边是一个地峡连接在网络中不相交的邻区那么它的值为0。
因此,导致群之间弱连接的边可以被辨别并且被过滤掉。
这种过滤进程在于消除小于给定阈值τ的边。
这个操作将会得到一个最大的没有连接的子图的集合{h1,h2,h3,....hq},与初始图的聚簇集相对应(每个相连的部件被认为是一个集)。
然后我们通过将H1看成一个新的更高层次的图的结点来计算熵图。
如果在原来的图Hi和Hj上至少存在一条边,则在这两个高级别的结点Hi和Hj之间有一条边。
Figure2说明了这个过程。
图(a)代表了一张力矢量布局算法画的图。
在图(b),弱边使用虚线绘制。
最终的熵图在(c)图显示。
这个过程可以递归地调用,最终得到一个层次聚类(..)。
图3描述了在从IMDB 中提取网络的例子中应用该技术产生的熵图。
我们可视化的技术依靠这种聚类算法。
与选择阈值有关的技术问题在第五部分得到解决。
图3.从表一中的网络中得到的熵图。
演员们被组织到一个更强或者更弱独立的社区中,所有的组都连接着一个核心小组。
3.2层次划分这个技术可以通过递归调用熵图的每个部件的度量而得到充分的利用。
注意这技术因网络的多尺度性质而有意义。
也就是说,较大的组件可以进一步使用相同的技术来分解,这可以根据需要重复(停止条件可以按照图的大小来定制并且直到其保留小世界性质)。