当前位置:文档之家› 复杂网络的社区结构

复杂网络的社区结构

复杂网络的社区结构
复杂网络的社区结构

第8卷第1期

复杂系统与复杂性科学v01.8No.12011年3月COM呻LEXSYSTEMSANDCOMPLEXITYSCIENCEMar.2011文章编号:1672—3813(2011)01一0057—14

复杂网络的社区结构

程学旗,沈华伟

(中国科学院计算技术研究所,北京100190)

摘要:社区结构作为真实复杂网络所普遍具有的一个重要拓扑特性,在最近10

内得到了广泛而深入的研究。回顾了近几年国内外社区结构研究的主要进展,

点介绍社区发现的研究历程和研究成果,并结合社会计算的背景展望了社区结研究的未来发展方向和潜在的应用价值。

关键词:社区结构;社区发现;模块度;社会计算

中图分类号:N94文献标识码:A

CommunityStructureofComplexNetworks

CHENGXue-qi,(InstituteofComputingTechn0109y,ChineseSHENHua—wei

AcademyofSciences,Be巧ing100190,China)

Abstract:Asacommonandimportanttopologicalcharacteristicofrealworldcomplexnetworks,

communitystructurehasbeenextensiVelystudiedinthelastdecade.

Thispaperreviewsthemainprogressesinthescientificresearch

oncommunitystructure.Especially,thispaperdescribesthedeVelopmentatthedetectionofcommunitystructurefromvariousdisciplines.

Finally,thispaperdiscussesthefutureresearchdirectionsofthecommunity

structureandthepotentialapplications

insociaIcomputing.Keywords:communitystructure;communitydetection;modularity;socialcomputing

0引言

真实世界中的许多复杂系统可以表示成图或网络,包括社会网络、信息网络、生物网络和技术网络等[1剖。经验分析表明,这些复杂网络可以自然地分成一些节点组,使同一个节点组内的两个节点之间比不同节点组的两个节点之间更倾向于有边相连,网络的这种拓扑特性被称为社区结构,相应地,每个节点组被称为一个社区‘6’。

社区结构刻画了网络中连边关系的局部聚集特性,也体现了网络中连边的分布不均匀性。进一步,网络中的社区通常由功能相近或性质相似的网络节点组成,因此,社区被认为有助于揭示网络结构和功能之间的关系。卜引。以万维网(WorldwideWeb)为例,通过超链接紧密关联的网页形成一个个的社区,同一个社区的网页具有相近的话题[3刮。社区结构的示例如图1所示。

收稿日期:2010一】O一29

墓金项目:国家自然科学基金(60873245,60933005)

作者简介:程学旗(197l一),男,研究员,博导,主要研究方向为网络科学、海量信息检索和数据挖掘、社会计算、分布式计算和网络模拟仿真。

年重构

计算机网络系统组成

计算机网络系统是一个集计算机硬件设备、通信设施、软件系统及数据处理能力为一体的,能够实现资源共享的现代化综合服务系统。计算机网络系统的组成可分为三个部分,即硬件系统,软件系统及网络信息系统。 1. 硬件系统 硬件系统是计算机网络的基础。硬件系统有计算机、通信设备、连接设备及辅助设备组成,如图1.6.4所示。硬件系统中设备的组合形式决定了计算机网络的类型。下面介绍几种网络中常用的硬件设备。 ⑴服务器 服务器是一台速度快,存储量大的计算机,它是网络系统的核心设备,负责网络资源管理和用户服务。服务器可分为文件服务器、远程访问服务器、数据库服务器、打印服务器等,是一台专用或多用途的计算机。在互联网中,服务器之间互通信息,相互提供服务,每台服务器的地位是同等的。服务器需要专门的技术人员对其进行管理和维护,以保证整个网络的正常运行。 ⑵工作站 工作站是具有独立处理能力的计算机,它是用户向服务器申请服务的终端设备。用户可以在工作站上处理日常工作,并随时向服务器索取各种信息及数据,请求服务器提供各种服务(如传输文件,打印文件等等)。 ⑶网卡 网卡又称为网络适配器,它是计算机和计算机之间直接或间接传输介质互相通信的接口,它插在计算机的扩展槽中。一般情况下,无论是服务器还是工作站都应安装网卡。网卡的作用是将计算机与通信设施相连接,将计算机的数字信号转换成通信线路能够传送的电子信号或电磁信号。网卡是物理通信的瓶颈,它的好坏直接影响用户将来的软件使用效果和物理功能的发挥。目前,常用的有 10Mbps、100Mbps和10Mbps/100Mbps自适应网卡,网卡的总线形式有ISA和PCI 两种。

大型复杂网络中的社区结构发现算法

—92— 大型复杂网络中的社区结构发现算法 胡 健1,董跃华1,杨炳儒2 (1. 江西理工大学信息工程学院,赣州 341000;2. 北京科技大学信息工程学院,北京 100083) 摘 要:在大型复杂网络中自动搜寻或发现社区具有重要的实际应用价值。该文把超图模型以及基于此的聚类算法应用到社区结构发现的领域。对于简单图的社区结构发现,引入边聚集系数的概念,提出基于边聚集系数的社区发现算法。将安然邮件数据集作为测试数据集,通过算法对比分析,证明该算法在时间复杂度上可以提高一个数量级。 关键词:边聚集系数;社区结构;社区发现 Community Structure Discovery Algorithm in Large and Complex Network HU Jian 1, DONG Yue-hua 1, YANG Bing-ru 2 (1. Faculty of Information Engineering, Jiangxi University of Science and Technology, Ganzhou 341000; 2. School of Information Engineering, University of Science and Technology Beijing, Beijing 100083) 【Abstract 】The automatic search and community discovery in large and complex network has important practical applications. This paper applies the hypergraph based model and cluster algorithm in community structure discovery, introduces the concept of Edge Clustering Coefficient(ECC) to community structure discovery of simple graph and proposes an algorithm of community discovery based on ECC. Enron e-mail data sets are test data sets, through comparative analysis of algorithm, to prove that this algorithm can significantly improve the time complexity. 【Key words 】Edge Clustering Coefficient(EBB); community structure; community discovery 计 算 机 工 程Computer Engineering 第34卷 第19期 Vol.34 No.19 2008年10月 October 2008 ·网络与通信· 文章编号:1000—3428(2008)19—0092—02 文献标识码:A 中图分类号:TP301.6 1 概述 复杂网络中社区发现(community finding)的研究起源于 社会学的研究工作。能够在大型复杂网络中自动搜寻或发现“社区”具有重要的实际应用价值[1],如社会网络中的社区可能代表的是根据兴趣或背景而形成的真实的社会团体,引文网络中的社区或许代表的是针对同一主题的相关论文,万维网中的社区或许就是讨论相关主题的若干网站,而生物化学网络或者电子电路网络中的社区可能就是某一类功能单元。发现这些网络中的社区有助于更有效地理解和开发这些网络。与社区发现相关的成熟理论包括图论以及模式识别。Wu 和Huberman 的研究成果[2]以及Newman 和Girvan 的研究成果[3]使得复杂网络中的社区发现成为近几年复杂网络领域的一个研究热点并形成了复杂网络中的一个重要研究方向。Newman 和Girvan 把社区发现问题定义为将网络节点划分成若干组,使得组内的节点之间连接比较稠密而不同组节点之间的连接则比较稀少。Newman 和Girvan 在其研究中提出了基于边介数(edge betweenness)概念的分割方法,尽管该方法计算量很大,但由于其性能优越而成为社区发现研究的重要参考模型。 对于一般简单图的社区发现,也可以称之为基于图的聚类,把具有相同或者相似属性的有共性的节点聚合到一起,形成一个个的聚类[2]。这方面的方法有很多,最常用的有G-N 算法、谱二分法和层次聚类法。 尽管人们对复杂网络的社区发现问题已进行了大量的研究,但是仍然存在一些目前无法解决的基本问题[4],如社区的概念虽然大量使用,但却缺少严格的数学定义;大多数社区发现算法虽然性能优越,但所需要的计算量却很大;更为 关键的是,很多算法不是针对异构数据集。这说明复杂网络中社区发现的研究还远没有成为体系,还有很多工作待完善。 2 边的聚集系数定义 为了刻画描述一个网络,通常有这样几个角度,一个是这个网络中点与点之间的距离以及整个网络的平均距离;另一个是每个节点的度以及整个网络的平均的度;还一个就是节点之间聚集的情况,点的聚集系数这个概念是用来体现对于某个节点A 来讲,如果B 和C 都是A 的邻接点(朋友关系),那么B 和C 两者之间也有邻接(朋友)的可能性。 定义1 某节点n 的聚集系数(node clustering coefficient) ()C n 如下定义: (1)假设某节点n 的度是k ,则该节点的这些邻居之间可能形成边的最大数是: ()(1)/2T n k k =? (2)()E n 表示图中这些邻居之间实际的边的个数,则 ()()/()C n E n T n = 定义2 一个网络的聚集系数为这个网络中节点的聚集系数的平均值。 如图1所示,节点1的度为5,所以与它相连接的5个顶点之间最多存在54/210×=条边;而实际上另外5个顶点相互之间存在6条边,所以节点1的聚集系数是6/100.6=。 基金项目:国家自然科学基金资助项目(60675030) 作者简介:胡 健(1967-),男,副教授、博士,主研方向:数据挖掘,智能信息检索;董跃华,副教授;杨炳儒,教授、博士生导师 收稿日期:2008-08-01 E-mail :euguenehu@https://www.doczj.com/doc/a18709767.html,

基于标签传播和社区融合的复杂网络社区检测

基于标签传播和社区融合的复杂网络社区检测复杂网络是各类复杂系统的抽象形式,具有无标度性、小世界性、聚集性和度的幂律分布等性质。复杂网络中的社区结构是网络中内部连接较多,与外部连接较少的节点集合。复杂网络的社区检测就是根据其节点连接信息和网络拓扑结构将网络划分成若干子网络的过程,对复杂网络中社区结构的检测有助于理解网络演变过程并发掘网络 中潜在的信息。针对复杂网络社区检测的相关研究越来越多,进化算法,标签传播算法,社区融合策略等方法被不断提出并改进。然而以上算法目前还不够完善,存在着准确性低,检测随机,检测速度慢,易陷 入局部最优,模块度分辨率限制等问题。并且在网络信息量飞快增长的今天,复杂网络社区检测也逐渐趋向大数据化,针对大规模网络的 社区检测方法的研究变得尤为重要。本文设计了三种方法,对以上普遍存在的检测问题进行改进,主要工作如下:1)提出了一种基于循环 查找核节点的标签传播算法检测中小规模网络中的社区结构。首先循环查找核节点并根据相似度对网络进行预划分,降低小社区被吞并的可能,增加标签传播过程中传播方向的多样性;然后执行标签传播算法,对预划分后的网络进一步划分,降低标签传播算法本身的随机性;再根据节点与社区隶属度对划分结果进行修正,更准确的对网络进行划分。实验表明本算法在中小规模上的检测结果优于传统标签传播算法。2)提出了一种基于节点权值的标签传播策略对大规模现实网络进行社区检测。首先,根据节点度查找网络中影响力较大的核节点集合,核节点由于与其他节点连接较多,因此其传递和接受的信息量较大;

然后,根据节点与核节点集合中成员的相似度及节点度为网络中节点 赋权值,这样在标签传播过程中,影响力较大的节点标签将被优先选择,有效提高标签传播准确度;最后提出一个节点与社区的紧密度函数,并以此为目标函数对网络执行标签传播策略。这一函数将节点与 社区连接数和节点隶属邻居社区的程度结合,充分利用网络中的节点 及边的信息。实验表明本算法在大规模网络上可以获得很好的检测结果。3)提出了一种基于改进模块密度增量的大规模网络社区融合方法。首先,查找网络中局部核节点即潜在社区中心,将与核节点相似度值 高于给定阈值的邻居节点划分到核节点所在社区,将初步形成的社区 按外部连接数降序排序;提出一种基于模块密度的改进模块密度增量 作为目标函数,在社区合并过程中,优先考虑外部连接少的邻居社区 进行合并,避免错误融合;在局部社区融合过程中加入全局判断,同时 计算并比较每组可能融合的两个社区与各自邻居社区融合得到的改 进模块密度增量值,判断是否进行社区融合,进一步降低社区融合过 程中出现错误融合的概率。本算法解决了大多数社区融合算法基于模块度函数而导致的分辨率限制问题。实验结果表明,本算法对大规模 网络的检测与现有经典算法相比更优。

网络系统结构与设计的基本原则

一、网络系统结构与设计的基本原则 1.1局域网(Local Area Network, LAN )按照采用的技术、应用的范围和协议标准不同分为共享局域网与交换局域网 1.2局域网特点: 1. 覆盖有限的地理范围 2. 提供高数据传输速率(10Mbps-10Gbps)、低误码率的高质量数据传输环境 3. 成本低,易于建立、维护和扩展 1.3计算机网络从逻辑功能上分为:资源子网和通信子网 1.4主机(host)包括用户终端设备(个人计算机、数字设备)、服务器,是资源子网的主要组成单元 1.5资源子网: 组成:主计算机系统、终端、终端控制器、连网外部设备、各种软件资源、网络服务 功能:负责全网的数据处理业务、向网络用户提供各种网络资源和网络服务 1.6通信子网: 组成:通信控制处理机、通信线路、其他通信设备功能:完成网络数据传输、转发等通信处理任务 1.7通信控制处理机:在网络拓扑结构中成为网络结点 1?作为与资源子网的主机、终端的连接接口,将主机和终端连入网络 2. 作为通信子网中的分组存储转发结点,完成分组的接收、校验、存储、转发等功能,实现将源主机报文准确发送到目的主机的作用 1.8通信线路:通信控制处理机与通信控制处理机、通信控制处理机与主机之间提供通信信道,计算机网路采用多种通信线路,如电话线、双绞线、同轴电缆、光纤、无线通信信道、微波与卫星通信信道等 1.9局域网与城域网(Metropolitan Area Network,MAN )、城域网与广域网(Wide Area Network,WAN )、广域网与广域网的互联是通过路由来实现的 1.10介入城域网方式:局域网、电话交换网(PSTN)、有线电视网(CATV )、无线城域网(WMAN )、无线局域网(WLAN ) 1.11广域网的基本概念: 1. 广域网建设投资大、管理困难,一般由电信运营商负责组建与维护 2. 电信运营商提供接入广域网的服务与技术,为用户提供高质量的数据传输服务,因此广域网是一种公共数据网络( Public Date Network,PDN 3. 用户可以在公共数据网络商开发各种网络服务系统,用户使用广域网的服务必须向广域网运营商购买服务 1.12广域网技术主要研究的是远距离、宽带、高服务质量的核心交换技术 1.13广域网发展: 1. 早期,人们利用电话交换网PSTN的模拟信道,使用调制解调器完成计算机与计算机之间的低速数据通信 2.1974年X . 25分组交换网出现 3. 随着光纤开始应用,一种简化的X . 25协议的网络:帧中继(Frame Replay, FR)网得到广泛应用

网络社区划分方法及评价

网络社区划分方法及评价 【摘要】网络社区结构是社会网络最普遍和最重要的拓扑属性之一,其特点是,同一社区内的节点连接密集,不同社区间的节点连接稀疏。揭示网络社区结构对分析复杂网络拓扑结构、理解其功能、发现其隐含模式、预测其行为都具有十分重要的理论意义,在社会网、生物网和万维网中具有广泛应用。本文主要从网络社区划分的起源、常见的社区划分方法及社区评价准则等三个方面介绍网络社区划分研究的相关工作。 【关键词】复杂网络;网络社区;社区划分;社会网络分析;社区的评价;局部社区划分 0.引言 网络科学将系统内部的各个元素作为节点,元素之间的关系视为连接,那么系统就构成了一个具有复杂连接关系的网络。然而,近几年的实证研究表明,这些看似毫不相干的且形态各异的真实系统的拓扑抽象都具有某些共同的拓扑性质,如小世界与无标度特性等等。由于它们所表现出来的拓扑性质与随机网络、规则网络等有着天壤之别,且节点众多,因此被称为复杂网络。目前,复杂网络成为技术、生物乃至社会各类复杂系统的非常一般的抽象方法与描述骨架,相关研究成为重要的学科交叉研究前沿。 所谓社区(community)即指网络的内聚子图,其基本特征表现为子图内部链接丰富,不同子图之间连接相对稀少。 1.常见网络社区划分方法 1.1基于优化思想的算法 基于优化思想的算法将复杂网络社区划分转化为优化问题,通过最优化预定义的目标函数来计算复杂网络的社区结构。比如K-L算法、谱平分法、随机游走(Random Walks)算法和派系过滤(CMP)算法等。这些算法的突出优点是速度比较快,效率显著。但是缺点也很突出,这一类算法都需要知道网络社区的数目,甚至KL算法还需要知道每个社区中各有多少节点,才能正确划分。这显然不适于网络未知社区的探索。 1.2社会网络分析方法 源于社会网络分析中寻找社区结构的传统算法,主要基于分级聚类思想,按照各个节点之间连接的相似性或者强度,把网络自然地划分为各个子群。其具体实现方式又有两种:其一是往网络中添加边,即凝聚方法(agglomerative method);其二是又从网络中移除边,即分裂方法(divisive method)。凝聚方法的基本思想是基于网络中节点某种相似性分层进行聚类的。初始时,每个节点为一个社区,然

基于复杂网络的社团结构分析_以四川大学蓝色星空为例

技术与市场 第16卷第12期2009年 1.引言 目前,国内对虚拟论坛的社区结构有一定的研究,张瑜通过实证分析证实了公社社会类型、科层社会类型和广场社会类型这三种类型的交往场域在BBS网络空间中的存在性,并分析了各类交往场域的特点,探讨了不同类型交往场域的形成机制。宫辉和徐渝利用社会网络矩阵分析法对网络虚拟社区中信息传播模式进行分析,概括出网络虚拟社区群体的基本特征。余兰则对大学生在BBS交往中的网络角色进行了研究。彭小川和毛晓丹运用社群图和矩阵法对网络社会群体进行了分析,概括出BBS群体的基本特征,并对群体中成员地位的形成、意见领袖的特点和群体内部人际交往的特征进行了探讨。王海明和韩瑞霞则在2004年发表了对国内BBS研究现状的述评文章。 从目前国内研究的情况看来,许多的研究已经开始使用社会网络的方法对论坛数据进行分析。尽管国内外学者作了大量研究,但是大部分都是从传播学、社会学以及心理学的某一角度进行研究,分析手段的限制使得大部分研究仍停留在定性阶段,所得到的结论说服力不强。因此,我们将采用复杂网络的方法,通过对蓝色星空数据进行研究和分析,包括两个阶段:1)建立复杂网络模型;2)对该模型进行分析,找出该网络的基本统计数据,包括度分布、聚集系数和平均路径长度等。 2.复杂网络 2.1网络定义 网络已成为各学科领域重要的分析工具和研究手段。网络是由许多节点与连接节点的边组成,其中节点代表系统中不同的个体,边则表示个体间的关系;两个节点之间具有特定的关系则连一条边,有边相连的两个节点被看作是相邻的。比如计算机网络可以看作是自主工作的计算机通过各种物理介质与通信协议相互连接得到的网络。 2.2复杂网络 网络模型包括规则网络、随机网络和复杂网络。随机网络首先由Erdos和Rényi引入,是概率方法与传统图论相结合的网络,着重于网络的随机性。而科学家们发现大量的真实系统的网络模型既不是随机网络,也不是规则网络,却是介于随机网络和规则网络之间的复杂网络。1998年Watts和Strogatz表明大量真实网络都具有小世界效应;1999年Barabasi和Albert指出许多现实世界中的大量网络具有无标度网络(scale-free)的特性—— —无尺度特征、脆弱性和抗毁性。无尺度特性刻画了复杂网络的不均匀复杂性,即大部分结点只有少数连接,少数结点拥有大量连接。脆弱性与抗毁性并存从另一方面反映无尺度特性。Albert等人的研究表明,无标度网络比随机网络具有更强的抗毁性,但是对于选择性攻击抗攻击能力较差,5%的核心结点被攻击,网络就基本瘫痪。 复杂网络的研究可以简单概括为三方面密切相关却又依次深入的内容:通过实证方法度量网络的统计性质;构建相应的网络模型来理解这些统计性质何以如此;在已知网络结构特征及其形成规则的基础上,预测网络系统的行为。 2.3复杂网络的主要统计参数 2.3.1度和度的分布 一个节点与其它节点相连的边数称为该节点的度,度是描述网络局部特性的基本参数。节点度分布是指网络中度为k的节点的概率p(k)随节点度k的变化规律。节点度的分布函数反映了网络系统的宏观统计特征,理论上利用度的分布可以计算出其它表征全局特征参数的量化行为。 2.3.2平均路径长度 网络中两个节点i和j之间的距离dij定义为连接这两个节点的最短路径上的边数。网络中任意两个节点之间的距离的最大值称为网络的直径,记为D,即 D=max i,j d ij 网络的平均路径长度L定义为任意两个节点之间的距离的平均值,即 L=1 1 2 N(N-1) ∑i≥j d ij其中,N为网络节点数。 2.3.3聚集系数C 在有N个节点的网络中,若第i个节点的度为k i ,由这k i个邻 基于复杂网络的社团结构分析 —— —以四川大学蓝色星空为例 陈志翔 四川大学计算机学院成都610041 摘要:随着我国计算机和网络的普及,网络社团、尤其是BBS,在人们日常生活中发挥着巨大的作用,国内目前对BBS 的社团结构进行定量分析的研究不多。本文通过对基于四川大学蓝色星空ID间相互回帖关系所构建的复杂网络模型的 研究,构造仿真实验,找出该网络的基本统计数据。 关键词:复杂网络社团结构BBS网络建模 doi:10.3969/j.issn.1006-8554.2009.12.029 专题研究 41

第一章--计算机网络体系结构

(答案仅供参考如有不对请自己加以思考) 第一章计算机网络体系结构 一、习题 1.比特的传播时延与链路带宽的关系()。 A.没有关系 B. 反比关系 C. 正比关系 D. 无法确定 2.计算机网络中可以没有的是()。 A. 客服机 B. 操作系统 C. 服务器 D.无法确定 3.在OSI参考模型中,提供流量控制的层是第(1)层;提供建立、维护和拆除端到端连接的层是(2);为数据分组提供在网络中路由功能的是(3);传输层提供(4)的数据传送;为网络层实体提供数据发送和接收功能和过程的是(5)。 (1)A. 1、2、3 B. 2、3、4 C. 3、4、5 D. 4、5、6 (2)A. 物理层 B. 数据链路层 C. 会话层 D. 传输层 (3)A. 物理层 B. 数据链路层 C. 网络层 D.传输层 (4)A. 主机进程之间 B. 网络之间 C. 数据链路层 D. 物理线路层 (5)A. 物理层 B. 数据链路层 C. 会话层 D. 传输层 4.计算机网络的基本分类方法主要有两种:一种是根据网络所使用的传输技术;另一种是根据()。 A. 网络协议 B. 网络操作系统 C. 覆盖范围与规模 D. 网络服务器类型与规模 5.计算机网络从逻辑功能上可分为()。 Ⅰ.资源子网Ⅱ.局域网Ⅲ.通信子网Ⅳ.广域网 A.Ⅱ、Ⅳ B.Ⅰ、Ⅲ B. Ⅰ、Ⅳ D. Ⅲ、Ⅳ 6. 计算机网络最基本的功能是()。 Ⅰ. 流量控制Ⅱ.路由选择 Ⅲ. 分布式处理Ⅳ. 传输控制 A. Ⅰ、Ⅱ、Ⅳ B.Ⅰ、Ⅲ、Ⅳ C. Ⅰ、Ⅳ D. Ⅲ、Ⅳ 7.世界上第一个计算机网络是()。 A.ARPANET B. 因特网 C. NSFnet D. CERNET 8. 物理层、数据链路层、网络层、传输层的传输单位(或PDU)分别是()。 Ⅰ.帧Ⅱ. 比特Ⅲ.报文段Ⅳ.数据报 A.Ⅰ、Ⅱ、Ⅳ、Ⅲ B. Ⅱ、Ⅰ、Ⅳ、Ⅲ C. Ⅰ、Ⅳ、Ⅱ、Ⅲ D. Ⅲ、Ⅳ、Ⅱ、Ⅰ 9.设某段电路的传播时延是10ms,带宽为10Mbit/s,则该段电路的时延带宽积为()。 A.2×105 bit B.4×105 bit C.1×105 bit D. 8×105 bit

复杂网络的局部社团结构挖掘算法

第40卷第5期自动化学报Vol.40,No.5 2014年5月ACTA AUTOMATICA SINICA May,2014 复杂网络的局部社团结构挖掘算法 袁超1柴毅1,2 摘要挖掘复杂网络的社团结构对研究复杂系统具有重要的理论和实践意义.其中,相较于全局社团,局部社团的挖掘难度更大,相关文献更少.现有的局部社团挖掘算法大都精度较低、稳定性较差.本文提出了一个有效的局部社团挖掘算法,称为内外夹推法(Shell interception and core expansion,SICE).算法有两个创新之处:1)将节点相似度模型引入到局部社团挖掘算法中(节点相似度模型在局部社团挖掘中较难应用),并提出了“一次一个子图”的社团扩展模式;2)提出了一种“内外夹推”的思想.这两个创新使SICE算法摆脱了缺乏网络全局信息的困扰,并解决了以往算法的一个致命缺陷,从而使算法具有很高的精度和稳定性.通过理论分析和实验比较,证明SICE算法要远好于当前的同类算法,甚至不逊色于性能较好的全局社团挖掘算法. 关键词复杂网络,局部社团,数据挖掘,聚类 引用格式袁超,柴毅.复杂网络的局部社团结构挖掘算法.自动化学报,2014,40(5):921?934 DOI10.3724/SP.J.1004.2014.00921 Method for Local Community Mining in the Complex Networks YUAN Chao1CHAI Yi1,2 Abstract Community structure detection bears both theoretical and practical signi?cance for the study of complex sys-tems.Generally speaking,the local community detection is relatively a more di?cult problem than the global community detection.So up to now,the related researches are still slow progress.And there are many defects existing in the previous local community detection algorithms,such as low precision and poor stability.In this paper,a local community detection algorithm,which is called shell interception and core expansion(SICE),has been proposed.There are two innovations in this algorithm:1)A node similarity model is introduced into this algorithm,and a community expansion mode“one sub-graph at a time”is proposed;2)An e?ective method which is named“shell interception and core expansion”is proposed. By these two innovations,the SICE algorithm has solved the problem of missing global network information,and avoided a fatal weakness of the previous algorithms.Theoretical analysis and experiments all illustrate that the SICE algorithm has high precision and stability,and it outperforms the previous algorithms. Key words Complex network,local community structure,data mining,clustering Citation Yuan Chao,Chai Yi.Method for local community mining in the complex networks.Acta Automatica Sinica, 2014,40(5):921?934 复杂网络分析是当前最重要的多学科交叉研究领域之一[1].社团结构挖掘则是复杂网络研究中的重要内容,对网络的结构特性和动力学特性分析具有重要帮助.此外,社团结构挖掘在许多工程领域中也有重要的应用,如图像分割领域[2?3]、互联网领域[4]等.近年来,不同领域的学者提出了许多有效的社团挖掘算法.如传统的全局社团挖掘算法 收稿日期2013-03-26录用日期2013-08-13 Manuscript received March26,2013;accepted August13,2013国家自然科学基金(61374135)资助 Supported by National Natural Science Foundation of China (61374135) 本文责任编委吕金虎 Recommended by Associate Editor LV Jin-Hu 1.重庆大学自动化学院重庆400044 2.重庆大学输配电装备及系统安全与新技术国家重点实验室重庆400044 1.School of Automation,Chongqing University,Chongqing 400044 2.State Key Laboratory of Power Transmission Equip-ment and System Security and New Technology,Chongqing Uni-versity,Chongqing400044(包括非重叠社团挖掘算法[5?9]和重叠社团挖掘算法[10?11])、演化网络的社团挖掘算法[12?13]以及局部社团挖掘算法[14?18]等. 现实世界中,对于像互联网这样的大规模复杂网络,通常只能获取其局部信息,很难获取其全局信息.这样,许多传统的全局社团挖掘算法就很难在这些网络上应用.另外,许多情况下我们也只需要挖掘某个或者某些节点所属的社团结构,并不需要探测整个网络的社团结构.因此,有必要设计出高效的局部社团挖掘算法.然而,由于只能得到网络的局部信息,局部社团的挖掘难度比全局社团的挖掘难度更大.目前,这方面的典型算法并不是很多.其中,Clauset提出了一个基于R值的局部社团挖掘算法[14].该算法首先定义了一个局部模块度R,然后,采用贪婪算法的思想,迭代地添加使R值增加最大的邻居节点,直到局部社团达到预先定义的规模.其中,局部模块度R值的定义如下:

复杂网络社区发现若干问题研究

复杂网络社区发现若干问题研究 近年来,复杂网络逐渐成为信息科学、社会学、物理学、乃至生命科学等学科研究的热点。所谓复杂网络,是指将自然界中的各个实体抽象为网络中的节点,实体与实体之间的关系抽象为网络中的边。 这使得自然界中的很多系统都可以表示为复杂网络的形式,例如社会关系网、科学家合作网、通信网、互联网、人类疾病基因网等等。研究发现,复杂网络具有复杂的内部结构和多样的结构特征,其中,模块性(即社区结构)是复杂网络的 一个重要特征,它表现出网络中的节点具有聚集化的特性,即社区内部节点之间 连接稠密、社区之间的节点连接稀疏。 此外,社区结构在现实世界中往往是“重叠”的。复杂网络(重叠)社区结构的发现对于分析复杂网络的拓扑结构、理解复杂网络的功能、发现复杂网络中的隐藏规律以及预测复杂网络的行为具有十分重要的意义。 目前,研究者提出了众多网络(重叠)社区发现方法,并将之成功应用于现实 系统的分析中,然而社区发现方法存在的问题还有很多,如复杂网络社区发现问 题与聚类分析问题两者之间的关系还有待研究;网络社区发现算法尤其是重叠社区发现算法的精度和效率还有待提高;传统的划分评价函数模块化Q函数存在分辨率的限制等等。鉴于复杂网络社区发现问题与传统机器学习中的聚类分析问题都是对数据进行划分,并且机器学习中的聚类分析研究日趋成熟,本文结合机器 学习相关的技术和方法,改进并提出了若干发现网络(重叠)社区的算法,主要贡 献如下:(1)揭示了社区发现问题和聚类分析问题之间的区别和联系,利用聚类分析中定义的相似度概念对GN (Girvan and Newman)算法进行改进,给出了快速的SGN (GN based on similarity)算法。

CRH2网络系统结构

12.2系统构成 12.2.1 列车信息控制系统构成 CRH2的列车信息控制装置由中央装置、终端装置、列车监控显示器、显示控制装置、IC卡架以及车内信息显示器构成。 表12-1 列车信息控制系统装置构成 *1 :有AI输入(Analog Input模拟输入),是MS-A941-G1,没有标注的是MS-A941-G2 (1)中央装置(型号:MS-A940) 中央装置:由输入输出连接器、电路板、后板、架子构成。 (2)终端装置(型号:MS-A941-G1、-G2) 终端装置:由输入输出连接器、电路板、后板、架子构成。 有AIN底座的终端装置型号为MS-A941-G1、没有AIN底座的型号为MS-A941-G2。(3)列车监控显示器(型号:MS-A942) 列车监视器部:由输入输出连接器、电路板、后板、架子构成。 (4)显示控制装置(型号:MS-A943) (5)IC卡控制装置(型号:MS-A944) 传输线有列车信息传输线(光纤)及自我诊断信息传输线(双绞线)二种。列车信息传输线为环线回路(loop),如果一个方向的传输没有检测到应答时,就向环线的另一个方向送信,因此能够避开故障部位。另外,两个编组联挂时,需要连接的中央装置之间由2对电缆(双绞线)连接,当联挂条件(联挂车辆的两个中央装置之间的MCR是OFF)成立时,联挂前原有环线回路(loop)断开,将联挂前独立的两个环线回路(loop)连接成大环,构成了新的由16节车厢组成的环线回路(loop)。

中央装置和终端装置由光纤连接,构成环线回路,采用不易发生故障的双向环形网络传输信息。具有向左和向右二条线路,是一种分散型的结构。当发生两处以上的线路故障时,可以继续由其他连接线路进行传输。另外,还设置有备份传输线(自我诊断传输线),当环形网络发生故障时也可以进行传输,通过此线路传输简化的控制指令,对各设备进行控制。 表12-3 传输系统构成设备一览表 列车信息控制装置的系统构成如图12.1所示。

复杂网络的社区结构

第8卷第1期 复杂系统与复杂性科学v01.8No.12011年3月COM呻LEXSYSTEMSANDCOMPLEXITYSCIENCEMar.2011文章编号:1672—3813(2011)01一0057—14 复杂网络的社区结构 程学旗,沈华伟 (中国科学院计算技术研究所,北京100190) 摘要:社区结构作为真实复杂网络所普遍具有的一个重要拓扑特性,在最近10 内得到了广泛而深入的研究。回顾了近几年国内外社区结构研究的主要进展, 点介绍社区发现的研究历程和研究成果,并结合社会计算的背景展望了社区结研究的未来发展方向和潜在的应用价值。 关键词:社区结构;社区发现;模块度;社会计算 中图分类号:N94文献标识码:A CommunityStructureofComplexNetworks CHENGXue-qi,(InstituteofComputingTechn0109y,ChineseSHENHua—wei AcademyofSciences,Be巧ing100190,China) Abstract:Asacommonandimportanttopologicalcharacteristicofrealworldcomplexnetworks, communitystructurehasbeenextensiVelystudiedinthelastdecade. Thispaperreviewsthemainprogressesinthescientificresearch oncommunitystructure.Especially,thispaperdescribesthedeVelopmentatthedetectionofcommunitystructurefromvariousdisciplines. Finally,thispaperdiscussesthefutureresearchdirectionsofthecommunity structureandthepotentialapplications insociaIcomputing.Keywords:communitystructure;communitydetection;modularity;socialcomputing 0引言 真实世界中的许多复杂系统可以表示成图或网络,包括社会网络、信息网络、生物网络和技术网络等[1剖。经验分析表明,这些复杂网络可以自然地分成一些节点组,使同一个节点组内的两个节点之间比不同节点组的两个节点之间更倾向于有边相连,网络的这种拓扑特性被称为社区结构,相应地,每个节点组被称为一个社区‘6’。 社区结构刻画了网络中连边关系的局部聚集特性,也体现了网络中连边的分布不均匀性。进一步,网络中的社区通常由功能相近或性质相似的网络节点组成,因此,社区被认为有助于揭示网络结构和功能之间的关系。卜引。以万维网(WorldwideWeb)为例,通过超链接紧密关联的网页形成一个个的社区,同一个社区的网页具有相近的话题[3刮。社区结构的示例如图1所示。 收稿日期:2010一】O一29 墓金项目:国家自然科学基金(60873245,60933005) 作者简介:程学旗(197l一),男,研究员,博导,主要研究方向为网络科学、海量信息检索和数据挖掘、社会计算、分布式计算和网络模拟仿真。 年重构

网络系统结构及配置规划

网络系统结构及配置规划 一级网络 一、网络结构 Internet--路由器--防火墙--核心交换机--(汇聚)接入交换机4台--POE交换机--无线AP 二、功能规划 1、路由器:连接Internet上网; 2、防火墙:内外数据交换安全审核; 3、核心交换机:各个业务承载网关(VLAN及路由表、ACL等分配); 4、(汇聚)接入交换机:业务接入(不同业务不同VLAN); 5、POE接入交换机:无线AP接入; 6、无线AP:手机或者终端接入Internet 三、配置规划 1、中心机房 路由器: (1)业务配置: W AN口数据(运营商提供); 路由表:指向外网的默认路由表和指向各个业务VLAN的

静态路由表; 端口映射:二、三级分支通过外网访问一级总部各个业务(比如GPS) (2)与上下级互联配置: 上联Internet: 配置W AN口地址,默认路由指向外网。 下联防火墙(Fw): 本端LAN1口连接防火墙(FW)的GE2口; LAN1口配置地址(172.16.200.1/24),静态路由表指向各个业务VLAN。 防火墙: (1)业务及互联配置: 开启基本防御功能;GE1口下联连接核心交换机(Core)的48口,本端GE2口上联连接路由器(Router)的LAN1口。核心交换机: (1)业务配置: 业务VLAN: 办公内网:VLAN10;172.16.10.1/24 WIFI:VLAN20;172.16.20.1/24 视频监控/视频会议:VLAN30;192.168.30.1/24 GPS:VLAN40;172.16.40.1/24 人员定位:VLAN50;172.16.50.1/24

复杂网络社区结构划分方法

复杂网络社区结构划分方法 已有 3661 次阅读2009-4-30 08:38|个人分类:科研笔记|系统分类:科研笔记|关键词:网络,系统,复杂网络,社区结构,聚类,划分方法 随着对网络性质的物理意义和数学特性的深入研究,人们发现许多实际网络都具有一个共同性质,即社区结构。也就是说,整个网络是由若干个“社区”或“组”构成的。每个社区内部的结点间的连接相对非常紧密,但是各个社区之间的连接相对来说却比较稀疏[1][2]。揭示网络的社区结构,对于深入了解网络结构与分析网络特性是很重要的。如社会网络中的社区代表根据兴趣和背景而形成的真实的社会团体;引文网络中的社区代表针对同一主题的相关论文;万维网中的社区就是讨论相关主题的若干网站[3];而生物化学网络或者电子电路中的网络社区可以是某一类功能单元[4][5]。发现这些网络中的社区有助于我们更加有效的理解和开发这些网络。 在复杂网络社区结构划分的研究中,社区结构划分算法所要划分的网络大致可分为两类,一类是比较常见的网络,即仅包含正联系的网络(网络中边的权值为正实数);另一类是符号社会网络,即网络中既包含正向联系的边,也包含负向联系的边。因此划分网络中社区结构的算法相应分为两大类,而对于第一类网络又提出了许多不同的社区结构划分算法,划分第一类网络社区的传统算法可分为两大类,第一类是基于图论的算法,比如K-L算法[6]、谱平分法[7][8]、随机游走算法[9]和派系过滤算法[10][11]等;第二类是层次聚类算法,比如基于相似度度量

的凝聚算法[2]和基于边介数度量的分裂算法[1][12][13]等。最近几年从其他不同的角度又提出了许多划分第一类网络社区结构的算法,大致可划分如下:基于电阻网络性质的算法[14]、基于信息论的算法[15]、基于PCA的算法[16]和最大化模块度[17]的算法[18-23]等。对于符号网络,Doreian和Mrvar提出了一种利用局部搜索划分符号网络社区结构的算法[24],且Bo Yang等提出一种基于代理的启发式划分符号网络社区结构的算法(FEC)[25]。 尽管复杂网络的社区发现问题得到了大量的研究,但还存在一些尚未解决的基本问题,如社区概念虽然大量使用,但却缺少严格的数学定义;大多数社区发现算法虽然性能优越,但所需计算量却很大。这说明复杂网络中社区发现的研究还需要付出大量的努力。 关于复杂网络社区发现问题更加系统深入的最新进展情况请看2009长篇综述文章Community Detection in graphs by Santo Fortunato (arXiv:0906.0612) 参考文献 [1] Girvan M, Newman M E J. Community structure in social and biological networks[J]. PNAS, 2001, 99(12): 7821-7826. [2] Newman M E J. Fast algorithm for detecting community structure in networks[J]. Physical Review E, 2004, 69(6): 066133.

公司网络系统结构框架

公司网络系统结构框架 1.引言 随着现代化企业管理高速发展,网络协同管理系统逐渐受到关注。一些大型企业集团正致力实现高层次的网络办公自动化,这将为他们节省大批的人力资源,节省大量的办公费用,大幅度提高了办公效率。 a、企业内各种信息及技术资源的共享 b、加强员工间的交流、提高整体素质工作效率 c、为领导提供各种有用数据,方便领导对公司情况的及时了解、提供决策支持 d、提供各种工作信息及技术资源记录,以备事后查询 2.结构的特点 系统可采用BS结构(Browser/Server,浏览器/服务器模式),使用方法类似平时的上网,对用户要求不高,如用户没有上网经验,只需短期培训即可上手使用。 系统组合完成后将在公司内部使用,最终用户为公司所有员工。用户都能熟练掌握计算机的操作。 3.设备及分布 该系统硬件设备由一台服务器及数据存储硬盘矩阵、数台PC工作站、交换机及网线组成。 4.支撑软件 .服务器 a.操作系统:Microsoft Windows 2000 Advance Server以上 b.数据库系统:Microsoft SQL Server 2000/Oracle/MySSQL以上 c.其他软件:JBoss、IE6.0以上等 .系统运行方式 系统采用独立运行的程序,采可用http协议,与其他同协议的组件挂接。 5.需求描述 5.1系统功能简述 系统分为个人办公、部门办公、邮件系统、信息更新、个人设置和系统设置这六个部分。 5.2系统一般性规定 各部门有自己的工作组、在组内资源共享 5.3数据库 公司文化资料库,员工信息资料库,客户信息资料库,技术信息资料库,产品设计资料库,仓库信息资料库,财务数据资料库。 5.4安全性规定 系统用户的权限分为5类,分别是员工级、项目经理及员工组长、部门经理、公司高管、超级用户。 .员工级:有个人办公、个人设置的全部权限,信息交互、资料调阅、事务处理的部分权限。员工所在部门不同,其权限也有所不同。 .项目经理及员工组长: .部门经理:这部分权限是分配给部门领导的。这个级别的权限除员工级的所有权限外,还包括部门办公的全部权限。这一级别权限的员工可以查看其所属部门员工的日程安排、已完成工作情况和工作日记并可以委托其部门员工为其工作。 .公司高管:这部分权限是分配给公司领导的。公司领导拥有除系统设置外的全部权限。他们可以查看所有员工的日程安排、已完成工作情况和工作日记并可以委托员工为其工作。 .超级用户:有系统设置的权限。 用户的具体权限按员工所在部门和岗位具体分配。

相关主题
文本预览
相关文档 最新文档