集群系统介绍以及和小型机的对比
- 格式:doc
- 大小:599.00 KB
- 文档页数:7
前言高性能计算集群(HPCC-High Performance Computing Cluster)是计算机科学的一个分支,以解决复杂的科学计算或数值计算问题为目的,是由多台节点机(服务器)构成的一种松散耦合的计算节点集合。
为用户提供高性能计算、网络请求响应或专业的应用程序(包括并行计算、数据库、Web)等服务。
相比起传统的小型机,集群系统有极强的伸缩性,可通过在集群中增加或删减节点的方式,在不影响原有应用与计算任务的情况下,随时增加和降低系统的处理能力。
还可以通过人为分配的方式,将一个大型集群系统分割为多个小型集群分给多个用户使用,运行不同的业务与应用。
集群系统中的多台节点服务器系统通过相应的硬件及高速网络互连,由软件控制着,将复杂的问题分解开来,分配到各个计算节点上去,每个集群节点独立运行自己的进程,这些进程之间可以彼此通信(通常是利用MPI -消息传递接口),共同读取统一的数据资源,协同完成整个计算任务,以多台计算节点共同运算的模式来换取较小的计算时间。
根据不同的计算模式与规模,构成集群系统的节点数可以从几个到上千个。
对于以国家政府、军方及大型组织机构来讲,节点数目可以达到数千甚至上万。
而随着HPCC 应用的普及,中小规模的高性能计算集群也慢慢走进中小型用户的视野,高性能计算集群系统的部署,极大地满足了此类用户对复杂运算的能力的需求,大大拓展了其业务范围,为中小型用户的成长提供支持。
本次方案研究适合于中小规模用户的典型系统:基于32个计算节点和In finiBand 高速网络的Linux 集群。
惠普Linux 高性能集群方案方案描述此次方案中,高性能计算集群系统的节点由 HP BladeSystem 刀片服务器搭建,节点间通过InfiniBand 高速网络相连,管理、登录和存储节点由HP ProLiant机架式服务器构成,存储节点通过SAN 交换机外挂HPStorageWorks 磁盘阵列来存储大容量数据。
小型机双机集群数据库系统管理与维护摘要:随着计算机技术的迅猛发展,大型数据的处理和存储已成为当今计算机科学中的重要问题。
为了保证数据库系统的稳定性和可扩展性,使用小型机双机集群成为一种常见的数据库解决方案。
本文以小型机双机集群数据库系统为研究对象,详细分析了其管理与维护的必要性,阐述了如何通过备份、故障转移、性能监测等手段保证数据库系统的安全、稳定运行。
关键词:小型机双机集群、数据库系统、管理、维护、备份、故障转移、性能监测。
正文:一、引言随着信息时代的到来,数据的容量和速度呈现爆炸式增长,数据处理与存储成为了计算机科学的急需问题。
作为现代信息化的重要基础设施,数据库系统的运行稳定性和数据存储安全问题受到了广泛关注。
在此背景下,小型机双机集群数据库系统应运而生,成为了常用的数据库解决方案。
二、小型机双机集群数据库系统概述小型机双机集群数据库系统相当于通过搭建集群将多台服务器联合成一个整体运行,每个服务器可以相互配合,并将数据分布在参与集群的服务器之间。
小型机双机集群的应用方案具有可扩展性,故障容错和性能提升的优势。
三、小型机双机集群数据库系统的管理与维护小型机双机集群数据库系统的管理与维护包括备份与恢复策略、故障转移和性能监测三个方面。
(一)备份与恢复策略备份与恢复策略是小型机双机集群数据库系统管理的重要方面。
备份策略的制定包括数据备份的时间、备份的频率、备份如何执行、备份存储的位置等,考虑数据量的大小、恢复所需时间等因素,同时也需要考虑故障发生的概率。
恢复的策略与备份策略类似,主要包括数据恢复的时间、恢复数据顺序,应急措施等。
(二)故障转移故障转移是小型机双机集群数据库系统管理的另一个重点。
故障发生时,系统要能够在最短时间内完成故障转移。
原理是通过主从切换,将数据库系统从故障节点转移到正常节点,并保证业务持续不中断。
同时,也需要进行故障原因的分析和处理,避免下一次故障的发生。
(三)性能监测性能监测的目的是了解任务执行的情况,发现运行中的问题,并及时解决。
集群系统主要分为两种:高可用性集群和高性能集群。
高可用性集群的主要功能就是提供不间断的服务。
有许多应用程序都必须一天二十四小时地不停运转,如所有的web服务器、工业控制器、ATM、远程通讯转接器、医学与军事监测仪以及股票处理机等。
对这些应用程序而言,暂时的停机都会导致数据的丢失和灾难性的后果。
高性能集群通过将多台机器连接起来同时处理复杂的计算问题。
模拟星球附近的磁场、预测龙卷风的出现、定位石油资源的储藏地等情况都需要对大量的数据进行处理。
传统的处理方法是使用超级计算机来完成计算工作,但是超级计算机的价格比较昂贵,而且可用性和可扩展性不够强,因此集群成为了高性能计算领域瞩目的焦点。
集群系统采用的操作系统主要有VMS、UNIX、WindowsNT和Linux。
美国DEC公司(Digital Equipment Corporation)开发的VMScluster系统开发最早,技术也很成熟,应用也很广泛,但由于VMS操作系统只能在DEC公司的VAX系列和Alpha系列服务器上运行,VMScluster的应用受到很大限制。
UNIX是服务器或工作站上普遍使用的操作系统,它运行稳定、安全性也比较好,因此许多大的公司都采用了基于UNIX的集群系统解决方案,如DEC、HP、SUN、IBM、NCR和DG等公司,其中在国内影响比较大的主要是DEC、HP、SUN和IBM。
其中DEC公司的Trucluster系统提供了由4台Digital Alpha Server组成的集群系统,它集高可靠性、高可用性和易管理性于一身,是关键业务计算机系统的理想解决方案。
基于WindowsNT的集群系统解决方案厂商主要有Mircrosoft和DEC。
Microsoft于1995年就开始了集群系统的开发工作。
Windows 2000中已经增加了集群功能,该高可用性集群叫做WolfPack,也叫做Microsoft Cluster Server (MCS)。
小型机相对X86服务器优势比较RISC芯片除了指令执行效率的优势(20%的指令使用频率最大占运行时间的80%),RISC系统经过长期的发展已经在可靠性等方面取得了不俗的成绩,小型机能够实现处理器、内存以及IO设备等的冗余与热插拔,这些都是X86架构的服务器所不具备的,而长期盘踞高端市场也使得RISC系统在高端市场形成了完善的生态系统。
在操作系统上,其采用的是UNIX操作系统,其性能安全性、稳定性是Windows/Linux操作系统无法比拟的。
下面从几个方面来阐述小型机优势.第一.性能考虑性能,主要是要考虑响应时间、批量运行时间、用户支持数量。
小型机采用RISC 指令集,20%的指令解决80%负载,其运行效率非常高,故其响应时间比响应x86服务器要快,另外RISC处理器多核多线程技术适用于多并发用户、大数据量处理的环境,故小型机在批量处理数据时比x86效率要高很多,tpcc 网站可查出Oracle T系列小型机配置32个4.13GHz RISC处理器核在3000GB数据库大小时,其TPC-H(主要测试数据挖掘能力)为205,792,而64个Intel E7560 2.27GHz八核处理器Hp DL980才162,601的TPC-H性能指标.尽管近几年PC服务器的性能提升很快,跟小型机的差距越来越小,但限于操作系统对多核多线程支持,故小型机在并发多用户复杂环境中表现更加突出,小型机以绝对优势超于x86,被企业关键业务应用忠爱,如数据库服务器、电子商务应用等负载较重环境中。
第二.可靠性一般而言,RISC+UNIX比x86+Linux或Windows更稳定。
RISC服务器在硬件架构设计上与X86服务器有很大的差别,使用了非常多的冗余技术和高可用技术,如处理器降级使用、PCI槽热插拔等,因此可靠性较高。
X86服务器的硬件质量水平参差不齐,有高有低,硬件做工上稍差。
另外操作系统方面,UNIX比Linux或Windows稳定多了,如Windows在处理器负载50%的时候,机器处于极度不稳定状态中,Linux系统在处理器负载75%的时候,机器也处于崩溃边缘,因为这些操作系统一开始面向的是中低端市场,而UNIX在处理器负载100%的情况下,系统不仅仅不会崩溃,还能响应客户请求,只不过响应时间长而已,这就是很多核心应用采用小型机的最主要原因之一.第三.扩展性x86服务器限于互联技术,在多处理器多核心配置中,其性能指标随着处理器数量增长而剧烈下降,如4个处理器时,其性能仅仅相对于1个处理器时的2.0-2.5倍之间,故x86目前最大8个处理器,而小型机采用NUMA(非一致性存储)架构,早已突破上千个处理器的限制.第四.售后服务许多用户之所以选择昂贵的RISC小型机,很重要的一个因素就是因为小型机厂家可以提升一站式的整套厂商级服务,用户系统出了问题直接找一家即可,小机厂商本身也确实拥有很强的技术支持队伍。
集群技术(2010-05-30 13:10:12)一、高可用性集群系统集群技术(Cluster技术)就是将多台服务器用集群软件连接在一起,组成一个高度透明的大型服务器群的计算机系统,作为一个整体为客户端提供服务,客户端能共享网络上的所有资源,如数据或应用软件等,同时客户端的用户并不关心其应用Server运行在那台服务器上,只关心其应用Server是否能连续工作。
当集群系统内某一台服务器出现故障时,其备援服务器便立即接管该故障服务器的应用服务,继续为前端的用户提供服务。
从客户端看来,集群中的所有服务器是一个系统,就像一台大型的计算机系统,其上运行着客户端需要的应用服务。
由于集群系统能够保证用户的业务是连续的并且具有持续可用的特性,即具有7x24的可用性。
在一年之内可达99.99%可用性时,这样的集群系统我们称为高可用性的集群系统。
在高可用性的集群系统中,由于是多台服务器在高可用性的集群系统软件的管理下为客户端提供服务,故每一个计算机的部件都有冗余备份,如服务器的主板、网卡、网络、电源系统、风扇系统、应用软件、存储设备(Disk Array)等等,其中最重要的是数据存放的介质要有冗余保护,一旦某个部件出现问题,冗余部件会自动接管故障部件的工作,也就是说某台服务器出现故障,则备份服务器将在集群软件的指挥下自动接管故障服务器的工作,从而消除了此故障对整个系统的影响。
现在常用的双机热备系统仅仅是只有两个节点的、最简单的集群系统,是高可用性集群系统的特例。
高可用性的集群系统主要包括以下几方面硬件组件:服务器组:在高可用性的集群系统中每个节点的服务器必须有自己的CPU、内存和磁盘。
每个服务器节点的磁盘是用于安装操作系统和集群软件程序。
对外提供服务的网路:集群系统中的服务器一般采用TCP/IP网络协议与客户端相连。
每个服务器上都有自己的应用服务,客户端必须通过集群服务器中的网络通路来得到自己的服务。
心跳信号通路:在高可用性的集群系统中每个节点必须有心跳接口,用于服务器节点之间互相监视和通信,以取得备援服务器的工作状态。
解析小型机、大型机和x86服务器间的差别小型机(minicomputer or midrangecomputer)是一个已过时的术语,用来指一类界于大型主机(mainframe)和微型计算机(microcomputer)之间的计算机产品,它是60年代由DEC(数字设备公司)公司首先开发的一类高性能计算产品。
UNIX服务器具有区别于X86服务器和大型主机的特有体系结构,基本上,各厂家UNIX 服务器使用自家的UNIX版本和处理器。
比如IBM公司采用Power处理器和AIX操作系统,Sun、 Fujitsu(富士通)公司采用SPARC处理器架构和Solaris操作系统,HP采用PA-RISC 架构(现在转向于安腾处理器)和HP-UX操作系统;过去的Compaq公司(已经被并入HP)处理器架构采用Alpha。
使用小型机的用户一般是看中Unix操作系统的安全性、可靠性和专用服务器的高速运算能力。
早期的小型机通常有各制造厂自己的专利技术,使用专用的指令系统和操作系统。
不过,自80年代UNIX操作系统兴起后,一些面临危机的小型机改用了UNIX系统。
小型机中国业内习惯上说的小型机,是指一种UNIX服务器,是在服务器市场中处于中高端位置。
小型机是指运行原理类似于PC(个人电脑)和服务器,但性能及用途又与它们截然不同的一种高性能计算机,它是70年代由DCE(数字设备公司)公司首先开发的一种高性能计算产品。
小型机通常采用8-32颗处理器,性能和价格介于PC服务器和大型主机之间,高性能 64 位计算机。
一般而言,小型机具有高运算处理能力、高可靠性、高服务性、高可用性等小型机具有区别PC及其服务器的特有体系结构,还有各制造厂自己的专利技术,有的还采用小型机专用处理器,比如美国Sun、日本Fujitsu(富士通)等公司的小型机是基于SPARC处理器架构,而美国HP公司的则是基于 PA-RISC架构;Compaq公司是Alpha架构。
集群系统介绍以及和小型机的对比下面将详细阐述集群系统的特点以及集群系统相对于传统的小型机系统在信息类服务领域中的优势。
1、目前多数信息中心建设的目标高性能以及大规模数据仓库和数据挖掘面对着日益飞速发展的互联网络,单个计算机系统的计算和应用能力正在接受着无比巨大的考验,在短短的几年当中,一些主流业务数据库系统的数据量已经从过去的几个G扩展到了目前的几十T甚至几千T,而且这样的业务数据还正在极大的速度增长着。
例如一个安全系统的内部信息中心常常要提供各种各样的业务系统的功能如人口户政系统、警员业务系统、罪犯资料系统等等,随着人口流动能力的逐渐增大以及各种各样新兴的业务系统的上马,对信息中心机房服务器的硬件性能的需求也在不断提高。
并且,随着犯罪分子的活动的复杂性的提高,在研究犯罪分子的规律的时候已经不得不引入诸如数据挖掘的手段,而这往往是对数据库系统的极大的考验。
高可靠性信息中心作为一个政府信息的重要链路和服务提供的出口,在关键业务上对系统的可靠性要求是十分强烈的,通常一个数据中心需要对自身的系统机房的可靠性进行详细地评估并针对这样的可靠性评估制定一些相应的可靠性策略。
目前大多数的信息中心在关键业务上采用了传统的单机方式或者双机热备的方式,但是这样的办法在可靠性上还是不能完全保证的,并且如果仅仅采用双机热备的方式,将会有大量的针对关键业务的主机服务器系统处于闲置状态,这显然是对资源的极大浪费。
高可扩展性信息中心的建设是一个长期持续的过程,信息中心的工作方向也会随着上级机关各种不同业务系统的相继出台而有所变动,对于飞速发展的硬件设备来说,一方面资金上不允许,一方面也会造成资源的极大浪费,所以我们并不会一次购进足够多的设备,因此,整个系统的可扩展性将成为信息中心系统建设的一个至关重要的问题,那就意味着系统必须能够一方面在升级的过程中不淘汰原有的系统,一方面又能最大地节约升级成本。
目前多数信息中心的建设采用单机服务器或者小型机模式,这种模式的可扩展性相对较差,新增加的升级系统很难和原有的系统很好地进行工作,而增加的系统的性能又比原有系统优异很多,这就表示原有系统将直接被淘汰而无法继续利用。
集群服务器有什么优点与缺点
集群服务器在某种程度上具有更强大的功能,不仅是因为增加节点而强化的处理能力,其扩展技术也更加容易实现,并且可扩展性也远远超过SMP。
综合来看,使用集群技术的优势有几点:
一、强扩展能力
一般的扩展技术,大概能支持几十个CPU的扩展,而集群的话可以扩展到几百甚至几千个CPU,并且相对其他技术限制更小,在扩展能力上具有明显优势。
其次,通过增加额外节点,能增加整体负荷的承受能力,能不断调整来满足具体增长的应用需求。
二、更容易实现
即使你拥有的是价格便宜、性能低下的多台服务器,通过集群技术仍然可以将它们连接在一起然后使得整个服务器系统多倍甚至几十倍的增长,而这仅仅通过软件即可实现,相对其他技术来说显得更为轻松,更容易实现。
并且,从软硬件成本上看,这种方式的性能提升显然更加规模效益。
三、易管理
可以通过管理系统来对所有的应用和系统进行监控和管理,使其像运行在同一台服务器一样。
同时,可以从网络的任意节点处来监控当前状态,如果出现服务器重连,会自动使其返回工作状态,自动平衡负荷等。
但技术的不足之处在于:
当应用出现故障需要重新修复运转时,其他服务器会接管该应用的数据区,而这个接管过程却需要消耗一些时间,应用越大,接管时间越长,会造成一定的延误。
什么是大型机,小型机。
大型机(mainframe)这个词,最初是指装在非常大的带框铁盒子里的大型计算机系统,以用来同小一些的迷你机和微型机有所区别。
虽然这个词已经通过不同方式被使用了很多年,大多数时候它却是指system/360 开始的一系列的IBM计算机。
这个词也可以用来指由其他厂商,如Amdahl, Hitachi Data Systems (HDS) 制造的兼容的系统。
有些人用这个词来指IBM的AS/400 或者iSeries 系统,这种用法是不恰当的;因为即使IBM自己也只把这些系列的机器看作中等型号的服务器,而不是大型机。
什么是I/O通道(Channel)一条大型机通道(channel)某种程度上类似于PCI 总线(bus),它能将一个或多个控制器连接起来,而这些控制器又控制着一个或更多的设备(磁盘驱动器、终端、LAN端口,等等。
)大型机通道和PCI 总线之间的一个主要区别是大型机通道通过几对大的bus and tag 电缆(并行通道方式),或者通过最近常使用的ESCON(Enterprise System Connection)光导纤维电缆(串行通道方式)以及光纤通道来连接控制器。
这些通道在早期是一些外置的盒子(每个约6’X30’’X5’H大小),现在都已经整合到了系统框架内。
这些通道的超强I/O处理能力是大型机系统功能如此强大的原因之一。
什么是DASDDASD 是Direct Access Storage Device(直接存取存储设备)的缩写;IBM创造这个词来指那些可以直接(并随意)设定地址的存储系统,也就是今天我们所说的磁盘驱动器。
但在过去,这个词也指磁鼓(drums)和数据单元(datacell)等等。
什么是数据单元?嗯,在磁盘驱动器变得廉价、快速并普遍使用前,IBM曾经制造过一种设备,基本上就是由一个磁鼓和绕在磁鼓上的许多磁条(单元)中的一个组成,然后读写的资料就被纪录在卷动的磁条的磁道上。
集群系统介绍以及和小型机的对比下面将详细阐述集群系统的特点以及集群系统相对于传统的小型机系统在信息类服务领域中的优势。
1、目前多数信息中心建设的目标➢高性能以及大规模数据仓库和数据挖掘面对着日益飞速发展的互联网络,单个计算机系统的计算和应用能力正在接受着无比巨大的考验,在短短的几年当中,一些主流业务数据库系统的数据量已经从过去的几个G扩展到了目前的几十T甚至几千T,而且这样的业务数据还正在极大的速度增长着。
例如一个安全系统的内部信息中心常常要提供各种各样的业务系统的功能如人口户政系统、警员业务系统、罪犯资料系统等等,随着人口流动能力的逐渐增大以及各种各样新兴的业务系统的上马,对信息中心机房服务器的硬件性能的需求也在不断提高。
并且,随着犯罪分子的活动的复杂性的提高,在研究犯罪分子的规律的时候已经不得不引入诸如数据挖掘的手段,而这往往是对数据库系统的极大的考验。
➢高可靠性信息中心作为一个政府信息的重要链路和服务提供的出口,在关键业务上对系统的可靠性要求是十分强烈的,通常一个数据中心需要对自身的系统机房的可靠性进行详细地评估并针对这样的可靠性评估制定一些相应的可靠性策略。
目前大多数的信息中心在关键业务上采用了传统的单机方式或者双机热备的方式,但是这样的办法在可靠性上还是不能完全保证的,并且如果仅仅采用双机热备的方式,将会有大量的针对关键业务的主机服务器系统处于闲置状态,这显然是对资源的极大浪费。
➢高可扩展性信息中心的建设是一个长期持续的过程,信息中心的工作方向也会随着上级机关各种不同业务系统的相继出台而有所变动,对于飞速发展的硬件设备来说,一方面资金上不允许,一方面也会造成资源的极大浪费,所以我们并不会一次购进足够多的设备,因此,整个系统的可扩展性将成为信息中心系统建设的一个至关重要的问题,那就意味着系统必须能够一方面在升级的过程中不淘汰原有的系统,一方面又能最大地节约升级成本。
目前多数信息中心的建设采用单机服务器或者小型机模式,这种模式的可扩展性相对较差,新增加的升级系统很难和原有的系统很好地进行工作,而增加的系统的性能又比原有系统优异很多,这就表示原有系统将直接被淘汰而无法继续利用。
➢高性能价格比信息中心建设在追求高性能和可扩展性的同时,还要考虑价格的因素,由于信息中心作为政府或者学校的支撑部门并不盈利,就意味着其资金的来源会收到一些外部的限制,因此考虑在得到相同性能的情况下花更少的钱,对于制定一个信息中心建设的策略是十分重要的。
➢高可管理性信息中心是一个提供信息服务的部门,而信息的管理是十分复杂的,因此通常一个具有强大自管理和自协调能力的系统是信息中心的必要条件。
而目前大多数的信息中心的网络布线和电源布线的整理都往往可能花上整个信息中心所有员工两天以上的时间,这是对管理性的强烈需求。
➢低管理成本在信息中心的建设中,不仅要考虑到购进系统设备的投资,还要考虑到在管理这些购进设备需要增加的投资,而管理成本通常包括管理人员的费用和培训费用以及管理制度的费用等。
目前很多信息中心中的服务器系统都零散地摆放并管理困难,这就无形中提高了管理的成本,一些信息中心采用Unix小型机的服务器,而对Unix小型机的管理成本也是十分昂贵的,这就意味着需要增加大量的额外投资。
2、集群系统的优势和特点集群系统定义:利用标准的网络将各种普通的服务器或者PC机连接起来,通过特定的方法,向用户提供更高的系统计算性能、存储性能和管理性能,同时为用户提供单一系统映象功能的计算机系统。
从定义中可以看到:●使用标准的网络和普通的服务器意味着集群系统可以更好的实现资源的共享,对普通PC server或者服务器系统的配置可以直接移植到集群系统上,集群系统使用标准的而非特制的网络就使得集群系统可以兼容以往已经成型的网络结构如TCP/IP,那么意味着集群系统将可以集成过去的任何基于TCP/IP的应用;●提供更高的系统计算性能和存储性能意味着集群系统具有很好的性能,其性能可以是集群系统节点的性能总和,一个集群系统的计算性能可以达到几个T GHz,存储性能甚至可以扩展至几千T;集群系统的一个重要特征就是要实现单一系统映象,单一系统映象意味着用户在使用集群系统的时候认为集群系统是一个单独的计算机,只不过这个计算机的性能更高罢了。
下图阐述了集群系统单一系统映象的涵义:图1 单一系统映象的含义3、集群系统的应用方式更好的整合这个特性利用了集群系统的单一系统映象的特性。
让我们看一下多功能应用系统的发展,如图:图2 单独的服务器上图是以往的应用服务器系统,这个系统采用了独立的服务器,在独立的服务器上安装了一个操作系统,由这个单独的操作系统对整个服务器进行管理,在管理上比较方便。
但是这样的系统会随着后端服务请求的不断增加而负担沉重,最终会由于无法承受巨大的压力而完全瘫痪。
为了解决这样的问题,人们将每种服务分别利用独立的服务器进行提供,如图:图3 多个服务器上图中,ftp服务器专门用来对ftp请求进行应答,web服务器专门用来对web请求进行应答,这样使用使得整个链路中的服务器不再出现瓶颈,系统也不会瘫痪了,但是,伴随而来了另外一个问题就是,在这个系统中每一个服务器毫无关联、系统管理员必须对每个系统进行分别的管理,这就无形中线性地增加了管理员的管理难度,提高了管理的成本。
随着这样的服务器数量的不断增加,单个管理员管理所有系统将不再可能。
此时,集群系统则体现出了无与伦比的优势:图4 集群系统在集群系统中,不再存在单个服务器的概念,与之对应的集群内部的节点机系统,每个节点机系统具有各自独立的功能,与前面的多服务器系统不同的是,集群系统由于具备良好的单一系统映象能力,因此在管理集群系统的时候管理员在感觉上就象是在管理单独的计算机系统一样简单方便。
利用集群系统的单一系统映象功能,用户可以完全不必考虑集群系统内部如何通讯,网络和电源如何布线和提供,一个集群系统只需要外部提供一个电源接口和网络接口,只需要外部提供一套显示器及鼠标键盘系统,这和传统的多服务器系统具有本质的区别。
利用集群系统,使用者可以极大的减少系统的故障检查点,我们可以通过集群系统的单一系统映象功能了解到整个集群系统的信息以进行实时的监控和管理。
更高的性能事实上,在很多信息服务领域遇到的情况是,即使将某种单独的服务运行在一个独立的服务器上,这个独立的服务器也可能承受不了外部网络应用请求的巨大压力。
典型的应用如web服务器的应用,vod服务器的应用以及ftp服务器的应用,这些应用都会消耗大量的服务器本地资源,当请求数量不断增多的时候,任何一个单独的服务器都有可能陷入瘫痪,在这样的情况下,集群系统再一次体现了强大的优势,因为集群系统为我们提供了性能更强的服务器系统,如图:图5 集群系统实现更高的吞吐率如上图,利用单独的服务器,如果某种服务器(例如web服务器)每秒钟只能承受5000次请求,则当同一秒钟内有超过5000次用户访问服务器的时候,就会有一些用户因为服务器不能承受更大的访问量而无法获取服务器的资源。
而利用集群系统更加强大的处理能力和吞吐能力,我们可以把这个最高访问频度提高到15000次甚至150000次或者更高。
更高的可靠性对于那些对可靠性要求非常高的应用,集群系统同样给出了具有极高可靠性和冗余度的解决方案,如图:图6 集群系统实现高可靠服务如上图,对于某些非常重要的应用(如身份证系统,电信计费系统等),这些应用作为关键业务,其短时间的中断可能意味着数十亿的国家资产的损失,因此对于这样的应用系统,必须设计一个高度可靠的应用支撑系统。
而集群系统无疑为我们提供了完美并且唯一的解决方案:在集群系统中,用户通向关键业务的链路从一条变成了多条,当主要链路出现了问题(也就是通向主要链路的服务器出现问题)的时候,应用系统将通过高可靠性的集群软件系统自动切换到备份链路上,继续保持业务系统的持续运行。
4、集群系统和小型机系统对比表特性小型机集群系统整体结构系统架构先进性古老模式现代模式软件层操作系统Unix为主Unix、Linux、windows全部支持是否支持内部多操作系统同时运行否是支持应用的数量较少很多操作数大小64位32位、64位全部支持管理和维护易管理性弱强管理成本很高较低是否支持易购买的零部件否是故障排除难度高低是否有国产厂商提供很少很多可靠性是否能够提供冗余否是性能价格比和可扩展性性能较低较高价格很高较低是否能够提供负载均衡否是可扩展性低高top500中的数量很少绝大多数从上表中可以看到,集群系统相对于小型机系统有如下几大优势:1.更高的性能价格比。
集群系统目前已经成为高性能计算机的发展方向,世界上top500排行榜的高性能计算机系统绝大多数是集群系统,小型机系统则很少。
2.更高的可扩展性。
集群系统可以通过原有预留的扩展接口进行无缝的扩展,这是小型机系统所无法做到的。
3.更高的可管理性。
通常管理一个集群系统要比管理一个小型机系统要简单得多,这也同时意味着培养一个小型机的管理人才将花费大量的费用和支出。
4.更高的系统鲁棒性(健壮或强壮)。
集群系统都是采用了标准的硬件设备,那就意味着这些设备可以轻松地拿到,在关键时候即使没有硬件厂商的提供也可以自行配置出临时的解决办法,但是小型机的每个配件都是专用的,那就意味着在一些关键的业务上我们需要等待小型机厂商的服务响应时间,将自己的工作带向了被动。
5.有更多国产厂商支持。
很多国产厂商支持集群系统,而小型机系统大多由国外厂商进行支持,这就涉及到一些关键的保密的部门将很难采用小型机系统。
6.对应用系统的更多的支持。
小型机系统只能支持相对较少的操作系统和64位软件,而集群系统可以支持大量的操作系统并且可以支持同时存在多种操作系统,也支持32位和64位的软件系统,在集群系统上运行的软件是小型机系统的成百上千倍。
基于上述的分析,集群系统具有比小型机系统更加先进的工作模式和更强的生命力,采用集群系统去替代原有陈旧的小型机系统是一种趋势和需求。