当前位置:文档之家› IBM-HACMP集群系统

IBM-HACMP集群系统

IBM-HACMP集群系统
IBM-HACMP集群系统

IBM HACMP集群系统

IBM AIX HACMP

双机系统安装与配置

杨益俊

时代朝阳系统工程师职业课程学员

时代朝阳数据库Talent Show(Oracle人才展示)

I.什么是HACMP

II.配置系统

III.HACMP 热备配置

IV.测试HACMP

V.插拔网线测试记录时代朝阳数据库Talent Show(Oracle人才展示)

实验软硬件环境:

?硬件:1G内存、本地存储、共享存储两台IBM:nodea、nodeb

?软件:AIX操作系统 5300-04

(64位系统,JFS2文件系统,安装有server2)

Nodea:en0 192.168.100.31 en1 172.16.100.31

Nodeb:en0 192.168.100.32 en1 172.16.100.32

Netmask:0xffffff00 时代朝阳数据库Talent Show(Oracle人才展示)

HACMP软件:hacmp5.3

Note:除以下包不需安装外,其余全部安装

cluster.es.plugins cluster.hativoli cluster.haview

I.什么是HACMP

HACMP: 高可用多处理集群

High Availability Cluster Multi-Processing

II.配置AIX HACMP 双节点热备环境

/扩到512M

/home扩到1024M

/usr扩到4096

/tmp扩到1024M

/opt和/var都扩到512M

文件系统名称 Lv逻辑卷名文件系统空间大小/ Hd4 512M /usr Hd2 4G

时代朝阳数据库Talent Show(Oracle人才展示)

/var Hd9 512M

/tmp Hd3 1G

/opt Hd10 512M

Note:检查下列系统软件包是否安装,如没有则安装

bos.adt bos.clvm bos.data https://www.doczj.com/doc/e0493457.html,pat bos.perf https://www.doczj.com/doc/e0493457.html,pat Xll.Dt

rsct.basic rsct.core https://www.doczj.com/doc/e0493457.html,pat

基本网络配置

#lscfg 查看网卡的位置(从插槽的位置辨别不同的网卡)

En0 P1—I3/E1

P1—I4/E1

En0 P1—I5/E1

P1/E1

主机名为:节点1:node_a 节点2:node_b

HostName IP地址(boot)IP地址(svc)IP地址(std)子网掩码Node_a 192.168.100.31192.168.11.31172.16.100.31 255.255.255.0 Node_b 192.168.100.32192.168.11.32172.16.100.32 255.255.255.0

编辑文件/etc/hosts

时代朝阳数据库Talent Show(Oracle人才展示)

保证所有节点能够解析所有集群地址,必须保证每个/etc/hosts 文件有下列行:

172.0.0.1 loopback localhost

Hosts文件内容:(双机两台机器上都一样)

时代朝阳数据库Talent Show(Oracle人才展示)

Boot地址:主网卡

Stdby地址:副网卡

Svc地址:漂移IP

配置rhost文件

Node_a:

编辑文件/usr/es/sbin/cluster/etc/rhosts:

192.168.100.31

172.16.100.31

192.168.100.32

172.16.100.32

时代朝阳数据库Talent Show(Oracle人才展示)

Node_b:

编辑文件/usr/es/sbin/cluster/etc/rhosts: 192.168.100.32 172.16.100.32

192.168.100.31 172.16.100.31

检查串口tty

在node_a 上执行命令cat < /dev/tty0

在node_b 上执行命令 cat /etc/hosts > /dev/tty0

Note :应该在node_a 的控制台上看到/etc/hosts 文件内容 反过来执行测试也可以。

时代朝阳数据库Talent Show (Oracle 人才展示)

#lsdev –Cc tty 可以用这个命令来查看串口。

这步主要是测试心跳线是否联通。

III.配置HACMP 热备

配置卷组、逻辑卷、文件系统Node_b:

#smit mkvg oravg(vg名可以随便取)

AUTOMATICALLY Restart 选NO

时代朝阳数据库Talent Show(Oracle人才展示)

#smit mklv halv(lv名可以随便取)

#smit mkfs hafs

MOUNT AUTOMATICALLY at system restart 选 no

完成后:

#varyoffvg oravg

Node_a:

#smit importvg 装入卷组并将其auto vary on 改为 off 在两节点上分别将前面的文件系统和卷组umount/varyoffvg

时代朝阳数据库Talent Show(Oracle人才展示)

NOTE:

?创建脚本:

node_a、node_b都需要创建,脚本一样都需要授权。该脚本将用于oracle数据库自动启动和关闭。

添加cluster和node

Smitty hacm p→initialization and standard configuaration 时代朝阳数据库Talent Show(Oracle人才展示)

→Add Node to an hacmp cluster

例如:创建名为cluster1的集群, New Nodes 选择前面我们设置的a、b两节点IP的地址。(node_a_boot node_b_boot)

配置HACMP拓扑及通信设备

Smitty hacmp→extend configuration→Extend Topology configuration→configre hacmp communication interfaces/devices→Add communication interfaces/devices →Add disconvered communiation interfaces and devices→communication devices

配置service ip label(配置漂移IP)

Smitty hacmp→initiatization and standare configuration →Configura resources to make highly available→configure hacmp service ip labels/address→Add a service label/address

时代朝阳数据库Talent Show(Oracle人才展示)

配置应用服务器

Smitty hacmp→initiatization and standare configuration →Configura resources to make highly available→configure application server→add an spplication server

设置Oracle数据库自动启动关闭的脚本。

时代朝阳数据库Talent Show(Oracle人才展示)

配置资源组

Smitty hacmp →initiatization and standare configuration →configure hacmp resource groups

Note:在选择participating node时注意,哪个是主节点时就要选哪个节点在前(我用的是node_b主节点,所以b在前)。

这个地方选择策略:

1)级联(优先级不同):本次实验所用的策略。

2)轮换/循环(优先级相同)

Startup policy 选择Online using………

Fallover policy 选择fallover using……..

Fallbackpolicy 选择fallback to higher….

3)并发(不切换)

Startup policy 选择online on all available

时代朝阳数据库Talent Show(Oracle人才展示)

Fallover policy 选择Bring offire….

Fallbackpolicy 选择never Fallback

更改资源组

Smitty hacm p→ initaization and standard configuration →configure hacmp resource groups→change/show resource and attributes for a resource group(standard)

将前面设置的服务、应用设置加入到资源

..................

时代朝阳数据库Talent Show(Oracle人才展示)

验证和同步

Smitty hacm p→ initaization and standard configuration →verify and synchronize hacmp configuration

同步时如果有像SSG、VO的错误可以用extend configuration→extended verify and synchronize 来修正错误。直到没有错误为止。

时代朝阳数据库Talent Show(Oracle人才展示)

启动hacmp

Smitty hacmp→

system management(C-SPOC) →manage hacmp services→start cluster services(在 node_b上启动hacmp)

时代朝阳数据库Talent Show(Oracle人才展示)

同样的方法在节点a上也启动节点hacmp

启动完成后可以用#nestat –i来查看漂移IP

再用#lsvg –o查看卷组

时代朝阳数据库Talent Show(Oracle人才展示)

以上是在Node_b上查看

这时Node_a状态为:

时代朝阳数据库Talent Show(Oracle人才展示)

服务器集群实验

2003服务器集群实验 一、服务器集群简介 什么是服务器群集?有何作用? 服务器群集是一组协同工作并运行Microsoft群集服务(Microsoft Cl uster Service,MSCS)的独立服务器。它为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。它允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。 服务器群集不同于NLB群集,服务器群集是有独立计算机系统(节点)构成的组,不同节点协同工作,就像单个系统一样,从而确保关键的应用程序和资源始终可由客户端使用。用于访问量较少的企业内网的服务器的冗余和可靠性。 哪些版本的操作系统支持服务器群集? 只有两个版本的windows server 2003系统支持该技术:企业版和数据中心版。 服务器群集的应用范围? 服务器群集最多可以支持8个节点,可实现DHCP、文件共享、后台打印、MS SQL server、exchange server等服务的可靠性。 二、群集专业术语 节点: 构建群集的物理计算机 群集服务: 运行群集管理器或运行群集必须启动的服务 资源: IP地址、磁盘、服务器应用程序等都可以叫做资源 共享磁盘: 群集节点之间通过光纤SCSI 电缆等共同连接的磁盘柜或存储 仲裁资源: 构建群集时,有一块磁盘会用来仲裁信息,其中包括当前的服务状态各个节点的状态以及群集转移时的一些日志 资源状态: 主要指资源目前是处于联机状态还是脱机状态 资源依赖: 资源之间的依存关系 组: 故障转移的最小单位 虚拟服务器: 提供一组服务--如数据库文件和打印共享等 故障转移: 应用从宕机的节点切换到正常联机的节点

分布式MySQL数据库集群在线监测系统设计与实现

` 硕士学位论文 (工程硕士) 分布式MySQL数据库集群在线监测系统 设计与实现 DESIGN AND IMPLEMENTATION OF DISTRIBUTED MySQL DATABASE CLUSTER ONLINE MONITORING SYSTEM 黄旭 哈尔滨工业大学 2012年6月

国内图书分类号:TP311 学校代码:10213 国际图书分类号:621.3 密级:公开 工程硕士学位论文 分布式MySQL数据库集群在线监测系统 设计与实现 硕士研究生:黄旭 导师:范国祥高级讲师 副导师:赵威高级工程师 申请学位:工程硕士 学科:软件工程 所在单位:软件学院 答辩日期:2012年6月 授予学位单位:哈尔滨工业大学

Classified Index: TP311 U.D.C.:621.3 Dissertation for the Master‘s Degree in Engineering DESIGN AND IMPLEMENTATION OF DISTRIBUTED MySQL DATABASE CLUSTER ONLINE MONITORING SYSTEM Candidate: Supervisor: Associate Supervisor: Academic Degree Applied for: Speciality: Affiliation: Date of Defence: Degree-Conferring-Institution: Huang Xu Senior Lecturer Fan GuoXiang Senior Engineer Zhao Wei Master of Engineering Software Engineering School of Software June, 2012 Harbin Institute of Technology

服务器集群系统解决方案

惠普服务器集群系统解决方案 计算系统与信息网络不停顿的运行与连接即高可用性已成为各行业特别是要求实时行业业务运行的基本要求。 惠普凭借丰富的经验创制的HP NetServer为您提供当今市场上最完备的高可用性系列产品和最优质的服务,使您的关键业务应用程序能连续可靠地高效运转。惠普还与业界领先的软硬件供应商联袂,为优化您的业务环境提供最为广泛的选择。同时,我们还可为您提供得益于最新、最优技术的服务器解决方案。 对于可用性要求高的公司,HP NetServer支持集群技术,例如Microsoft Windows NT(r)Server 4.0Enterprise Edition和Windows2000Advanced Server中包含的Microsoft(r)Cluster Server(MSCS),HP NetServer还支持Novell’s NetWare Cluster Services for NetWare5和Veritas公司的高可用性解决方案。同时在应用前景广泛的Linux操作系统平台上惠普公司也有性能优异的Longer HA双机解决方案。 某些业务要求为最终用户或其它系统提供的服务不能有丝毫中断,为此惠普采用Microsoft Windows NT环境下的虚拟服务器阵列技术,为您提供"HP NetServer超级保障解决方案",作为集群技术的补充,这些业界领先的解决方案将系统的正常运行时间提升到最高水平--使关键任务服务实现了不停顿的处理,连续的数据存取,不间断的连接以及始终如一的性能。 用户可根据实际的应用需求选择合适的解决方案,使HP NetServer真正的无忧之选。 在今天的商务应用系统中,稳定持续的系统运行时间变得越来越重要,而传统意义中的小型机系统使得普通用户望而却步。用户需用的是更高的可用性以及更低的成本。 集群系统 集群系统是一种提供高可用性、改善性能和增强企业应用软件可管理性的有效途径。随着基于Intel平台的服务器业已成为关键性业务和应用的主流服务器,集群技术的应用也日益广泛。 集群系统优点 集群可有效地提高系统的可用性。如果一个服务器或应用程序崩溃,集群系统中另一个服务器在继续工作的同时,接管崩溃服务器的任务,最大限度地缩短用户服务器和应用程序宕机的时间。 集群的另外一个优点是通过增加现有系统的的节点,提高了系统的延展性,使系统因故障中断的可能性降到最低。在这种架构中,多服务器的运行是针对相同的应用程序或数据库

计算机集群技术的解释

【赛迪网独家特稿】集群技术是使用特定的连接方式,将相对于超级计算机便宜许多的计算机设备结合起来,提供与超级计算机性能相当的并行处理技术。早在七十年代就有人提出可以使用这种集群技术完成并行处理,但是由于受到当时网络交换技术的限制,集群系统在性能上与其他并行处理系统相距甚远,直到网络技术逐渐成熟的今天,它才具备了与超级计算机相匹敌的能力。 什么是集群 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。 计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。在大多数模式下,集群中所有的节点拥有一个共同的名称,集群内的任一节点上运行的服务都可被所有的网络客户所使用。 集群的特点 1.提供强大处理能力的高性能计算机系统:计算机集群可以通过负载均衡、并行处理、时间片处理等多种形式,将多台计算机形成高性能计算机集群。对用户端(Client)而言,计算机集群则是一个单一的系统,可以为用户提供高性能的计算机系统,而用户不用关心有多少计算机承担了系统实现的任务,而只需要关注系统的整体处理能力。因此,计算机集群可以用多台普通性能的计算机组成具有高性能的计算机系统,承担只有超级计算机才能胜任的工作。 2.提供高可用性的计算机系统:通过计算机集群技术组成的系统,可以确保数据和应用程序对最终用户的高可用性,而不管故障属于什么类型。即当计算机集群中的节点计算机出现软硬件故障的时候,高可用性集群提供了对软件和硬件失败后的接替。它将服务器镜像到备用系统或节点中,当主节点上的系统崩溃时,冗余节点就从替补角色转换到正式角色,并自动投入应用,从而保证了系统运行的不间断。

两台服务器的集群方案

本文由szg81贡献 doc1。 七台服务器的集群方案 在传统的终端/主机的网络模式时代,终端功能简单,无需维护工作,在主机一端进行专门的管理与维护,具有资源共享、便于 管理的特点。但是,主机造价昂贵,终端没有处理能力,限制了网络的规模化发展。之后的客户机/服务器模式推进了计算产业 的标准化和开发化的发展,为系统提供了相当大的灵活性,但是随着分布系统规模的规模扩大,系统的维护和管理带来了巨大 的开销。面向 Internet 的服务型应用,需要高性能的硬件平台作为支持,将并行技术应用在服务器领域中,是计算机发展的必然 趋势。并行处理技术在高性能计算领域中,高可用和高性能是集群服务器系统发展的两个重要方向。 集群的概念 集群英文名称是 CLUSTER,是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管 理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。和传统的高性能计算 机技术相比,集群技术可以利用各档次的服务器作为节点,系统造价低,可以实现很高的运算速度,完成大运算量的计算,具 有较高的响应能力,能够满足当今日益增长的信息服务的需求。 集群技术应用的需求 Internet 用户数量呈几何级数增长和科学计算的复杂性要求计算机有更高的处理能力,而 CPU 的发展无法跟上不断增长的需求, 于是我们面临以下问题: ●大规模计算如基因数据的分析、气象预报、石油勘探需要极高的计算性能。 ●应用规模的发展使单个服务器难以承担负载。 ●不断增长的需求需要硬件有灵活的可扩展性。 ●关键性的业务需要可靠的容错机制。 IA 集群系统(CLUSTER)的特点 ●由若干完整的计算机互联组成一个统一的计算机系统; ●可以采用现成的通用硬件设备或特殊应用的硬件设备,例如专用的通讯设备; ●需要特殊软件支持,例如支持集群技术的操作系统或数据库等等; ●可实现单一系统映像,即操作控制、IP 登录点、文件结构、存储空间、I/O 空间、作业管理系统等等的单一化; ●在集群系统中可以动态地加入新的服务器和删除需要淘汰的服务器, 从而能够最大限度地扩展系统以满足不断增长的应用的需 要; ●可用性是集群系统应用中最重要的因素,是评价和衡量系统的一个重要指标; ●能够为用户提供不间断的服务,由于系统中包括了多个结点,当一个结点出现故障的时候,整个系统仍然能够继续为用户提供 服务; ●具有极高的性能价格比,和传统的大型主机相比,具有很大的价格优势; ●资源可充分利用,集群系统的每个结点都是相对独立的机器,当这些机器不提供服务或者不需要使用的时候,仍然能够被充分 利用。而大型主机上更新下来的配件就难以被重新利用了。 实现服务器集群的硬件配置 ●网络服务器 七台 ●服务器操作系统硬盘 七块 ●ULTRA 160 LVD SCSI 磁盘阵列 一个 ●18G SCSI 硬盘 十块 ●网络服务网卡 十四块 服务器集群的实践步骤 ●在安装机群服务之前的准备: 1、 十四块 18G SCSI 硬盘组成磁盘阵列,做 RAID5。 2、 两台服务器要求都配置双网卡,分别安装 Microsoft Windows Server2008 操作系统,并配置网络。 3、 所有磁盘必须设置成基本盘,阵列磁盘分区必须大于 7 个。 4、 每台服务器都要加入域当中,成为域成员,并且在每台服务器上都要有管理员权限。 ●安装配置服务器网络要点 1、在这一部分,每个服务器需要两个网络适配器,一个连接公众网,一个连接内部网(它只包含了群集节点) 内部网适配器 。 建立点对点的通信、群集状态信号和群集管理。每个节点的公众网适配器连接该群集到公众网上,并在此驻留客户。 2、安装 Microsoft Windows 2000 Adwance Server 操作系统后,开始配置每台服务器的网络。在网络连接中我们给连接公众网的 命名为"外网",连接内部网的命名为"内网"并分别指定 IP 地址为:节点 1:内网:ip:10.10.10.11 外网 ip:192.168.0.192 子网 掩码:255.255.255.0 网关:192.168.0.191(主域控制器 ip) ;节点 2:内网:ip:10.10.10.12 外网 ip:192.168.0.193 子网掩码: 255.255.255.0 网关:192.168.0.191;节点 3:内网:ip:10.10.10.13 外网 ip:192.168.0.194 子网掩码:255.255.255.0 网关: 192.168.0.191;节点 4:内网:ip:10.10.10.14 外网 ip:192.168.0.195 子网掩码:255.255.255.0 网关:192.168.0.191;节点 5: 内

数据库负载均衡解决方案

双节点数据库负载均衡解决方案 问题的提出? 在SQL Server数据库平台上,企业的数据库系统存在的形式主要有单机模式和集群模式(为了保证数据库的可用性或实现备份)如:失败转移集群(MSCS)、镜像(Mirror)、第三方的高可用(HA)集群或备份软件等。伴随着企业的发展,企业的数据量和访问量也会迅猛增加,此时数据库就会面临很大的负载和压力,意味着数据库会成为整个信息系统的瓶颈。这些“集群”技术能解决这类问题吗?SQL Server数据库上传统的集群技术 Microsoft Cluster Server(MSCS) 相对于单点来说Microsoft Cluster Server(MSCS)是一个可以提升可用性的技术,属于高可用集群,Microsoft称之为失败转移集群。 MSCS 从硬件连接上看,很像Oracle的RAC,两个节点,通过网络连接,共享磁盘;事实上SQL Server 数据库只运行在一个节点上,当出现故障时,另一个节点只是作为这个节点的备份; 因为始终只有一个节点在运行,在性能上也得不到提升,系统也就不具备扩展的能力。当现有的服务器不能满足应用的负载时只能更换更高配置的服务器。 Mirror 镜像是SQL Server 2005中的一个主要特点,目的是为了提高可用性,和MSCS相比,用户实现数据库的高可用更容易了,不需要共享磁盘柜,也不受地域的限制。共设了三个服务器,第一是工作数据库(Principal Datebase),第二个是镜像数据库(Mirror),第三个是监视服务器(Witness Server,在可用性方面有了一些保证,但仍然是单服务器工作;在扩展和性能的提升上依旧没有什么帮助。

集群系统实现方案详解

集群系统实现方案详解 有一种常见的方法可以大幅提高服务器的安全性,这就是集群。 1、集群的基本概念 Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。 大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。Cluster必须可以协调管理各分离的组件的错误和失败,并可透明地向Cluster中加入组件。 一个Cluster包含多台(至少二台)拥有共享数据存储空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。 Cluster内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时,客户将能很快连接到新的应用服务上。 2、集群的硬件配置 镜像服务器双机 集群中镜像服务器双机系统是硬件配置最简单和价格最低廉的解决方案,通常镜像服务的硬件配置需要两台服务器,在每台服务器有独立操作系统硬盘和数据存贮硬盘,每台服务器有与客户端相连的网卡,另有一对镜像卡或完成镜像功能的网卡。

镜像服务器具有配置简单,使用方便,价格低廉诸多优点,但由于镜像服务器需要采用网络方式镜像数据,通过镜像软件实现数据的同步,因此需要占用网络服务器的CPU及内存资源,镜像服务器的性能比单一服务器的性能要低一些。 有一些镜像服务器集群系统采用内存镜像的技术,这个技术的优点是所有的应用程序和网络操作系统在两台服务器上镜像同步,当主机出现故障时,备份机可以在几乎没有感觉的情况下接管所有应用程序。因为两个服务器的内存完全一致,但当系统应用程序带有缺陷从而导致系统宕机时,两台服务器会同步宕机。这也是内存镜像卡或网卡实现数据同步,在大数据量读写过程中两台服务器在某些状态下会产生数据不同步,因此镜像服务器适合那些预算较少、对集群系统要求不高的用户。 硬件配置范例: ?网络服务器两台 ?服务器操作系统硬盘两块 ?服务器数据存贮硬盘视用户需要确定 ?服务器镜像卡(部分软件可使用标准网卡)两块 ?网络服务网卡两块 双机与磁盘阵列柜 与镜像服务器双机系统相比,双机与磁盘阵列柜互联结构多出了第三方生产的磁盘阵列柜,目前,豪威公司、精业公司等许多公司都生产有磁盘阵列柜,在磁盘阵列柜中安装有磁盘阵列控制卡,阵列柜可以直接将柜中的硬盘配置成为逻辑盘阵。磁盘阵列柜通过SCSI电缆与服务器上普通SCSI卡相连,系统管理员需直接在磁盘柜上配置磁盘阵列。 双机与磁盘阵列柜互联结构不采用内存镜像技术,因此需要有一定的切换时间(通常为60——180秒),它可以有郊的避免由于应用程序自身的缺陷导致系统全部宕机,同时由于所有的数据全部存贮在中置的磁盘阵列柜中,当工作机出现故障时,备份机接替工作机,从磁盘阵列中读取数据,所以不会产生数据不同步的问题,由于这种方案不需要网络镜像同步,因此这种集群方案服务器的性能要比镜像服务器结构高出很多。双机与磁盘阵列柜互联结构的缺点是

两台服务器集群巧搭建

两台服务器集群巧搭建 服务器集群系统中,服务器不再分布在各处,而是集中在一起统一进行管理和维护。它保持了分布式客户机/服务器模式的开发性、可扩展性的优点,同时又具备了终端/主机模式的资源共享和集中易于管理的优点。 服务器集群系统中,服务器不再分布在各处,而是集中在一起统一进行管理和维护。它保持了分布式客户机/服务器模式的开发性、可扩展性的优点,同时又具备了终端/主机模式的资源共享和集中易于管理的优点。相对集中的集群系统,降低了系统管理的成本,而且还提供了和大型服务器系统相媲美的处理能力。 在传统的终端/主机的网络模式时代,终端功能简单,无需维护工作,在主机一端进行专门的管理与维护,具有资源共享、便于管理的特点。但是,主机造价昂贵,终端没有处理能力,限制了网络的规模化发展。之后的客户机/服务器模式推进了计算产业的标准化和开发化的发展,为系统提供了相当大的灵活性,但是随着分布系统规模的规模扩大,系统的维护和管理带来了巨大的开销。 面向Internet的服务型应用,需要高性能的硬件平台作为支持,将并行技术应用在服务器领域中,是计算机发展的必然趋势。并行处理技术在高性能计算领域中,高可用和高性能是集群服务器系统发展的两个重要方向。 集群的概念 集群英文名称是CLUSTER,是一组相互独立的、通过高速网络互联的计算机,它们构 成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。 和传统的高性能计算机技术相比,集群技术可以利用各档次的服务器作为节点,系统造价低,可以实现很高的运算速度,完成大运算量的计算,具有较高的响应能力,能够满足当今日益增长的信息服务的需求。 #P# 集群技术应用的需求 Internet用户数量呈几何级数增长和科学计算的复杂性要求计算机有更高的处理能力,而CPU的发展无法跟上不断增长的需求,于是我们面临以下问题: ●大规模计算如基因数据的分析、气象预报、石油勘探需要极高的计算性能。 ●应用规模的发展使单个服务器难以承担负载。 ●不断增长的需求需要硬件有灵活的可扩展性。 ●关键性的业务需要可靠的容错机制。 #P# IA集群系统(CLUSTER)的特点 ●由若干完整的计算机互联组成一个统一的计算机系统; ●可以采用现成的通用硬件设备或特殊应用的硬件设备,例如专用的通讯设备;

DBTwin数据库集群技术白皮书

DBTwin数据库集群系统 技 术 白 皮 书 无锡浙潮科技有限公司 2010年1月

目录 1.当前数据库用户面临的问题 (3) 2.当前市场上存在的针对数据库的解决方案 (4) 3.DBTWIN数据库集群 (8) 4.DBTWIN的实现原理 (9) 5.DBTWIN的特性 (10) 6.DBTWIN技术指标 (11) 7.DBTWIN与备份/复制软件,及数据库镜像的功能、特点比较 (12) 8.DBTWIN支持的系统环境 (12)

1.当前数据库用户面临的问题 随着信息时代的发展,公司和企业的运作越来越依赖于计算机系统。大量有关企业生产、销售的数据维系着企业的生存,是企业珍贵的无形资产。这些数据一旦因为存储系统遭受到失窃、断电或不可避免的自然灾害,造成大量丢失,将会给企业带来重大的经济损失。 根据Gartner的调查数据,在经历大型灾难事件而导致系统停运的公司中,有五分之二左右的公司再也没有恢复运营,剩下的公司中也有接近三分之一在两年内破产了。而由于数据库的故障导致的重大事故确是时有发生的,让我们来看几个实例: 实例1:2005年12月5日,国内某著名网络游戏公司的数据库服务器出现严重宕机事故,造成众多玩家数据丢失并蒙受经济损失 实例2:2005年6月9日某证券公司股票交易系统的数据库出现故障,股票无法正常买卖,迫使股民望“红”兴叹。 实例3:2002年7月23日国内某机场数据库系统宕机,导致6000名旅客长时间滞留机场。实例4:2000年国内某银行的支付系统突然死机,给广大用户造成极大的损失和不便。 以上发生的这些事件都是与企业数据库系统相关的故障。 另外,几乎每个数据库客户都或多或少地存在数据库性能问题,当然数据库性能问题涉及很多方面,其中,能否采用“集群”的方法来提高性能,我们公司研究的重点。 概括来讲,当前数据库系统已经成为了企业信息系统的瓶颈,究其原因,各厂家的解决方案无外乎在下列三大方面无法取得同步的进展: 1)数据库数据可靠性 2)数据库系统性能 3)系统服务的可用性 当前几乎所有的数据库系统解决方案,都无法的象真正的集群系统那样,在上述三方面同时具有良好的可伸缩性,具体来讲,当前数据库系统存在下列各种各样的问题:

集群通信系统

集群通信系统 集群通信系统是一种用于集团调度指挥通信的移动通信系统,主要应用在专业移动通信领域。该系统具有的可用信道可为系统的全体用户共用,具有自动选择信道功能,它是共享资源、分担费用、共用信道设备及服务的多用途、高效能的无线调度通信系统。 1、简介 集群通信的最大特点是话音通信采用PTT(Push To Talk),以一按即通的方式接续,被叫无需摘机即可接听,且接续速度较快,并能支持群组呼叫等功能,它的运作方式以单工、半双工为主,主要采用信道动态分配方式,并且用户具有不同的优先等级和特殊功能,通信时可以一呼百应。 2、发展历程 中国在1989年开始引进模拟集群系统,1990年投入使用。随着数字通信技术的发展,集群通信系统也开始向第二代的数字技术发展,最主要的特点是采用了TDMA(时分多址)和CDMA(码分多址)通信方式。同时,由于各集群使用企业为了满足其各自不同的使用要求,采用了独立建设集群通信网络的方案,所以众多企业的集群网络在网间互联互通性、频率资源使用、整体建设等方面存在诸多问题。此外,国外通信巨头通过控制核心技术并设置专利等知识产权保护壁垒,使得内部接口基本不公开,技术开放性很差,系统和终端设备市场价格居高不下,也制约了中国数字集群的产业化进程和规模应用。 2000年12月28日,我国信息产业部正式发布的《数字集群移动通信系统体制》(SJ/T11228-2000)行业推荐标准,参照国际标准TETRA(体制A)和美国国家标准iDEN (体制B),确定了两种集群通信体制。后来又加入了我国自主的GoTa和GT800两种体制。目前我国现有数字集群标准有四个:欧洲的Tetra,美国的Iden,以及我国中兴和华为公司的GOTA和GT800。国产的两个标准都是在公网基础上改进而来的,在入网时间及脱网直通等方面无法满足专业用户的需求。美国的Iden也是从公网改进而来的,存在同样的问题。只有Tetra能够满足包括公安在内的专业用户的需求。但Tetra也存在覆盖区域小、建网成本高、各厂商的设备无法互联、很难与模拟系统兼容以及国外知识产权壁垒等问题。中国公共安全行业亟需一个具备自主知识产权,并适合国内公共安全模拟系统数字化改造的新数字集群标准。

集群的基本概念

一、集群的基本概念 有一种常见的方法可以大幅提高服务器的安全性,这就是集群。 Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。 大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。Cluster必须可以协调管理各分离的组件的错误和失败,并可透明地向Cluster中加入组件。 一个Cluster包含多台(至少二台)拥有共享数据存储空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。 Cluster内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时,客户将能很快连接到新的应用服务上。 二、集群的硬件配置 镜像服务器双机 集群中镜像服务器双机系统是硬件配置最简单和价格最低廉的解决方案,通常镜像服务的硬件配置需要两台服务器,在每台服务器有独立操作系统硬盘和数据存贮硬盘,每台服务器有与客户端相连的网卡,另有一对镜像卡或完成镜像功能的网卡。 镜像服务器具有配置简单,使用方便,价格低廉诸多优点,但由于镜像服务器需要采用网络方式镜像数据,通过镜像软件实现数据的同步,因此需要占用网络服务器的CPU及内存资源,镜像服务器的性能比单一服务器的性能要低一些。 有一些镜像服务器集群系统采用内存镜像的技术,这个技术的优点是所有的应用程序和网络操作系统在两台服务器上镜像同步,当主机出现故障时,备份机可以在几乎没有感觉的情况下接管所有应用程序。因为两个服务器的内存完全一致,但当系统应用程序带有缺陷从而导致系统宕机时,两台服务器会同步宕机。这也是内存镜像卡或网卡实现数据同步,在大数据量读写过程中两台服务器在某些状态下会产生数据不同步,因此镜像服务器适合那些预算较少、对集群系统要求不高的用户。 硬件配置范例:

数据库集群实施方案

数据库集群实施方案 数据库安全的核心和关键是其数据安全。数据安全是指以保护措施确保数据的完整性、保密性、可用性、可控性和可审查性。由于数据库存储着大量的重要信息和机密数据,而且在数据库系统中大量数据集中存放,供多用户共享,因此,必须加强对数据库访问的控制和数据安全防护。 数据库系统安全的层次与结构一般数据库系统安全涉及5个层次: (1)用户层:侧重用户权限管理及身份认证等,防范非授权用户以各种方式对数据库及数据的非法访问;(2)物理层:系统最外层最容易受到攻击和破坏,主要侧重保护计算机*络系统、*络链路及其*络节点的实体安全;(3)*络层:所有*络数据库系统都允许通过*络进行远程访问,*络层安全性和物理层安全性一样极为重要;(4)操作系统层:操作系统在数据库系统中,与DBMS交互并协助控制管理数据库。操作系统安全漏洞和隐患将成为对数据库进行非授权访问的手段;(5)数据库系统层:数据库存储着重要程度和敏感程度不同的各种数据,并为拥有不同授权的用户所共享,数据库系统必须采取授权限制、访问控制、加密和审计等安全措施。 为了确保数据库安全,必须在所有层次上进行安全性保护措施。若较低层次上安全性存在缺陷,则严格的高层安全性措施也可能被绕过而出现安全问题。 数据库系统安全解决方案概述环境安全环境安全是指数据库所运行的软硬件环境的安全控制。正确的架构设计是数据库及其他应用稳定、安全的运行最有力保障,一个正确的架构设计可以较好的体现在物理环境中,通过比较简单的对物理环境的设定,就可以屏蔽大量的安全隐患。 错误的架构设计会导致物理结构散乱,无论从运维还是管理上来说,都有相当大的困难,较多的物理漏洞必须通过繁杂的软件安全控制来屏蔽风险,抛开安全本身无法较好保证而言,更换服务器时对软件的设置相当困难。 软硬件架构按照较大的框架进行分割,我们可以知道任何安全的架构都是传统三层架构的扩展,根本还是在于表示层,业务逻辑层,数据访问层,对于数据库看来则是应用层,中间层,数据层。 逻辑上实现三层架构比较容易,在软件中分离数据访问即可,但是往往我们

集群系统管理

简介:本文首先对Linux高性能集群Cluster1350及其集群管理系统CSM (Cluster System Management)进行了简要的介绍,然后对CSM的体系结构进行了比较详细的剖析。 一、集群 一般来说,集群是指一组高性能计算机通过高速网络连接起来的,在工作中像一个统一的资源,所有节点使用单一界面的计算系统。集群技术的出现,使得使用多台PC或工作站就可获得同大型机相匹敌的计算能力,同时成本大大降低,从而在很多高性能计算领域内由集群完全取代大型机也将成为可能。 广义上的集群的节点可以是任意类型的计算机,包括PC机、工作站、SMP等等,甚至是大型机。Linux集群是指一类以PC架构计算机为集群节点,以某一版本Linux操作系统为集群节点操作系统的集群。由于Linux本身具有开放源码、稳定、支持PC架构等诸多优势,以及操作系统及节点机价格的因素,Linux集群技术被认为是最具发展潜力的集群技术。 回页首二、集群系统管理 根据典型的集群体系结构,集群中涉及到的关键技术可以归属于四个层次:网络层、节点机及操作系统层、集群系统管理层、应用层。 ?网络层:网络互联结构、通信协议、信号技术等。 ?节点机及操作系统层:高性能PC或工作站、分层或基于微内核的操作系统等。 ?集群系统管理层:资源管理、资源调度、负载平衡、并行I/O、安全等。 ?应用层:并行程序开发环境、串行应用、并行应用等。 集群技术是以上四个层次的技术有机结合,所有的相关技术虽然解决的问题不同,但都有其不可或缺的重要性。集群系统管理层是集群系统所特有的功能与技术的体现。在未来按需(On Demand)计算的时代,每个集群都应成为业务网格中的一个节点,所以自治性(自我保护、自我配置、自我优化、自我治疗)也将成为集群的一个重要特征。自治性的实现,各种应用的开发与运行,大部分直接依赖于集群的系统管理层,并且,系统管理层的完善程度,决定着集群系统的易用性、稳定性、可扩展性等诸多关键参数。正是集群管理系统将多台机器组织起来,使之可以被称为"集群"。 回页首三、IBM Cluster1350,Linux高性能集群 Cluster1350是IBM公司目标定位于高性能计算市场的Linux集群,包括一套完整的解决方案,集成了众多IBM与非IBM的先进的软硬件技术,有其特有的技术优势与强大的服务支持。Cluster1350集群的体系结构如下图所示:

服务器集群技术方案

服务器集群技术方案 集群(Cluster)技术是发展高性能计算机的一项技术。它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。其出发点是提供高可靠性、可扩充性和抗灾难性。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一台服务器发生故障时,它所运行的应用程序将由其它服务器自动接管。在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用。采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。 当前主流的集群方式包括以下几种: 1.服务器主备集群方式 服务器主-备方式由一台服务器在正常运行状态提供对外服务,其它集群节点作为备份机,备份机在正常状态下不接受外部的应用请求,实时对生产机进行检测,当生产机停机时才会接管应用服务,因此设备利用率最高可达50%。主备方式集群如下图所示,节点2为正常提供服务的服务器,运行多个应用(pkgA,pkgB..),节点1平时只监控节点2的状态,不对外提供服务,当节点2出现故障时,节点1将把两个应用接管过来,并对外提供服务。 图表错误!文档中没有指定样式的文字。-1主备方式集群 2.服务器互备份集群方式 多台服务器组成集群,每台服务器运行独立的应用,同时作为其它服务器的备份机,当主应用中断,服务将被其它集群节点所接管,接管服务的节点将运行

自身应用和故障服务器的应用,这种方式各集群节点的硬件资源均可被应用于对外服务。互备方式集群如下图所示,节点1和节点2分别运行1个或多个不同的应用,但只对外提供本地的主应用,两个节点之间互相进行监控,集群中任何一个节点出现故障后,另一个节点把故障节点的主应用接管过来,所有应用服务由一台服务器完成。 图表错误!文档中没有指定样式的文字。-2互备份方式集群这种方式的主要缺点在于: 由于需要重新启动数据库核心进程,无法保证数据库系统连续不间断地 运行 在系统切换的过程中,客户端与服务器之间的数据库连接会中断,需要 重新进行数据库的连接和登录工作 由于数据库系统只能在一台服务器上运行,另一台服务器无法分担系统 的负载,实际上造成了客户投资的浪费。在有些系统中,为了解决双机 负载分担的问题,将应用系统人为分割为两个数据库系统,分别在两台 服务器上运行。这种方式在一定程度上解决了负载分担的问题,但给系 统管理、统计分析等业务处理带来了很多额外的复杂性 3.服务器并行集群方式 集群有多台服务器构成,同时提供相同的应用,可以实现多台服务器之间的负载均衡,提供大访问量的应用需求,如Web访问及数据库等应用,服务器并行集群方式一般由应用系统自身(如OracleRAC、中间件负载均衡等)或外部专用服务器负载均衡设备实现。

数据库集群技术介绍

数据库集群技术介绍 1前言 1.1 简介 用来保存计算最终结果的数据库是整个信息系统的重要组成部分,技术也相对成熟。然而,对于所有数据库而言,除了记录正确的处理结果之外,也面临着一些挑战:如何提高处理速度,数据可用性、数据安全性和数据集可扩性。将多个数据库联在一起组成数据库集群来达到上述目标应该说是一个很自然的想法。 集群(Cluster)技术是使用特定的连接方式,将价格相对较低的硬件设备结合起来,同时也能提供高性能相当的任务处理能力。 本文试图对当前主要的数据库集群用到的具体技术和市场上的主流产品进行分析并作点评,从而为读者提供一个数据库集群的评价参考。 下面讨论的数据库集群技术分属两类体系:基于数据库引擎的集群技术和基于数据库网关(中间件)的集群技术。 基于数据库引擎的集群技术(共享磁盘或非共享磁盘)

基于数据库网关(中间件)的集群技术(不共享磁盘) 1.2 理想的数据库集群应具备的特点 提高速度:只通过简单地增加数据库服务器就能相对提高数据库处理速度。 数据同步:在任何时刻需要有多个随时可用的实时同步数据服务。最好有多个异地的同步数据服务。 安全保证:除了密码保护之外,我们最好能控制企业内部对数据库的非法访问。 可扩展性:应保证我们能任意增大数据集而没有对可用性产生负面影响。 2名词解释 2.1 集群 是一组通过协同工作方式运行同一套应用程序并针对客户端及应用程序提供单一系统映像的独立计算机。集群技术的目标在于通过多层网络结构进一步提高伸缩能力、可用性与可靠性。 2.2 可伸缩性 是指一台计算机在维持可接受性能的前提下处理不断提高的工作负载的能力。 2.3 可用性 是指存在质量、备用能力、获取简便性以及可访问能力。 2.4 可靠性 是指系统牢固程度。

服务器集群技术方案

服务器集群技术方案 集群(Cluster)技术是发展高性能计算机的一项技术。它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。其出发点是提供高可靠性、可扩充性和抗灾难性。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一台服务器发生故障时,它所运行的应用程序将山其它服务器自动接管。在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用。采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。 当前主流的集群方式包括以下儿种: 1.服务器主备集群方式 服务器主-备方式由一台服务器在正常运行状态提供对外服务,其它集群节点作为备份机,备份机在正常状态下不接受外部的应用请求,实时对生产机进行检测,当生产机停机时才会接管应用服务,因此设备利用率最高可达50%。主备方式集群如下图所示,节点2为正常提供服务的服务器,运行多个应用 (pkgA, pkgB..),节点1平时只监控节点2的状态,不对外提供服务,当节点2 出现故障时,节点1将把两个应用接管过来,并对外提供服务。 图农3-2主备方式集群 2.服务器互备份集群方式 多台服务器组成集群,每台服务器运行独立的应用,同时作为其它服务器的备份机,当主应用中断,服务将被其它集群节点所接管,接管服务的节点将

运行自身应用和故障服务器的应用,这种方式各集群节点的硬件资源均可被应用于对外服务。互备方式集群如下图所示,节点1和节点2分别运行1个或多个不同的应用,但只对外提供本地的主应用,两个节点之间互相进行监控,集群中任何一个节点出现故障后,另一个节点把故障节点的主应用接管过来,所有应用服务由一台服务器完成。 I I 图农3-3互备份方式集 这种方式的主要缺点在于: 由于需要重新启动数据库核心进程,无法保证数据库系统连续不间断地运行 在系统切换的过程中,客户端与服务器之间的数据库连接会中断,需要重新进行数据库的连接和登录工作 III于数据库系统只能在一台服务器上运行,另一台服务器无法分担系统的负载,实际上造成了客户投资的浪费。在有些系统中,为了解决双机负 载分担的问题,将应用系统人为分割为两个数据库系统,分别在两台服务器上 运行。这种方式在一定程度上解决了负载分担的问题,但给系统管理、统计分 析等业务处理带来了很多额外的复杂性 3.服务器并行集群方式 集群有多台服务器构成,同时提供相同的应用,可以实现多台服务器之间的负载均衡,提供大访问量的应用需求,如Web访问及数据库等应用,服务器并行集群方式一般由应用系统自身(如OracleRAC>中间件负载均衡等)或外部专用服务器负载均衡设备实现。

数据库集群技术

数据库集群技术 引言 信息系统作为企业的神经中枢,在企业的发展过程中起着极其重要的作用,成为保障企业快速发展的重要因素。数据库是用来保存最终计算结果的,所以是整个信息系统中最重要的组成部分,企业的数据库系统应该非常稳健,为什么我无法访问决策所需的数据,为什么用户不能查询到实时准确的数据,为什么用户经常反映系统的速度非常缓慢,为什么经常会造成数据丢失?为什么总是不停地更换更高配置的服务器也不能解决这些问题? 这些问题的答案其实很简单,传统的数据处理方式由于技术限制已无法满足企业需求。只有实时的数据采集方式,才能为正确的决策提供精准分析的数据支撑,降低信息延迟,保证快速的业务响应,并推动业务价值的提升,只有合理的分担用户的访问压力,才能提升系统的反映速度,带来更好的用户体验,只有保证冗余的数据结构才能保证数据的安全,只有系统具备非常好的伸缩性才具备良好的扩展能力。用来保存计算最终结果的数据库是整个信息系统的重要组成部分,技术也相对成熟。然而,对于所有数据库而言,除了记录正确的处理结果之外,也面临着一些挑战:如何提高处理速度,数据可用性、数据安全性和数据集可扩性。将多个数据库联在一起组成数据库集群来达到上述目标应该说是一个很自然的想法。 1.数据库集群的背景 随着经济的高速发展,企业的用户数量、数据量呈爆炸式增长,在这样一个不断增长的环境下,对数据库提出了严峻的考验。对于所有的数据库而言,除了记录正确的处理结果之外,还面临着以下几方面的挑战:如何提高处理速度,实现数据库的负载均衡;如何保证数据库的可用性、数据安全性以及如何实现数据集可扩性?怎么综合解决这些问题成为众多企业关注的焦点。PC服务器以其高性能和低廉的价格而倍受广大客户青睐,在WEB应用或高性能计算中,为了追求更高的性能、以及可用性,大家都采用计算机集群技术(将多台服务器联合起来组成集群来实现综合性能优于单个大型服务器的技术)来实现,这种技术不但能满足应用的需要,而且大幅度地节约了投资成本;在数据库上,组建集群也是同样的道理,主要有以下几个原因: 原因一:伴随着企业的成长,在业务量提高的同时,数据库的访问量和数据量快速增长,其处理能力和计算强度也相应增大,使得单一设备根本无法承担。在此情况下,若扔掉现有设备做大量的硬件升级,势必造成现有资源的浪费,而且下一次业务量提升时,又将面临再一次硬件升级的高额投

组建计算机服务器集群

组建计算机服务器集群 摘要:集群,是一组独立的计算机系统构成一个松耦合的多处理器系统,它们之间通过网络实现进程间的通信。应用程序可以通过网络共享内存进行消息传送,实现分布式计算机。建造一个集群并不是一件简单的事件。集群的组成部分必须根据要运行的主要应用进行调整,以使之运行在最佳状态。这此因素带来的结果就是,建造集群系统不是只有一个标准的方案,在本章中,我们就会看到许多种建造方案。集群技术是计算机系统结构的前沿领域,笔者也仅是略有了解,希望本文能起到抛砖引玉之用。 1.什么是服务器集群 随着Internet的爆炸性增长,Internet与人的生活越来越息息相关,通过Internet上进行交易也就越来越受关注。近几年,电子商务的年增长均超过100%。服务器的工作量也迅速增长,所以服务器(特别是一个受人欢迎的WEB服务器)很容易在访问高峰时期过载。 而另一方面,计算机从1946年单纯的科学计算任务到现在大量纷繁复杂的信息处理,工作量越来越大,需要越来越快的处理能力。所以计算机界就不得不不断研究更快的处理器,存储器,以适应这一需求。 然而,科学家们意识到,单块处理器的速度发展空间是有限的,为什么不能让计算机象人一样协同工作,“群策群力”地将工作完成好呢!这时,就掀起了“并行计算”的研究。 举个例子来说,我们架设了一台WWW服务器,上面构建了一个电子商务网站,然而随着时间的推移,名声越来越大,这时点击率也就越来越高,WWW服务器的负载也就越来越高。这种情况下,我们就必须提升WWW服务器的能力,以满足以益增长的服务请求。这时,我们就面临两种选择: 1)升级WWW服务器,采用更快的CPU,增加更多的内存,使其更具有POWER;但日益增长的服务请求又会使服务器再次过载,需要再次升级,这样就陷入了升级的怪圈。还有,升级时还得考虑到服务如何接续,能否中止! 2)增加WWW服务器,让多台服务器来完成相同的服务。 这种方法就是服务器集群,通过并行技术来大大提升系统性能。也就是这一章的主要内容,这种方法具有很好的扩展性,而且可以最大限度地利用已有投资。 1.1.集群的概念 集群,是一组独立的计算机系统构成一个松耦合的多处理器系统,它们之间通过网络实现进程间的通信。应用程序可以通过网络共享内存进行消息传送,实现分布式计算机。 近几年来,微处理器、内存、总线技术、网络技术有了非常大的进步,软件的并行技术也有了非常大的进步,这使得让一组廉价的个人电脑与工作站协同工作成为可能,甚至可以与拥有强大的芯片处理能力的超级计算机竞争。 比如,16个普通微处理器组成的集群系统可以达到亿次级浮点计算机能力,而且总的成本小于40万元。 不幸的是,建造一个集群并不是一件简单的事件。集群的组成部分必须根据要运行的主要应用进行调整,以使之运行在最佳状态。这此因素带来的结果就是,建造集群系统不是只有一个标准的方案,在本章中,我们就会看到许多种建造方案。 集群技术是计算机系统结构的前沿领域,笔者也仅是略有了解,希望本文能起到抛砖引玉之用。 1.2.并行技术 这是一个非常简单的建造四节点的小集群系统的例子,它是构建在Linux操作系统上,通过MPICH软件包实现的,希望这个小例子能让大家对集群系统的构建有一个最基本的了解。

相关主题
文本预览
相关文档 最新文档