双机热备份软件介绍
- 格式:doc
- 大小:222.50 KB
- 文档页数:19
BrightStor HA 简述---- BrightStor HA为Microsoft Windows操作系统提供高服务器可用性。
BrightStor HA允许服务器通过现有网络连接松散结合,并且没有特殊用途的硬件要求。
它实现了三个主要的设计目标:只需片刻检测便可接管失效服务器最大限度地降低服务器和网络运营成本保证数据完好---- BrightStor HA还能够极为迅速地同步服务器,允许从服务器(在接管操作之前或之后)处理其他工作,允许用单个服务器接管多台主服务器,并且为装有BrightStor HA的整个网络提供直观的单点管理。
BrightStor HA 的安装---- 下图说明了BrightStor HA的安装,其中从服务器保护单一主服务器,两台服务器间仅有一条LAN 连接,并下辖多台客户端工作站。
---- 要建立这样的安装结构,系统管理员应同时在主从服务器上安装BrightStor HA,并在网络中任意一台工作站上安装BrightStor HA控制台组件(也可以就在主或从服务器上运行)。
虽然要求主从服务器的处理器、内存和硬盘容量应大致相当,但无需完全一致。
显然,从服务器除在发生失效后接管主服务器的工作之外,还必须具有足够的能力运行其自身工作。
---- 完成安装后,系统管理员便可配置BrightStor HA,使用复制任务向导(BrightStor HA 控制台程序的一部分)创建复制任务。
复制任务将定义主从服务器、失效条件、各种复制设置和一项或多项工作(要复制到从服务器的主服务器文件系统的一部分)。
同步---- 完成安装和配置工作后,复制任务就可以启动了。
它的第一项工作就是确保主从服务器文件系统的同步(更确切地说,是构成工作的主服务器文件系统的某些部分精确镜像到从服务器)。
在新的安装过程中,将通过网络连接把主服务器中的复制文件传给从服务器。
现有目录结构, 文件属性和安全信息一样被精确复制,BrightStor HA可以从NTFS复制到NTFS 或FA T,从FA T复制到NTFS或FA T。
双机热备软件的安装与配置指导手册系统版本:A1文档编号:CHI-PT-NJBL-SJRB-A0内容简介《双机热备软件的安装与配置指导手册》主要针对目前公司人员定位系统服务器双机热备软件的安装和配置进行了详细说明,指导现场工程师对双机热备软件进行安装及配置。
本手册共分四章节,分别为:第一章:概述第二章:软件的安装第三章:服务的安装及配置第四章:注意事项第五章:常见故障处理本文档的读者范围:公司内部员工版权声明本文档属南京北路科技有限公司版权所有,侵权必究。
本文文件专供用户、本公司职员以及经本公司许可的人员使用,未经公司书面同意,任何单位或个人不得以任何方式复制、翻印、改编、摘编、转载、翻译、注释、整理、出版或传播手册的全部或部分内容。
南京北路自动化系统有限责任公司位于南京江宁经济技术开发区,是南京市高新技术企业,现有高级工程师、工程师及其他专业技术人员100余名。
是专业从事煤矿通信、自动化、信息化产品的研发、生产、销售及服务的高科技公司。
公司拥有ISO9001:2000质量管理体系认证,坚持“质量第一、用户至上、至诚服务、持续改进”的质量方针,得到了广大客户的信赖和支持。
目前公司产品覆盖全国10多个省、自治区,并在多个煤炭主产区设有售后服务机构。
公司以满足客户需求为己任,不断生产高性价比的产品,为客户创造价值。
南京北路自动化系统有限责任公司联系地址:南京市江宁开发区菲尼克斯路99号邮政编码:211106电话号码:(025)52187543传真:(025)52185703邮件地址:*****************客户服务电话:400-611-5166客户支持网站:目录1概述 (1)1.1运行环境 (1)1.2硬件配置 (1)2软件的安装 (1)2.1安装前准备 (1)2.2修改hosts文件 (2)2.3RoseMirrorHA的安装配置 (2)2.4软件配置 (6)3服务的安装及配置 (23)4注意事项 (29)5常见问题处理 (30)插图目录图2-1 软件安装图.................................................................................................. 错误!未定义书签。
双机热备/双机容错/高可用集群软件NEC-EXPRESSCLUSTER随着信息化建设的不断推进,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用,一旦发生宕机故障或应用停机,将给机构带来巨大的经济损失。
可见,对那些需要保障信息安全和提供不间断的信息服务的机构来说,业务系统的容错性和不间断性显得尤为重要。
如何保障各种关键应用持续运营,达到永续经营的良性循环,已成为当今企事业单位和IT领域急需解决的关键问题。
荟萃NEC技术精华的EXPRESSCLUSTER是一款专业的高可用集群软件产品(而不仅仅是一款双机热备软件),它可为您提供Windows和Linux平台上完整的高可用性解决方案。
当集群中的某个节点由于软件或硬件原因发生故障时,集群系统可以把IP、客户业务等资源切换到其他健康的节点上,使整个系统能连续不间断的对外提供服务,从而为机构24x365的关键业务提供了可靠的保障,达到了系统99.999%的高可用性和可靠性。
高可靠性.高可用性在要求持续运行的关键业务系统中,由于服务器宕机等故障所造成的业务停止将带来无法估量的损失。
在由NEC的容错软件EXPRESSCLUSTER构建的集群系统中,即使某台服务器发生故障,用户业务和数据也可迅速切换到健康的服务器上,从而保证了整个系统对外服务的正常,为企业24小时x365天的关键业务应用提供了强大的保障。
多种心跳监测方式支持网卡(私网/公网)、COM口、磁盘心跳等多种心跳方式,多重保障心跳检测途径,进一步提高了系统的可靠性。
EXPRESSCLUSTER独特的利用内核空间进行心跳探测的技术,可以保证心跳探测不受系统负荷影响,从而避免在高负荷状态下心跳超时所导致的误切换。
支持共享、镜像、混合等多种集群构成方式无磁盘型+适用于无后台数据的业务系统;+可构筑HW、OS、AP组成的简单集群共享磁盘型+数据通过外挂的磁盘阵列柜共享在服务器之间继承+适用于大规模的集群系统(2~32节点)+支持SAN,iSCSI等多种存储架构磁盘镜像型+通过本地磁盘的镜像方式实现数据继承+适用于小规模、低成本的集群系统+支持3节点以上的多点镜像共享和镜像共存型+实现共享和镜像共存于一个集群的应用场景+部分重要的数据可存放于镜像盘中以保证数据物理上存在冗余备份,避免了单点崩溃风险NAS连接的共享型+基于NAS接续的共享型集群+无需外挂共享磁盘阵列混合型(共享磁盘镜像型)+ 支持盘柜和盘柜之间的镜像+ 有助于实现远程异地灾备方案支持差分镜像在镜像型方案中,我们使用的差分备份和差分恢复技术,可直接对2台服务器的镜像盘中的差分数据进行同步和恢复,而不必通过全盘Copy,大幅缩短了镜像同步及恢复所需的时间,提高了镜像集群的性能。
、双机热备双机热备特指基于active/standby 方式的服务器热备。
服务器 数据包括数据库数据同时往两台或多台服务器写, 或者使用一个共享 的存储设备。
在同一时间内只有一台服务器运行。
当其中运行着的一 台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(一般是通过心跳诊断)将standby 机器激活,保证应用在短时间内完全恢复正常使用。
其实现过程如下图所示:为什么要做双机热备?双机热备针对的是服务器的故障。
服务器的故障可能由各种原因引起,如设备故障、操作系统故障、 软件系统故障等等。
一般地讲,在技术人员在现场的情况下,恢复服 务器正常可能需要10分钟、几小时甚至几天。
双机高可用系统解决 方案,为用户提供了具有单点故障容错能力的系统平台。
它采用主服双机热备简介数据库 应用 数据库『应用图(1)务发生故障时备服务器接管的机制,实现在线故障自动切换,实现系统7X 24小时不间断运行,避免停机造成的损失。
(一)纯软件双机热备纯软件双机热备是在实时数据镜像基础上,实现了不需要共享存储的纯软高可用性系统,一般支持数据库和应用软件实现双机热备。
方案一:Win dows (或者 Linux )+ Rose Mirror HA+ORACLE (或者 SQL Server )的双机热备网络拓扑:D 也 mirror图(2)投资采购软硬件设备:(1) 数据库服务器:两台数据库服务器,每台服务器至少两个 网络口;(2) 操作系统:windows 或者linux 操作系统;(3) 数据库软件:Oracle 或者SQL Server 企业版;(4) 集群软件:Rose mirror HA ( Rose 公司);(5) 交换机:核心交换机一台。
Rose mirror 柱跳线 -----------------ia 0.0.2 mirror简介:整个集群组网方式所需的IP 地址(需要规划6个IP )如图( 2) 所示,两台数据库服务器虚拟出一个集群IP 地址(192.168.1.3 )用于集群的管理和虚拟出一个数据库访问IP 地址(192.168.1.4 )供外部访问。
LifeKeeper for Windows v6.1安装配置手册一. 安装前准备安装规划在本文档中的示例中,THR Service是我们将要保护的应用程序。
THR Service是一个计费的服务程序。
客户端通过浮动IP-192.168.1.193 访问THR Service。
THR Service的数据文件存放在共享卷V ol.E上,以实现集群中应用程序切换时数据的完整性。
服务器间共享V ol.E的方式有两种,一种是使用磁盘阵列,另一种是使用软件创建磁盘镜像。
在本例中,我们使用SteelEye Data Replication v6创建共享磁盘。
主机名Server1 Server2公网IP地址Public1192.168.1.191Public2192.168.1.192专用IP地址Private110.10.10.191Private210.10.10.192浮动IP地址192.168.1.193数据卷Vol.E Vol.E应用程序THR Service注意事项:1.在安装LifeKeeper之前确定集群中服务器的主机名,在安装LifeKeeper不可更改。
2.对于Windows Server 2000系统,需要将应用程序日志和系统日志的大小设置为“按需要改写事件”。
3.至少需要两条独立的子网作为通信路径,其中一条专用网络作为数据同步的专用通道。
4.备份服务器的数据镜像卷的空间要不小于主服务器的数据镜像卷的空间,且主、备机卷的盘符相同。
5.修改集群中每台服务器的C:\WINDOWS\system32\drivers\etc\hosts文件,添加集群中每台服务器的公用ip地址-主机名的映射,浮动IP的映射不是必须的。
127.0.0.1 localhost192.168.1.191 Server1192.168.1.192 Server2192.168.1.193 Server6.在系统的网络的高级设置中,将公网IP作为优先访问的网络。
双机热备软件方案双机热备软件方案指的是利用两台服务器进行热备份,以实现系统的高可用性。
在这个方案中,一台服务器作为主服务器,负责正常的业务运行,而另一台服务器则作为备份服务器,实时复制主服务器上的数据和状态,并在主服务器发生故障时接管主服务器的运行。
下面是一个示例的双机热备软件方案:1.硬件要求:-两台性能相近的服务器,建议使用服务器级硬件。
-硬盘容量足够大以容纳主服务器上的所有数据。
-网络带宽足够大以支持实时数据复制。
2.操作系统要求:-主服务器和备份服务器上安装相同的操作系统,以保证软件兼容性。
- 操作系统应该支持实时数据复制和热备份功能,如Linux中的DRBD(Distributed Replicated Block Device)。
3.数据同步方案:-配置DRBD,使用它的实时数据复制功能,将主服务器上的数据实时同步到备份服务器上。
-DRBD将主服务器上的数据块按照指定的规则复制到备份服务器上的相应位置,以保证主备服务器上的数据一致性。
-使用DRBD提供的工具和命令,配置数据同步的策略,如同步频率、数据压缩等。
4.状态同步方案:-主服务器上的应用程序状态也需要实时同步到备份服务器上,以确保备份服务器能够准确接管主服务器的运行。
-在应用程序中,可以使用心跳机制或者主备切换的通知机制,将主服务器上的状态发送到备份服务器上。
-备份服务器需要能够及时响应主服务器发送的状态请求,并且能够正确接收和处理状态信息。
5.故障切换方案:-当主服务器发生故障时,备份服务器需要能够自动接管主服务器的运行。
-在服务器之间建立自动故障检测机制,一旦主服务器发生故障,备份服务器将自动接管。
-主备服务器之间可以使用心跳机制或者广播通知,以检测主服务器的状态。
-一旦备份服务器接管主服务器的运行,它需要能够自动更新服务端口、地址等必要的参数,以确保客户端能够无缝切换到备份服务器上。
6.故障恢复方案:-当主服务器发生故障后,必须进行故障恢复操作,将主服务器正常运行。
联想sureHA双机热备软件LenovoureHA双机热备软件介绍1、产品简介LenovoureHA双机热备软件提供的高可用系统解决方案,为用户提供了具有单点故障容错能力的系统平台。
它采用主服务发生故障时备服务器接管的机制,实现在线故障自动切换,达到了系统7某24小时不间断运行,避免因系统停机造成的损失。
LenovoureHA是一款能够支持多平台多环境的高可用集群软件,主要应用在Linu某和Window平台下的应用程序保护。
通过对应用有关的资源实时监控来确定程序的正常运行,一旦检测到故障则立即将应用切换到备援机,实现对用户透明的快速切换,保证业务持续运行不间断服务。
其良好的兼容性能够适应各种协议、设备和环境,同时也可以在虚拟化环境下完美实现P2V和V2V的灵活运行模式,有效地增加了企业方案设计的可选择性。
2、产品定义属于高可用容错集群软件,运行于WindowServer及主流Linu某平台。
同时支持纯软件镜像方式和共享磁盘阵列柜方式,并支持远程灾难实时复制备份恢复系统。
使用户的服务器、操作系统、数据库系统以及关键的数据及应用程序保持7天某24小时连续不间断,提供99.99%的高可用性。
3、产品特点高可用容错集群软件。
它可以采用软件镜像方式或共享磁盘阵列柜方式,配置简单灵活,可以定义多种失效切换方式,支持Active/Active模式和Active/Standby模式。
支持多应用、多实例的实时热备份,同时强大的数据复制功能可以单独使用实现数据迁移、数据备份、异地容灾4、关于LenovoureHA集群解决方案众多的双机热备产品中大多数产品只能够支持共享型双节点热备模式,而LenovoureHA是一款可以支持多节点集群的高端集群产品。
由于产品支持多节点集群的特性提高了其方案设计的灵活性,不仅支持基本的共享型双机热备,同时支持本地磁盘镜像型、双机互备、N对一备份等多种模式。
4.1共享型双机热备基于存储共享的双机热备是双机热备的标准方案。
SCAP热备实施方案一、环境描述SCAP双机热备,基本的软件架构为(heartbeat+ drbd+ mysql + tomcat + monit )。
系统采用CentOS6.6,按照客户要求提供两台服务器做热备,意味着软件层数据库、文档库、WEB服务器都部署在同一台服务器上。
heartbeat是一款优秀的HA的软件,它的主要功能是实现真实机的故障隔离及负载均衡器间的失败切换(failover)。
DRBD的全称为:Distributed ReplicatedBlock Device(DRBD)分布式块设备复制,主要用作热备双机的数据备份,相当与网络RAID1.软件列表:软件版本备注关闭防火墙和SelinuxOS环境CentOS 6.5 x86_64 或CentOS 6.6x86_64DRBD (6.5)drbd-8.4.3-2.x86_64(centos6.5)(6.6)drbd-8.4.3-2.el6.x86_64(centos6.6)MySQL MySQL 5.1.73HA heartbeat-2.1.4.el6.x86_64 scap_master: 192.168.8.191scap_backup: 192.168.8.192drbd_vip:192.168.8.190 JRE server-jre-8u92-linux-x64.tar.gzTomcat apache-tomcat-8.0.35.tar.gz二、系统设置1、关闭防火墙和SELInux/etc/init.d/iptables status #会得到一系列信息,说明防火墙开着。
/etc/init.d/iptables stop #临时关闭chkconfig iptables off#永久关闭SELinux查看当前SELinux状态:/usr/bin/setstatus -v编辑/etc/selinux/config,找到SELINUX 行修改成为:SELINUX=disabled: # This file controls the state of SELinux on the system.# SELINUX= can take one of these three values:# enforcing - SELinux security policy is enforced.# permissive - SELinux prints warnings instead of enforcing.# disabled - No SELinux policy is loaded.SELINUX=disabled# SELINUXTYPE= can take one of these two values:# targeted - Only targeted network daemons are protected.# strict - Full SELinux protection.SELINUXTYPE=targeted2、设置HOSTNAME需要对192.168.8.191和192.168.8.192分别设置hostname为scap_master和scap_backup,设置方法如下:vi /etc/sysconfig/network修改HOSTNAME为scap_mastervi /etc/hosts填入:192.168.1.101 scap_master192.168.1.103 scap_backup使scap_master hostnmae临时生效3、配置IP地址(文件备份和keepalived不要采用同一个端口)使用命令vi /etc/sysconfig/network-scripts/ifcfg-eth0 修改该文件内容如下DEVICE="eth0"BOOTPROTO="static" 这里改为使用静态ipHWADDR="08:00:27:0C:33:8F"NM_CONTROLLED="yes"ONBOOT="yes" 设置为自动启动TYPE="Ethernet"UUID="f4adafbc-322d-4dc8-b549-4291f1c04f01"IPADDR=192.168.8.191 #设置该虚拟机的ip地址,要与宿主机在一个网段,但是不能重名NETMASK=255.255.255.0 # 设置子网掩码GATEWAY=192.168.8.1 #设置网关,也就是PEERDNS=yes #表示允许从DHCP获得的DNS覆盖本地的DNS。
双机热备软件在当今信息化时代,各行各业对于数据的安全性和可靠性要求越来越高,数据的丢失或系统的故障可能会给企业带来严重的损失。
为了应对这种情况,很多企业都会考虑使用双机热备软件来保障数据的备份和系统的稳定运行。
什么是双机热备软件?双机热备软件是一种可以在主备两台服务器之间实时同步数据,并且可以在主服务器故障时自动切换到备用服务器上继续运行的软件。
通过双机热备软件的使用,可以实现在主服务器发生故障时无缝切换到备用服务器,避免系统停机时间过长和数据的丢失。
双机热备软件的特点1.实时数据同步: 双机热备软件可以实现主备服务器之间的数据实时同步,确保数据的一致性。
2.自动切换: 当主服务器发生故障时,双机热备软件可以自动将系统切换到备用服务器上,无需人工干预。
3.高可靠性: 双机热备软件可以提供高可靠性的系统运行保障,降低系统故障风险。
4.故障恢复快速: 在主服务器发生故障时,双机热备软件可以快速将系统切换到备用服务器上,减少系统停机时间。
双机热备软件的应用场景双机热备软件广泛应用于各种对数据可靠性要求较高的领域,比如金融、电信、医疗等。
在这些行业中,系统的稳定运行和数据的安全性至关重要,双机热备软件可以帮助企业实现系统的高可用性和数据的灾备保障。
如何选择双机热备软件?在选择双机热备软件时,企业需要考虑以下几点:1.功能完备性: 要选择功能完备、稳定可靠的双机热备软件,确保软件能够满足企业的需求。
2.兼容性: 双机热备软件需要与企业现有的硬件和软件环境相容,避免出现不必要的兼容性问题。
3.运维便捷性: 良好的界面设计和操作逻辑可以降低运维人员的学习成本,提高运维效率。
4.服务支持: 选择有良好售后服务支持的双机热备软件,以保障系统的长期稳定运行。
结语双机热备软件作为一种保障系统运行稳定性和数据安全性的重要工具,在当前信息化时代扮演着越来越重要的角色。
通过选择合适的双机热备软件,并合理配置系统架构,企业可以有效提高系统的可靠性和稳定性,应对各种意外情况,确保数据的安全性和系统的连续性运行。
双机热备份软件介绍1、PrimeCluster(PCL)HA集群软件产品概述PrimeCluster HA(PCL HA)是德国富士通-西门子计算机公司(Fujitsu-Siemens Computers)提供的业界领先的支持双机热备和多节点集群的高可用管理软件。
PCL HA是一种应用与系统高可用性(High Availability)管理器。
它为关键业务应用及其相关资源提供了能够持续访问的平台。
PCL HA可为任何类型的应用、服务或数据提供最通用的高可用性环境。
最主要的优点在于自动识别系统故障及组件错误,并具有诸如透明本地恢复或应用故障转移(Failover)等合适的恢复措施。
PCL HA拥有多方向故障转移功能——集群内任一节点均可接管其他节点的功能。
若特定服务器出现故障,它所运行的应用会分配给余下正常运行的服务器,使管理员能灵活而有效地应用系统资源。
由于应用可通过管理干预转移到其他服务器,这样就能在不中断操作的情况下对集群进行扩容。
PCL HA for Linux同目前市场上其他的基于开放源代码的HA软件不同,PCL是由FSC完全自行开发的Linux平台上的高可用软件,它在维护、故障排除、升级、售后服务方面都能够有充分的保障。
同时根据PCL用户的反馈,对于开放源代码的HA类的系统关键软件,最终用户普遍对其版本更新能力、数据安全性和故障(特别是兼容性及底层故障)的排除能力普遍持怀疑态度。
PCL for Linux在欧洲已经有相当的关键业务成功案例,在中国也有上百个成功安装使用的案例,因此,最终用户对PCL的接受度明显较高。
PCL HA做为一个高可靠的HA软件,以德国富士通-西门子公司的先进技术、严谨作风和可靠信誉为后盾,为用户提供系统高可用性方面的可靠保障,是关键应用下服务器集群的理想选择。
PCL HA高可用软件应用环境PCL HA支持的操作系统有Linux和Solaris。
Intel-based的Linux发行版:∙RedHat Enterprise Linux ES/AS 3 (up to Update 5)∙RedHat Enterprise Linux ES/AS 4 (up to Update 2)以及64bit版本∙SuSE Linux Enterprise Server 8 ( up to SP4)∙SuSE Linux Enterprise Server 9 ( up to SP2)以及64bit版本∙以及各种兼容上述两种发行版的Linux,比如红旗、中标、CentOS等等Sparc-based的Solaris∙Solaris 8 / 9 / 10注:上述操作系统为PCLv4.2A00支持的操作系统,随着操作系统的升级,PCL也会做出相应的版本更新PCL HA可用于基于上述操作系统的所有应用,它可对几乎所有的系统组件和应用进行故障监测以及自动的故障转移,为客户的业务提供一个持续可用的平台。
PCL监控的对象包括:∙主机∙操作系统∙本地文件系统∙远程文件系统∙IP网络∙卷管理器(Volume Manager)∙裸设备(Raw Device)∙任何脚本或者程序PrimeCluster_HA特点及优势HA 服务器——应用与服务随时可用PRIMECLUSTER拥有近20年的历史,它随着富士通西门子计算机公司在全球的业务开展,遍布各个行业和领域,在欧洲、中东、非洲和亚洲有着大量的成功案例。
支持多平台――PRIMECLUSTER支持Linux/Intel和Solaris/Sparc平台。
它在用户层面保持界面、操作方法、管理命令的统一,和OS,硬件平台无关。
高效、冗余的集群心跳协议――PRIMECLUSTER可拥有多达8条心跳线路;采用自有的ICF (Internode Communication Facility)协议取代低效的IP协议保护数据完整性――独有的Shutdown Facility机制,确保在集群脑裂(Brain-Split)的情况下用户数据的完整性,最完美的解决方案。
严谨的Online、Offline检查机制,确保应用只可能在一个节点上启动。
灵活的配置方案――HA模式最大支持8个节点,支持1:1、N+1、N:M配置模式,多节点多应用可在集群内灵活配置。
单一管理图形界面――PRIMECLUSTER采用基于浏览器的Java管理界面,可在单一节点上远程管理集群内所有节点。
向导化的配置工具――PCS配置工具能够自动生成资源树,简化配置步骤,自动检查配置的一致性和生成配置文件信息。
能够自动识别某些资源,如卷管理器、SAN网络和NAS。
对于Oracle、DB2、WebServer、SAP等应用拥有Turn Key解决方案滚动升级――PRIMECLUSTER支持版本异构(甚至OS异构),从而支持滚动升级,最小限度减少停机时间。
动态配置――HA和负载均衡模式均支持动态配置,可以在不停止应用的情况下对配置进行修改并生效。
数据完整性保护任何一个集群系统在心跳线路出现故障,或者系统挂死的情况下都会出现集群分裂(Brain-Split)的情况:集群内的节点相互不能得知对方的状态。
如果没有一个严格的机制去处理集群分裂,那用户的应用就有可能同时在多个节点上运行,这种情况下会造成共享资源的争用,造成用户数据的损坏。
比如两台节点同时对共享磁盘上的数据进行写的操作,用户数据很可能就会被损坏,而且是无法恢复的。
PCL通过Shutdown Facility来处理集群分裂的情况,一旦某个节点在规定的时间范围内没有收到对方的心跳信号,那它就会将对方的节点状态改为LEFTCLUSTER,同时调用某个关机代理(Shutdown Agent)去将对方进行关机。
在关掉对方并通过确认对方节点已处于关机状态之后,该节点才将对方的状态变为DOWN,同时会按照用户设置的切换策略进行应用的切换。
在分裂发生之后,哪一台节点会被关掉,这是由用户设置的节点权重+应用权重来决定的。
Shutdown Agent是通过基于硬件的某种管理端口来对节点的电源进行控制(不是操作系统级的Shutdown),现今的PC Server大多数情况下都带有此类的管理端口,比如说HP的iLO,Blade Management,ATCA CMM等等,每种硬件需要不同的SA。
SA只是一个脚本或者程序,它在被调用时会通过远程接入的方式来对服务器进行电源关闭和查询的操作,对于某种特定的硬件来说,我们只需要对操作方法进行简单的修改即可完成SA的开发工作。
PCL除了在节点级给予用户数据最大的保护完,在HA管理器方面同样也有一套严格的数据保护机制。
用户的应用在切换过程中,必须要在一方应用的Offline操作完全执行完毕并且成功的条件下才会在另一方进行应用Online的操作,如果有任何一个资源出现“不一致”或者Offline操作不成功的情况,切换都会被阻止,从而最大限度的杜绝了共享资源争用的情况发生。
尽管高可靠性是RMS的目标,但在数据可能受到破坏的任何情况下,数据完整性优先于高可靠性。
PCL HA Active/Standby工作模式两节点的Active/Standby模式是HA中最简单的一种,两台服务器通过双心跳线路组成一个集群。
应用Application联合各个可选的系统组件如:外置共享的磁盘阵列、文件系统和浮动IP地址等组成业务运行环境。
PCL为此环境提供了完全冗余的服务器配置。
这种模式的优缺点:缺点:Node2在Node1正常工作时是处于“闲置”状态,造成服务器资源的浪费。
优点:当Node1发生故障时,Node2能完全接管应用,并且能保证应用运行时的对处理能力要求。
PCL HA Active/Active工作模式这是目前运用最为广泛的双节点双应用的Active/Active模式。
支撑用户业务的数据库和应用程序在正常状态下分别在两台节点上运行,各自有自己的资源,比如IP地址、磁盘阵列上的卷或者文件系统。
当某一方的系统或者资源出现故障时,就会将应用和相关资源切换到对方的节点上。
这种模式的最大优点是不会有服务器的“闲置”,两台服务器在正常情况下都在工作。
但如果有故障发生导致切换,应用和数据库将放在同一台服务器上运行,由于服务器的处理能力有可能不能同时满足数据库和应用程序的峰值要求,这将会出现处理能力不够的情况,降低业务响应水平。
PCL HA 集群工作模式PCL所支持的N+1模式是用一台Standby的服务器来为N台处理不同业务的节点做冗余备份。
任何一台业务服务器出现故障时都能自动地将业务转移到Standby服务器上,而对其他正常工作的服务器无任何影响。
这种模式可很好的解决集群中服务器“闲置”以及应用“堆叠”的问题。
PCL 与其他集群产品的比较来自第三方的测评报告:PrimeCluster SIS负载均衡软件概述PRIMECLUSTER(PCL) SIS是一个功能强大的基于软件的负载均衡产品,提供可扩展的容错网络服务。
SIS帮助用户建立一个可扩展的、可靠的并易于管理的服务器集群,提供了在Linux、Solaris、Windows环境下实现负载均衡(Load Balance)的高效、可靠和高性价比的方案。
PCL-SIS集群中的节点可通过一至多个虚拟IP(VIP)地址来访问,在用户面前就好象是一个网络服务器。
PCL-SIS节点可以包括Linux、Solaris或Windows,它们共享不同服务的负载。
有了SIS,用户可配置每项服务的负载共享,还可运用多种负载均衡算法对特殊应用及站点需求进行细调。
PCL-SIS删除了单一故障点并确保以下可用性:∙如果任一SIS节点或服务出现故障,SIS会对故障节点周围的请求进行调度;∙任一出现故障的SIS模块会得到适度修复;∙曾启动过SIS的故障节点重启之后将无缝加入集群,从而恢复最大性能。
∙通过将出局包从NIC路由至功能节点,SIS可恢复NIC故障。
SIS具有以下特色:∙为所有外部用户提供单一IP目标地址∙易于添加节点和服务∙基于每个端口的TCP和UDP服务配置∙多种可用的负载均衡算法∙无缝处理节点故障、服务故障和组件故障∙灵活的备份节点管理∙用于集群的代理服务器地址∙节点间的专用通信∙基于软件的解决方案∙基于图形界面GUI的配置和管理界面更多关于SIS:∙SIS应用环境∙SIS负载均衡工作原理∙SIS负载均衡算法∙代理服务器与专用地址∙故障转移SIS应用环境服务节点服务节点提供web服务和目录服务之类的网络服务。
SIS可将服务节点构成集群,如果一个服务节点发生故障,会在其周围调度服务。
服务节点恢复正常后将无缝加入应用集群中。
服务节点可以是Windows 2000服务器、Solaris及Linux。