当前位置:文档之家› DB2 HA双机集群

DB2 HA双机集群

DB2 HA双机集群
DB2 HA双机集群

数据是现代随需应变业务的血液;存储和移动数据的系统(服务器、网络、数据库)是这个系统的心脏。但是如果没有 heartbeat ——对这些数据具有可靠而快速的访问,且宕机时间最少——那么这两者都是惰性组件。

简介

本系列的第一篇文章 Linux 上的高可用中间件,第 1 部分:Heartbeat 和Apache Web 服务器简要介绍了高可用(HA)的概念,以及如何安装并配置 heartbeat。本篇文章是本系列的最后一篇文章,它将介绍如何在一个冷备份(cold standby)配置中使用 heartbeat 为 DB2 UDB 8.1 实现一个 HA 方案。

关于 heartbeat

Heartbeat 是 Linux-HA 项目中提供的一个公用包。Heartbeat 提供了 HA 系统所需要的基本功能,例如启动/停止资源,监视集群中系统的可用性,在集群节点之间切换共享的 IP 地址信息。Heartbeat 还可以通过一个串口线或以太网接口来监视特定服务(或多个服务)的健康信息。当前的版本支持一个两节点的配置,其中使用特殊的 heartbeat "pings" 来检查服务的状态和可用性。

在这种实现中,heartbeat 会检测主节点的失效情况,并发起故障迁移的过程:

在主节点上停止 DB2 进程

在主节点上释放共享磁盘

在主节点上释放该服务的 IP 地址

将这个服务的 IP 地址添加到备用节点上

在备用节点上加载这个共享磁盘

在备用机器上重新启动 DB2 进程

为了最好地理解本文的内容,您需要对 DB2 UDB 和高可用集群有一个基本的理解。本系列的第一篇文章介绍了对于软件的高可用性来说这意味着什么,以及如何在一个两节点的系统上使用 High-Availability Linux 项目安装并设置 heartbeat 软件。

DB2 UDB 和 HA 基础

在 heartbeat 集群中使用的任何 DB2 UDB 都必须将数据全部存放在共享磁盘上,这样在发生节点失效的情况时,就可以在依然存活的机器上访问这些数据。运行数据库实例的节点还必须在内部磁盘上维护很多文件。这些文件包括与节点上的所有数据库有关的文件。

与数据库实例有关的文件会被分别存放在内部磁盘和外部磁盘上。图 1 详细介绍了

DB2 文件系统的组织,它介绍了在我们的测试中针对实例 db2inst1 和数据库 hadb 的设置。

图 1. DB2 对实例 db2inst1 和数据库 hadb 的高可用设置

查看原图(大图)

在该设置中:

机器 ha1 用作主 DB2 UDB 数据库机器。

机器 ha2 用作节点 ha1 的备用机器。

每个节点都有所安装的 DB2 UDB 8.1 的一个本地副本。

数据库 hadb 特定的目录(db2inst1/NODE0000/SQL00001 和

db2inst1/NODE0000/sqldbdir)将保留在共享文件系统(/ha)上。

安装数据库

按照本节中介绍的步骤在主节点和备用节点上安装 DB2 UDB 8.1。更多信息,请参考DB2 Information Center:

以 root 用户身份登录。

使用下面的命令解压 DB2 UDB 8.1 的安装映像文件:

rm -rf /tmp/db28.1-install

mkdir /tmp/db28.1-install

tar xf C48THML.tar -C /tmp/db28.1-install

这里的 C48THML.tar 是安装的 tar 文件。

设置内核级别:export LD_ASSUME_KERNEL=2.4.19。

不要使用 IBM Developer Kit for Linux,即 DB2 安装光盘中提供的 Java 2 Technology Edition。使用 IBM 1.4.2 JDK 来替换 DB2 中提供的 JDK。

cd /tmp/db28.1-install/009_ESE_LNX_32_NLV

mv ./db2/linux/java ./db2/linux/java.db2

ln -s /opt/IBMJava2-142 ./db2/linux/java

使用下面的命令启动 DB2 安装向导:./db2setup。

在这个向导中,使用下面的信息:

对于 Product to install,请使用 DB2 UDB Enterprise Server Edition。

对于 Group and User IDs,组 ID(gid)和用户 ID(uid)域的值在两台机器上必须匹配。我们使用表 1 中给出的 ID 值。

对于 Partition,请选择 single-partition instance。

对于 DB2 Instance Name,请选择 db2inst1。

表 1. 安装 DB2 使用的组名/ ID、用户名/ ID

组名GID 用户名UID

dasadm1 2001 dasusr1 2001

db2grp1 2002 db2inst1 2002

db2fgrp1 2003 db2fenc1 2003

创建一个高可用的数据库

按照下面的步骤创建高可用的数据库 hadb:

以 db2inst1 用户的身份在主节点(ha1)和备用节点(ha2)上登录:su - db2inst1。

确保 DB2(R) 实例在 ha1 和 ha2 两个节点上都不会在启动时(以 db2inst1 的身份)使用 db2iauto 工具启动:

cd sqllib/bin

./db2iauto -off db2inst1

修改 /etc/inittab 文件,以正确运行 DB2 HA。在节点 ha1 和 ha2 上注释掉在系统启动时启动 DB2 的那一行,如下所示:

#fmc:2345:respawn:/opt/IBM/db2/V8.1/bin/db2fmcd #DB2 Fault Monitor Coordinator。

在主节点 ha1 上启动 DB2:db2start。

在备用节点(ha2)上以 root 用户的身份使用下面的命令挂载文件系统 /ha:mount /ha。

在节点 ha1 上使用下面的命令创建数据库 hadb:db2 create database hadb on /ha。

在节点 ha1 上使用下面的命令确保可以连接到数据库 hadb 上:db2 connect to hadb。如果成功,就使用这个命令断开连接:db2 connect reset。

在节点 ha1 上使用 db2stop 命令停止 DB2。

在备用节点(ha2)上以 root 用户的身份使用下面的命令挂载文件系统 /ha: mount /ha。

在备用节点上使用下面的命令启动 DB2:db2start。

以 db2instl 用户的身份在节点 ha2 上执行下面的命令,对数据库 hadb 进行catalog 操作:db2 catalog database hadb on /ha。

在节点 ha2 上使用 db2 connect to hadb 命令,确保可以连接到数据库 hadb 上。如果成功,就使用 db2 connect reset 命令断开连接。

在节点 ha2 上使用 db2stop 命令停止 DB2。

配置 heartbeat 来管理 DB2

现在配置 /etc/ha.d/haresources 文件(在主节点和备用节点上都要进行),使其包括管理 DB2 进程的脚本。这个脚本是由 heartbeat 提供的。

修改文件的一部分如下所示:

https://www.doczj.com/doc/373547711.html, 9.22.7.46

Filesystem::https://www.doczj.com/doc/373547711.html,:/ha::/ha::nfs::rw,hard db2::db2inst1

这一行说明在启动 heartbeat 时,hal 使用集群的 IP 地址,挂载共享文件系统,并启动数据库服务器。在停止服务器时,heartbeat 首先要停止数据库服务器,然后卸载共享文件系统,最后放弃 IP 地址。

测试 DB2 UDB 的故障迁移

本节将介绍如何对高可用的 DB2 数据库 hadb 进行测试。这可能是本文中所介绍的最为棘手的一项工作,因此要仔细阅读以下的内容。

在主节点上启动 heartbeat 服务,然后在备用节点上也启动 hartbeat 服务。您可以以 root 用户的身份执行 /etc/rc.d/init.d/heartbeat start 命令。

在成功启动 heartbeat 之后,您应该会看到一个新的接口,它使用了您在 ha.cf 文件中配置的 IP 地址。在启动 heartbeat 之后,可以看一下主节点上的日志文件(默认是

/var/log/ha-log),并确保它正在进行 IP 接管,然后又启动了 DB2。使用 ps 命令确保 DB2 进程正在主节点上运行。heartbeat 将不能在备用节点上启动任何上述进程,这只能在主节点失效之后才会发生。

在 ha1 节点上以 db2instl 的身份检查数据库的状态:db2 -tf

/ha/hahbcode/db2/listdb.sql。这个命令的输出如下所示:

Active Databases

Database name = HADB

Applications connected currently = 0

Database path = /ha/db2inst1/NODE0000/SQL00001/

在节点 ha1 上以 db2instl 的身份创建一个测试表(hadb.TestHATable),方法如下:db2 -tf /ha/hahbcode/db2/createdb.sql。

现在,在节点 ha1 上以 db2instl 的身份向测试表中插入一行数据:db2 -tf

/ha/hahbcode/db2/insertdb.sql。

在节点 ha1 上以 db2instl 的身份查看测试表的内容:db2 -tf

/ha/hahbcode/db2/selectdb.sql。您应该可以看到在上一个步骤中插入的数据行。运行的结果如下:

[db2inst1@ha1 db2inst1]$ db2 -tf /ha/hahbcode/db2/selectdb.sql Database Connection Information

Database server = DB2/LINUX 8.1.0

SQL authorization ID = DB2INST1

Local database alias = HADB

COL1 COL2

----------- ------------

10 Hello

1 record(s) selected.

DB20000I The SQL command completed successfully.

为了模拟故障迁移的情况,我们只需要在主节点上以 root 用户的身份来停止heartbeat 即可:/etc/rc.d/init.d/heartbeat stop。您应该会看到在备用节点上,所有的服务都在一分钟之内启动起来了。您可以通过检查 /var/log/ha-log 文件的内容并在备用节点上使用 ps 命令来确认 DB2 正在备用节点上运行。

在节点 ha2 上以 db2instl 的身份检查数据库的状态:db2 -tf

/ha/hahbcode/db2/listdb.sql。这个命令的输出如下所示:

Active Databases

Database name = HADB

Applications connected currently = 0

Database path = /ha/db2inst1/NODE0000/SQL00001/

在节点 ha2 上以 db2instl 的身份查看测试表(hadb.TestHATable)的内容:db2 -tf /ha/hahbcode/db2/selectdb.sql。您应该可以看到当 DB2 在节点 ha1 上运行时所插入的数据。我们运行的结果如下:

[db2inst1@ha2 db2inst1]$ db2 -tf /ha/hahbcode/db2/selectdb.sql Database Connection Information

Database server = DB2/LINUX 8.1.0

SQL authorization ID = DB2INST1

Local database alias = HADB

COL1 COL2

----------- ------------

10 Hello

1 record(s) selected.

DB20000I The SQL command completed successfully.

这说明在从主节点到备用节点进行故障迁移时,数据得以维护下来了。

在节点 ha2 上以 db2instl 的身份向测试表中插入一行数据:db2 -tf

/ha/hahbcode/db2/insertdb.sql。

您可以在主节点上以 root 用户的身份启动 heartbeat 来启动主节点:

/etc/rc.d/init.d/heartbeat start。您应该会看到所有的服务器在一分钟之内都在主节点上启动起来了。您可以通过检查 /var/log/ha-log 文件的内容并在主节点上使用 ps 命令来确认 DB2 正在主节点上运行。

在节点 ha1 上以 db2instl 的身份检查测试表的内容:db2 -tf

/ha/hahbcode/db2/selectdb.sql。您会看到这个表中包含两行数据了。我们运行的结果如下:

[db2inst1@ha1 db2inst1]$ db2 -tf /ha/hahbcode/db2/selectdb.sql Database Connection Information

Database server = DB2/LINUX 8.1.0

SQL authorization ID = DB2INST1

Local database alias = HADB

COL1 COL2

----------- ------------

10 Hello

10 Hello

2 record(s) selected.

DB20000I The SQL command completed successfully.

这说明在从备用节点到主节点进行故障迁移时,数据得以维护下来了。

结束语

关键的数据库应用程序都需要一种健壮的策略来防止数据丢失,并保证数据存储的高可用性。DB2 UDB 简化了具有高可用特性的大型数据库的管理。

在这篇文章中,您已经看到了如何使用开源软件和廉价的硬件来简单而且低成本地为DB2 UD 数据库实现一个 HA 的方案。

如何实现的双机热备

如何实现的双机热备 2009-01-05 12:19:58 一.介绍 作为服务器,需要提供一定的24X7的安全保证,这样可以防止关键节点的宕机引起系统的全面崩溃。春笛公司在长期的邮件系统方案实施过程 中,利用OpenSource开源软件,结合金笛邮件系统,成功地为多家单位实施了大容量邮件系统的高可靠双机热备方案。 基于linux的 HA软件可靠稳定,比使用商业版本的HA软件降低成本约9成左右。 在这里我们用 lvs 和 DRBD 实现了一个真实环境下的双机热容错集群。 这里的关键技术是如何实现ip代换, mon/heartbeat检测, 文件同步。 同样这一方法稍加改动就可以实现oracle热备份、ldap热备份等。 二.方案描述 将真实服务地址绑定到一个虚拟网卡(eth0:1)上通过检测程序 (heartbeat)来将主机或是备份主机的虚拟网卡(eth0:1)激活。从而实现热备份。使用网络硬盘RAID来同步文件。检测程序通过内网进行监控。 金笛高可用邮件系统架构(双机系统) F 2 工作模式

a) 正常状态:

正常工作状态 b) 备份激活: node1失效,node2激活状态c) 主机就绪: node1故障排除,恢复状态

d) 切换回正常模式: 需要手动停止备份服务器的服务,系统会自动切换回正常模式 三.软硬件需求 两台双网卡主机完全安装 redhat6.2 主机IP 10.0.0.126 备份主机IP 10.0.0.250 实际服务即浮动IP 202.93.204.68 邮件系统: 金笛邮件系统Jindi-Mail2.0 (https://www.doczj.com/doc/373547711.html,) HA软件: ftp://https://www.doczj.com/doc/373547711.html,/pub/ha/piranha-docs-0.4.17-2.i386.rpm ftp://https://www.doczj.com/doc/373547711.html,/pub/ha/piranha-gui-0.4.17-2.i386.rpm ftp://https://www.doczj.com/doc/373547711.html,/pub/ha/piranha-0.4.17-2.i386.rpm ftp://https://www.doczj.com/doc/373547711.html,/pub/ha/ipvsadm-1.11-4.i386.rpm https://www.doczj.com/doc/373547711.html,plang.tuwien.ac.at/reisner/drbd/download/drbd-0.5 .8.1.tar.gz 安装软件: rpm –Uvh ipvsadm* piranha*两台主机都要装 金笛邮件系统安装 DRBD 安装 Tar zvxf tar -zvxf drbd-0.5.8.1.tar.gz cd drbd make make install 有如下相关文件 /usr/sbin/drbdsetup /lib/modules/2.2.18pre11-va2.1/block/drbd.o /etc/ha.d/resource.d /etc/rc.d/init.d/drbd /sbin/insmod drbd进行测试 应返回”Using /lib/modules/2.2.18pre11-va2.1/block/drbd.o” 四.设置 编辑/etc/lvs.cf文件 #Example of /etc/lvs.cf #还需要smtpd popd这两个启动脚本 service = fos # 采用fos模式 primary = 10.0.0.126 # 主ip地址(qmail) backup = 10.0.0.250 # 备份主机ip地址(Backup) backup_active = 1 # 激活备份 heartbeat = 1 # 激活Heartbeat heartbeat_port = 1050 # Heartbeat端口 keepalive = 2 # heartbeat间隔单位秒 deadtime = 10 # 判定死机间隔 rsh_command = ssh # 文件同步方案选ssh

HCSCA105 HCNA-Security-CBSN 第五章 防火墙双机热备技术V2.5

1

●双机热备份技术的出现改变了可靠性难以保证的尴尬状态,通过在网络出口位置部署两 台或多台网关设备,保证了内部网络于外部网络之间的通讯畅通。 ●USG防火墙作为安全设备,一般会部署在需要保护的网络和不受保护的网络之间,即位 于业务接口点上。在这种业务点上,如果仅仅使用一台USG防火墙设备,无论其可靠性多高,系统都可能会承受因为单点故障而导致网络中断的风险。为了防止一台设备出现 意外故障而导致网络业务中断,可以采用两台防火墙形成双机备份。

●为了避免路由器传统组网所引起的单点故障的发生,通常情况可以采用多条链路的保护 机制,依靠动态路由协议进行链路切换。但这种路由协议来进行切换保护的方式存在一定的局限性,当不能使用动态路由协议时,仍然会导致链路中断的问题,因此推出了另一种保护机制VRRP(虚拟路由冗余协议)来进行。采用VRRP的链路保护机制比依赖动态路由协议的广播报文来进行链路切换的时间更短,同时弥补了不能使用动态路由情况下的链路保护。 ●VRRP(Virtual Router Redundancy Protocol)是一种基本的容错协议。 ●备份组:同一个广播域的一组路由器组织成一个虚拟路由器,备份组中的所有路由器一 起,共同提供一个虚拟IP地址,作为内部网络的网关地址。 ●主(Master)路由器:在同一个备份组中的多个路由器中,只有一台处于活动状态, 只有主路由器能转发以虚拟IP地址作为下一跳的报文。 ●备份(Backup)路由器:在同一个备份组中的多个路由器中,除主路由器外,其他路 由器均为备份路由器,处于备份状态。 ●主路由器通过组播方式定期向备份路由器发送通告报文(HELLO),备份路由器则负责 监听通告报文,以此来确定其状态。由于VRRP HELLO报文为组播报文,所以要求备份组中的各路由器通过二层设备相连,即启用VRRP时上下行设备必须具有二层交换功能,否则备份路由器无法收到主路由器发送的HELLO报文。如果组网条件不满足,则不能使用VRRP。

ODA数据库一体机与传统双机集群方案比较

传统解决方案ODA数据库一体机购买2台服务器,2套正版操作 系统,双机集群软件,4 块光纤HBA卡, 两台光 纤交换机,一台光纤存储 阵列 一台ODA 安装部署集成商或者专业工程师来 进行部署有基本IT技能的人员都能进行部署

部署过程非常复杂:安装操作系统,配置网络集群,部署Oracle数据库,进行大量的测试调优工作部署过程非常简单,通过安装向导进行一键安装 一般需要一周左右时间完成最长2小时完成所有部署工作 维护升级管理 员 需要专业的系统管理员, 网络管理员和数据库管理 员 对系统维护文员的专业技能 要求不高 日常 监控 和诊 断 复杂:需对操作系统,存 储,数据库,集群软件分 别进行监控和诊断 简单:使用Appliance Manager对整个ODA进行 系统监控和诊断,包括硬 件,操作系统和数据库。 补丁 升级 管理员在多个供应商处寻 找最新的补丁版本,手工 对服务器硬件、固件、操 作系统和数据库软件打补 丁。无版本一致性检测, 可能会出现版本冲突等问 题,甚至导致系统故障。 Appliance Manager拥有一 键补丁的功能,在Oracle唯 一补丁程序接入点获取所有 最新版本补丁程序并进行快 速安装,无版本冲突等问 题。 高可用性无法保证多个厂商间产品 兼容性的问题,尤其是在 界定软、硬件问题时存在 诸多困难。 来自多个厂商的部件难以 做到高效配合,最终影响 数据库系统的整体性能。业内同级别解决方案最高的高可用性,数据库服务器、存储、网络以及操作系统软件、数据库软件、系统部署诊断软件有效的整合在一体机中,ODA是Oracle数据库解决方案最佳实践: 硬件全部采用冗余设计,采用三重数据镜像保护,数据重建速度是Raid5等方式的上百倍

PLUSWELL双机热备

PLUSWELL多机集群、数据备份 解决方案

一:概述 企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。 而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。而用户寻求底成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。有时因护理不当造成数据损坏,发生更大的事故。 蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。 蓝科泰达容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux平台,SCO UNIX平台上的多种双机热备软件。 二、需求分析 企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。 所以我们要求双机软件能够实现以下几点: 1、异常终端检测 2、网络故障,系统故障,应用程序故障等全系统检测 3、当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行 4、速度快(快速恢复) 贵单位业务平台,是以Windwos 2003 Server系统平台为基础,以SQL Server核心的数据库应用系统,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。 因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell 软件可以保障该系统中的某一节点故障都可被PlusWell 软件所监控,如主服务器应用程序、网卡、操作系统,均纳入公共的安全体系,确保7*24的不停机。 比较典型的危及系统安全应用和系统错误主要有: (1)进程错误,比如用户应用与文件数据库的连接异常中断或用户进程 发生错误。 (2)文件系统故障,由于异常操作或其它原因造成文件系统内部部分信 息丢失或不一致。 (3)操作系统故障,操作系统本身的系统调用问题及底层的应用驱动在 安装或更新出现冲突; (4)网络线缆故障。 (5)介质问题,网络连接或物理硬盘也可能会出现问题。 方案拓扑:

存储、集群双机热备方案

存储集群双机热备方案

目录 一、前言 (3) 1、公司简介 (3) 2、企业构想 (3) 3、背景资料 (4) 二、需求分析 (4) 三、方案设计 (5) 1.双机容错基本架构 (5) 2、软件容错原理 (6) 3、设计原则 (7) 4、拓扑结构图 (7) 四、方案介绍 (10) 方案一1对1数据库服务器应用 (10) 方案二CLUSTER数据库服务器应用 (11) 五、设备选型 (12) 方案1:双机热备+冷机备份 (12) 方案2:群集+负载均衡+冷机备份 (13) 六、售后服务 (15) 1、技术支持与服务 (15) 2、用户培训 (15)

一、前言 1.1、公司简介 《公司名称》成立于2000年,专业从事网络安全设备营销。随着业务的迅速发展,经历了从计算机营销到综合系统集成的飞跃发展。从成立至今已完成数百个网络工程,为政府、银行、公安、交通、电信、电力等行业提供了IT相关系统集成项目项目和硬件安全产品,并取得销售思科、华为、安达通、IBM、HP、Microsoft等产品上海地区市场名列前茅的骄人业绩。 《公司名称》致力于实现网络商务模式的转型。作为国内领先的联网和安全性解决方案供应商,《公司名称》对依赖网络获得战略性收益的客户一直给予密切关注。公司的客户来自全国各行各业,包括主要的网络运营商、企业、政府机构以及研究和教育机构等。 《公司名称》推出的一系列互联网解决方案,提供所需的安全性和性能来支持国内大型、复杂、要求严格的关键网络,其中包括国内的20余家企事业和政府机关. 《公司名称》成立的唯一宗旨是--企业以诚信为本安全以创新为魂。今天,《公司名称》通过以下努力,帮助国内客户转变他们的网络经济模式,从而建立强大的竞争优势:(1)提出合理的解决方案,以抵御日益频繁复杂的攻击 (2)利用网络应用和服务来取得市场竞争优势。 (3)为客户和业务合作伙伴提供安全的定制方式来接入远程资源 1.2、企业构想 《公司名称》的构想是建立一个新型公共安全网络,将互联网广泛的连接性和专用网络有保障的性能和安全性完美地结合起来。《公司名称》正与业界顶尖的合作伙伴协作,通过先进的技术和高科产品来实施这个构想。使我们和国内各大企业可通过一个新型公共网络来获得有保障的安全性能来支持高级应用。 《公司名称》正在帮助客户改进关键网络的经济模式、安全性以及性能。凭借国际上要求最严格的网络所开发安全产品,《公司名称》正致力于使联网超越低价商品化连接性的境界。《公司名称》正推动国内各行业的网络转型,将今天的"尽力而为"网络改造成可靠、安全的高速网络,以满足今天和未来应用的需要。 1.3、背景资料 随着计算机系统的日益庞大,应用的增多,客户要求计算机网络系统具有高可靠,高

服务器双机热备方案

双机热备方案 双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。 其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2. 双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID 技术和数据备份技术。但是数据备份只能解决系统出现问题后的恢复;而RAID

技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。 要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3. 实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。 1)基于共享的存储设备的方式 基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存放在该磁盘阵列中)。两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器

服务器双机热备方案定稿版

服务器双机热备方案精 编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

双机热备方案 双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。 其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2. 双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份

技术。但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。 要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3. 实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。 1)基于共享的存储设备的方式 基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存

双机热备、集群及高可用性入门

双机热备、集群及高可用性入门

什么是双机热备? 双机热备这一概念包括了广义与狭义两种意义。 从广义上讲,就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。(相关文章:为什么需要双机热备?) 双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。但在实际应用中,可能会出现多台服务器的情况,即服务器集群。(相关文章:双机软件与集群软件的异同) 双机热备一般情况下需要有共享的存储设备。但某些情况下也可以使用两台独立的服务器。(相关文章:双机热备的实现模式) 实现双机热备,需要通过专业的集群软件或双机软件。(相关文章:双机与集群软件的选择) 从狭义上讲,双机热备特指基于active/standby方式的服务器热备。服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备。在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(一般是通过心跳诊断)将standby机器激活,保证应用在短时间内完全恢复正常使用。(相关文章:双机热备、双机互备与双机双工的区别) 为什么要做双机热备? 双机热备针对的是服务器的故障。 服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。从实际经验上看,除非是简单地重启服务器(可能隐患仍然存在),否则往往需要几个小时以上。而如果技术人员不在现场,则恢复服务的时间就更长了。 而对于一些重要系统而言,用户是很难忍受这样长时间的服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 决定是否使用双机热备,正确的方法是要分析一下系统的重要性以及对服务中断的容忍程度,以此决定是否使用双机热备。即,你的用户能容忍多长时间恢复服务,如果服务不能恢复会造成多大的影响。 在考虑双机热备时,需要注意,一般意义上的双机热备都会有一个切换过程,这个切换过程可能是一分钟左右。在切换过程中,服务是有可能短时间中断的。

高可用多机集群数据备份双机热备方案

PLUSWELL多机集群、数据备份解决方案 北京蓝科泰达科技有限公司 2008年7月

一:概述 企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。 而现有的双机热备份设备存在价格高昂,成本较高的情况,往往使用户望而却步。而用户寻求底成本的纯软件方案又往往因产品不容易维护,纯软件双机方案不稳定等因素,往往给用户造成不必要的使用麻烦。有时因护理不当造成数据损坏,发生更大的事故。 蓝科泰达凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了蓝科泰达双机容错打包解决方案,目的在于保证数据永不丢失和系统永不停顿,同时为用户节省大量的开支。蓝科泰达容错系统结合了蓝科泰达磁盘阵列产品的安全可靠性与双机容错技术高可用性的优点,相互配合二者的优势。蓝科泰达磁盘阵列针对双机容错技术做了许多优化和改进,满足了双机硬件的连接要求,根据应用环境的实际情况,适用于Windows2000平台以上,开放源代码Linux 平台,SCO UNIX平台上的多种双机热备软件。 二、需求分析 企业关键业务一旦中断,企业的日常运作将受到致命的影响,那么就要求我们的系统在最短的时间内将系统恢复到正常状态。 所以我们要求双机软件能够实现以下几点: 1、异常终端检测 2、网络故障,系统故障,应用程序故障等全系统检测 3、当高可用系统中的某个节点故障,无须人工干预自动切换,保障系统运行 4、速度快(快速恢复) 贵单位业务平台,是以Windwos 2003 Server系统平台为基础,以SQL Server核心的数据 库应用系统,该系统对稳定性要求很高、系统实时性和可用性提出要有连续运行的能力,系统一旦出现故障,其损失是惨重的。 因此,建议用户采用高可用技术,高可用系统在各个节点间保持的间歇的通讯,使系统中的独立节点组合成整体的一套系统,并使用PlusWell 软件可以保障该系统中的某一节点故障都可 被PlusWell 软件所监控,如主服务器应用程序、网卡、操作系统,均纳入公共的安全体系,确 保7*24的不停机。 比较典型的危及系统安全应用和系统错误主要有: (1)进程错误,比如用户应用与文件数据库的连接异常中断或用户进程发生错误。 (2)文件系统故障,由于异常操作或其它原因造成文件系统内部部分信息丢失或不一致。 (3)操作系统故障,操作系统本身的系统调用问题及底层的应用驱动在安装或更新出现冲突; (4)网络线缆故障。 (5)介质问题,网络连接或物理硬盘也可能会出现问题。 方案拓扑:

最新利用赛门铁克veritas SFHA技术实现双机集群架构案例

利用赛门铁克 v e r i t a s S F H A技术实现双机集群架构案 例

利用赛门铁克veritas SFHA技术实 现双机集群架构案例 一、系统拓扑结构: (一)环境描述 两台IBM P750 小型机,其中A机和B机组成一个Oracle Rac,两个存储上划分同等Lun。 (二)SFRAC功能 1.通过底层VXVM功能,实现两个盘柜的镜像(Mirror),保证在一个阵列出现down机,损坏等情况下保证应用的可用; 2.通过文件系统CFS,提供Oracle的并行操作,到达Oracle RAC的功能。 3.设置IO Fencing功能,防止因心跳线断掉,而出现的脑裂情况。 二、详细功能: (一)镜像功能 赛门铁克Storage Foundation采用独特的镜像双写技术,构造全冗余的存储高可用架构,在存储层面实现“HA”,当一个存储发生硬件故障时,业务系统主机会自动采用另一个镜像存储提供数据,核心业务丝毫不受影响。另外,

当生产存储性能下降到一定程度时,Storage Foundation会自动断掉主机与生产存储的连接,直接读取镜像存储数据,使业务应用性能免受生产存储性能的恶劣影响。而且Storage Foundation能够实现异构存储之间的高可用HA,最大限度避免来自同构同型号存储的Bug并发影响。该技术彻底消除核心业务系统的存储单故障点,减少业务中断风险,有效加固存储层面的高可用性,减少意外停机时间。 (二)DMP动态多路径 DMP(Dynamic):采用Symantec DMP组件(动态多路径)实现主机对存储的多路径读写;在 I/O 路径出现故障时,确保可以访问存储设备,保证数据的可用性;通过I/O路径优化算法改进I/O 性能。其主要功能如下: 1.光纤多通道的Fast failover 快速切换; 2.I/O 路径优化,提供六种算法:平衡路径,循环,最小队列长度,自适应,优先级,单个活动路径; 3.自动发现光纤路径; 4.动态监测多路径的状态; 5.异构环境支持,支持所有主流的磁盘阵列。 (三)IO fencing

双机热备解决方案讲解

双机热备解决方案 方案特点: 双机热备可以采用第三方双机软件实现,也可以采用windows server系统自带的mscs来实现双机热备。两套相同应用的服务器采用主/备机模式,主备机采用心跳线连接, 备机会监测主机的运行状态,如果主机出现故障,备机可以自动接管主机的应用继续服务,保证业务的连续性。双机热备的方案建议采用存储设备,数据全部存放在存储设备中,保证数据的一致性,可以让备机顺利接管主机应用。也可以选择不带存储来实现双机。需要软件支持,相当于两台服务器做镜像的模式。 避免的风险: 随着业务对IT系统的依存度越来越高、为保证业务连续性、IT系统的安定、连续运行成为必需。系统中断服务、业务被中断的可能性如下所示。 一、由于操作错误造成系统停止 二、软件/硬件故障 三、利用备份软件等进行恢复的情况下、长时间的操作导致业务中断 四、自然灾害 您的收益: 一、系统安全:双重保护,实时保护公司重要的无形资产 二、业务连续性:IT系统7x24在线,减少停机时间,提供最优质的IT服务 三、IT体验:提高企业员工IT使用体验,提高工作效率 四、满意度:先进的IT系统能更好的服务客户,提高客户满意度

WINDOWS故障转移群集 故障转移群集是一种高可用性的基础结构层,由多台计算机组成,每台计算机相当于一个冗余节点,整个群集系统允许某部分节点掉线、故障或损坏而不影响整个系统的正常运作。一台服务器接管发生故障的服务器的过程通常称为"故障转移"。 如果一台服务器变为不可用,则另一台服务器自动接管发生故障的服务器并继续处理任务。群集中的每台服务器在群集中至少有一台其他服务器确定为其备用服务器。 故障转移群集可应用于Windows server 2003、Windows server 2008、Windows 2012 server等操作系统中部署。 适用环境 1. 硬件组件、应用程序或服务出现故障导致程序或服务无法使用或影响工作;例 如某服务器电源出现故障,如果该该服务器和电源都是唯一的,则存在单点故障, 并且服务器提供的应用程序将不可用。 2. 计划内的服务器停机或维护影响应用程序的可用性;例如要更新无备用服务器 的一台数据库服务器 上的操作系统,你可能需要重启或停止应用程序服务才能安装更新修补程序; 3. 监视和维护多服务器层增加了对系统和网络资源的要求。例如你需要多台服务 器提供多种应用程序服务,各自独立的服务器不利于监视与维护; 工作原理 故障转移群集必须基于域的管理模式部署,以“心跳机制”来监视各个节点的健康状况;备用服务器以心跳信号来确定活动服务器是否正常,要让备用服务器变成活动服务器,它必须确定活动服务器不再正常工作。 同步状态 备用服务器必须首先将其状态与发生故障的服务器的状态进行同步,然后才能开始处理事务。主要有三种不同的同步方法:

Windows Server 2008集群 + SQL Server 2008数据库主主模式双机集群

第一步准备工作 事先把操作系统、数据库、计算机名、IP地址等等相关内容提前规划好,本次数据库双机集群实验全程是在VMware虚拟机环境下搭建,一共使用四台虚拟机进行,分别是一台DC服务器、一台存储服务器、两台数据库服务器。实际生产环境中,物理存储绝大部分都是走光纤通道(Fibre Channel),即服务器上会安装一块HBA连接到光纤交换机,而模拟实验中是使用基于网络的iSCSI存储,为了进一步简化硬件数量,本次实验中,两台数据库服务器上就不专门新建用于存储通信的网卡了,直接让一张网卡在提供对外业务通信服务的同时,顺便承载起和iSCSI存储通信的工作,具体信息如下: DC服务器 操作系统:Windows Server 2008 R2 计算机名:Wanghualang-DC 网络模式:桥接 新建域名:https://www.doczj.com/doc/373547711.html, 新建域组1:DBEngine(数据库引擎组) 新建域组2:DBAgent(数据库代理组) 新建域组3:DBAnalysis(数据库分析服务组) 新建域用户1:DBAdmin(数据库管理专用帐号) 新建域用户2:DBServices(数据库运行专用帐号) IP地址:192.168.1.100 DNS地址:192.168.1.100 备注1:DBAdmin、DBServices这两个域用户需要加入DBEngine、DBAgent、DBAnalysis这三个域组 备注2:DBAdmin、DBServices这两个域用户需还要加入数据库服务器A、数据库服务器B的本地管理员组 存储服务器 操作系统:Windows Server 2008 R2 + Windows Storage Server 2008 R2 计算机名:iSCSI 网络模式:桥接 iSCSI软件:iSCSI Software Target 3.3 IP地址:192.168.1.200 新建磁盘数量:4 磁盘用途容量:仲裁盘(2G)、MSDTC盘(5G)、数据盘A(10G)、数据盘B(10G) 数据库服务器A 操作系统:Windows Server 2008 R2 计算机名:Wanghualang-A 网络模式:业务线使用桥接,心跳线使用VMnet1 数据库:SQL 2008 R2 Enterprise With SP1 IP地址1:192.168.1.101(业务线) IP地址2:192.168.88.101(心跳线) DNS地址:192.168.1.100 集群名称:Wanghualang-HA 集群虚拟IP地址:192.168.1.250 MSDTC集群虚拟IP地址:192.168.1.240 SQL Server 网络名称A / B:SQLha01 / SQLha02 SQL Server 实例名称A / B:WanghualangSQL01 / WanghualangSQL02 SQL Server 实例虚拟IP地址A / B:192.168.1.241 / 192.168.1.242 挂载盘名称和盘符分配:仲裁盘(Q)、MSDTC盘(M)、数据盘A(D)、数据盘B(E) 数据库服务器B 操作系统:Windows Server 2008 R2 计算机名:Wanghualang-B 网络模式:业务线使用桥接,心跳线使用VMnet1 数据库:SQL 2008 R2 Enterprise With SP1 IP地址1:192.168.1.102(业务线) IP地址2:192.168.88.102(心跳线) DNS地址:192.168.1.100 集群名称:Wanghualang-HA 集群虚拟IP地址:192.168.1.250 MSDTC集群虚拟IP地址:192.168.1.240 SQL Server 网络名称A / B:SQLha01 / SQLha02 SQL Server 实例名称A / B:WanghualangSQL01 / WanghualangSQL02 SQL Server 实例虚拟IP地址A / B:192.168.1.241 / 192.168.1.242 挂载盘名称和盘符分配:仲裁盘(Q)、MSDTC盘(M)、数据盘A(D)、数据盘B(E) 第二步安装配置iSCSI存储 本次实验将使用 Windows Storage Server 2008 R2 来搭建存储服务器,新建一台虚拟机安装 Windows Server 2008 R2 操作系统,按事先规划配置好IP地址,并禁用防火墙!载入 Windows Storage Server 2008 R2 镜像,进入 Windows Storage Server 2008 R2 文件夹,安装 Windows6.1-KB982050-x64-EnterpriseBranding 程序。

服务器双机热备

服务器双机热备解决方案

前言 数据信息是当今社会进步、发展的关键。面对日益庞大的计算机网络,用户的要求是网络能够可靠、高速、稳定地运行。当前大部分网络服务都是采用中心服务器的模式(只有一台服务器),服务器的高可靠性、高可用性是网络安全运行的关键,一旦服务器出现故障,所提供的服务就会被中断,影响正常工作,并可能丢失关键数据,从而造成严重后果。无论对企业的有形和无形资产都带来不必要的损失。如何在故障情况下尽快恢复使用并保证数据的安全,已经成为一个日渐突出的问题。服务器双机热备份技术正是解决由软硬件故障引起可靠性降低的有效措施,该技术较为成熟,成本相对较低,具有安装维护简单、稳定可靠、监测直观等优点,在网络保障中获得了广泛的应用。 一、双机热备阐述 什么是双机热备? 所谓双机热备份,概况地说,就是用网络两台服务器连接起来,平时互相备份,共同执行同一服务。当一台服务器停机时,可以由双机中的另一台服务器自动将停机服务器的业务接管,从而在不需要人工干预的情况下,保证系统能持续提供服务。 什么时候需要双机热备呢? 一般服务器要长年累月(7 X 24 小时)不间断工作,其备份工作就绝对少不了。所以,决定是否使用双机热备,应首先对系统的重要性,以及终端用户对服务中断的容忍程度进行考虑,然后再来决定是否使用双机热备。比如网络中的用户最多能容忍多长时间恢复服务?如果服务不能很快恢复会造成什么样的后果等等。

二、双机热备拓扑图以及工作原理 双机热备工作示意图

三、双机热备方案介绍 在高可用性方案中,操作系统和应用程序是安装在两台服务器的本地系统盘上的,而整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据的集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备来读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。 双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者是备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件(双机软件RoseHA)认为主机系统发生故障,立即令主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。 双机备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍: ?双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby服务器处于监控准备状态。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。这是目前最理想的一种模式。 ?双机互备模式,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。服务器配置相对要好。 ?双机双工模式 : 是目前Cluster(集群)的一种形式,两台服务器均为活动状态,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份。WEB服务器或FTP服务器等用此种方式比较多。

双机热备搭建系统项目解决方案

UPS电源安装实施方案 1.双机集群介绍 1.1.双机集群的原理说明 双机容错是计算机应用系统稳定、可靠、有效、持续运行的重要保证。它通过系统冗余的方法解决计算机应用系统的可靠性问题,并具有安装维护简单、稳定可靠、监测直观等优点。当一台主机出现故障的时候,可及时启动另一台主机接替原主机任务,保证了用户数据的可靠性和系统的持续运行。在高可用性方案中,操作系统和应用程序是安装在两台服务器的本地系统盘上的,而整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据的集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备来读取和存储,并由专业人员进行管理,极保护了数据的安全性和性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者是备用系统无法收到主机系统的“心跳”信号,则系统的高可用性管理软件(双机软件)认为主机系统发生故障,立即令主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。 双机热备模式即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby服务器处于监控准备状态。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间完全恢复正常使用。这是目前采用较多的一种模式。

1.2.双机系统逻辑图 1.3.双机热备实现模式 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。基于存储共享的双机热备是双机热备的最标准方案。这种方式采用两台(或多台)服务器,使用共享的存储设备(磁盘阵列柜或存储区域网SAN)。两台服务器可以采用热备(主从)、互备、双工(并行)等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。对于用户而言,这一过程是全自动的,在很短时间完成,从而对业务不会造成影响。由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。

在win7下的vmware上搭建双机学习环境群集双机热备Cluster

一、群集介绍 服务器群集是一组协同工作并运行Microsoft群集服务(Microsoft Cluster Service,MSCS)的独立服务器。它为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。它允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。(说明:本文档编写的目的是为了帮助大家实现所关心的如何在VMWare Workstation中完成典型群集的配置步骤,不会具体的涉及到如何安装群集应用程序,如Exchange群集等) 二、群集专业术语 节点: 构建群集的物理计算机 群集服务: 运行群集管理器或运行群集必须启动的服务 资源: IP地址、磁盘、服务器应用程序等都可以叫做资源 共享磁盘: 群集节点之间通过光纤 SCSI 电缆等共同连接的磁盘柜或存储 仲裁资源: 构建群集时,有一块磁盘会用来仲裁信息,其中包括当前的服务状态各个节点的状态以及群集转移时的一些日志 资源状态: 主要指资源目前是处于联机状态还是脱机状态 资源依赖: 资源之间的依存关系 组: 故障转移的最小单位 虚拟服务器: 提供一组服务--如数据库文件和打印共享等 故障转移: 应用从宕机的节点切换到正常联机的节点 故障回复: 某节点从宕机状态转为联机状态后,仍然继续宕机前的工作,为其他节点分流 三、实验环境介绍及要求 1、拓扑图

(1) DC软件配置信息 OS:Windows Server 2003 X86 SP1 中文企业版Role: Active Directory域控制器 Domain:https://www.doczj.com/doc/373547711.html, ServerName:https://www.doczj.com/doc/373547711.html, IP:192.168.0.254 (以“桥接”方式连接)Netmask:255.255.255.0 Gateway:192.168.0.254 (2) Cluster Node A软件配置信息 OS: Windows Server 2003 X86 SP1 中文企业版Role: Member Server ServerName:https://www.doczj.com/doc/373547711.html, IP1:192.168.0.1 (以“桥接”方式连接)Netmask1:255.255.255.0 Gateway1:192.168.0.1 Dns1:192.168.0.254 IP2:10.0.0.1 (以“VMnet2”方式连接)Netmask2:255.0.0.0 Gateway2:None DNS2:None (3) Cluster Node B软件配置信息 OS: Windows Server 2003 X86 SP1 中文企业版Role: Member Server ServerName:https://www.doczj.com/doc/373547711.html, IP1:192.168.0.2 Netmask1:255.255.255.0 Gateway1:192.168.0.1 (以“桥接”方式连接)Dns1:192.168.0.254 IP2:10.0.0.2 (以“VMnet2”方式连接)Netmask2:255.0.0.0 Gateway2:None DNS2:None

双机热备技术

服务器热备技术 双机热备方案双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2.双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份技术。但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3.实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。

相关主题
文本预览
相关文档 最新文档