服务器双机热备建议方案
- 格式:doc
- 大小:1.20 MB
- 文档页数:33
双机热备实施方案一、引言双机热备是指在主服务器出现故障时,备用服务器能够立即接管主服务器的工作,以保证系统的持续运行。
双机热备实施方案是企业信息化建设中重要的一环,它能够有效提高系统的可靠性和稳定性,保障企业的正常运营。
本文将就双机热备实施方案进行详细介绍。
二、双机热备原理双机热备系统由主服务器和备用服务器组成,主服务器负责正常的业务处理,备用服务器处于待命状态。
主服务器将实时数据同步到备用服务器上,一旦主服务器出现故障,备用服务器能够迅速接管主服务器的工作,保证系统的连续性和稳定性。
双机热备系统的实施需要考虑到硬件设备、网络连接、数据同步等多个方面,确保系统能够在最短的时间内实现故障切换。
三、双机热备实施步骤1. 硬件设备准备:首先需要准备两台性能相当的服务器,确保备用服务器能够完全替代主服务器的工作。
同时需要配置双机热备专用的网络设备,保证主备服务器之间的数据同步和通讯畅通。
2. 系统软件安装:在主备服务器上安装双机热备软件,确保数据能够实时同步,并能够实现故障切换。
同时需要进行系统的配置和优化,确保系统能够在最短的时间内完成故障切换。
3. 数据同步设置:配置主备服务器之间的数据同步策略,确保数据能够实时同步。
同时需要定期进行数据同步的测试,保证数据同步的准确性和及时性。
4. 故障切换测试:在双机热备系统实施完成后,需要进行故障切换的测试,确保备用服务器能够在主服务器故障时能够迅速接管工作,并保证系统的正常运行。
四、双机热备实施注意事项1. 确保主备服务器之间的网络连接畅通,避免数据同步的延迟和丢失。
2. 定期对双机热备系统进行全面的检查和测试,确保系统的可靠性和稳定性。
3. 对双机热备系统进行定期的维护和更新,确保系统能够及时适应业务的变化和需求。
4. 对双机热备系统的故障切换进行定期的演练,提高系统故障切换的速度和准确性。
五、结论双机热备实施方案是企业信息化建设中非常重要的一环,它能够有效提高系统的可靠性和稳定性,保障企业的正常运营。
(第一部分)ROSE双机热备解决方案前言数字化建设是一个庞大而复杂的系统工程,其整体系统由上百个业务子系统组建而成,而这些系统间又有频繁的数据交换和业务联动,数据/信息中心系统的建设和部署是整个数字化系统建设的核心和基础,其架构设计是一项复杂的工作。
本方案提出双机热备硬件平台基础架构的概述。
本方案针对数字化基础架构,帮助各个层次上保持正常、健康的运行。
具体方案如下:一、高可用性评估:对 IT 可用性计划、流程、过程、角色、职责、报告、控制和服务水平实现情况进行分析;通过事后分析、故障成本或组件故障影响分析技术,对可能发生的故障进行分析;二、高可用性规划与设计对高可用性进行规划,包括计划、计划管理、报告和服务水平管理、高可用性流程和过程设计,包括角色和职责。
三、高可用性实施各种服务器优化与整合服务规划、设计和实施。
四、容灾规划与实施服务数据中心和灾备中心连续性接管服务,灾难恢复演练计划制定与实施。
一.系统环境1.1 方案业务简述本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。
为支持越来越高的业务连续性要求。
二.关健业务连续性系统设计2.1 基础架构2.2 系统设计说明1. 服务器、存储和软件系统本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。
根据我们对业务系统的分析,充分满足对系统数据容量的规划,建议配置如下:✓2两台服务器建议选择IBM X3650,每台建议配置如下:✓磁盘阵列建议选择IBM DS3512,建议配置如下:✓双机软件选择RoseHA 一套,配置如下:操作系统要求选择支持大内存和硬盘RAID功能。
两台IBM X3650双机系统为数据库服务器,两台互为备份,这大大提高了系统的可靠性,在任意一台服务器发生故障时整个系统能够继续安全良好的运行。
Intel 服务器双机热备解决方案1. 方案背景随着行业竞争日益剧烈,业务系统日趋完善,企业对于营运过程中所不断产生的大量数据越来越关注,数据对企业而言已不仅仅只是单纯的信息,它往往还意味着巨大的财富和潜在的无限商机。
如何能够有效的保存与管理好企业的数据,同时又不影响企业业务的正常运行性能,成为企业在其众多竞争对手之中制胜的关键。
由于运营设备将对整个企业业务系统运行的速度、可靠性、数据安全性具有至关重要的作用,而且用户对运营设备的投资及其未来投资保护都是目前急需解决的问题。
Intel 在业界领先提出了基于Intel server的高可靠性、高可用性的解决方案。
2. 什么是双机热备(Hot Standby)双机热备份方式是一种软硬件结合的高可靠性应用模式。
该系统由两台服务器和一个外接磁盘阵列柜及相应的软件构成。
用户的数据放在外接磁盘阵列柜的存储盘里。
操作系统和应用程序安装在两台服务器的内置系统盘上。
双机热备份系统由相应的软件控制。
当一台服务器作为主服务器运行某个应用时,另一台服务器就是备份机。
备份机不停地监视主服务器,一旦主服务器发生故障 (如主机故障,网络故障,软件故障等),备份机就会自动接管主机的任务,使得整个应用系统能继续工作。
一旦主机修复后,又可把任务从备份机切回到主机。
双机容错的目的在于保证数据永不丢失和系统永不停机,采用智能型磁盘阵列柜可保证数据永不丢失,采用双机容错软件可保证系统永不停机。
所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standy Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机科尽早同志系统管理员解决,确保下一次切换的可靠性)。
当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行(Non-Stop)。
双机热备高可用解决方案双机热备高可用解决方案是一种常见的应用服务器高可用性方案,通过将两台服务器配置为主备关系,主服务器负责正常的应用服务处理,备服务器则处于备用状态,随时准备接管主服务器的工作,以确保系统的稳定性和可用性。
以下是一个典型的双机热备高可用解决方案的构建过程,包括网络配置、数据同步、故障检测和切换机制:1.网络配置:将两台服务器连接到同一个局域网中,并配置相应的IP地址和子网掩码,确保彼此可以相互通信,建立心跳通道用于主备服务器之间的通信。
2.数据同步:在双机热备方案中,主服务器会不断处理应用请求并生成数据,备服务器需要及时同步主服务器的数据以保持数据的一致性。
这可以通过异步数据同步、基于共享存储的数据复制或者数据库复制等方式实现。
3.故障检测:为了及时检测主服务器的状态,可以使用心跳检测机制。
主服务器会周期性地向备服务器发送心跳信号,如果备服务器在一定时间内没有收到主服务器的心跳信号,就会判断主服务器发生了故障。
4.切换机制:当备服务器检测到主服务器故障后,会通过切换机制将自己转为主服务器继续处理应用请求,以确保系统的可用性。
切换机制可以通过改变DNS解析、负载均衡器配置或者通过共享存储等方式实现。
5.故障恢复:一旦主服务器恢复正常,可以通过自动或者手动的方式将主服务器重新接管应用服务,备服务器恢复备用状态。
此外,为了进一步提高系统的可用性1.冗余配置:可以通过增加更多的备服务器来提高系统的冗余度,从而进一步减少系统故障的影响。
2.负载均衡:通过引入负载均衡器来分发应用请求,可以将请求在主备服务器之间平衡分配,减轻服务器的负载。
3.监控和报警:设置监控系统来实时监测服务器的状态,以及时发现并解决潜在的问题。
总结起来,双机热备高可用解决方案是一种常见且有效的应用服务器高可用性方案,通过主备服务器的配置、网络设置、数据同步、故障检测和切换机制等措施,可以提高系统的稳定性和可用性,保证应用服务的连续性和用户体验。
(第一部分)ROSE双机热备解决方案前言数字化建设是一个庞大而复杂的系统工程,其整体系统由上百个业务子系统组建而成,而这些系统间又有频繁的数据交换和业务联动,数据/信息中心系统的建设和部署是整个数字化系统建设的核心和基础,其架构设计是一项复杂的工作。
本方案提出双机热备硬件平台基础架构的概述。
本方案针对数字化基础架构,帮助各个层次上保持正常、健康的运行。
具体方案如下:一、高可用性评估:对IT 可用性计划、流程、过程、角色、职责、报告、控制和服务水平实现情况进行分析;通过事后分析、故障成本或组件故障影响分析技术,对可能发生的故障进行分析;二、高可用性规划与设计对高可用性进行规划,包括计划、计划管理、报告和服务水平管理、高可用性流程和过程设计,包括角色和职责。
三、高可用性实施各种服务器优化与整合服务规划、设计和实施。
四、容灾规划与实施服务数据中心和灾备中心连续性接管服务,灾难恢复演练计划制定与实施。
一.系统环境1.1 方案业务简述本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS 的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。
为支持越来越高的业务连续性要求。
二.关健业务连续性系统设计2.1 基础架构2.2 系统设计说明1. 服务器、存储和软件系统本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。
根据我们对业务系统的分析,充分满足对系统数据容量的规划,建议配置如下:2两台服务器建议选择IBM X3650 M4,每台建议配置如下:IBM System X3650 M4服务器类型2U机架式CPU 八核至强E5-2650(2.0G主频/20MB三级缓存/最高支持1600MHz 内存频率),可扩展至2个处理器内存(RAM)2*8GB 1333MHz RDIMM内存硬盘4*300G 2.5"HDD网络4口千兆网卡光驱DVD光驱HBA 卡I BM 6Gb SAS HBA*2电源双电源冗余磁盘阵列建议选择IBM DS3512,建议配置如下:IBM DS5020控制器类型单控制器硬盘配置2TB 7.2K 3.5" NL HDD SAS*4互联线3m SAS Cable*2电源双电源冗余双机软件选择RoseHA 一套,配置如下:RoseHA 双机容错系统RoseHA for Windows Windows 2019/2019/2019 Server for x86-64 (Standard / Advanced / Datacenter Edition)操作系统要求选择支持大内存和硬盘RAID功能。
服务器双机热备方案 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】双机热备方案双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。
1.集群技术在了解双机热备之前,我们先了解什么是集群技术。
集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。
这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。
一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。
计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。
一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。
当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。
其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。
当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。
可见,双机热备是集群技术中最简单的一种。
2. 双机热备适用对象一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。
有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID技术和数据备份技术。
但是数据备份只能解决系统出现问题后的恢复;而RAID技术,又只能解决硬盘的问题。
我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。
要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。
双机热备解决方案简介双机热备是一种常见的高可用性解决方案,通过在两台服务器之间进行数据同步和状态同步,实现在主服务器故障时快速切换到备服务器,从而确保系统的持续可用性。
在本文档中,将介绍双机热备的原理、实施步骤和常见问题解决方案。
原理双机热备的原理是将主服务器和备服务器通过网络连接起来,通过定期同步数据和状态,以便备服务器能够准确地为主服务器提供备份服务。
当主服务器出现故障时,备服务器将立即接管主服务器的工作,并提供相同的服务,以保证系统的可用性。
具体的原理如下: 1. 主服务器和备服务器通过一个交换机或路由器进行网络连接。
2. 定期将主服务器的数据和状态同步到备服务器上,可以使用文件同步工具、数据库复制等技术实现。
3. 备服务器处于待命状态,随时可以接管主服务器的服务。
4. 当主服务器出现故障时,备服务器立即接管主服务器的服务,并通知管理员进行处理。
实施步骤要实施双机热备解决方案,需要进行以下步骤:步骤一:选取适合的硬件设备为了实现双机热备,首先需要选取适合的硬件设备,例如服务器、网络交换机等。
这些硬件设备应具备高可靠性和性能。
步骤二:配置网络环境在选取合适的硬件设备后,需要配置网络环境。
主服务器和备服务器应通过可靠的网络连接起来,并保证网络延迟较低和带宽较大,以确保数据和状态的快速同步。
步骤三:选择并配置数据同步及状态同步方式选择和配置合适的数据同步和状态同步方式是双机热备的关键。
可以根据具体需求选择文件同步工具、数据库复制等技术来实现数据和状态的同步。
步骤四:验证双机热备方案在配置完数据同步和状态同步后,需要进行验证双机热备方案是否生效。
可以通过模拟主服务器故障的方式来验证备服务器是否能够成功接管主服务器的服务。
步骤五:监控和管理备服务器在双机热备方案生效后,需要对备服务器进行监控和管理。
通过实时监控备服务器的状态和性能,及时发现和解决问题,确保备服务器的可靠性和可用性。
常见问题解决方案在实施双机热备方案过程中,可能会遇到一些常见的问题。
服务器双机热备解决方案服务器双机热备解决方案是一种为服务器提供高可用性和容错能力的解决方案。
通过使用两台服务器进行镜像备份和故障切换,可以实现在主服务器故障时无缝地切换到备份服务器,确保系统的连续可用性。
以下是一个详细的服务器双机热备解决方案。
1. 硬件配置:首先,选择两台具备相同规格和配置的服务器作为主备服务器,确保它们具备相同的处理能力、存储容量和网络连接性能。
在服务器之间建立高速互联通道,如双机网卡冗余链接(Multiple Network Interface Redundancy)或光纤通道(Fibre Channel),确保数据传输的稳定和可靠性。
2.系统镜像备份:在主服务器上完成系统的安装和配置后,制作主服务器的系统镜像,并定期更新备份服务器的系统镜像。
可以使用备份软件或快照工具来实现系统镜像的制作和恢复。
3. 数据同步:使用数据复制技术实现主备服务器之间数据的实时同步。
常用的数据同步方式包括同步复制(Synchronous Replication)和异步复制(Asynchronous Replication)。
在同步复制中,主服务器将数据写入备份服务器之前,需要确认数据已经被写入备份服务器。
而在异步复制中,主服务器将数据写入备份服务器后马上返回,不等待备份服务器的确认。
根据需求和实际情况选择适当的数据同步方式。
4. 心跳检测:为了监测主备服务器的状态并确保高可用性,需要在主备服务器之间建立心跳检测机制。
心跳检测可以通过心跳包(Heartbeat)或集群管理软件实现。
当主服务器发生故障时,备份服务器可以通过接收不到心跳信号来判断主服务器的故障,并开始服务切换过程。
5. 故障切换:主服务器发生故障后,备份服务器需要尽快接管主服务器的工作。
在故障切换过程中,需要确保数据的一致性和完整性。
可以通过一些技术手段来实现故障切换,如虚拟IP(Virtual IP)、磁盘共享(Shared Disk)或共享文件系统(Shared File System)等。
服务器双机热备方案概述在现代的企业环境中,服务器的高可用性和稳定性对于业务的正常运行至关重要。
为了保证服务器在故障情况下的快速恢复和数据的实时备份,许多企业采用了服务器双机热备方案。
本文将介绍服务器双机热备方案的基本原理、实施步骤和优势。
一、基本原理服务器双机热备方案是通过将主服务器和备份服务器配置为完全相同的硬件和软件环境来实现的。
主服务器负责处理业务请求和数据处理,而备份服务器则实时复制主服务器上的数据,并保持与主服务器的完全同步。
当主服务器发生故障或不可用时,备份服务器会立即接管业务并继续提供服务,从而实现了高可用性和持续的业务运行。
二、实施步骤1. 硬件准备:首先,需要选购两台相同规格和配置的服务器,并确保它们能够满足业务需求和性能要求。
2. 软件配置:在主服务器和备份服务器上安装相同版本和配置的操作系统及相关服务软件。
确保两台服务器之间能够通过网络连接,以实现数据的复制和同步。
3. 数据复制和同步:选择合适的数据复制和同步方式,如数据库的主从复制、文件系统的镜像复制等。
确保备份服务器能够实时复制主服务器上的数据,并保持与主服务器的完全同步。
4. 故障检测和切换:配置故障检测机制,如心跳检测、网络监控等,以便在主服务器故障或不可用时能够及时发现并触发切换操作。
一旦主服务器故障,备份服务器会自动接管业务,并在后续维护和修复主服务器故障时恢复原状。
5. 故障恢复和修复:定期检查和测试备份服务器的状态和数据同步情况,确保备份服务器处于正常工作状态。
当主服务器故障修复完成后,需要重新将备份服务器配置为主服务器的备份,以实现系统的长期稳定运行。
三、优势1. 高可用性:当主服务器发生故障时,备份服务器能够立即接管业务,减少业务中断时间,提高了系统的可用性和稳定性。
2. 数据保护:备份服务器实时复制主服务器上的数据,确保数据的实时备份和保护。
即使主服务器发生灾难性故障,也能够快速恢复数据并保证业务的连续运行。
服务器双机热备方案一、概述随着企业业务的快速发展,数据安全和业务连续性变得越来越重要。
服务器双机热备方案是一种有效的策略,用于确保数据的可靠性和业务的持续性。
这种方案通过在两台服务器之间实时备份数据,确保即使在一台服务器发生故障时,另一台服务器也能接管业务,维持业务的正常运行。
二、方案介绍服务器双机热备方案的核心是两台服务器同时运行,并共享一份或多个数据副本。
当一台服务器发生故障时,另一台服务器可以接管业务,并继续处理数据请求。
这种方案包括以下几种关键技术:1、磁盘阵列(RAID):通过将多个硬盘组合成一个逻辑单元,提供数据冗余和容错功能。
在RAID中,数据会分布在多个硬盘上,如果一个硬盘发生故障,其他硬盘上的数据可以继续提供服务。
2、心跳监测:两台服务器之间通过心跳监测机制保持实时通信。
当一台服务器发生故障时,另一台服务器可以立即检测到,并接管业务。
3、数据库复制:对于数据库应用,可以通过数据库复制技术实现双机热备。
主服务器上的数据库更改会自动复制到从服务器的数据库中。
当主服务器发生故障时,从服务器可以接管数据库服务。
4、负载均衡:通过负载均衡器,可以将请求分发到两台服务器上,平衡负载,提高系统的整体性能。
三、实施步骤实施服务器双机热备方案需要遵循以下步骤:1、硬件准备:准备两台性能相当的服务器,安装必要的硬件和软件。
2、配置RAID:根据业务需求配置适当的RAID级别,提供数据冗余和容错功能。
3、安装心跳监测软件:在两台服务器上安装心跳监测软件,确保它们能够实时通信。
4、配置数据库复制:对于数据库应用,配置数据库复制软件,确保数据在两台服务器之间同步。
5、配置负载均衡器:安装负载均衡器,将请求分发到两台服务器上,平衡负载。
6、测试与调试:在正常业务运行前,进行全面的测试和调试,确保双机热备方案的正常运行。
7、监控与维护:定期监控双机热备方案的运行状态,及时发现和处理问题,确保数据的可靠性和业务的持续性。
(第一部分)ROSE双机热备解决方案前言数字化建设是一个庞大而复杂的系统工程,其整体系统由上百个业务子系统组建而成,而这些系统间又有频繁的数据交换和业务联动,数据/信息中心系统的建设和部署是整个数字化系统建设的核心和基础,其架构设计是一项复杂的工作。
本方案提出双机热备硬件平台基础架构的概述。
本方案针对数字化基础架构,帮助各个层次上保持正常、健康的运行。
具体方案如下:一、高可用性评估:对IT 可用性计划、流程、过程、角色、职责、报告、控制和服务水平实现情况进行分析;通过事后分析、故障成本或组件故障影响分析技术,对可能发生的故障进行分析;二、高可用性规划与设计对高可用性进行规划,包括计划、计划管理、报告和服务水平管理、高可用性流程和过程设计,包括角色和职责。
三、高可用性实施各种服务器优化与整合服务规划、设计和实施。
四、容灾规划与实施服务数据中心和灾备中心连续性接管服务,灾难恢复演练计划制定与实施。
一.系统环境1.1 方案业务简述本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS 的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。
为支持越来越高的业务连续性要求。
二.关健业务连续性系统设计2.1 基础架构2.2 系统设计说明1. 服务器、存储和软件系统本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。
根据我们对业务系统的分析,充分满足对系统数据容量的规划,建议配置如下:✓2两台服务器建议选择IBM X3650,每台建议配置如下:✓磁盘阵列建议选择IBM DS3512,建议配置如下:✓双机软件选择RoseHA 一套,配置如下:操作系统要求选择支持大内存和硬盘RAID功能。
两台IBM X3650双机系统为数据库服务器,两台互为备份,这大大提高了系统的可靠性,在任意一台服务器发生故障时整个系统能够继续安全良好的运行。
数据存储方面,根据业务要求,确定了数据集中结构、数据冗余备份写入,服务器通过交换机和DS4200磁盘阵列组网。
为提供存储底层可靠性,我们建议配置1台DS4200阵列柜,阵列各划分划分多外逻辑卷—供不同的应用服务器使用。
数据库文件和控制文件、应用程序文件全部建议放置在磁盘阵列上,在发生双机切换时无需手工同步文件。
2.3 系统方案特点•存储使用阵列,即稳定可靠、绝对数据安全而且成本较低,充分节省用户投资;•服务器、网卡、电源模块等关健设备全部使用冗余设计,无单点故障;•双机软件快速反映,错误检测时间小于10秒,故障切换及恢复时间一般在10-20秒;•双机软件GUI与Server分离,可随时中断GUI而不影响Server的运行;•支持JOB和BRING IN/BRING OUT、在一台SERVER上停止JOB不会导致FAILOVER•在同一块网卡上建立多个活动的IP地址,支持多个JOB的运行•自动切换:当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。
而故障服务器中未受影响的应用不会被切换,既不会受任何影响。
不需要系统管理员干预。
三.附录3.1 RoseHA 双机容错系统RoseHA是利用共享磁盘阵列实现系统高可用性,保证应用系统7*24不间断运行的软件产品。
ROSE HA软件同时安装在两台主机上,用于监视系统的状态,协调两台主机的工作,维护系统的可用性。
它能侦测应用级系统软件、硬件发生的故障,及时地进行错误隔绝、恢复,以最低成本提供用户几乎不停顿的计算机作业环境。
RoseHA 以其稳定、可靠,在windows2000、windows2003、windows2008服务器的容错软件中占有绝对的优势,同时也成为国内绝大多数的磁盘阵列柜厂家的OEM容错软件。
工作模式•主从方式(Active/Standby)主机工作,从机处于监控准备状态。
当主机宕机时,从机接管从机的工作,待主机恢复正常后,按使用者的预定以自动或手动的方式将服务切换到主机上运行。
•双工方式(Active/Active)两台主机同时运行各自的服务工作,且相互监测对方的情况。
当一台主机宕机时,另外一台主机立即接管它的工作,保证工作不间断。
譬如:A机运行ORACLE数据库应用,B机运行IIS网站应用。
特点•自动切换当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。
而故障服务器中未受影响的应用不会被切换,既不会受任何影响。
不需要系统管理员干预。
•支持多条心跳路径可以将网线和RS-232串口线作为在RoseHA软件的心跳路径。
配置多条心跳路径可以避免系统的单点故障。
两台服务器的信息交换可通过:RS232、TCP/IP•自动检测在集群系统的每一台服务器内,RoseHA具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复。
•丰富的附加功能提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),使用者可针对特定的服务编写Agent程序,执行与特定服务相关的状态诊断及错误恢复工作的。
•RoseHA采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时间并防范错误,提供故障警告;•RoseHA可设定故障排除后自动或手动回复(switch back);•RoseHA安装时不需要修改操作系统的核心、更改应用软件,也无需特殊的硬件;•RoseHA提供基于GUI的监控中心,管理员能查看ROSE HA的状态、检查错误信息和警告、修改系统参数及从远程工作站管理ROSE HA系统;•RoseHA支持各种数据库,包括ORACLE、Sybase、Informix、DB2、MySQL等。
Private Net 私用网络两台服务器通过私用网络心跳(HeartBeat)信号,使两台服务器能够相互了解对方的运行情况。
为了避免不必要的失效切换,最好建立两条独立的物理路径作为通讯路径。
•RS-232 Socket Private Net:配置服务器空闲的串口作为一条通讯路径。
•TCP/IP Socket Private Net:两台服务器的网卡用反线(back to back)直接或通过LAN建立一条通讯路径。
如果所有的私用网均失效,服务器仍然可以用公用侦测对方服务器的可用性。
如果对方服务器仍然可用,不触发接管动作;如果对方服务器不可用,立即接管动作。
Public Net 公用网络客户端通过此网络与服务器通信,当两台服务器互为备份。
对于不同的服务,可以用不同的公用网连接到两台服务器。
ROSE HA支持TCP/IP协议,可以在EthernetFastEthernet、FDDI和ATM网上运行。
管理工具•友好、直观、易于操作的GUI界面•有关ROSE HA的配置都可以在GUI中完成,支持动态配置和实时同步•网卡的状态,磁盘的状态都可在GUI中显示出来监控的对象资源•V olume•IP地址•计算机别名•共享文件•NT服务•用户自定义工作原理系统启动后,ROSE HA首先启动HA Manager管理程序,根据高可靠性系统的配置结构初始化,然后启动必要的服务和代理程序来监控和管理系统服务。
HA代理程序用来监控、监测、诊断和管理硬件软件服务。
代理程序检测到该服务器处于活动状态,HA Manager就会认为该服务处于活动状态,HA Manager会定时通知后备服务器上的HA Manager,其每项服务处于正常。
当代理程序检测到某个服务发生故障时,它就通知HA Manager管理程序。
HA软件首先会重新启动该服务多次(可由用户设定)。
如果启动不能成功,该服务会由HA转移到后备服务器上。
HA周期性地检测系统硬件的状态,如果硬件发生故障,HA会把与该硬件相关的服务转移到后备服务器上。
当某项服务发生转移时,HA首先在运行服务器上停止该服务,之后,由备份服务器上的HA在备份服务器上启动该服务。
由于停止和启动该服务需要一定的时间,所以,当服务被切换(转移)时,该服务会有短暂的中断,转移完成后,服务自动恢复正常运行。
考虑到一些数据库系统(如ORACLE、SYBASE、INFORMIX等)以及其他一些应用软件(如Domino Server、WWW Server等),ROSE HA在HA管理模块(HA Manager)的基础上,提供了一系列的Agent软件模块。
Agent为一个软件监视模块,监控数据库服务或其他应用服务的运行。
当运行服务器发生故障时,由Agent向HA主控软件请求,进行相应的处理动作。
总之,ROSE HA软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的运行。
(第二部分)双机热备系统实施方案硬件准备1.安装前检查服务器IBM 3650两台(01号、02号表示),阵列柜1台,双机互联线1根,阵列柜电源线2根,服务器电源线2根,SCSI数据连接线2根。
2.阵列柜安装事项先连接SCSI数据线,一头接阵列柜后方数据接口,一头接服务器上方非集成接口(服务器接口有两个,一个是主板集成,一个是非集成,非集成的在服务器背部上方),再分别将电源线两根接阵列柜后方风扇口一侧,扣好搭扣。
3.网卡连接注意事项双机互联线,一头插在01服务器非集成网卡上,另一头插在02服务器上。
业务用的网线一头插在服务器集成网卡上,另外一头插在交换机上,01、02都是这样安装。
4.开机顺序先开阵列柜,直到看到上面出现英文提示“Startup Completed”后再开服务器01,直到出现登录窗口再开服务器02,到服务器02出现登录窗口后,双机开机过程结束。
关机:先关服务器02,直到电源完全关闭。
再关服务器01,直到电源完全关闭,最后按阵列柜电源开关,则阵列柜关闭。
切记:1.不能双机同时读写文件到阵列柜相同分区,否则可能会造成文件或分区损坏。
2.先保证服务器关机后方可关闭阵列柜,不然会造成阵列柜内数据丢失。
3.一定要配置UPS,严防停电事故发生。
软件使用双机容错的核心是双机热备软件通过互相监控来实现热备的效果。
建议采用的软件是美国ROSE数据公司的ROSE HA。
ROSE HA可及时地进行错误隔绝、恢复,保证服务器在出现意外及有计划的停机情况下均能为客户提供连续有效的服务。
将ROSE HA软件同时安装在两台服务器上,用于监视系统的状态,协调两台服务器的工作,维护系统的可用性。
将软件分别安装在01和02服务器上,并输入正确的授权号。