当前位置:文档之家› 高可用性集群解决方案设计HA

高可用性集群解决方案设计HA

高可用性集群解决方案设计HA
高可用性集群解决方案设计HA

1.业务连续

1.1.共享存储集群

业务系统运营时,服务器、网络、应用等故障将导致业务系统无常对外提供业务,造成业务中断,将会给企业带来无法估量的损失。针对业务系统面临的运营风险,Rose提供了基于共享存储的高可用解决方案,当服务器、网络、应用发生故障时,Rose可以自动快速将业务系统切换到集群备机运行,保证整个业务系统的对外正常服务,为业务系统提供7x24连续运营的强大保障。

1.1.1.适用场景

基于共享磁盘阵列的高可用集群,以保障业务系统连续运营

硬件结构:2台主机、1台磁盘阵列

主机

备机心跳

磁盘阵列

局域网

1.1.

2.案例分析

某证券公司案例

客户需求分析

某证券公司在全国100多个城市和地区共设有40多个分公司、100多个营业部。经营围涵盖:证券经纪,证券投资咨询,与证券交易、证券投资活动有关的财务顾问,证券承销与保荐,证券自营,证券资产管理,融资融券,证券投资基金代销,金融产品代销,为期货公司提供中间介绍业务,证券投资基金托管,股票期权做市。

该证券公司的系统承担着企业的部沟通、关键信息的传达等重要角色,随着企业的业务发展,系统的压力越来越重。由于服务器为单机运行,如果发生意外宕机,将会给企业的日常工作带来不便,甚至

给企业带来重大损失。因此,急需对服务器实现高可用保护,保障服务器的7×24小时连续运营。

解决方案

经过实际的需求调研,结合客户实际应用环境,推荐采用共享存储的热备集群方案。部署热备集群前的单机环境:业务系统,后台数据库为MySQL,操作系统为RedHat6,数据存储于磁盘阵列。

在单机单柜的基础上,增加1台备用主机,即可构建基于共享存储的热备集群。增加1台物理服务器作为服务器的备机,并在备机部署系统,通过Rose共享存储热备集群产品,实现对应用的高可用保护。如主机上运行的系统出现异常故障导致宕机,比如应用服务异常、硬件设备故障,Rose将实时监测该故障,并自动将系统切换至备用主机,以保障系统的连续运营。

客户端

局域网

心跳

电子邮件服务器(主机)电子邮件服务器(备机)

磁盘阵列

系统特点

?业务连续运营

实时监测服务运行状态,如出现软、硬件故障,自动将系统切换至备用主机,以保障系统连续运营。

?容错结构

基于共享存储的热备集群,由2台服务器、1台磁盘阵列构成,服务器、磁盘阵列等硬件设备容错,解决单点故障。

?监控应用和系统资源

实时监测应用服务运行状态,并支持深度监控CPU/存资源使用率,可进行智能预警和策略切换。

?充分利用现有资源

可利用现有软、硬件资源,轻松构建热备集群方案,避免重复投

资。

简化运维

Rose提供友好的图形化界面,用户可以远程管理热备集群,并监管集群工作状态。

提供多种事件告警方式,比如在线状态、在线日志、短信、等,方便用户进行日常管理,从而简化运维工作,降低运维难度。

1.2.数据镜像集群

随着服务器硬件及软件的发展,服务器的性能、部存储容量以及网络传输能力等都有了大幅度地提升,服务器在应对主流业务方面提供了更加强大的能力。传统高可用性系统中必须通过共享存储来实现数据的一致性和连续性,这个特性无形中增加了可用性系统的成本。

Rose基于以太网络TCP/IP协议,通过数据实时镜像技术,在两台主机之间实现不需要共享存储的纯软高可用系统。如此灵活的双机高可用系统配置方式,用户可以在充分利用已有资源的基础上,根据自己的实际硬件环境来选择。

该解决方案采用HA技术对主机的IP、应用程序、数据存取等进行监控和保护。当应用程序或主机发生故障后,Rose将自动、快速

地切换应用到备机,保障应用服务的连续运营。

1.2.1.适用场景

基于主机的数据镜像高可用集群,以保障业务系统连续运营。

硬件结构:2台主机

1.2.2.案例分析

某百货公司是一家联交所主板挂牌上市公司,并控股多家A股上市公司。经过十余年长足发展,该公司年销售额近100亿元,居中国百货零售业前列,目前在全南、西南、华北、华东区域20个城市共拥有40多家门店。

项目背景及需求

该百货公司每个门店销售管理系统均由运行在RedHat 5.4平台上前端管理应用服务和Sybase数据库服务构成,其中Sybase数据库服务作为前端销售管理应用服务的核心后台数据库,无疑是系统中最为重要的一个环节。项目实施前,客户后台Sybase数据库均运行在单机系统上。

项目实施目标:

为该公司旗下所有的门市销售管理系统,提供保障业务连续运营不间断的基础环境,实现各个门市销售管理系统持续不间断运营,为提高各个门市销售效率,同时,减小全公司系统管理人力和财力成本。

解决方案

作为整个方案的重点,门市销售管理系统的核心后台Sybase数据库,需要能够连续不间断运营来确保整个系统的可用性。通过慎重方案筛选及客户现有资源等因素综合考虑,Rose公司推荐其采用基于数据镜像的业务连续性产品,将该公司旗下某市城区的八个客流量较大的商场销售管理系统后台Sybase数据库组成镜像热备方案保护业务连续工作。

总体架构描述

因各商场硬件平台不同,有些商场硬件配置增加1台服务器作为Sybase数据库备机,有些商场利用前端应用服务器作为Sybase数据

库备机,充分运用硬件资源,在软硬件环境准备就绪后,通过Rose 解决方案搭建基于数据镜像的热备集群。

实现过程

以某一个门店为例作详细说明。

正常情况下,2台服务器中的1台服务器作为Sybase主机,通过活动IP对外提供服务,主机产生的数据会直接写入主机的本地磁盘,同时通过Rose解决方案,将实时捕获到的变动数据,通过网络实时传输到备机,从而保证两台服务器数据的一致性。在此基础上,如果主机出现故障(服务器宕机,应用系统故障,网络故障等情况),导致所保护的应用程序无法继续对外提供服务,主机会在保证数据一致性前提下,通过Rose解决方案将Sybase数据库切换到备机运行,继续对外提供服务,确保生产管理系统持续运营工作。

数据复制

心跳局域网

数据库主机数据库备机

系统特点

? 业务连续运营

实时监测Sybase 数据库运行状态,如出现软、硬件故障,自动将数据库服务切换至备用主机,以保障数据库系统的连续运营。

? 数据实时复制

应用在线的数据实时复制,保障主、备机的数据一致性。并支持计划快照任务,可定期为数据创建快照记录,进一步保障数据安全。

? 多种监控方式

实时监测应用服务运行状态,并支持深度监控CPU/存资源使用率,可进行智能预警和策略切换。

?架构灵活

无需磁盘阵列设备,即可构建热备集群,方案架构灵活。可充分利用现有软、硬件资源,轻松构建热备集群方案,避免重复投资。

?简化运维

Rose提供友好的图形化界面,用户可以远程管理热备集群,并监管集群工作状态。

提供多种事件告警方式,比如在线状态、在线日志、短信、等,方便用户进行日常管理,从而简化运维工作,降低运维难度。

2.灾备恢复

2.1.远程容灾

随着IT行业的发展,用户核心系统重要性逐渐凸显,为了应对核心系统的可靠性,用户纷纷开始构建自己的容灾系统,实现核心系统的远程容灾保护。Rose针对用户的需求提供远程容灾方案,一旦生产中心发生灾难事故,可以把核心系统快速转移到容灾系统上继续运营,达到RPO≈0、RTO=分钟级的远程容灾级别。

2.1.1.适用场景

用户根据系统环境、网络环境,结合容灾需求等情况,构建远程容灾方案。在不改变用户现有架构的情况下,适用于本地及远程的应用系统和核心数据的容灾备份场景。

2.1.2.案例分析

客户为华东地区某市的一个天然气供应商,是该市工业园区城市燃气基础设施投资、建设、管理和运营的主体,每天为10多万户家庭和超过1000家企事业单位提供洁净天然气。

项目背景及需求

客户在总部部署有多套业务系统,包括OA、ERP、数据采集SCADA、燃气客户管理系统等,分别部署在多台服务器上,考虑到各种突发事件可能导致的业务中断及数据丢失,客户计划在距离总部10公里地方部署容灾机房,将相关业务系统通过容灾机房服务器保护,达到数

据和应用的冗余保护。

项目实施目标

为企业相关核心系统实现异地的数据+应用容灾保护,在本地机房出现故障时,能够在容灾机房快速启用相关服务,保持业务系统对外连续、稳定运行。

解决方案

推荐采用基于数据容灾的旗舰产品—RoseReplicator,部署企业核心系统的异地数据+应用保护方案。

?总体架构描述

通过和客户沟通,计划在容灾机房通过一台高性能服务器,采用VMware ESXi虚拟化方式,虚拟出多个虚拟机,分别对应多台生产服务器,通RoseReplicator部署多个1to1的数据+应用保护模式来保护不同的应用程序。网络层面,客户在两地通过运营商专网实现100M 带宽通信,确保数据传输稳定性。

?实现过程

以管理系统为例:容灾机房的虚拟机保持和原生产服务器相同操作系统,应用程序和数据库部署方式保持一致,通过RoseReplicator搭建1-1数据保护模式,将管理系统生产服务器的数据实时复制到容灾服务器上,确保两台机器数据一致性。当主服务器出现故障时,可通过备用服务器快速恢复业务系统;当本地机房完

全瘫痪时,可通过容灾机房公网IP将服务映射出去,对外提供服务;当本地服务器恢复后,可通过恢复向导将数据快速恢复至生产服务器,继续通过生产服务器对外提供服务。

?解决方案示意图

?方案效果

核心数据的异地容灾备份

核心应用系统的容灾切换

多种数据删除模式避免误删除

灵活的网络带宽限制策略

远程集中统一管理

方案总结

通过虚拟化平台下搭建容灾方案,为客户节省不少硬件投入,满

足客户数据异地保护需求。

2.2.云容灾

越来越多的用户计划将其业务系统或数据迁移至云。业务和数据迁移至云端,业务系统的运营和数据将完全托管于云服务商,而如何对云端的业务系统和数据进行有效控制和容灾保护,也是用户将业务迁移至云需考虑的一个重要环节。

结合云平台,常见的容灾模式有如下几种:

本地至云

将生产中心的数据和业务实时灾备至云端,如生产中心出现事故,可迅速利用云端的容灾系统及时接管业务。

云至本地

用户将业务迁移至云端,可将云端的业务数据实时灾备至用户本地机房,可有效控制业务和数据安全。

不同区域的云之间

不同区域的云之间,构建数据和业务灾备,最大化保障业务系统和数据的安全。

2.2.1.适用场景

本地至云,云至本地,不同区域的云之间,构建云容灾方案

2.2.2.案例分析

某公司是全球最大的中央处理器散热风扇(CPU Cooler)供应厂商,为高新技术企业。公司主要生产制造散热片(Heat Sink)、风扇(DC Fan)、导热管(Heat Pipe)等。

在工厂生产流水线作业平台信息化建设过程中,需对核心MES业务系统构建容灾保护,以保障MES系统能够抵御灾难事故。容灾方案部署前,MES系统数据库已迁移至微软云,并使用云端高可用技术实现业务系统的连续性保护,、、等分公司均通过VPN网络访问云端数据库。用户希望将微软云端的MES系统数据灾备至自建机房,以加强数

据的管控和构建数据容灾保护。

解决方案

经过调研用户需求,结合现有架构,提供了“公有云至本地机房”的容灾方案。如下图所示,在厂区的自建机房中,部署数据容灾主机。Rose将微软云中MES系统数据实时灾备至容灾主机,如微软云中出现意外风险,用户可利用容灾主机的灾备数据快速恢复MES业务;以尽量降低灾难事故带来的损失。

系统特点

公有云容灾

将公有云端MES系统数据实时灾备至用户自建机房,实现公有云的远程容灾,进一步提升数据灾备级别,并且方便用户对业务数据进

行有效的安全控制。

?实时复制数据

时复制数据,高级别保护数据,提供RPO≈0的数据保护级别。

?网络流量控制

支持计划带宽传输数据,合理分配利用网络传输资源。支持数据压缩传输,降低网络带宽占用。

?信息安全保障

支持数据加密传输,防止数据泄密。

3.其他方案

3.1.虚拟化平台运营

随着虚拟化技术的不断发展和成熟,为了简化系统部署和维护管理,同时节省资源,大量客户的信息系统逐渐迁移到虚拟化平台运行,如VMwarevSphere、MicroSoft Hyper-V等。但由于虚拟化平台本身也存在基础硬件故障、存储故障、网络故障、虚拟化平台本身故障以及虚拟客户机部操作系统以及应用故障等导致业务系统宕机中断访问服务的风险,故在虚拟化平台实现高可用热备集群方案,避免业务因各种因素不可用的需求,是企业和IT管理者在建设IT信息虚拟化建设过程中不可忽视的问题。

在Rose提供的虚拟化高可用集群方案中,可以轻松应对整个系统中软硬件故障带来的中断业务风险,实现业务系统7x24小时不间断运行和提供服务;并且在维护管理层面,Rose解决方案集中化管理功能,为客户节省了大量的维护人力和物力成本投入。

3.1.1.适用场景

兼容各大主流虚拟化平台,构建虚拟化环境的高可用热备集群方案。

3.1.2.案例分析

国某电力集团是国家电力体制改革组建的全国性五家国有独资发电企业集团之一,属于国务院国资委监管的特大型中央企业。在企业不断发展过程中,信息系统高可靠性建设是公司信息化建设的重要容,是提高办公效率、推动打赢提质增效攻坚战、建设世界一流能源

集团可靠办公信息平台的重要步骤。

一直以来公司信息系统建设都是采用物理服务器架构HA高可用热备系统,近年来随着虚拟化技术的发展,实践证实,通过虚拟化技术对服务器的整合,提高了物理服务器的资源利用率,实现了快速部署,无缝迁移,又大大方便了管理,华电信息管理系统逐渐从物理服务器迁移到虚拟化平台,在虚拟化迁移过程中需要着重考虑的是系统高可用性建设以及平滑迁移过渡要求下遇到的挑战。

客户环境

●操作系统:Win08R2、RHEL5/6

●前端应用:ERP 系统、OA系统、档案系统

●后台数据库:Oracle、DB2

●迁移后的虚拟化平台:VMWare

存在的问题

●原有系统不支持虚拟化平台

●原有系统授权方式不适应虚拟化环境

●原有系统切换效率不高

●原有系统配置管理维护复杂

新提出需求:应用系统迁移到虚拟化平台

解决方案

?采用虚拟化集群方案

?采用Ukey集中授权40节点

系统特点

?基于虚拟化的高可用集群

浪潮WIN2K 集群服务解决方案

浪潮WIN2K 集群服务解决方案 集群服务的需求分析 随着Internet服务和电子商务的迅速发展,计算机系统的重要性也日益上升,对服务器可伸缩性和高可用性的要求也变得越来越高。集群技术的出现和发展则很好地解决了这两个问题。群集是由一组独立的计算机组成,这些计算机一起工作以运行一系列共同的应用程序,同时,为用户和应用程序提供单一的系统映射。群集内的计算机物理上通过电缆连接,程序上则通过群集软件连接。这些连接允许计算机使用故障应急与负载平衡功能,而故障应急与负载平衡功能在单机上是不可能实现的。 有网络负载平衡功能的Windows 2000为在分布和负载平衡的方式下建立关键且合乎要求的网站的工作提供了完整的基础结构。与组件服务的分布式应用程序特性和Internet 信息服务的增强可伸缩性相结合,网络负载平衡有助于确保服务能够灵活处理最重的通信负荷,同时,保持对服务器状态的监控,确保系统不停机。 Win2000群集技术具有以下特点: ·可伸缩性:加入更多的处理器或计算机可提高群集的计算能力,一般的桌面机每秒能够处理几千个请求,而传统的IA服务器每秒能够处理几万个请求。那么对于需要每秒处理几十万个请求的企业来说,如果不采用集群技术,唯一的选择就是购买更加高档的中、小型计算机。如果这样做,虽然系统性能提高了十倍,但其购买价格和维护费用就会上升几十倍甚至更多。 ·高度的可用性:群集具有避免单点故障发生的能力。应用程序能够跨计算机进行分配,以实现并行运算与故障恢复,并提供更高的可用性。即便某一台服务器停止运行,一个由进程调用的故障应急程序会自动将该服务器的工作负荷转移至另一台服务器,以保证提供持续不断的服务。 ·易管理性:群集以单一系统映射的形式来面向最终用户、应用程序及网络,同时,也为管理员提供单一的控制点,而这种单一控制点则可能是远程的。 随着计算机应用地位的逐渐提升,系统安全和重要性的日益增加,基于Win2000的负载均衡必将会有着极为广阔的应用前景。 Win2K集群技术 一、集群

高可用性集群解决方案设计HA

1.业务连续 1.1.共享存储集群 业务系统运营时,服务器、网络、应用等故障将导致业务系统无常对外提供业务,造成业务中断,将会给企业带来无法估量的损失。针对业务系统面临的运营风险,Rose提供了基于共享存储的高可用解决方案,当服务器、网络、应用发生故障时,Rose可以自动快速将业务系统切换到集群备机运行,保证整个业务系统的对外正常服务,为业务系统提供7x24连续运营的强大保障。 1.1.1.适用场景 基于共享磁盘阵列的高可用集群,以保障业务系统连续运营 硬件结构:2台主机、1台磁盘阵列

主机 备机心跳 磁盘阵列 局域网 1.1. 2.案例分析 某证券公司案例 客户需求分析 某证券公司在全国100多个城市和地区共设有40多个分公司、100多个营业部。经营围涵盖:证券经纪,证券投资咨询,与证券交易、证券投资活动有关的财务顾问,证券承销与保荐,证券自营,证券资产管理,融资融券,证券投资基金代销,金融产品代销,为期货公司提供中间介绍业务,证券投资基金托管,股票期权做市。 该证券公司的系统承担着企业的部沟通、关键信息的传达等重要角色,随着企业的业务发展,系统的压力越来越重。由于服务器为单机运行,如果发生意外宕机,将会给企业的日常工作带来不便,甚至

给企业带来重大损失。因此,急需对服务器实现高可用保护,保障服务器的7×24小时连续运营。 解决方案 经过实际的需求调研,结合客户实际应用环境,推荐采用共享存储的热备集群方案。部署热备集群前的单机环境:业务系统,后台数据库为MySQL,操作系统为RedHat6,数据存储于磁盘阵列。 在单机单柜的基础上,增加1台备用主机,即可构建基于共享存储的热备集群。增加1台物理服务器作为服务器的备机,并在备机部署系统,通过Rose共享存储热备集群产品,实现对应用的高可用保护。如主机上运行的系统出现异常故障导致宕机,比如应用服务异常、硬件设备故障,Rose将实时监测该故障,并自动将系统切换至备用主机,以保障系统的连续运营。

高可用软件系列方案之二(存储高可用)讲解

高可用方案之二 高可用中的存储容灾方案 北京市科瑞讯科技发展股份有限公司

企业和事业单位的运转越来越依赖于计算机系统,如果一旦这个数据处理中心无法正常运转,就会造成业务停顿,导致不可挽回的损失。 随着信息时代的到来,关键数据的安全、持续可用问题直接关系到企业的生存和发展。用户对于保证数据的安全、持续可用的方案需求也变得多元化、复杂化,单一的解决方案已经逐渐不能满足用户的实际需求。 中金富捷凭借其丰富的研发经验,为您提供高可用性系列产品和优质的服务,推出了中金富捷高可用存储容灾解决方案,目的在于保证数据永不丢失和系统永不停顿,彻底解决传统高可用系统中存储设备单点故障的风险。 而采用中金富捷科技有限公司硬盘虚拟化产品SyMirror,可以最大限度的保护用户的数据信息,将用户的不同的存储设备进行同步复制,同时虚拟存储系统提供用户透明化的存取访问,任何一台存储设备的故障都会在SyMirror软件的检测下迅速切换到备用存储设备继续使用。而故障的存储设备修好后,重新加入SyMirror系统后,SyMirror会自动将增量数据同步到加入的存储设备。 具有国际领先技术的中金富捷SyMirror软件,具有以几个特点: 1、数据实时同步功能,确保两台存储设备的数据在任保时候保持一致。 2、透明化的数据存取功能,任何一台存储设备的损坏都不影响用户使用存储设备。 3、虚拟存储中的任何一个真实的存储设备都可以在任保时候轻松离线工作。 4、智能增量数据实别功能,确保加入虚拟系统中的存储设备进行快速增量同步。 5、存储设备之间的容灾切换时间小于1秒钟,对用户存取数据几乎无任何影响。 6、同PlusWell HA软件系统紧密配合,随动切换。实现真正意义的高可用冗余存储方 案。 北京中金富捷科技有限公司的高可用存储容灾方案结合了PlusWell HA高可用软件的高可用性及PlusWell SyMirror虚拟存储软件的透明化特点,结合二者之优势为客户提供了一套没有单点故障的高可用存储容灾方案。 一:方案特点 1、传统高可用解决方案(双机热备): 主要以一台共享的存储设备提供数据共享存储区域,两台或两台以上的服务器提供主备两种状态,当主机故障时,备机接管主机工作。实现业务的可持续性工作。其工作原理如下:

如何构建高可用性HIS系统方案

构建高可用性HIS 近几年来,我国的HIS系统建设已从单纯的经济管理逐步向以病人为中心的临床应用发展,如联机检验数据采集、PACS系统以及电子病历等等,使医院对HIS系统的依赖程度越来越高,这就要求HIS系统需要达到7X24小时永不间断地高效可靠运行,计算机集群系统能够较好地满足这一要求。 1集群系统及其基本架构 1.1 集群的概念 集群就是把多个独立的计算机连接在一起,面对客户机作为一个虚拟整体,使整个系统能够提供更大的可用性、更好的可伸缩性和更强的容灾能力。 1.2 集群系统的基本构成 一个集群系统通常由多个服务器(或称为节点)、共享存储子系统和使节点可以进行信息传递的内部节点连接构成。图1为两节点集群的基本架构。 每个集群节点具有两类资源:非共享资源和共享资源。非共享资源包括安装网络操作系统的本地硬盘、系统页面文件(虚拟内存)。本地安装的应用程序,以及特定节点访问的各种文件。共享资源包括存储在共享设备中的文件,每个集群节点使用共享存储系统访问集群的quorum资源和应用程序数据库等。 1.3 集群系统中的几个重要组件 ①后台共享存储设备:所有的节点都必须与至少一个集群系统的共享存储设备相连。共享存储设备将存储集群本身的系统数据及应用程序所产生的数据。 ②集群内部网络通讯:这个网络提供信息传递的服务,被称为心跳网络,它用来传递各个节点的状态。内部连接可采用高带宽的通讯机制(例如千兆以太网),以确保集群中的节点可以快速交换信息和同步数据。 ③公共网络:为客户端提供访问服务的网络,这个网络为其它的应用服务提供必要的网络通讯基础。 ④虚拟的前台界面:所有的节点被合为一组,有一个虚拟的服务器名称,为了管理集群系统,也需要为集群提供一个名称。应用程序在集群环境下运行的时候,也需要创建自己的虚拟服务器名称,便于客户端的访问。 1.4 集群中节点的运行模式 在集群中节点可以有几种运行模式,取决于实际应用环境。 ①Active/passive模式。在两个节点集群环境中,其中一个集群节点处理所有集群应用请求而另外一个节点则只简单地等待那个起作用的节点失效。这种Active/passive集群方式从性能价格比方面来讲并不合算,因为其中一个服务器在大多数时间处于空闲状态。但在失效时应用可以完全使用另一个服务器的处理能力,所以这种配置比较适用于一些关键业务环境。 ②Active/active模式。在集群中每一个节点都作为一个虚拟的服务器,当一个应用运行在节点A时,节点B不需要处于空闲状态以等待节点A的失效,节点B可以在为节点A的资源提供失效恢复能力的同时运行它自己的集群相关应用。由于这种模式各个系统都是独立运行,因此在资源的应用上其效率要更高一些。但一个Active/active方式的节点必须具备相应的能够处理两个节点上的负载的能力(在发生失效恢复事件时),否则接管了失效节点的服务也会很快因不堪重负而垮掉。 ③3-active/passive模式。Microsoft Windows 2000 Datacenter Server支持这种配置方式,由三个服务器共同作为一个虚拟服务器运行,第四个服务器作为备份服务器,当虚拟服务器中任何一个服务器出现故障,备份服务器接管其原有的应用和资源。这种集群环境提供更强大的处理能力,适用于更高的企业用户需求,能够满足更多的客户访问。

Linux下的高可用性方案研究

Linux下的高可用性方案研究 保证持续稳定的系统运行时间变得越来越重要,而传统意义上的小型机系统让普通用户望而却步。用户需要的是更高的可用性以及更低的成本。高可用性(HA)技术能自动检测服务器节点和服务进程错误、失效,并且当发生这种情况时能够自动适当地重新配置系统,使得集群中的其他节点能够自动承担这些服务,以实现服务不中断。 Cluster应用可分为三方面:High-Availability(HA)(高可用性集群)、Load Balance(负载均衡集群)、Scientific(科学集群)。在集群的这三种基本类型之间,经常会发生混合与交杂。于是,可以发现高可用性集群也可以在其节点之间均衡用户负载,同时仍试图维持高可用性程度。同样,可以从要编入应用程序的集群中找到一个并行群集,它可以在节点之间执行负载均衡。而本文则侧重于介绍基于Linux的HA解决方案方面的问题。 基于LVS的HA方案 Linux要进入高端市场就必须在这方面有相应的措施,所以许多公司都在这方面加大了研究力度。现在,我们可以使用一些现存的软件去构筑具有高可用性的LVS系统。下面列出两种方案,以供参考。 [方案一]mon+heartbeat+ fake+coda 我们可以使用“mon”、“heart beat”、“fake”和“coda”四个软件来构筑具有高可用性的Virtual Server(虚拟服务器)。“mon”是一个大众化的资源管理系统,用来监控网络上的服务器节点和网络服务。“heartbeat”实现在两台计算机间通过在串行线上使用UDP协议传送“心跳信息”。“Fake”是一个使用ARP欺骗的方法来实现IP接管。 当服务器故障时,处理过程如下:“mon”进程运行在负载均衡器上,负责监测整个集群的服务器节点和服务进程。在配置文件“fping.monitor”中写入要检测服务器节点,然后“mon”进程将会隔t秒检查一下相应的服务器节点是否还活着。 另外相关的服务监视器也要做相应的配置,这样“mon”进程将每m秒检测一下所有节点的相应服务进程。例如:http.monitor:用于配置监控http服务;ftp.monitor:用于配置监控FTP服务;以此类推。当配置完成后,某个服务器节点失效或重新生效、服务进程失效或重新生效时都会发送一个通告信息,因此,负载均衡器能够知道服务器节点是否能接受服务。 现在,负载均衡器成为了整个系统的单点失效。为了防止这一现象,我们必须安装一个负载均衡器的备份服务器。“fake”软件实现当负载均衡器失效时,备份服务器自动接管IP地址,并继续服务。而“heartbeat”则随时根据负载均衡器的状态自动激活/关闭备份服务器上的“fake”进程。在负载均衡器和备份服务器上都运行着一个“heartbeat”进程,它们通过串行线周期性地发送“I'm alive ”消息。如果备份服务器在一个预定时间内接收不到来自负载均衡器的“I'm alive”信息时,将自动激活“fake”进程接管负载均衡器的IP地址,并开始提供负载均衡服务;而当再次收到来自负载均衡器的“I'm alive ”消息时,备份服务器将自动将“fake”进程关闭,释放出它接管的服务器,负载均衡器重新开始工作。

存储高可用解决方案

方 案 建 议 书 (XXX容灾方案建议)

目录 第1章XXXX容灾方案参考 (1) 1.1 系统现状 (1) 1.2 容灾需求分析 (1) 1.3 容灾参考方案 (2) 1.3.1 总体架构规划 (2) 1.3.2 V7000 外部存储虚拟化功能说明 (2) 1.3.3 V7000 VDM(虚拟磁盘镜像)功能说明 (3) 1.3.4 后期存储扩展建议 (4) 1.4 系统配置参考 (4) 第2章V7000存储设备介绍 (6) 2.1 IBM V7000存储系统概述 (6) 2.2 通过IBM S YSTEM S TORAGE E ASY T IER增强访问能力 (6) 2.3 通过精简调配来优化效率 (7) 2.4 动态迁移避免系统中断运行 (7) 2.5 通过复制服务来保护数据 (8) 2.6 管理工具与IBM S YSTEMS D IRECTOR相集成 (9) 2.7 高性能SSD支持 (10) 2.8 外部存储系统虚拟化 (10) 第3章存储高可用技术建议 (11) 3.1 存储高可用性的内容 (11) 3.2 存储高可用性方案的主要实现方式 (13) 3.2.1 方式一:磁盘设备间数据镜像( 如LVM Mirror ) (14) 3.2.2 方式二:磁盘设备间数据复制(如PPRC或ERM) (18) 3.2.3 方式三:采用SVC或V7000或V7000实现逻辑卷镜像 (20) 3.2.4 三种HA方式的比较 (21)

第1章XXXX容灾方案参考 1.1系统现状 XXXX现有IT系统的现状大致如下图所示。采用IBM P550服务器作为数据库服务器,采用DS3400存储设备作为主存储系统。 1.2容灾需求分析 当前,XXXX计划在同一园区内建设容灾系统,在容灾中心和主生产中心之间采用2km长的裸光纤进行直连。并且,希望对现有的存储设备进行充分利旧。 IBM将针对当前所了解的情况,做出初步的方案,供XXXX容灾建设参考。 由于DS3400设备没有自身的基于磁盘的远程复制功能,因此无法采用基于存储底层的磁盘复制技术。此外,由于DS3400的性能有限,且缓存较低,因此采用基于AIX操作系统的LVM镜像方式性能会有影响。(各种高可用技术,详见第3章的说明) 而目前IBM最新的虚拟化存储设备V7000,即可以支持外部存储的接入,也可以支持内部存储和外部存储之间的镜像,因此可以通过V7000存储设备来实现存储的高可用,并达到同园区内容灾的目的。

M集群通信解决方案

现状分析 我国公安集群无线通信系统所采用的通信体制是集群信令系统和在“集群脑系统接口性能规范”基础上制定的编号制式。 模拟集群系统是最早引入我国的集群系统。首先,系统内部没有制定互联的标准,造成各厂商之间无法互联互通,甚至在同一省市由于存在不同厂商的模拟系统,同一地市的公安部门都无法互联互通,全国公安联网更是天方夜谭,根本无法实现;其次,由于固有的技术缺陷,移动终端无法越区切换,移动终端从某一基站覆盖范围移动到另一基站覆盖范围是通信将中断,给实际工作带来诸多不便;第三,由于数据功能和数据接口没有定义,除语音调度外,系统更多功能无法实现,单纯的对讲功能已不能满足用户的需要;第四,模拟系统专网建设需要投入较高的建设成本,每年还要投入大量的人力和资金进行维护,这不是一般的用户能够承受的;第五,随着数字移动通信技术的飞速发展以及国家加强对无线频点的管制,用户很难再申请到新频点,模拟运营面临停牌,模拟集群网已趋向淘汰。 需求说明 随着社会经济的不断发展,日常公共安全管理、重大活动勤务保障和反恐处突的需求非常迫切,公安机关对无线通信的需求不断增长,现有频率资源十分紧张,频率干扰日益严重,缺乏通信安全手段,现有模拟系统无法支持大容量数据业务(大容量的

定位等),公安无线通信难以满足同一指挥、反应快速、协调有序、安全准确、运转高效、可靠地进行通信联络和信息传输。系统在满足公安需求的前提下存在以下亟待解决的问题: ◆频率资源不足 现有模拟通信频率带宽为,可用于公安集群通信的频点仅为对,难于建设更多集群基站和信道,无法增加覆盖范围和移动用户,已经严重制约了无线通信系统的发展。 ◆信号干扰日益严重 城市无线电波传输环境越来越恶劣,对现有公安无线通信带来了直接的影响。另外,由于在部分省市公安的市区采用了模拟集群同播、模拟常规等同播系统,造成重叠区同频信号干扰严重,这不但直接影响了警务活动的效率,更可能在关键时刻造成不可挽回的损失。 ◆通信保密性差 社会治安形式日益复杂,突发事件日益增多,公安反恐维稳任务日益加重,通信安全的保障是公安机关有力打击犯罪的根本举措。现在的模拟通信通过简单的频谱扫描就可以获取通信信息,这给公安机关的通信留下巨大的隐患,对重大警务活动的安全性带来危害。 ◆系统业务扩展性差 现有模拟集群系统无法支持较大容量数据业务,除语音调度外,数据功能和数据接口没有定义,使得系统功能过于单一。如:

技术方案-应用高可用解决方案(两地三中心)

英方软件数据库系统高可用解决方案 英方软件(上海)有限公司

目录 1. 概述 (1) 2. 需求分析 (2) 3.1主机配置 (3) 3.2方案拓扑图: (3) 3.3 I2高可用方案功能介绍 (4) 3.4管理控制台 (7) 5. I2的主要优势 (10) 6. 典型案例 (12) 7.公司简介 (13)

1. 概述 现代大型企业大多拥有为数众多的服务器,提供Internet与Intranet使用者各种不同的服务。如数据库系统、影像系统、录音系统、Email系统等。保持业务的持续性是当今企业用户进行数据存储需要考虑的一个重要方面。系统故障的出现,可能导致生产停顿,客户满意度降低,甚至失去客户,企业的竞争力也大打折扣。因此,保持业务的持续性是用户在选择计算机系统的重要指标。究其根本,保护业务持续性的重要手段就是提高计算机系统的高可靠性同时将数据的损失降至最低限度。 关键数据和数据库的备份操作已经成为日常运行处理的一个组成部分,以确保出现问题时及时恢复重要数据。传统的解决方案,类似于磁带机备份存在较大的缺点. 通常数据采用磁带离线备份,当数据量较大或突发灾难发生时,备份磁带无法真正及时快速恢复数据及业务。 提供有效的数据保护和高可用性服务,又在合理预算范围之内,并且能够基于你现有环境当中,获得实时数据保护,并无距离限制,为确保你重要数据的保护----包含数据库和邮件系统。I2为您提供了完美的解决方案。 I2 采用先进的异步实时数据复制技术(Asychronous Real-Time Data Replication),立即将所有服务器上对于磁盘系统的变更透过网络传输至备援服务器,而非整个档案或磁盘的镜设(Mirror),因此对于服务器的效能与网络带宽的影响都能降至最低,并能将成本降至最低,做到真正的实时数据保护. 业务数据是用户最宝贵的资产之一,数据的损失就是企业资产利润的损失,所以保护业务数据是企业计算系统的主要功能之一。实施I2的备份方案可以将用户数据的损失降至最低甚至为零。

双机双柜高可用解决方案

双机双柜高可用解决方案 关键字:双机双柜 传统的基于共享存储的双机热备方案解决了用户业务连续性的问题,当主服务器故障时,备机能及时接管保证业务7*24小时连续运行。但共享的存储设备却成为了系统的单一故障点,当盘阵不可用时,整个业务系统也必然停顿。 为了解决共享盘阵单点故障可能导致的系统不可用问题,Rose提出了相应的解决方案。仅需在现有架构基础上增加一台冗余的磁盘阵列,即构成双机双盘柜的解决方案,既消除了存储的单点故障,又使得客户拥有冗余的数据副本,大大提升了数据和业务的可靠性。 双机双柜高可用解决方案一:镜像方式 如上图所示,主、备服务器上均挂载一个磁盘阵列,部署Rose的双机双柜解决方案,通过Rose双机镜像软件利用TCP/IP网络实现主备机存储设备上的数据实时同步,当主机遭遇存储设备故障时,由于备机上有一份完全一致的数据,则可以利用备机上的数据将应用正常启动并恢复生产。 解决方案优点: ●数据存储在两台磁盘阵列上,数据冗余备份,避免磁盘单点故障 ●基于镜像技术的实施复制,保证数据的一致性

●Rose的高可用技术,保证业务连续性 ●提升高可用容灾距离 双机双柜高可用解决方案二:LAN-FREE方式 该方案中服务器、交换机、存储设备均有冗余设计,磁盘阵列A 和磁盘阵列B 分别接入不同的光纤存储交换机,服务器A 和服务器B 分别接入不同的光纤存储交换机;这种部署结构,实现了硬件设备和存储通道的完全冗余。 利用盘阵的多路径管理软件将冗余路径映射的磁盘还原为实际磁盘,通过操作系统的磁盘管理工具将不同盘阵映射的磁盘创建为RAID 1镜像卷。分别在服务器上部署需保护的应用,并将应用数据存放至不同盘阵构成的镜像卷中,实现对业务系统的高可用保护;通过系统的软RAID技术及光纤存储网络实现两台磁盘阵列中的数据同步。 冗余的存储路径设计,有效避免了存储HBA卡、光纤存储交换机、磁盘阵列、存储通道的单点故障,完全冗余的双机双柜结构保证了业务系统的连续运营和业务系统的数据安全,方案稳定性及可靠性得到保障。 解决方案优点: ●完全冗余结构,有效避免硬件设备和软件的单点故障。彻底解决了传统双机单柜模式下,磁盘阵列单点故障的情况。 ●数据的存储架构为FC-SAN,通过存储多路径管理软件实现存储通道的负载冗余,提升了业务系统数据存储的可靠性、高效性、安全性,并且基于FC-SAN 的架构具有高可扩展性。 ●高性价比的整体解决方案,既帮助用户实现了高容错,高安全,高性能的解

高可用系统部署方案

高可用性系统部署方案 2010年2月5日 1.1 概述 1.1.1 前言 在金融工程系统应用中,对服务器的安全性、可靠性要求较高,在服务器故障情况下,要求尽可能短的时间内恢复运行,并且能对故障发生时的数据进行恢复和处理,而能否实现这一功能是一个系统是否达到高可用性的主要指标。

高可用性可体现于应用系统和数据库存储两部分,应用系统部分重点是主备机达到故障自动切换,而数据存储部分注重数据的完整性、安全性和故障转移。 1.1.2 目前情况 股指套利、算法交易、交易网关等系统在使用上需要作整个架构部署的高可用性考虑,但目前只是部分或没有作整个系统的高可用性方案及实现。 1.1.3 参考文档 附件:SQL2005数据镜像方案测试报告_20100204.doc 1.2 高可用性需求 即要实现高可用性,又要控制成本投入,实施部署也要可操作性强是这次方案的主要目标,基于此目标,本方案对成本很高的共享磁盘阵列的故障转移群集和第三方商业故障系统不作为实现技术方案。 本方案解决的高可用性需求如下: 1、应用主服务器故障发生时,连接能够短时间内自动连接到备机继续工作。 2、数据库主服务器发生时,备机上要有完整的数据,并且连接到主数据库的连 接会话能很快的重新连接到备机上继续工作 3、应用系统和数据库的服务器均能达到自动故障切换转移,以达到快速故障恢 复的目的。 4、服务器数量尽可能少,成本投入不能太高。 1.3 解决方案 出于安全和可靠性考虑,建议数据库和应用系统部署在不同的服务器上,以减少性能上的彼此影响。以算法交易服务应用为例,在母单下得较多的时候会出现系统CPU和内存上的较大消耗,如果再加上数据库的占用资源,很容易出现系统负载过重,故在方案中将应用系统与数据库分布在不同服务器,便于管理及提高整体性能。

无线数字数集群系统具体实施方案模板.doc

天一阁·月湖景区无线集群通信指挥系统 (设计方案) 浙江宝兴智慧城市建设有限公司 二○一七年七月

目录 1 项目概述 .................................................... 错误 ! 未定义书签。 通信现状 . ............................................ 错误 ! 未定义书签。 集群通信必要性 . ...................................... 错误 ! 未定义书签。 信道利用率高 . .................................... 错误 ! 未定义书签。 业务功能丰富 . .................................... 错误 ! 未定义书签。 系统建成后可实现的功能 . .............................. 错误 ! 未定义书签。 数字集群系统的先进性 . ............................ 错误 ! 未定义书签。 2 项目总体设计方案 ............................................. 错误 ! 未定义书签。 设计目标 . ............................................ 错误 ! 未定义书签。 系统组网方案 . ........................................ 错误 ! 未定义书签。 基站建设 . ........................................ 错误 ! 未定义书签。 站点容量计算 . .................................... 错误 ! 未定义书签。 站点部署示意图 . .................................. 错误 ! 未定义书签。 系统规划 . ........................................ 错误 ! 未定义书签。 系统特点及功能介绍 . .................................. 错误 ! 未定义书签。 基本业务功能 . .................................... 错误 ! 未定义书签。 移动性管理 . .............................. 错误 ! 未定义书签。 安全功能 . ................................ 错误 ! 未定义书签。 基本话音业务 . ............................ 错误 ! 未定义书签。 基本数据业务 . ............................ 错误 ! 未定义书签。 有线调度功能 . .................................... 错误 ! 未定义书签。 语音调度功能 . ............................ 错误 ! 未定义书签。 基本业务功能 ......................... 错误 ! 未定义书签。 多选呼叫 . ............................ 错误 ! 未定义书签。 用户监听 . ............................ 错误 ! 未定义书签。 强插 / 强拆 . ........................... 错误 ! 未定义书签。 遥晕 / 复活 . ........................... 错误 ! 未定义书签。 在线检测 . ............................ 错误 ! 未定义书签。 呼叫提醒 . ............................ 错误 ! 未定义书签。 会议 . ................................ 错误 ! 未定义书签。 遥毙 . ................................ 错误 ! 未定义书签。 短信管理 . ................................ 错误 ! 未定义书签。 紧急告警 . ................................ 错误 ! 未定义书签。 录音回放 . ................................ 错误 ! 未定义书签。 报表查询 . ................................ 错误 ! 未定义书签。 数字系统网管系统 . ................................ 错误 ! 未定义书签。 3 系统设备介绍 ................................................ 错误 ! 未定义书签。 单基站示意图 . ........................................ 错误 ! 未定义书签。 信道机 . .............................................. 错误 ! 未定义书签。 产品描述 . ........................................ 错误 ! 未定义书签。 技术规格 . ........................................ 错误 ! 未定义书签。 合路器 . .............................................. 错误 ! 未定义书签。 分路器 . .............................................. 错误 ! 未定义书签。 双工器 . .............................................. 错误 ! 未定义书签。 室外全向天线 . ........................................ 错误 ! 未定义书签。 手持终端 PD680 ....................................... 错误 ! 未定义书签。

高可用解决方案

高可用解决方案 数据中心高可用网络系统设计 数据中心的故障类型众多,但故障所导致的结果却大同小异。即数据中心中的设备、链路或server发生故障,无法对外提供正常服务。缓解这些问题最简单的方式就是冗余设计,可以通过对设备、链路、Server提供备份,从而将故障对用户业务的影响降低到最小。 但是,一味的增加冗余设计是否就可以达到缓解故障影响的目的?有人可能会将网络可用性与冗余性等同起来。事实上,冗余性只是整个可用性架构中的一个方面。一味的强调冗余性有可能会降低可用性,减小冗余所带来的优点,因为冗余性在带来好处的同时也会带来一些如下缺点: w 网络复杂度增加 w 网络支撑负担加重 w 配置和管理难度增加 因此,数据中心的高可用设计是一个综合的概念。在选用高可靠设备组件、提高网络的冗余性的同时,还需要加强网络构架及协议部署的优化,从而实现真正的高可用。设计一个高可用的数据中心网络,可参考类似OSI七层模型,在各个层面保证高可用,最终实现数据中心基础网络系统的高可用,如图1所示。 网络架构高可用设计 企业在进行数据中心架构规划设计时,一般需要按照模块化、层次化原则进行,避免在后续规模越来越大的情况再进行大规模的整改,造成时间与投资浪费。 模块化设计

模块化设计是指在对一定范围内的不同功能或相同功能不同性能、不同规格的应用进行功能分析的基础上,划分并设计出一系列功能模块,模块之间松耦合,力求在满足业务应用要求的基础上使网络稳定可靠、易于扩展、结构简单、易于维护。 层次化设计 包括网络架构分层和应用系统分层两个方面。在当前网络及安全设备虚拟化不断完善的情况下,应用系统分层可完全通过设备配置来实现逻辑分层,不影响网络的物理拓扑。对于网络架构层次化设计,选择三层架构还是二层架构是不少企业进行数据中心网络建设时面临的难题。 从可靠性的角度来看,三层架构和二层架构均可以实现数据中心网络的高可用。近年来随着云计算的逐渐兴起,二层扁平化网络架构更适合云计算网络模型,可以满足大规模服务器虚拟化集群、虚拟机灵活迁移的部署。二层架构和三层架构两者之间没有绝对的优劣之分,企业用户可根据自身的业务特点进行选择。也可以先二层,后续针对某些特定的功能分区采用三层组网。 设备层高可用设计 设备可靠是系统可靠的最基本保证,数据中心核心交换区设备的可靠稳定尤为重要。尽管可以通过架构、策略、配置等的调整和优化等多种手段降低核心设备的故障几率以及影响范围,但若要解决最根本的设备本身的软硬件故障,则必须选用数据中心级的网络设备。 关于数据中心级设备,业界还没有标准的定义,但从目前主流网络设备供应商提供的数据中心解决方案产品可以看出,数据中心级交换机应具备以下特征: 1) 控制平面与转发平面物理分离 控制平面与转发平面硬件物理分离,引擎切换时不影响转发,可实现零丢包。同时控制平面与转发平面均提供独立的冗余架构,实现控制与转发两级冗余,保证更高的可靠性。 2)关键部件更强的冗余能力 除了引擎和交换网板的冗余外,此类设备的电源一般均可以配置多块,实现N+M的冗余,保证电源的可靠性更高;另外风扇的冗余也由原来的风扇级冗余,提高到了风扇框冗余,每个独立的风扇框内多个风扇冗余。 3)虚拟化能力 数据中心的复杂度越来越高,需要管理的设备也越来越多,设备的虚拟化可将同一层面(核心、汇聚、接入)的多台设备虚拟化为一台,进行设备的横向整合,简化设备的配置和管理。 4)突发大流量的缓冲能力

核心系统高可用性设计

关于系统稳定性策略的探讨 1.前言 系统作为业务系统的核心,其运行稳定性和高可用性至关重要。因此,需要通过高可用性设计来尽量减少系统的计划内和计划外停机,并在系统出现故障时及时响应、快速恢复,以保障关键数据和业务系统的运行稳定性和可持续访问性。其中: 1.计划内停机是指管理员有组织、有计划安排的停机,比如升级硬件微码、升 级软件版本、调整数据库库表、更换硬件设备、测试系统新功能等时,可能需要的停止系统运行。 2.计划外停机是指非人为安排的、意外的停机,比如当硬件出现重大故障、应 用程序停止运行、机房环境遭到灾难性的破坏时所引起的业务系统停止运行。 目前,对于计划内和计划外停机,可通过消除系统中的单点失效来尽量减少停机时间。同时,通过采用可在线维护(固件升级、在线扩充、故障部件更换)的设备,并通过负载均衡机制实现应用系统的在线升级、维护,将有效消除计划内停机对业务系统的影响。此外,由于系统中采用了全面的负载均衡设计,并针对系统失效提供了可靠的数据备份恢复和多点容灾保护,因而能够有效减少系统计划外停机的恢复时间。 在造成系统宕机的原因方面,有统计中表明并非都是硬件问题。其中,硬件问题只占40%,软件问题占30%,人为因素占20%,环境因素占10%。因此,高可用性设计应尽可能地考虑到上述所有因素。对于系统而言,其整体的可用性将取决于内部的应用系统、主机、数据库等多种因素;同时,训练有素的系统维护人员和良好的服务保障也是确保系统稳定运行和故障快速恢复的关键。 2.应用系统 系统在应用软件架构设计中应从渠道层、渠道管理层、业务处理层等不同

层面通过多种措施和策略的综合设计来提高应用系统的高可用性和稳定性。 在渠道管理层和业务处理层的设计中,要考虑设置应用负载均衡、应用软件失效备援、vip服务通道、流量控制、故障隔离等机制。 1.应用负载均衡 应用软件负载均衡通过多个层次上不同的负载均衡策略一起实现整体的负载均衡,应用负载均衡的设计思路是将大量的并发访问或数据流量分担到多台节点设备上分别处理和将单个重负载的运算分担到多台节点设备上做并行处理来达到负载均衡的效果,从而提高服务响应速度,提高服务器及其他资源的利用效率,避免服务请求集中于单一节点导致拥塞。 2.应用软件失效备援 应用软件构建在面向服务的架构、设计思想上,应用服务具有较高的可灵活部署性。通过这种灵活性,结合系统基础设施的规划、部署可以实现应用软件的失效备援。系统可以考虑实现基于应用服务和基于应用服务管理框架的多种应用软件失效备援机制。 基于应用服务的失效备援是在应用服务管理框架中可以实现应用服务的冗余部署,利用硬件负载均衡设备或应用软件负载均衡可以在需要时将服务请求切换到相应的冗余服务。 基于应用服务管理框架的失效备是将应用服务框架在系统中冗余部署,利用硬件负载均衡设备或应用软件负载均衡可以在需要时将服务请求切换到相应的冗余的应用服务管理框架。 3.vip服务通道 在系统中,从系统运行稳定性、持续性及处理性能的角度,配合物理设备、系统支撑软件(数据库系统、操作系统)的相关措施,应用软件可通过构建VIP服务通道的方式降低应用服务运行期间的相互影响。服务通道可以基于不同业务产品或不同应用服务管理框架的不同粒度来设置,从而满足部分应用处理资源只响应特定的服务请求或不同的服务监听响应不同的通道传递过来的服务申请的功能。 4.流量控制 在系统中,从系统运行稳定性、持续性角度,配合物理设备、系统支撑软

MSSQL数据库高可用性方案

高可用MS SQL Server数据库解决方案 建设目标 减少硬件或软件故障造成的影响,保持业务连续性,从而将用户可以察觉到的停机时间减至最小,确保数据库服务7*24小时(RTO为99.9%)运转,建设一套完整的高可用性MS SQL Server数据库系统。 需求分析 服务器宕机造成的影响 服务器宕机时间使得丢失客户收益并降低员工生产效率,为了避免对业务造成影响,从两个方面采取预防措施: 一、计划宕机时的可用性: ●补丁或补丁包安装 ●软硬件升级 ●更改系统配置 ●数据库维护 ●应用程序升级 二、防止非计划性宕机: ●人为错误导致的失败 ●站点灾难 ●硬件故障

●数据损毁 ●软件故障 现有状况 ●服务器存在单点故障; ●数据库未做高可用性配置; ●数据库版本为MS SQL Server2008; ●服务器配置为CPU E7540 2.0,24G存; ●数据库容量约800G 技术解决方案 解决思路 考虑到本项目的需求和最佳性能,为了达到最佳可用性,方案采用两台数据库服务器做故障转移集群,连接同一台存储做数据库的共享存储,实现故障自动转移。同时,将旧服务器作为镜像数据库,采用SQL Server 2012的alwayson 功能来再次完成自动故障转移,并可以分担查询的负载。

架构拓扑 新数据库:承担数据库主体计算功能,用于生产数据,采用双机集群,实现自动故障转移。 旧数据库:通过镜像功能,存储数据库副本,用于发生故障时的转移。也可配置为只读,承担备份的负载。 存储:存储采用双控制器,双FC连接两台服务器,避免单点故障。 主/辅域控制器:采用双机模式,SQL Server 2012 实现高可用的必备基础设施。 高可靠性技术方案 SQL Server的企业版支持所有的高可用性功能,这些功能包括:

数据库负载均衡解决方案

双节点数据库负载均衡解决方案 问题的提出? 在SQL Server数据库平台上,企业的数据库系统存在的形式主要有单机模式和集群模式(为了保证数据库的可用性或实现备份)如:失败转移集群(MSCS)、镜像(Mirror)、第三方的高可用(HA)集群或备份软件等。伴随着企业的发展,企业的数据量和访问量也会迅猛增加,此时数据库就会面临很大的负载和压力,意味着数据库会成为整个信息系统的瓶颈。这些“集群”技术能解决这类问题吗?SQL Server数据库上传统的集群技术 Microsoft Cluster Server(MSCS) 相对于单点来说Microsoft Cluster Server(MSCS)是一个可以提升可用性的技术,属于高可用集群,Microsoft称之为失败转移集群。 MSCS 从硬件连接上看,很像Oracle的RAC,两个节点,通过网络连接,共享磁盘;事实上SQL Server 数据库只运行在一个节点上,当出现故障时,另一个节点只是作为这个节点的备份; 因为始终只有一个节点在运行,在性能上也得不到提升,系统也就不具备扩展的能力。当现有的服务器不能满足应用的负载时只能更换更高配置的服务器。 Mirror 镜像是SQL Server 2005中的一个主要特点,目的是为了提高可用性,和MSCS相比,用户实现数据库的高可用更容易了,不需要共享磁盘柜,也不受地域的限制。共设了三个服务器,第一是工作数据库(Principal Datebase),第二个是镜像数据库(Mirror),第三个是监视服务器(Witness Server,在可用性方面有了一些保证,但仍然是单服务器工作;在扩展和性能的提升上依旧没有什么帮助。

存储高可用解决方案

目录 第1章存储高可用性给业务连续运营提供保障 (1)

1.1为什么要构建存储高可用性解决方案 (1) 1.2存储高可用性解决方案简述 (2) 1.3存储高可用性解决方案价值 (2) 第2章IBM存储高可用性解决方案介绍 (3) 2.1存储高可用性的内容 (3) 2.2存储高可用性方案的主要实现方式 (4) 第3章IBM高可用性存储产品介绍 (11) 3.1 IBM SYSTEM STORGE DS8000 TURBO系列存储产品 (11) 3.2 IBM SYSTEM STORAGE DS5000系列存储产品 (17) 3.3 IBM SYSTEM STORAGE DS4000系列存储产品 (20) 第4章为什么选择IBM (22) 第5章IBM中国公司简介 (23) 第1章存储高可用性给业务连续运营提供保障 1.1 为什么要构建存储高可用性解决方案 随着社会的发展和科技的进步,企业越来越依赖于数据处理来进行业务运营,对IT 系统的依赖性也随之增加。一旦数据由于某种原因丢失,就有可能造成整个组织在运营上的重大不便和经济损失,企业的信誉也将受到影响。如果核心数据丢失,严重时完全有可能造成整个企业的瘫痪。所以

保证企业的业务连续运营及数据处理的高可靠性和高可用性,就成为所有IT 人员在建设IT 基础架构中首先要考虑的问题。 显然,企业所面临的风险和挑战来自多方面: ?无法预知的IT 硬件设备的损坏、断电、火灾、自然灾害、恐怖袭击等,造成数据丢失或业务的突然中断; ?系统人员误操作造成意外宕机或关键数据丢失,无法避免; ?手段频多的黑客攻击、病毒入侵、垃圾邮件、网络与系统的漏洞,造成网络瘫痪、系统崩溃; ?用户需要实时应用与访问机密、关键数据,向企业的服务提出更高的要求; ?行业与政府的标准与法规的不断变化,进一步增加了企业的压力与成本。 信息是企业的最宝贵的资产之一;集中的数据备份、恢复和管理已经成为企业数据存储管理的重要任务。企业需要的是: ?数据与存储系统的高可用性,保证数据7X24 小时的连续访问; ?将现有的存储技术集成,创造出一种更有效的数据存储管理,实现高效、高可靠性、低成本的数据管理; ?需要一套成熟度高,业内应用广泛的企业级软硬件整体解决方案; ?需要对企业现有的数据库、邮件系统、文件服务器以及各种应用系统进行集中化、自动化的基于策略的保护; ?易于IT部门日常的管理维护,界面友好,可操作性强; ?能够符合企业日后发展需求,对异构平台有很好的支持,可以满足将来远程数据灾备的需求; ?一旦发生灾难(洪水、地震、火灾等),或者人为灾难(用户失误、磁盘失

相关主题
文本预览
相关文档 最新文档