应用级容灾解决方案
- 格式:pptx
- 大小:3.58 MB
- 文档页数:36
Xx项目存放方案介绍目录1.现状综述 (4)2.总体建设方案 (4)2.1.建设原则和策略 (4)2.1.1.建设原则 (4)2.1.2.建设策略 (5)2.2.建设目标 (7)2.2.1.总体目标 (7)2.2.2.分期目标 (7)2.3.建设内容 (7)2.4.总体设计方案 (8)3.容灾的核心技术及选择 (9)3.1.容灾系统衡量指标 (9)3.2.容灾级别 (10)3.3.常见容灾建设模式 (11)3.3.1.同城容灾 (11)3.3.2.异地容灾 (11)3.3.3.两地三中心 (11)3.3.4.双活数据中心 (11)3.4.常用的数据复制技术 (12)3.4.1.基于存储层的容灾复制方案 (13)3.4.2.基于主机数据复制技术的灾备方案 (19)3.4.3.基于数据库的数据复制技术构建灾备方案 (20)3.5.如何选择最优的容灾方案 (28)3.5.1.数据容灾技术选择原理 (28)3.5.2.数据容灾技术选择度量标准 (29)3.6.本项目容灾模式及技术的选择 (29)3.6.1.容灾模式选择 (29)3.6.2.容灾中心选址 (30)3.6.3.数据复制技术的选择 (32)4.推荐方案概述 (33)4.1.技术路线选择 (33)4.2.总体方案架构 (33)4.3.数据库容灾系统设计 (35)4.3.1.Golden Gate技术原理 (36)4.3.2.各委办局和同城容灾中心之间的数据库复制 (37)4.3.3.同城容灾中心和异地容灾中心之间的数据库复制 (40)4.4.非结构化数据容灾系统设计 (40)4.4.1.同城容灾中心和生产中心之间的数据容灾 (41)4.4.2.同城容灾中心和远程容灾中心的数据容灾 (43)4.4.3.应用级容灾几种实现方式 (44)4.5.一体化集中备份系统 (45)4.6.容灾网络建设方案设计 (46)4.6.1.整体容灾网络架构设计 (46)4.6.2.前端服务网络容灾方案 (47)4.6.3.服务器数据网络容灾方案 (49)4.6.4.存储网络容灾方案 (50)4.6.5.本项目建议容灾网络方案 (51)5.本项目灾备系统建设的几点建议 (52)5.1.需要按照灾备要求梳理系统 (52)5.2.解决好数据库系统数据复制 (52)5.3.“现实”的切换策略 (53)6.软硬件设计 (54)6.1.软硬件总体选型原则 (54)6.2.同城容灾中心软硬件设计 (55)6.2.1.一体化备份系统 (55)6.2.2.数据库容灾系统 (56)6.2.3.云计算平台容灾系统 (57)6.2.4.同城数据存储容灾系统 (58)6.2.5.机房改造系统 (58)6.2.6.网络系统 (60)6.2.7.安全系统 (60)6.2.8.详细软硬件配置清单 (60)6.3.远程容灾中心软硬件设计 (63)6.3.1.远程数据备份系统 (63)6.3.2.远程数据库容灾系统 (64)6.3.3.远程云计算平台容灾系统 (65)6.3.4.远程数据存储容灾系统 (66)6.3.5.网络系统 (66)6.3.6.安全系统 (66)6.3.7.详细软硬件配置清单 (66)7.项目组织机构和人员培训 (68)7.1.领导和管理机构 (68)7.2.项目实施机构 (70)7.3.运行维护机构 (70)7.4.技术力量和人员配置 (71)7.5.人员培训方案 (71)8.项目实施进度 (72)8.1.项目建设期 (72)8.2.实施进度计划 (72)8.2.1.同城容灾中心建设计划 (72)8.2.2.异地容灾中心建设计划 (73)9.投资估算 (75)9.1.投资估算的说明 (75)9.2.投资估算 (75)9.3.估算编制依据 (76)9.4.资金来源与落实 (76)9.5.投资估算明细表11.现实状况综述XX市政府网站管理中心自成立之日起, 就根据集中建设标准完成了“XX市电子政务外网统一平台示范工程项目”建设工作, 完成了XX市124家党政部门接入工作, 完成了在全市范围内只铺设一套网络基础设施工作, 实现了市及电子政务外网和省、国家政务外网之间互联互通, 现在共有服务器500多台, 存放40多套, 布署虚拟服务器300多台。
容灾解决方案容灾解决方案引言容灾(Disaster Recovery)是指在不可抗力因素引发的各类灾害中,通过可靠的技术手段,确保系统能够在最短时间内恢复正常运行,提供连续、稳定的服务。
容灾解决方案是实现容灾目标的具体实施方案,本文将介绍容灾解决方案的基本原则和常用技术手段。
容灾解决方案的基本原则在制定容灾解决方案时,需要遵循以下几个基本原则:1. 可靠性:容灾解决方案必须基于可靠的技术手段,确保系统能够在发生灾害时保持运行,并尽快恢复正常。
2. 可行性:容灾解决方案必须是可行的,在技术和经济上都能够被接受和实现。
3. 可扩展性:容灾解决方案应该具备良好的可扩展性,能够适应系统规模和业务变化带来的需求变化。
4. 高效性:容灾解决方案应尽可能地减小数据和服务的恢复时间,提供快速的灾难恢复能力。
常用的容灾技术手段数据备份与恢复数据备份与恢复是最基本、最常用的容灾技术手段之一。
通过定期备份关键数据,并将备份数据存储在不同地点的独立存储设备上,可以在数据丢失或遭受灾害时,快速恢复数据。
常见的数据备份与恢复技术包括:- 磁盘备份:将数据备份到磁盘设备中,可以实现快速的数据恢复。
- 磁带备份:将数据备份到磁带中,可以实现大规模数据的存储和长期保存。
高可用集群高可用集群是通过将多台服务器组成一个集群,提供冗余的硬件和软件环境,实现系统和数据的高可用性。
常见的高可用集群技术包括:- 主备切换:将主服务器的功能实时切换到备份服务器上,确保在主服务器故障时,系统能够快速恢复。
- 负载均衡:将用户请求均衡地分配到集群中的每个服务器上,提高系统的并发处理能力。
跨机房部署跨机房部署是通过在不同地理位置的机房中部署相同的系统和应用,实现系统和数据的分布式存储和备份,提高系统的容灾能力。
常见的跨机房部署技术包括:- 多活部署:在多个机房中部署相同的系统和应用,通过数据同步和负载均衡,实现系统的并发访问和容灾恢复。
- 异地多中心部署:在不同的地理位置建立多个数据中心,通过数据同步和延迟恢复,提供更高级别的容灾和灾难恢复能力。
数据保护系统医院备份、容灾及归档数据容灾处理方案1、序言在医院信息化建设中,HIS、PACS、RIS、LIS 等临床信息系统得到广泛应用。
医院信息化HIS、LIS 和PACS 等系统是现在各个医院关键业务系统,负担了病人诊疗信息、行政管理信息、检验信息录入、查询及监控等工作,任何系统停机或数据丢失轻则降低患者满意度、医院信誉丢失,重则引发医患纠纷、法律问题或社会问题。
为了确保各业务系统高可用性,必需针对关键系统建立数据安全保护,做到“不停、不丢、可追查”,以确保关键业务系统得到全方面保护。
伴随电子病历新规在 4 月 1 日正式施行,《电子病历应用管理规范(试行)》要求电子病历书写、存放、使用和封存等均需按相关要求进行,依据规范,门(急)诊电子病历由医疗机构保管,保留时间自患者最终一次就诊之日起不少于15 年;住院电子病历保留时间自患者最终一次出院之日起不少于30 年。
2、医院备份、容灾及归档处理方案针对医疗卫生行业特点和医院信息化建设中关键应用,包含:HIS、PACS、RIS、LIS 等,本企业推出基于数据保护系统多个处理方案,以达成对医院信息化系统提供全方面保护和关键应用系统异地备份容灾2.1 数据备份处理方案针对于医院HIS、PACS、LIS 等服务器进行数据备份时,数据保护系统备份架构采取三层构架。
备份软件主控层(内置一体机):负责管理制订全域内备份策略和跟踪用户端备份,能够管理磁盘空间和磁带库库及光盘库,实现多个用户端数据备份。
备份软件主服务器是备份域内集中管理关键。
用户端层(数据库和操作系统用户端):其它应用服务器和数据库服务器安装备份软件标准用户端,经过这个用户端完成每台服务器LAN 或LAN-FREE 备份工作。
另外,为包含数据库用户端安装数据库代理程序,从而确保数据库在线热备份。
备份介质层(内置虚拟带库):主流备份介质有备份存放或虚拟带库等磁盘介质、物理磁带库等,通常提议将备份存放或虚拟带库等磁盘介质作为一级备份介质,用于近期备份数据存放,将物理磁带库或光盘库作为二级备份介质,用于长久备份数据存放。
两地三中心容灾解决方案2010-12-26目录1“两地三中心”容灾系统建设的功能目标 (3)2两地三中心”容灾系统技术方案 (4)2.1总体设计方案 (4)2.2容灾方案实现 (5)2.2.1同城应用级容灾方案 (5)2.2.2异地数据级灾备方案 (6)3基于SHAREPLEX的容灾方案 (7)3.1S HARE P LEX FOR O RACLE产品介绍 (7)3.2S HAREPLEX主要技术指标 (8)4成功案例 (10)4.1银联数据 (10)4.2山西移动 (12)4.3北京地税 (15)4.4S HARE P LEX国内部分客户 (18)1 “两地三中心”容灾系统建设的功能目标理想目标:在确保系统稳定安全的前提下,颠覆“切换时长、数据丢失,平时不用、浪费投资,决策困难、影响巨大,演练复杂、风险增加”的传统“灾备”模式,创建全新“容灾”理念,使新增投资平时发挥生产效力、实现容纳各种灾难、确保业务连续和数据安全的崭新模式。
同城应用级容灾:覆盖能被客户直接感知的各类业务,平时与主机房同时运行,负载均衡使用,可分担各查询业务流量。
当容灾机房或主机房任何一处出现灾难造成的非计划内停机,则另一个机房都能在保证不丢失数据的前提下,继续对外提供同样的服务,对业务或对客户的感觉影响极低。
异地容灾;异地容灾机房,存放一台存储设备和一台核心业务验证服务器,异步存储数据,容许0-15分钟数据丢失。
发生城市级灾难时仍可以有效恢复生产系统核心数据和,。
最终实际目标:以系统稳定、安全、高效为基本前提,经严格论证和实测,可以逐步退守,直至实现一定投资下“高可用性和高安全性”的平衡。
容灾系统将能够应对下述的灾难和风险,确保数据安全性和业务连续性:灾难发生的百分比统计电源问题硬件、软件、程序故障机房其它基础设施故障系统设计失误小失误/故障长期累加人为操作失误或渎职蓄意破坏/病毒/黑客网络/线路故障技术失败大规模自然灾害其它0102030405060708090100Number of Declarations2 两地三中心”容灾系统技术方案2.1 总体设计方案生产系统的容灾系统拟建成“两地三中心“模式。
容灾需求:三大风险:数据丢失、数据破坏、业务中断。
每小时业务中断导致损失以百万美元计法规遵从:金融合规,等保3,安全隔离,两地三中心,高业务连续性IT运维:系统容灾,有备无患,简化IT运维工作,避免突出事件冲击容灾挑战:昂贵的投入高CAPEX:服务器、存储、软件等基础架构购置成本高;机房等基建费用高高OPEX:专业运维支撑(实施/培训/现场支持);水、电等资源长期投入繁琐的管理设备众多,管理不统一:存储介质、服务器、网络管理界面独立,工作流复杂,效率低下扩容复杂:容量不足,需自行扩容,上线周期长有限的容灾能力安全性、容灾能力不足:备份数据不出数据中心,基础设施故障易导致极端状况敏捷性不足:灾难恢复,数据共享等能力受数据物理位置限制。
应用与数据无法分离,无法构建敏捷应用与更好容灾特性HA: High Availability,高可用性HA:是指提供在本地系统单个组件故障情况下,能继续访问应用的能力。
无论这个故障是业务流程、物理设施、IT软/硬件的故障最好的高可用性就是数据中心的一台机器宕机了,但是使用该数据中心服务的用户完全感觉不到。
但一般数据中心的机器宕机了,在该机器上运行的服务故障切换(failover)一般都需要时间,从而导致客户会有感知HA 的关键指标是可用性,其计算公式是[ 1 - (宕机时间)/(宕机时间 + 运行时间)],我们常常用几个 9 表示可用性:4 个9 : 99.99% = 0.01% * 365 * 24 * 60 = 52.56 分钟/年5 个9 : 99.999% = 0.001% * 365 = 5.265 分钟/年6 个9 : 99.9999% = 0.0001% * 365 = 31秒钟/年的宕机时间对 HA 来说,往往使用共享存储,这样的话,RPO =0 ;同时往往使用Active/Active (双活集群) HA 模式来使得 RTO 几乎0,如果使用 Active/Passive 模式的 HA 的话,则需要将 RTO 减少到最小限度HA 需要使用冗余的服务器组成集群来运行负载,包括应用和服务。
中国XX银行XX分行城市综合网系统性容灾系统解决方案版本1.0X公司北京办事处2003.6目录1技术建议书要点 (3)2概述 (4)2.1项目背景 (4)2.2关于X Software (4)2.3关于X V olume Replicator (5)3容灾系统设计 (6)3.1需求清单 (6)3.2复制模式选择 (7)3.2.1同步数据复制 (7)3.2.2异步数据复制 (7)3.2.3数据复制模式选择 (10)3.3网络带宽测算 (11)3.3.1理论测算 (11)3.3.2现场测算 (11)3.4数据滞后量控制 (11)4配置及工作流程说明 (12)4.1推荐配置及工作流程 (12)4.2可选方案 (14)4.3可选方案 (14)5方案优势汇总 (15)6测试说明 (16)7方案实施 (17)8容灾系统的管理、维护和演习 (17)9成功案例 (18)附录X Found ation Suite™ (23)附录X原厂售后服务介绍 (29)1技术建议书要点本技术建议书由全球最大的数据存储管理软件供应商X Software (Nasdaq:VRTS)提供,旨在协助中国XX银行XX分行实现异地容灾系统规划。
其要点概括如下:2概述2.1项目背景中国XX银行XX分行的城市综合网系统是X行业务的核心系统,担负着数据中心和应用中心的职责。
现有的高可用结构(High Availbility Architecher)虽然能够做到本地系统的高可用,但如果发生不可抗拒的灾难事件,还是会导致关键数据的丢失和金融服务的长时间中断。
而对于银行服务而言,任何原因的短时间停顿都是不允许的,因此,有必要XX一个具有容灾功能的容灾中心,当生产中心发生故障时,可由容灾中心接管所有的业务处理。
X是全球最大的数据存储管理软件供应商,非常荣幸能够为中国XX银行XX分行提供异地容灾系统的解决方案。
我们相信在和贵行进行合作的过程中,能够利用产品的技术优势构建最佳的解决方案,彻底消除贵行对于数据灾难事故的后顾之忧。
应用级灾备的实现方法当前,灾备系统建设主要分为数据级灾备和应用级灾备两大类。
数据级灾备关注数据的备份和恢复,是应用级灾备的基础和前提;而应用级灾备则在数据级之上,进一步提供业务接管和恢复能力。
应用级灾备包括两个方面:数据同步和应用接管。
数据同步是应用接管的前提。
在保证数据同步基础上,要实现应用接管,还要能实现灾难发生时的网络切换和应用切换。
本文将从数据同步和应用接管这两个方面来讨论应用级灾备的实现方法。
1数据同步数据的同步是应用接管的基础,保障数据同步的完整性和实时有效性才能使得应用的接管有意义。
数据的同步主要分为两大类,第一类是基于磁盘阵列的复制软件实现,比如EMC MirrorView镜像功能、H3C ReplicationIP复制功能等,第二类是基于服务器或者应用软件(应用层)实现,比如Oracle DataGuard组件、GoldenGate数据库复制软件、Veritas VVR软件等。
不管采用何种技术,都只是在不同的层面实现了数据的同步,要达到应用接管的目的,还需要实现网络切换和应用切换。
从中我们可以了解到,应用层的数据同步和应用级灾备是有区别的,这也是经常会被混淆的地方。
在现实环境中,我们最常见的应用级灾备方案是“磁盘阵列的数据复制+备用服务器”,也就是通过磁盘阵列来实现数据同步,通过备用服务器提供业务接管能力。
磁盘阵列同步有以下主要特点:可以实现对所有数据的灾备,支持所有的数据类型,是最全面的灾备保护方式;基于存储设备进行灾备,可以有效的解决对数据库服务器和各种应用服务器的计算资源的占用问题;部署简单,无需更改原来的文件系统。
维护也更加简单,维护好存储灾备系统就可以。
基于服务器或应用软件的灾备,例如VVR主机复制方式,有以下特点:对原系统改动巨大,需要重建原系统的数据和文件系统,对原有数据造成破坏,需要提前做好大量的数据迁移工作;对软件要求较高,生产中心和灾备中心的每一台服务器上都要安装专门的软件,部署成本较高,在服务器扩展的时候,成本会直线上升;灾备软件和应用软件、操作系统之间可能存在版本冲突、兼容性问题,这个问题长期存在,在扩容的时候更加需要考虑,有可能导致应用系统受到限制或扩展受到影响;对主机的性能占用和消耗;每个服务器对应一个节点,在管理和维护方面增加了复杂性;数据复制采用异步的方式,在网络故障的情况下,会造成同步数据的不一致,导致数据不可用或无法访问;因此,数据同步从实现效果、成本、维护、资源占用、对原系统的影响几个角度来看,从磁盘阵列层面实现都要优于通过主机软件方式实现。
VERITAS容灾解决方案、需求分析随着移动业务的迅猛发展和移动用户的迅速增加,移动通信市场的竞争日趋激烈。
移动通信有限公司现有的各业务系统相对分散、孤立,缺乏有机的联系,很难对市场的变化作出迅速反应。
为了适应竞争和企业的长远发展目标,迫切需要建立一个集中的、模块化结构的、可扩展的数据中心。
在新的业务系统中,应用的高可用和数据的高可用是最重要的两个部分,可以说是新系统成功与否的关键。
两者即相互独立又密切相关,需要从整体上去设计和实施。
所谓高可用性,用最简单的话说,就是系统在使用过程中有百分之多少的时间是可用的。
一般情况下,群集系统需要达到99~99.8%的可用性,也就是说,系统每年有四天零九个小时不可用是可以接受的。
如果对系统进行了一些特别的优化管理,减少一些配置上不必要出现的错误,把可用性提升到99.9%~99.98%也是不成问题的。
在某个群集中,可以使系统的可用性达到4个9或5个9;对于一些容错率特别高的系统,可能达到5个9,甚至6个9以上。
怎样才能让系统达到更高的可用性呢?一般说来,一个高度可靠的应用系统具有以下特征:l 包含一个完善的面向数据库的备份/恢复系统,以保证各种意外情况下的数据后备支援。
数据存放在一个地方总是有风险的,况且人为的逻辑错误有可能破坏数据,采用高性能、完善的备份系统,将数据的另一个Copy存放到价廉的存储介质上,是数据安全的基本保证。
l 包括一个本地的双机系统,用集群方式保证本地业务的不中断运行。
在网络、系统与数据的各个环节出现故障时,如何使系统的运行不受影响,或尽量少受影响。
电信计费业务系统,要求系统保证7X24小时不间断工作。
所以,必须从设备选型和方案设计上保证系统的高可用性。
应用系统应配备安全性能极高的cluster 高可用热备份软件,该软件应该具有应用广泛、切换迅捷、用户界面友好、配置方便等特点。
在任何应用环节故障的情况下,cluster软件应能做到不停机应用切换,确保应用系统平稳运行。
某地应用级容灾方案(初步解决方案)一、容灾备份中心建设模式分析客户现已在中心机房对现有重要业务及应用部署了HACMP集群,确保不会出现因本地软硬件或系统管理维护导致的失效而引起应用和数据对用户的不可用。
但本地容灾方案无法解决因火灾、自然灾害(如洪水、地震)造成对系统及应用数据的破坏。
对于客户的信息系统建设,光有本地的设备冗余和数据备份是远远不够的,如果数据中心出现非计划停机(如停电、自然灾害等),那么其下辖的网点将无法正常开展工作,必须要防范区域性灾难对系统造成的重大影响。
因此应该采用本地备份和异地应用容灾相结合的保护措施,确保数据中心即使遭遇整体性故障,应用容灾中心能在很短的时间内接管所有下辖网点和相关部门的业务,确保业务的整体高可用性。
1.需考虑的因素容灾中心建设模式的确定主要考虑以下三方面因素:(1)灾难承受程度:明确数据中心需要承受的灾难类型,系统故障,通信故障,长时间断电甚至火灾等意外情况所采取的方案不尽相同;(2)业务影响程度:明确当数据中心发生意外无法工作时,导致业务停顿所造成的损失程度,即对于IT环境发生故障的最大容忍时间,它是容灾中心系统建设的重要指标;(3)数据保护程度:是否要求数据库可以恢复所提交的交易并且要求实时同步数据,即数据的连续性和一致性,决定了灾难恢复方案规模和复杂程度的重要数据。
从上述分析可以看出,在对业务影响程度和数据的保护程度要求较高的前提下,如果距离不是很远(在几十公里之内),那么采用“同步”的方式最为理想。
因为业界现有的技术已经可以在这样的距离之内将线路铺设成本降至最低,同时提供最大的带宽;容灾技术对于业务性能的影响也可以降低到最低(5%之内)。
客户的容灾备份系统采用应用级的同城异地容灾系统,由于生产中心与容灾中心同在某市内,数据复制的距离不是很远(在十公里到三十公里之内),因此建议采用同步数据复制方式。
只有这样才能够保证数据的零丢失。
同时为了保证主要核心业务系统能最快的得到接管,在主数据中心,灾备中心和下辖网点之间采用高带宽TCP/IP网络连接方式。