阵列双活容灾解决方案
- 格式:pptx
- 大小:1.83 MB
- 文档页数:47
双活数据中心与灾备解决方案多数据中心的建设需要投入大量资金,其项目周很长,涉及的范围也比较大。
从技术上来说,要实现真正意义上的双活,就要求网络、应用、数据库和存储都要双活。
就现阶段来看,大多数客户的多数据中心建设还达不到完全的双活要求,主流的建设目标是实现应用双活。
目前客户建设多数据中心的模型可以归纳为以下几种:1.单纯的数据容灾:正常情况下只有主数据中心投入运行,备数据中心处于待命状态。
发生灾难时,灾备数据中心可以短时间内恢复业务并投入运行,减轻灾难带来的损失。
这种模式只能解决业务连续性的需求,但用户无法就近快速接入。
灾备中心建设的投资巨大且运维成本高昂,正常情况下灾备中心不对外服务,资源利用率偏低,造成了巨大的浪费。
数据容灾2.构建业务连续性:两个数据中心(同城/异地)的应用都处于活动状态,都有业务对外提供服务且互为备份。
但出于技术成熟度、成本等因素考虑,数据库采用主备方式部署,数据库读写操作都在主中心进行,灾备中心进行数据同步。
发生灾难时,数据中心间的数据库可以快速切换,避免业务中断。
双活数据中心可充分盘活企业闲置资源,保证业务的连续性,帮助用户接入最优节点,提高用户访问体验。
构建业务连续性3.提升业务服务能力:多个数据中心同时对外提供服务且互为备份,各中心的数据库可同时处理应用的读写请求,网络、存储、应用和数据库全部实现多活。
各数据中心独立运营,用户流量可被智能调度,形成灵活、弹性和可扩展的面向服务的业务架构。
提升业务服务能力数据中心业务连续性解决方案的几种主要应用场景同城双活:站点级双活(可支持应用级双活),整合距离相对较近的两个数据中心中的计算、存储和网络资源,实现高度灵活的负载分配,结合数据中心内部的高可用机制,为业务连续性提供最高级别保障。
特点:1、跨数据中心实现高可用性与负载平衡,支持各种应用2、管理简便,成本较高3、数据零丢失,无单一故障点,可靠性高,可最大化业务在线时间4、距离有限,可实现城域级别的应用迁移与灾难避免/灾难恢复异地灾备在不限距离的两个数据中心之间构建备份关系,可抵御较大范围的灾难性事件对业务的影响。
“双活”容灾,走好容灾建设每一步建设容灾系统就是指利用各种技术和管理手段将灾难的影响化解,它的主要表现形式为两个方面:一是保证企业数据的安全;二是保证业务的连续性。
当各企业的信息化建设走向了一个新的层次,面临各类法规、竞争、高质量服务的新的要求时,能否有效的建立灾难防御体系就成了企业进一步发展的一个里程碑。
容灾系统的建设意义已经被铺天盖地的渲染,各级政府和行业也开始制定规则,规范信息系统在各种灾难下的危机响应水平,从各方面来看,是否有必要建设容灾系统已经走过了探讨的阶段,而摆在人们面前的却是另一个过去始料不及的问题---建立容灾系统的复杂性。
这个问题的复杂度在人们考虑灾备系统规划和建设方案时凸现了出来,例如:人们会发现当提出一个理想的各类业务统一灾难防御体系的建设目标之后,却无法选出满足要求的技术路线或者需要极为高昂的造价。
又比如,人们发现容灾体系建设中,IT部门却无法控制一个整体的容灾流程,而流程的制定又是一个需要全民意识的多兵种工程,等等诸如此类。
在建设容灾系统中,通常会遇到下面几个问题。
第一,在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响。
比如,采用数据复制技术对系统I/O带来的延迟,应用数据同步对日常业务处理系统带来的压力等。
因此,企业要通过周密的测试和分析来规避容灾系统建设时带来的这些风险,以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。
第二,数据状态要保持同步。
为保证在灾难发生时,业务可以成功地切换到备份中心,就必须保证容灾系统数据同步机制的可靠性。
因此,建立可靠的数据同步校验机制是必须的;同时,还要考虑建立定时的、自动的数据同步核查对比机制,以检验两个中心数据的一致性,这是数据容灾工作中非常重要的一部分。
第三,容灾系统的日常维护工作要尽可能轻,并能承担部分业务处理和测试的工作。
容灾系统的维护和管理是容灾切换成功的重要保证,在系统建设中,就必须要考虑系统的维护管理流程。
MacroSAN 双活存储解决方案介绍杭州宏杉科技有限公司1. 解决方案概述在信息社会里,数据的重要性已经毋容置疑,作为数据载体的存储阵列,其可靠性更是备受关注。
尤其在一些关键应用中,不仅需要单台存储阵列自身保持高可靠性,往往还需要二台存储阵列组成高可靠的系统。
一旦其中一台存储阵列发生故障,另一台可以无缝接管业务。
这种两台存储都处于运行状态,互为冗余,可相互接管的应用模式一般称之为双活存储。
由于技术上的限制,传统的双活存储方案无法由存储阵列自身直接实现,更多的是通过在服务器上增加卷镜像软件,或者通过增加额外的存储虚拟化引擎来实现。
通过服务器上的卷镜像软件实现的双活存储,实施复杂,对应用业务影响大,而且软件购买成本较高。
通过存储虚拟化引擎实现的双活存储,虽然实施难度有一定降低,但存储虚拟化引擎自身会成为性能、可靠性的瓶颈,而且存在兼容性的限制,初次购买和维护成本也不低。
宏杉科技的对称双活存储(Symmetrical Dual Active Storage,简称SDAS)是一项专门针对双活存储方案的创新技术。
通过宏杉科技对称双活存储技术,可以不需要引入任何第三方软硬件,直接通过两台同档次的MS系列存储阵列实现两台存储的双活工作,互为冗余。
当其中一台存储发生故障时,可由另一台存储实时接管业务,实现RPO、RTO为0。
这是一种简单、高效的新型双活存储技术。
宏杉科技的SDAS技术,不仅支持近距离的双活存储系统,而且支持上百公里甚至更远的远距离双活数据中心。
近距离的双活存储可以采用更加高效的光纤交叉直连的方式进行组网部署,远距离的双活数据中心采用交换机连接方式,再配以仲裁者机制进行组网部署。
宏杉科技的SDAS两套存储之间的链路不仅可以支持10GE以太网,而且在业界率先支持40GE以太网技术。
40GE具有目前以太网应用领域中的最高的传输带宽,可以大大降低同步数据传输时延。
目前宏杉科技的MS3000、MS5500、MS7000存储产品都已经支持对称双活存储技术。
Fujitsu存储双活解决方案谈谈Fujitsu 存储双活解决方案前两天,《高端存储知识》的作者西瓜哥发表了一篇文章《原来富士通ETERNUS DX S3系列已经支持双活,但好像没有看到仲裁机制》,文中对ETERNUS DX S3系列StorageCluster(存储高可用)解决方案进行了相关的介绍和应用场景的分析。
在这里要感谢西瓜哥对Fujitsu ETERNUS存储双活解决方案关注和技术普及,同时,我们也将对文中的一些理解偏差(姑且这么说吧)进行进一步的解释和阐述。
问题一:Storage Cluster是否有仲裁机制?要回答这个问题,我们首先来看看Storage cluster解决方案架构图。
这里仅简单说明一下:生产存储和备用存储之间使用FC链路,通过存储自带的远程复制技术实现LUN数据的实时同步复制,同时生产LUN和备份LUN都Mapping给前端业务主机。
当生产存储出现故障时,将自动切换到备用存储上,由于生产存储和备用存储Mapping 给前端主机的端口共享相同的一组逻辑WWPN/WWNN,所以对前端主机来说,后台只有一台存储,且切换是透明的,所以前端绝大多数应用是不会中断的。
上图中的工作站Storage Cluster Controller就是存储双活解决方案中的仲裁者,它时刻监控着生产存储、备用存储的健康状态,当生产存储或者备用存储出现问题,它就开始执行Failover策略。
这里需要说明的是Storage Cluster Controller并不是一个单独的软件,它只是一个后台服务进程,该服务进程集成在ETERNUSSF Storage Cruiser Agent软件中,需要单独准备一台工作站或者服务器安装ETERNUSSF Storage 管理套件。
那Storage Cluster Controller什么时候干活呢?它如何干活呢?它干些什么事呢?那就进入第二个话题----Storage cluster 故障处理机制。
资料编码阵列双活华为双活数据中心解决方案技术建议书2016年3月11日华为技术有限公司版权所有© 华为技术有限公司2014。
保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
商标声明和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有.注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。
除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编:518129网址:客户服务邮箱:客户服务电话:0755—28560000 4008302118客户服务传真:0755—28560111目录1适用场景(供参考,实际使用删除) (5)1。
1文档适用场景说明 (5)1。
2版本更新 (5)2概述 (6)2。
1项目背景 (6)2。
1.1项目概述 (6)2。
1.2建设总体要求 (6)2.2需求分析 (7)2。
2。
1需求分析 (7)2.2.2现状分析 (8)2.2.3建设目标(适用于升级改造) (9)2.2.4方案设计原则 (9)3存储双活架构选择 (10)3.1存储双活架构选择 (10)3。
1.1存储双活架构描述 (10)3。
1。
2业界存储双活技术路线 (10)3.1.3存储双活架构对比 (10)4系统方案设计 (13)4。
1整体架构设计 (13)4.1。
1方案描述 (13)4.1。
2存储双活架构的要求 (14)4.2存储双活方案详细设计 (16)4。
2。
1虚拟化存储双活设计 (16)4。
2.2双活读策略设计 (17)4.2.3优选路径设计 (17)4。
双活灾备方案方案一双活灾备方案在当今数字化高速发展的时代,数据和业务的连续性成为了企业生存和发展的关键。
时不时出现的自然灾害、硬件故障、人为失误等,都可能给企业带来致命的打击。
这就是我们制定双活灾备方案的背景,目的很简单,就是要确保在各种“幺蛾子”出现时,企业能够稳如泰山,业务不中断,数据不丢失。
其意义嘛,那可大了去了,不仅能保护企业的“钱袋子”,还能保住企业的声誉和客户的信任,不然一旦出问题,那可真是“凉凉”了。
咱们先定个小目标,方案实施后,在遇到灾难事件时,业务恢复时间要控制在 30 分钟以内,数据丢失量不超过 10 分钟的数据,系统可用性要达到 99.99%以上。
来看看现状,内部情况是咱们的业务系统越来越复杂,数据量也与日俱增,现有的备份手段有点跟不上节奏啦。
外部呢,竞争对手们都在加强灾备能力,市场对企业的服务连续性要求越来越高,客户可不会容忍咱们动不动就“掉链子”。
具体方案内容如下:首先,搭建双活数据中心,实现数据实时同步。
这就像是给数据找了两个“家”,一个“家”出问题,另一个“家”立马顶上。
然后,优化网络架构,确保数据传输的高效稳定,别让数据在“路上”堵着。
还有,建立完善的监控和预警系统,让咱们能提前发现问题,别等出了事才傻眼。
风险评估与应对这一块,可能会出现网络延迟导致数据同步不及时,那咱就多弄几条备用网络线路呗。
要是数据中心出现故障,得有快速切换的应急预案,平时多演练,关键时刻才不慌。
效果评估方面,用业务恢复时间、数据丢失量、系统可用性这些指标来衡量。
每季度进行一次评估,通过模拟灾难事件来测试方案的有效性。
怎么样,这方案是不是还挺靠谱?方案二双活灾备方案哎呀,如今这世界变化快,各种意外情况防不胜防。
要是企业因为没做好灾备,一下子业务中断、数据丢失,那可真是哭都没地方哭去。
所以咱得搞个双活灾备方案,这就是背景啦。
目的就是让企业在灾难面前也能昂首挺胸,继续赚钱,意义嘛,那就是给企业穿上一层“金钟罩铁布衫”,让它不怕风吹雨打。
“两地三中⼼”和“双活”简介--容灾技术⽅案当前市场上常见的容灾模式可分为同城容灾、异地容灾、双活数据中⼼、两地三中⼼⼏种。
1、同城容灾同城容灾是在同城或相近区域内( ≤ 200K M )建⽴两个数据中⼼ : ⼀个为数据中⼼,负责⽇常⽣产运⾏ ; 另⼀个为灾难备份中⼼,负责在灾难发⽣后的应⽤系统运⾏。
同城灾难备份的数据中⼼与灾难备份中⼼的距离⽐较近,通信线路质量较好,⽐较容易实现数据的同步复制,保证⾼度的数据完整性和数据零丢失。
同城灾难备份⼀般⽤于防范⽕灾、建筑物破坏、供电故障、计算机系统及⼈为破坏引起的灾难。
2、异地容灾异地容灾主备中⼼之间的距离较远(> 200KM ) ,因此⼀般采⽤异步镜像,会有少量的数据丢失。
异地灾难备份不仅可以防范⽕灾、建筑物破坏等可能遇到的风险隐患,还能够防范战争、地震、⽔灾等风险。
由于同城灾难备份和异地灾难备份各有所长,为达到最理想的防灾效果,数据中⼼应考虑采⽤同城和异地各建⽴⼀个灾难备份中⼼的⽅式解决。
本地容灾是指在本地机房建⽴容灾系统,⽇常情况下可同时分担业务及管理系统的运⾏,并可切换运⾏;灾难情况下可在基本不丢失数据的情况下进⾏灾备应急切换,保持业务连续运⾏。
与异地灾备模式相⽐较,本地双中⼼具有投资成本低、建设速度快、运维管理相对简单、可靠性更⾼等优点;异地灾备中⼼是指在异地建⽴⼀个备份的灾备中⼼,⽤于双中⼼的数据备份,当双中⼼出现⾃然灾害等原因⽽发⽣故障时,异地灾备中⼼可以⽤备份数据进⾏业务的恢复。
本地机房的容灾主要是⽤于防范⽣产服务器发⽣的故障,异地灾备中⼼⽤于防范⼤规模区域性灾难。
本地机房的容灾由于其与⽣产中⼼处于同⼀个机房,可通过局域⽹进⾏连接,因此数据复制和应⽤切换⽐较容易实现,可实现⽣产与灾备服务器之间数据的实时复制和应⽤的快速切换。
异地灾备中⼼由于其与⽣产中⼼不在同⼀机房,灾备端与⽣产端连接的⽹络线路带宽和质量存在⼀定的限制,应⽤系统的切换也需要⼀定的时间,因此异地灾备中⼼可以实现在业务限定的时间内进⾏恢复和可容忍丢失范围内的数据恢复。
双活数据中心解决方案目录1。
行业背景12.系统建设原则及思路23。
技术方案4双活数据中心基础架构设计4双活数据中心网络设计4双活数据中心系统设计4双活数据中心系统优势5浪擎CDP,最可靠的CDP5ACDP-恢复速度最快的CDP5ACDP—强大的复制,恢复.容错功能5ACDP-支持报警和一键切换6其他优势61.行业背景随着全球化信息技术的发展,信息化已经成为各个单位的关注热点,各行各业都在进行着信息化的改革。
信息化系统已经成为企业核心竞争力的关键条件之一.企业信息化的时代也发生了翻天覆地的变化。
为适应我国改革开放和社会主义现代化建设的新形势对公安执法提出的新要求国家提出了以“公安信息化工作”为核心,以“科技强警"为目标的国家信息化工程-“金盾工程”的建设要求。
“金盾工程”既全国公安信息化工程,是国家电子政务建设“十二金”中重要的一部分,主要是利用现代化信息通信技术增强我国公安机关的统一指挥,快速反应,协同作战,打击罪犯的能力,以适应公安机关动态管理和打击罪犯的需要.随着金盾工程在全国的展开信息技术的广泛应用,公安信息化建设全面加快各种业务系统的陆续建设投入使用产生了大量的数据。
随着业务数据的增加和应用数据的依赖性的增强,数据已经成为开展业务不可缺少的基础。
数据的有效汇集,集中管理,综合分析以及容灾备份的需要等处理要求日益提高。
因此,通过管理机制与技术手段相结合保障数据的一致性和业务的连续性在建设公安系统容灾机制中势在必行.2.系统建设原则及思路1)绿色容灾,减少对生产系统的影响双活数据中心在实施和使用的过程中对原有的生产系统、硬件系统、网络系统会造成一定的影响,有的容灾系统可能需要在冻结原有的生产系统的情况下进行数据的复制;有的容灾系统可能要对硬件、网络环境进行改造,改造成系统所要求的条件;有的容灾系统对生产服务器的CPU、内存、网络等资源占用较大,这些影响或者改造对原有的系统和数据都存在一定的风险性。
资料编码阵列双活华为双活数据中心解决方案技术建议书2016年3月11日华为技术有限公司版权所有© 华为技术有限公司2014。
保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
商标声明和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。
除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编:518129网址:客户服务邮箱:客户服务电话:0 4008302118客户服务传真:1目录1 适用场景(供参考,实际使用删除)1.1 文档适用场景说明本文档适用以下场景:1)同城容灾,生产中心和灾备中心之间的容灾链路距离≤100;2)要求0;3)≈0,部件故障或生产中心故障,能自动切换;4)生产中心和灾备中心之间有裸光纤网络。
5)适用4节点与8节点双活(2个4节点)环境注:以下蓝色字体根据具体项目情况替换或删除。
1.2 版本更新2 概述2.1 项目背景2.1.1 项目概述数据中心的生产平台,是全局的计算中心、存储中心、备份中心,承载着的核心业务系统,随着业务的快速发展,对业务连续性的要求也越来越高。
此次项目建设以的2个数据中心为2个物理站点,并考虑异地一处作为异地站点,构建跨双数据中心(公里)实现双活站点的存储虚拟化平台。
该平台主要为各类应用业务提供高可用性基础保障,为构建虚拟数据中心提供存储资源和服务,保障数据的一致性和完整性。
2.1.2 建设总体要求1)云数据中心建设云数据中心建设是建设云平台的核心与关键,虚拟数据中心负责按需提供满足要求的运算处理资源、存储资源、网络资源等基础架构服务。
双活容灾方案概述双活容灾方案是一种旨在保证系统高可用性和业务连续性的解决方案。
通过在不同地理位置部署多台服务器,并将其配置为主备模式,可以实现在主服务器故障时,自动切换到备份服务器以确保业务的顺利进行。
本文将介绍双活容灾方案的基本原理、常见的实现方式以及应用场景。
基本原理双活容灾方案的基本原理是通过在主服务器和备份服务器之间实现数据同步和状态同步,实现主备切换的自动化。
在正常情况下,主服务器负责处理业务请求,并将数据和状态同步到备份服务器。
当主服务器发生故障时,备份服务器会自动接替主服务器的角色,继续处理业务请求,从而实现业务的连续性。
实现方式双活容灾方案可以通过多种实现方式来达到高可用性和业务连续性的目标。
以下是一些常见的实现方式:1. 双机热备双机热备是最基本的双活容灾方案。
在双机热备方案中,主服务器和备份服务器配置相同的硬件和软件环境,业务数据实时同步到备份服务器上。
当主服务器发生故障时,备份服务器会立即接管主服务器的角色,并继续处理业务请求。
这种方案实现简单,容易理解和管理,但成本相对较高。
2. Active-Standby 方案在 Active-Standby 方案中,主服务器和备份服务器处于待命状态,只有主服务器处于活动状态处理业务请求。
备份服务器实时同步主服务器上的数据和状态,并且可以接收来自主服务器的心跳检测,以便在主服务器故障时及时接替其角色。
这种方案灵活性较高,可以根据实际业务需求进行配置和调整。
3. Active-Active 方案Active-Active 方案是一种更为复杂的双活容灾方案。
在这种方案中,同时存在两个主服务器,每个主服务器都能够独立地处理业务请求。
主服务器之间实时同步数据和状态,从而实现业务的高可用性和负载均衡。
这种方案适用于对性能和吞吐量要求较高的业务场景,但也需要更复杂的配置和管理。
应用场景双活容灾方案适用于对业务连续性要求较高的场景,尤其是关键业务系统和在线服务。
双活容灾方案引言随着互联网和信息技术的发展,对于系统的高可用性要求也越来越高。
在企业应用中,任何停机或数据丢失都可能导致巨大的损失。
为了确保系统的持续运行和数据的安全性,企业需要采取容灾方案来应对各种突发情况。
双活容灾方案作为一种常用的容灾模式,在保证系统高可用性的同时,还能提高系统的整体性能和数据一致性。
本文将对双活容灾方案进行详细介绍。
双活容灾方案概述双活容灾方案是指在不同的地理位置建立两个相同的数据中心,通过实时数据同步和流量分发,使两个数据中心能够同时提供服务。
在双活容灾方案中,主数据中心和备份数据中心之间的数据同步需要实时进行,以保证两个数据中心的数据保持一致。
同时,通过智能的流量分发机制,可以将用户请求分发到最近的数据中心,从而提高系统的响应速度。
双活容灾方案的优势与传统的单活容灾方案相比,双活容灾方案具有以下优势:1.高可用性:双活容灾方案可以将系统的配置、应用和数据分散在不同的数据中心,当一个数据中心发生故障时,另一个数据中心可以立即接管服务,从而保证系统的持续运行。
2.性能增强:通过将用户请求分发到最近的数据中心,可以减少网络延迟和带宽消耗,提高系统的响应速度和并发能力。
3.数据一致性:双活容灾方案使用实时数据同步机制,可以保证主数据中心和备份数据中心的数据保持一致,避免因数据丢失或不一致而导致的问题。
4.灵活性:双活容灾方案可以根据实际需求进行灵活配置,可以选择同城或异地部署数据中心,也可以选择主备或多活模式。
双活容灾方案的实施实施双活容灾方案需要以下关键步骤:1. 设计数据同步机制数据同步是双活容灾方案的核心内容,主要包括数据同步方式和同步频率的设计。
常用的数据同步方式有异步复制和同步复制两种,异步复制可以提高系统的性能,但存在一定的数据丢失风险;同步复制可以保证数据的一致性,但会增加网络延迟和带宽消耗。
根据实际需求和系统的特点,选择合适的数据同步方式和同步频率。
2. 部署数据中心根据双活容灾方案的要求,在不同的地理位置建立两个相同的数据中心。
医疗行业:基于‘双活’的容灾解决方案一、我国医疗行业数据存储趋势和容灾的需求随着医疗行业信息化的进程的加深,对医疗数据进行高效地存储和管理,以便提供安全有效地数据与信息的快速访问和利用成为医疗行业数据存储的主要发展趋势。
目前医疗行业信息系统主要有HIS(医院信息治理系统,Hospital Information System)、LIS(实验室信息管理系统,Laboratory Information Management System)、PACS( 医学影像治理与通讯系统,Picture Archiving and Communication System)、EMR(电子病历,EMR,Electronic Medical Record),财务核算为中心的系统(MIS)、以医生工作站为核心的临床信息系统(CIS)等关键应用。
如何对上述应用系统的关键数据进行集中存储管理和容灾规划,成为医疗行业信息系统灾难恢复建设的核心任务。
根据医院信息系统信息量大、结构复杂、数据在线、可靠性要求高的特点,在数据容灾方面的需求具体归纳如下:1) 强调持续化服务能力,业务运行不允许中断;医疗行业的信息化程度越来越高,导致了医疗服务业务的开展对信息系统的依赖程度的加深。
病人的诊治需求要求医疗信息系统必须提供7*24小时的高可用性服务。
2) 强调数据的准确性,不允许丢失数据或出错;病人的病情、诊治数据等信息,是对病人进行治疗决策的依据和记录,事关病人的人身健康和生命安全,容不得半点疏漏和丢失。
国外的医疗行业相关法案已经对医疗数据的存储从法律上提出了要求,比如美国的HIPAA 法案要求医疗数据不仅要实施防盗窃的安全策略,还要防止其丢失和损毁。
3) 需要可靠的灾难恢复方案,保证数据的安全及提供快速的恢复和应急能力;对于医疗行业而言,时间就是生命,在信息系统灾难发生时,信息系统的灾难恢复体系应该可以提供快速的系统切换。
为此需建立一套实时的、可用的备用系统,减少主系统的单个故障点,从而保障业务系统的持续服务能力。
双活数据中心容灾解决方案为什么要讲双活数据中心?从应用系统和系统保护来说,分这么几个角度:首先做容灾,第一个要考虑的是主备,上图左侧是最早出现的主备模式,一般是在两个中心建互备系统,比如我在B中心,容灾系统在另外一个地方,这种模式比较容易切换。
假如A中心出问题了,就绑定在B中心,或者是把数据复制到B中心,容灾资源是闲置着,承担着容灾的任务。
另外真的出问题了,我得需要一个定位,因为并不能确认它是否确实不能用了,所以,要确保这个业务完整,数据也不丢,定的时间加上切换流程,至少得0.5小时,甚至更长,甚至一两天,这样导致弊端很多。
后来为了节约资源,发展到现在双中心互备,A中心一部分做生产,B中心也一部分做生产,在原来的储备方式上做了一个改进,优点是因为这两个中心都有生产业务运行,可通过资源共享技术节省资源。
但仅仅是计算源,对于存储来说,由于这个存储空间必须要保证完整来做,所以没有办法充分利用起来,还是闲置状态。
针对这种问题,我们现在又有了双活并行模式,同一个系统,两个中心都可以承担业务,同时对外服务,坏掉任何一方不影响。
这是非常理想的一种状态,今天主要讲的是要实现这种架构或部分实现,需要哪些技术,需要做哪些工作,只是简单的讲,不一定很深入,也希望能够和大家一起沟通交流,看有没有更好更优的方案。
我主要从应用到基础设施的角度来讲。
因为从整个应用架构来看,咱们有一些业务可能是有接入层,下面是应用逻辑,后面包括还有一些接口,再下面是数据层,再下面是基础架构,有可能有存储和网络,这么几层,每一层都会有相应的双活实现技术。
例如应用层可能有各种集群,数据层可能有一边同时可读写,或一边只能读等。
再如基础架构层,在网络上对稳定性和带宽吞吐性能要求更高,甚至需要打通跨中心的大二层网络,存储方面则需改变一主一备的读写机制,实现同时可读写。
下面从这五个方面展开谈,一个是数据层,二是存储层,三是接入/应用层,四是虚拟化/云平台;五是技术关键点。