双活数据中心面面观
- 格式:docx
- 大小:5.12 MB
- 文档页数:85
双活数据中心概念及优缺点介绍01、热备热备的情况下,只有主数据中心承担用户的业务,此时备数据中心对主数据中心进行实时的备份,当主数据中心挂掉以后,备数据中心可以自动接管主数据中心的业务,用户的业务不会中断,所以也感觉不到数据中心的切换。
02、冷备冷备的情况下,也是只有主数据中心承担业务,但是备用数据中心不会对主数据中心进行实时备份,这时可能是周期性的进行备份或者干脆不进行备份,如果主数据中心挂掉了,用户的业务就会中断。
03、双活双活是觉得备用数据中心只做备份太浪费了,所以让主备两个数据中心都同时承担用户的业务,此时,主备两个数据中心互为备份,并且进行实时备份。
一般来说,主数据中心的负载可能会多一些,比如分担60~70%的业务,备数据中心只分担40%~30%的业务。
A—PAP 双活通过将业务分类,部分业务以数据中心 A 为主,数据中心B 为热备,而部分业务则以数据中心 B 为主,数据中心 B 为热备,以达到近似双活的效果。
A—AAA 双活则是真正的双活,同一个双活 LUN 的所有 I/O 路径均可同时访问,业务负载均衡,故障时可无缝切换。
04、什么是双活数据中心?首先我们要知道双活就是Active-Active,故名思义就是两边都是活动在线提供服务的,是相对于传统的主备模式Active-Standby模式的。
一个真正的双活方案是应该涵盖基础设施、中间件、应用程序各个层次的。
双数据中心同时对外提供业务生产服务的双活模式,两个数据中心是对等的、不分主从、并可同时部署业务,可极大的提高资源的利用率和系统的工作效率、性能,让客户从容灾系统中获得最大的价值。
a.两个生产中心部署相同的业务系统,结合网络层、主机层或应用的负载均衡技术,实现业务系统在两个数据中心并行工作和负载分担。
b.两个生产中心部署不同的业务系统,互相实时灾备接管。
数据中心双活又分为:同城双活、异地双活。
传统主备模式的缺点出于灾备(Disaster Recovery)的目的,一般都会建设2个(或多个)数据中心。
双活数据中心解决方案-通用1·引言在现代信息化时代,数据中心的高可用性和可靠性成为各个行业组织所追求的目标。
为了实现数据中心的高可用性,双活数据中心解决方案被广泛采用。
本文将介绍双活数据中心解决方案的通用架构和实施步骤。
2·概述2·1 解决方案概述双活数据中心解决方案是通过在两个地理位置相距较远的数据中心之间进行数据实时同步,以确保当一个数据中心发生故障时,另一个数据中心可以无缝接替其工作,保证业务系统的连续性运行。
2·2 设计目标双活数据中心解决方案的设计目标包括:●提供连续性的业务运行。
●最小化数据中心之间的数据同步延迟。
●最大化数据恢复速度。
●确保数据的一致性。
3·架构设计3·1 主备数据中心双活数据中心解决方案通常由一个主数据中心和一个备份数据中心组成。
主数据中心负责处理实时业务请求,备份数据中心作为主数据中心的镜像,并负责处理当主数据中心故障时的业务请求。
3·2 数据同步机制为了实现数据中心间的实时数据同步,双活数据中心解决方案通常采用以下机制:●数据异步复制。
●数据同步模式。
●数据冲突解决策略。
4·实施步骤4·1 前期准备在实施双活数据中心解决方案之前,需要进行以下准备工作:●确定主备数据中心的位置和网络架构。
●评估主备数据中心之间的网络带宽和延迟。
●确定数据同步机制和数据冲突解决策略。
4·2 网络连接实施双活数据中心解决方案需要建立可靠的网络连接,确保主备数据中心之间的数据实时同步。
4·3 数据同步配置配置数据同步机制,并根据实际需求进行性能调优和容错配置。
4·4 故障切换测试在实施双活数据中心解决方案之后,需要进行故障切换测试,确保备份数据中心能够无缝接替主数据中心的工作。
4·5 系统监控和运维建立有效的系统监控和运维机制,对主备数据中心进行实时监控,并定期进行数据中心切换和巡检。
金融行业双活七讲作者:赵国刚来源:《中国金融电脑》 2016年第7期近些年来,大家对如何通过更先进的技术,提高金融行业的业务连续性水平的相关话题热议不断,对双活技术的关注和讨论也在逐渐升温。
对于相关问题,大家见仁见智,在此提出个人的一些看法,抛砖引玉,希望能引出更多深入的讨论。
1. 什么是双活数据中心?双活数据中心最初是不同的业务运行在不同的数据中心,同时对外提供服务,但提供的业务各自不同。
两个中心虽然都是“活”的,但对于单个业务来说,只能在其中的一个中心运行。
后来有了A-Q 模式的双中心架构,读操作可以在两个中心进行,写操作仍然只由一个中心承载,因此不是完整意义上的双活。
同一笔交易,如果能同时在两个中心写入,又能在两个中心读取,才是真正的双活数据中心架构:这既要严格保障交易数据的一致性,又要满足数据的实时可用性。
2. 双活数据中心在金融行业的技术发展历程和价值金融行业涉及广大民生,账务准确、服务及时便成为其重要的业务特点;随着业务逐步从依赖手工账务转化到基于IT 平台,金融行业对IT 基础架构的数据可靠性和可用性的要求就更高了。
存储方式的安全和高可靠是金融行业得以生存的根本,高等级的业务连续性水平是服务及时性的重要保障。
金融行业的主要业务特征,是以联机事务处理(On-Line Transaction Processing,OLTP) 模式为主,更适合部署在具有高安全性和可靠性的高端存储平台。
业务连续性的最高级别是,当网络层、应用服务器层、数据库层或存储层等各层中发生任何单点设备故障的情况下,也能实现业务的不中断。
因此,金融行业必须找到一种基于高端存储平台、提供RPO=0和RTO=0 的双活技术。
3. 双活数据中心的实现从层面上看,双活数据中心架构可以分为网络访问层、应用及数据库层、存储层(如图1所示)。
从双活数据中心的网络访问层来看,如果要实现双活架构,需要两个中心的网络二层打通,形成大二层网络,配合负载均衡设备,实现网络访问层的双活架构。
什么是双活数据中心前面的文章我们大量的介绍了IDC,IDC对企业十分重要,但为提高可靠性,双活的IDC更为重要。
今天和大家一起聊聊双活数据中心,即双活IDC.首先我们要知道双活就是Active-Active,故名思义就是两边都是活动在线提供服务的,是相对于传统的主备模式Active-Standby模式的。
一个真正的双活方案是应该涵盖基础设施、中间件、应用程序各个层次的。
双数据中心同时对外提供业务生产服务的双活模式,两个数据中心是对等的、不分主从、并可同时部署业务,可极大的提高资源的利用率和系统的工作效率、性能,让客户从容灾系统中获得最大的价值。
a.两个生产中心部署相同的业务系统,结合网络层、主机层或应用的负载均衡技术,实现业务系统在两个数据中心并行工作和负载分担。
b.两个生产中心部署不同的业务系统,互相实时灾备接管。
数据中心双活又分为:同城双活、异地双活。
传统主备模式的缺点出于灾备(Disaster Recovery)的目的,一般都会建设2个(或多个)数据中心。
一个是主数据中心用于承担用户的业务,一个是备份数据中心用于备份主数据中心的数据、配置、业务等。
主备数据中心之间一般有热备、冷备、双活三种备份方式。
热备的情况下,只有主数据中心承担用户的业务,此时备数据中心对主数据中心进行实时的备份,当主数据中心挂掉以后,备数据中心可以自动接管主数据中心的业务,用户的业务不会中断,所以也感觉不到数据中心的切换。
冷备的情况下,也是只有主数据中心承担业务,但是备用数据中心不会对主数据中心进行实时备份,这时可能是周期性的进行备份或者干脆不进行备份,如果主数据中心挂掉了,用户的业务就会中断。
双活是觉得备用数据中心只做备份太浪费了,所以让主备两个数据中心都同时承担用户的业务,此时,主备两个数据中心互为备份,并且进行实时备份。
一般来说,主数据中心的负载可能会多一些,比如分担60~70%的业务,备数据中心只分担40%~30%的业务。
双活数据中心解决方案在当今数字化时代,数据中心的重要性日益凸显。
随着云计算、大数据、人工智能等技术的快速发展,数据中心的需求也在不断增加。
然而,传统的单活数据中心面临着诸多挑战,例如单点故障风险大、资源利用率低、能耗高等问题。
为了解决这些挑战,双活数据中心方案应运而生。
双活数据中心是指在两个地理位置相距较远的数据中心之间进行数据的主备备份,当一个数据中心发生故障时,另一个数据中心可以立即接管其工作,保证业务的连续性和可靠性。
双活数据中心解决方案可以有效降低单点故障风险,提高系统的可用性和稳定性。
在双活数据中心解决方案中,关键的一环是数据的同步和备份。
通过采用实时数据同步技术,可以确保两个数据中心之间的数据保持一致性,当主数据中心发生故障时,备份数据中心可以立即接管工作,保证业务的连续性。
同时,双活数据中心还可以实现负载均衡,提高资源的利用率,降低能耗成本。
双活数据中心解决方案还可以应对突发事件,例如自然灾害、网络攻击等。
通过将数据中心部署在地理位置相距较远的地方,可以有效降低突发事件对业务的影响,保障数据的安全性和可靠性。
除此之外,双活数据中心解决方案还可以为企业提供更加灵活的部署方式。
企业可以根据自身的业务需求和预算情况,选择合适的数据中心部署方案,实现资源的灵活调配和成本的最优化。
总的来说,双活数据中心解决方案是一种高可用、高稳定、高灵活的数据中心部署方案,可以有效应对传统单活数据中心所面临的诸多挑战。
随着数字化技术的不断发展,双活数据中心解决方案必将成为未来数据中心发展的主流趋势。
通过采用双活数据中心解决方案,企业可以提高业务的连续性和可靠性,降低风险,实现业务的持续发展。
因此,我们有理由相信,双活数据中心解决方案将会在未来得到更加广泛的应用和推广。
大话数据中心双活在当今数字化飞速发展的时代,数据中心已经成为了企业运营的核心支撑。
而“数据中心双活”这个概念,也逐渐从专业领域走入了更多人的视野。
那么,到底什么是数据中心双活呢?让我们一起来揭开它神秘的面纱。
想象一下,您的企业正在如火如荼地开展业务,突然数据中心出了故障,所有的业务都陷入了停滞,这会给企业带来多大的损失?数据中心双活,简单来说,就是让两个数据中心同时处于工作状态,互为备份,共同承担业务负载。
这样一来,即使其中一个数据中心出现问题,另一个也能迅速接管,确保业务的连续性,就像汽车的双引擎,一个出了故障,另一个依然能保证车辆继续前行。
为什么我们需要数据中心双活呢?首先,它能极大地提高业务的可用性和可靠性。
在竞争激烈的市场环境中,企业的业务不能有丝毫的中断,否则可能会失去客户的信任,甚至面临市场份额的流失。
其次,双活的数据中心可以实现资源的优化利用。
两个数据中心可以根据业务的繁忙程度动态地分配资源,提高资源的利用率,降低成本。
再者,它有助于应对突发事件,比如自然灾害、网络攻击等,为企业的业务提供了强大的韧性。
要实现数据中心双活,可不是一件简单的事情。
这需要在技术、架构、管理等多个方面下功夫。
在技术层面,数据同步是关键。
两个数据中心的数据必须实时同步,确保数据的一致性和完整性。
这就需要高效的数据复制技术,能够在短时间内将数据准确无误地从一个中心传输到另一个中心。
同时,网络的稳定性和低延迟也至关重要。
如果网络出现卡顿或者延迟过高,就会影响数据的传输和业务的响应速度。
架构设计也不能马虎。
要实现双活,需要对数据中心的架构进行精心规划。
包括服务器的部署、存储系统的配置、应用程序的架构等。
比如,服务器要能够在两个数据中心之间灵活切换,存储系统要能够支持数据的快速同步和共享。
管理方面也面临着挑战。
两个数据中心的协同管理需要一套完善的流程和制度。
包括人员的分工、故障的应急处理、资源的调配等。
而且,还需要对员工进行培训,让他们熟悉双活的架构和操作流程,以确保在关键时刻能够迅速响应。
双活数据中心方案双活数据中心方案一、介绍双活数据中心方案是一种高可用性解决方案,通过将数据和应用同时部署在两个数据中心,实现数据和应用的双向同步,提供业务连续性,降低系统故障风险。
本文档将详细介绍双活数据中心方案的各个方面。
二、架构设计1、数据中心选择- 硬件条件:选择具备足够硬件资源的数据中心,包括服务器、存储等设备。
- 网络条件:确保数据中心之间的网络带宽和延迟满足业务需求。
- 电力条件:确保数据中心具备稳定可靠的电力供应。
2、数据同步- 数据同步技术:选择合适的数据同步技术,如数据库复制、文件同步等,使两个数据中心的数据保持一致性。
- 数据同步策略:确定数据同步的频率和方式,如同步延时要求和同步方式(异步或同步)等。
3、应用部署- 应用集群化:将应用部署在多个服务器上,实现负载均衡和故障切换。
- 应用同步部署:将应用同时部署在两个数据中心,实现两地的业务连续性。
4、故障切换与容灾- 故障切换策略:定义故障触发条件和切换流程,确保故障时能够快速切换到备用数据中心。
- 容灾测试:定期进行容灾测试,验证容灾方案的可行性和有效性。
三、监控与报警1、监控系统- 监控指标:确定需要监控的指标,如服务器负载、网络流量、存储空间等。
- 监控工具:选择合适的监控工具,实时监控数据中心的各项指标。
- 监控策略:设置监控策略,包括告警阈值、告警通知方式等。
2、报警系统- 报警方式:选择适合的报警方式,如邮件、短信、方式APP等。
- 报警接收人:确定接收报警信息的人员,包括运维团队、管理人员等。
四、数据备份与恢复1、数据备份- 备份频率:确定数据备份的频率,如每天、每周等。
- 备份策略:定义备份策略,包括全量备份和增量备份等。
- 备份验证:定期验证备份数据的完整性和可用性。
2、数据恢复- 恢复时间目标(RTO):定义数据恢复的时间目标,即从故障发生到数据恢复的时间。
- 恢复点目标(RPO):定义数据恢复的点目标,即恢复到哪个时间点的数据。
双活数据中心方案双活数据中心方案是一种部署在不同地理位置的两个数据中心,旨在提供高可用性和灾备恢复能力。
这种方案能够确保在一个数据中心出现故障的情况下,另一个数据中心能够顺利接管服务,并保证用户体验不受影响。
以下将详细介绍双活数据中心方案的设计和优势。
1.数据复制:双活方案需要确保两个数据中心之间的数据实时复制或者近实时复制。
这可以通过数据库的主从复制、文件同步或者数据快照实现。
数据复制的目的是保持数据的一致性,以便在故障发生时能够无缝切换到另一个数据中心。
2.心跳检测和故障切换:为了监测数据中心的健康状态,通常会设置心跳检测机制,以确保数据中心之间的连接正常。
如果主数据中心出现故障,心跳检测会及时发现,并触发故障切换机制,将服务切换到备用数据中心。
故障切换的过程应该是自动化的,以减少人工干预和减少切换时间。
3.基础设施冗余:为了实现高可用性,双活方案需要在两个数据中心都配置冗余的基础设施,包括独立的电力供应、网络连接、服务器和存储设备等。
当一个数据中心发生故障时,备用数据中心能够顺利接管服务,而不会由于基础设施故障而导致服务中断。
1.高可用性:双活方案可以提供更高的可用性,因为即使一个数据中心出现故障,另一个数据中心仍然可以继续提供服务。
这种设计可以最大限度地减少服务中断的风险,并提供卓越的用户体验。
2.灾备恢复能力:双活方案能够提供更好的灾备恢复能力。
当一个数据中心发生灾难性故障时,备用数据中心可以快速接管服务,并恢复运营。
这种方案可以最大限度地减少业务损失,并提供持续的服务。
3.地理位置容灾:由于双活方案将数据中心部署在不同地理位置,可以有效应对地域性的自然灾害或人为事故。
即使一个地区受到灾害影响,另一个地区的数据中心仍然能够正常运营,确保数据安全和业务连续性。
4.故障切换和容错能力:双活方案通常自动化故障切换,减少人工干预的需要。
这种方案可以提供更快的故障恢复时间,并减少对用户的影响。
此外,双活方案中的数据复制和冗余设计可以减少单点故障的风险,提供更可靠的服务。
双活数据中心方案(华为)目录1 灾备建设的挑战与趋势....................................... 错误!未定义书签。
2 华为双活数据中心解决方案介绍 (2)2.1双活数据中心架构 (3)2.2 双活数据中心部署 (4)2.3 客户价值 (5)3双活数据中心关键技术 (6)3.1存储层双活 (6)3.1.1 AA双活架构 (6)3.1.2 高可靠技术 (8)3.1.3高性能技术 (15)3.1.4 高可扩展性 (17)3.2 计算层双活 (19)3.3应用层双活 (20)3.3.1 B/S应用双活 (20)3.3.2 C/S应用双活 (21)3.3.3数据库双活 (22)3.4.网络架构 (26)3.4.1 网络架构 (26)3.4.2跨数据中心网络 (26)3.4.3业务访问网络架构 (27)3.4.4二层互联 (28)3.4.5负载均衡技术 (29)3.5传输层技术 (31)3.6安全层技术 (31)4可视化容灾管理 (34)4.1总体部署 (35)4.2应用支持矩阵 (35)4.3 SAN双活场景 (36)4.3.1 SAN双活场景 (36)4.3.2 SAN双活+快照场景 (37)5. 故障场景 (39)5.1 GSLB 故障 (39)5.2 SLB故障 (40)5.3Web服务器故障 (41)5.4应用服务器故障 (42)5.5 Oracle RAC 故障 (42)5.6 IBM DB2 故障 (43)5.7 阵列单控故障 (43)5.8广域网链路故障 (44)5.9站点间链路故障 (44)5.10站点故障 (45)1 灾备建设的挑战与趋势随着信息化技术的飞速发展,信息系统在各种行业的关键业务中扮演着越来越重要的角色。
在通讯、金融、医疗、电子商务、物流、政府等领域,信息系统业务中断会导致巨大经济损失、影响品牌形象并可能导致重要数据丢失。
因此,保证业务连续性是信息系统建设的关键。
双活数据中心解决方案双活数据中心是一种为了提高数据中心的可靠性和容错能力而采取的解决方案。
传统的单一数据中心往往会存在单点故障的问题,当数据中心发生故障时,会导致服务的中断,造成严重的损失。
而双活数据中心则通过将数据和服务分散在两个或多个数据中心中,从而实现数据和服务的高可用性和容错性。
下面将介绍双活数据中心解决方案的原理、技术和应用。
双活数据中心的原理是通过在不同地理位置建设两个相互独立的数据中心,每个数据中心都具备完整的数据和服务能力。
在正常情况下,数据和服务会在两个数据中心之间进行实时同步,用户可以通过任意一个数据中心访问数据和服务。
当一些数据中心发生故障时,系统会自动切换到另一个数据中心继续提供服务,从而实现了服务的高可用性和容错性。
为了实现双活数据中心解决方案,需要采取一系列的技术手段。
首先,需要使用高速网络来保证两个数据中心之间的实时数据同步。
常见的技术包括数据镜像、数据复制和数据同步等。
其次,需要使用负载均衡技术来处理用户的请求,将请求分发到两个数据中心中的任意一个。
常见的负载均衡技术包括DNS负载均衡、硬件负载均衡和软件负载均衡等。
最后,需要使用自动故障转移和故障恢复技术来处理数据中心的故障情况。
常见的技术包括故障切换、容灾备份和自动恢复等。
双活数据中心解决方案可以应用于各种场景。
首先,它可以应用于互联网服务提供商,以提供高可用性的互联网服务。
例如,电子商务平台可以使用双活数据中心来确保订单和支付数据的安全和可靠性。
其次,它可以应用于金融行业,以确保金融交易的可靠性和安全性。
例如,银行可以使用双活数据中心来实现跨地域的交易处理和结算。
第三,它可以应用于企业内部的数据中心,以提高企业内部系统的可用性和容错性。
例如,大型企业可以使用双活数据中心来部署企业资源计划(ERP)系统和客户关系管理(CRM)系统等。
总之,双活数据中心解决方案是一种提高数据中心可靠性和容错能力的有效方法。
通过将数据和服务分散在两个或多个数据中心中,并实现实时数据同步和自动故障转移,可以提供高可用性和容错性的数据中心服务。
双活数据中心方案双活数据中心方案文档1.引言1.1 目的本文档旨在提供一个详尽的双活数据中心方案,用于在灾难恢复和高可用性方面保护组织的关键业务系统和数据。
该方案旨在确保业务连续性,减少停机时间,并提供可靠的数据备份和恢复机制。
1.2 背景随着企业依赖关键业务系统的增加,确保系统的高可用性和容错性变得至关重要。
传统的单活数据中心方案可能因为单点故障而导致停机和数据丢失的风险。
为了解决这些问题,双活数据中心方案应运而生。
通过在两个地理位置上设置相互镜像的数据中心,双活方案可以提供故障转移和灾难恢复能力,以确保业务连续性。
2.方案概述2.1 架构图在双活数据中心方案中,我们将使用两个位于不同地理位置的数据中心(Data Center A和Data Center B),它们通过高速网络连接进行同步和数据复制。
每个数据中心都包含一组服务器、存储设备和网络设备,以及备用电源和冷却系统,以提供高可用性和灾难恢复能力。
2.2 功能要求- 快速故障转移和灾难恢复:当一个数据中心发生故障时,系统可以自动切换到备用数据中心,从而减少停机时间。
- 数据同步和复制:确保数据在两个数据中心之间的同步和复制,使数据丢失最小化。
- 监控和报警:监测数据中心的运行状态和性能参数,及时发现并解决潜在问题。
- 安全性和数据保护:采取适当的安全措施,保护数据的机密性和完整性,并进行定期备份。
3.数据中心架构3.1 数据中心 A数据中心 A 位于位置 X,包含以下组件:- 服务器集群:运行核心业务系统的一组服务器,以提供业务功能。
- 存储设备:用于存储和管理数据的高性能存储设备。
- 网络设备:提供内部和外部网络连接的交换机、路由器和防火墙等。
- 冷却系统:确保数据中心的温度保持在合适的范围内。
- 备用电源:在主电源故障时提供电力供应。
3.2 数据中心 B数据中心 B 位于位置 Y,与数据中心 A 类似,包含以下组件:- 服务器集群:与数据中心 A 同步的一组服务器,用于故障转移和灾难恢复。
双活数据中心方案(华为)目录1 灾备建设的挑战与趋势 (3)2 华为双活数据中心解决方案介绍 (4)2.1双活数据中心架构 (4)2.2 双活数据中心部署 (7)2.3 客户价值 (9)3双活数据中心关键技术 (10)3.1存储层双活 (10)3.1.1 AA双活架构 (10)3.1.2 高可靠技术 (13)3.1.3高性能技术 (25)3.1.4 高可扩展性 (30)3.2 计算层双活 (34)3.3应用层双活 (35)3.3.1 B/S应用双活 (35)3.3.2 C/S应用双活 (37)3.3.3数据库双活 (39)3.4.网络架构 (45)3.4.1 网络架构 (45)3.4.2跨数据中心网络 (45)3.4.3业务访问网络架构 (46)3.4.4二层互联 (51)3.4.5负载均衡技术 (52)3.5传输层技术 (58)3.6安全层技术 (59)4可视化容灾管理 (64)4.1总体部署 (64)4.2应用支持矩阵 (65)4.3 SAN双活场景 (66)4.3.1 SAN双活场景 (66)4.3.2 SAN双活+快照场景 (68)5. 故障场景 (71)5.1 GSLB 故障 (72)5.2 SLB故障 (73)5.3Web服务器故障 (75)5.4应用服务器故障 (77)5.5 Oracle RAC 故障 (79)5.6 IBM DB2 故障 (80)5.7 阵列单控故障 (81)5.8广域网链路故障 (83)5.9站点间链路故障 (84)5.10站点故障 (85)1 灾备建设的挑战与趋势随着信息化技术的飞速发展,信息系统在各种行业的关键业务中扮演着越来越重要的角色。
在通讯、金融、医疗、电子商务、物流、政府等领域,信息系统业务中断会导致巨大经济损失、影响品牌形象并可能导致重要数据丢失。
因此,保证业务连续性是信息系统建设的关键。
目前,各行业普遍通过建设灾备中心来提高关键应用的业务连续性,在灾备中心保存生产数据副本。
传统灾备部署方式为一个生产中心对应一个灾备中心,灾备中心平时不对外提供业务访问。
一旦生产中心发生灾难,业务瘫痪,无法短时间恢复时,灾备中心才应需启动以提供业务访问。
这种灾备系统面临以下挑战:➢当生产中心遭遇供电故障、火灾、洪灾、地震等灾难时,需要手动将业务切换到灾备中心,有可能需要专业的恢复手段和长时间调试,业务中断时间长,无法保证业务连续运行。
➢灾备中心不能对外提供服务,常年处于闲置状态,资源利用率低。
华为针对客户提高资源利用率,在两个数据中心间实现负载均衡和灾难自动切换的需求,推出了端到端双活数据中心解决方案。
2 华为双活数据中心解决方案介绍双活数据中心解决方案指两个数据中心均处于运行状态,可以同时承担生产业务,提高数据中心的整体服务能力和系统资源利用率。
业界目前有两种双活形态:AP双活和AA双活。
➢AP双活通过将业务分类,部分业务以数据中心A为主,数据中心B为热备,而部分业务则以数据中心B为主,数据中心B为热备,以达到近似双活的效果。
➢AA双活则是真正的双活,同一个双活LUN的所有I/O路径均可同时访问,业务负载均衡,故障时可无缝切换。
华为双活数据中心解决方案为AA双活架构,以业界领先的OceanStor V3 HyperMetro 功能为基础,与Web、数据库集群、负载均衡、传输设备和网络等组件相结合,为客户提供100km的端到端双活数据中心解决方案,确保业务系统发生设备故障、甚至单数据中心故障时,业务无感知,自动切换,实现RPO (Recovery Point Objective) =0, RTO (Recovery Time Objective) =0 (RTO 与应用系统及部署方式有关)。
2.1双活数据中心架构端到端双活数据中心解决方案分为6层:存储层、计算层、应用层、网络层、传输层和安全层。
逻辑架构图如图2-1所示。
图2-1逻辑架构图端到端双活数据中心解决方案,为了实现更好的可靠性、性能和负载均衡,针对每一层进行一些设计和优化,表2-1列举了一部分设计要点。
表2-1 6层方案设计要点2.2 双活数据中心部署整体的方案物理组网图如图2-2所示。
图2-2 物理组网图各方案模块部署如表2-2所示:说明GSLB是英文Global Server Load Balance的缩写,意思是全局负载均衡。
作用:实现在广域网 (包括互联网)上不同地域的服务器间的流量调配,保证使用最佳的服务器服务离自己最近的客户,从而确保访问质量。
SLB是Server Load Balancing ,意思是服务器负载均衡。
SLB可以看作HSRP (热备份路由器协议)的扩展,实现多个服务器之间的负载均衡。
2.3 客户价值华为充分利用其宽产品线的优势,通过多产品的紧耦合,为客户提供端到端双活数据中心解决方案,也是业界唯一可提供端到端双活解决方案的厂家。
6层Active-Active可靠性设计,业务负载均衡,应用零中断,数据零丢失,实现了业界最高等级的业务连续性保障。
华为双活数据中心解决方案有以下特点:➢AA双活架构,数据零丢失,业务零中断(RPO=0,RTO =0)。
➢两个数据中心同时提供业务,充分利用灾备资源。
➢支持异构存储,保护已有设备投资。
➢方案扩展灵活,容灾可视化管理。
华为6层双活数据中心解决方案能给客户带来以下价值:➢端到端双活设计:华为提供端到端双活方案设计,快速上线业务。
➢真AA精简双活,业务7X24小时持续运行:去存储网关精简双活架构,方案故障点少,系统可靠性更高,提供站点同时读写的Acive-Active双活能力。
➢双活I/O优化,性能高:去存储网关的双活架构,I/O处理路径最短。
同时,通过锁预取优化,存储协议优化和地域优化访问等极大提升双活业务性能。
➢利旧现有设备,保护现有投资:存储支持异构接管第三方存储,计算层支持FusionSphere等虚拟化平台利旧已有服务器,保护现有投资。
3双活数据中心关键技术以下是华为双活数据中心解决方案的关键技术:➢存储层:通过HyperMetro实现存储层的双活➢计算层:通过FusionSphere、VMware等虚拟化技术,提供虚拟机HA特性,故障时自动恢复。
➢应用层:通过应用集群和数据库集群技术实现双活。
➢网络层:通过DWDM、EVN等二层互联技术,实现低时延、高可靠的二层网络互联;通过网络设备的双活网关、RHI等路径优化技术,以及全局负载均衡器、➢服务器负载均衡器实现双活就近接入或高可用网络切换。
➢传输层:通过设备冗余及板卡冗余构建可靠的双活传输网络。
➢安全层:通过防火墙和安全策略规划和设计保证访问安全,通过传输层加密特性,保证跨数据中心数据传输安全。
华为双活数据中心解决方案在以上6个层次上进行联动及联合,为客户提供端到端的双活方案。
3.1存储层双活华为双活数据中心解决方案存储层基于OceanStor V3融合存储系统的HyperMetro特性实现。
HyperMetro采用AA双活架构将两套存储阵列组成跨站点集群,实现数据实时镜像,具有高可靠、高性能和高扩展的特点。
本章节将对HyperMetro特性的主要技术原理和特点进行介绍。
3.1.1 AA双活架构3.1.1.1并行访问HyperMetro特性基于两套存储阵列实现AA(Active-Active)双活,两端阵列的双活LUN 数据实时同步,且双端能够同时处理应用服务器的I/O读写请求,面向应用服务器提供无差异的AA并行访问能力。
当任何一台磁盘阵列故障时,业务自动无缝切换到对端存储访问,业务访问不中断。
相较于AP方案,AA双活方案可充分利用计算资源,有效减少阵列间通信,缩短I/O 路径,从而获得更高的访问性能和更快的故障切换速度。
图3-1展示了几种双活方案的交互流程。
图3-1存储双活架构数据中心A 数据中心B3.1.1.2 免网关设计HyperMetro双活架构无需额外部署虚拟化网关设备,直接使用两套存储阵列组成跨站点集群系统。
最大支持32个存储控制器,即两套16控存储阵列组建双活关系。
本方案架构精简、与存储增值特性良好兼容,对客户的价值如下:➢减少网关故障点,提高方案可靠性。
➢I/O响应速度更快,无需经过存储网关转发,减少网关转发I/O时延。
➢双活可以兼容存储阵列已有特性,与OceanStor V3融合存储系统的其它Smart系列和Hyper系列特性组合,可为客户提供多种数据保护和灾备解决方案。
➢显著降低双活组网复杂度,便于维护。
3.1.3.3 I/O访问路径HyperMetro在应用主机侧,通过UltraPath主机多路径软件,将两台存储阵列上的双活成员LUN聚合为一个双活LUN,以多路径Vdisk方式对应用程序提供I/O读写能力。
应用程序通过访问VDISK时,Ultrapath通过选路模式,选择最佳的访问路径,将I/O请求下发到存储阵列。
存储阵列的LUN空间上接收到I/O请求后,对于读I/O请求,直接读本地Cache空间,将数据返回应用程序;对于写I/O请求,首先会进行并行访问互斥(参见3.1.3.4 分布式锁技术),获取写权限后,将I/O请求数据同时写本地双活成员LUN Cache以及对端的双活成员LUN Cache,双端写成功后返回应用程序写完成(参见3.1.2.2跨站点数据实时镜像)。
图3-2双活IO路径3.1.1.4存储层组网两套双活存储阵列间通信支持FC或IP链路,推荐使用FC链路。
另外,存储阵列和仲裁服务器之间的链路采用更易于获取的IP链路。
图3-3为4控制器的双活组网情况下,FC交换机端口占用情况。
图3-3阵列双活方案组网3.1.2 高可靠技术HyperMetro在继承OceanStor存储系统高可靠设计的基础上,全新设计了一些解决方案级高可靠技术,最大化提高了存储双活方案的可靠性。
本章节将从以几个方面介绍HyperMetro的高可靠技术:➢跨站点集群➢跨站点数据实时镜像➢跨站点坏块修复➢仲裁防脑裂➢高可靠链路设计3.1.2.1 跨站点集群两套独立的存储阵列组建成跨站点集群,并以跨站点集群为核心,提供双活存储架构,向应用服务器提供无差异的并行访问,处理应用服务器的i/o请求。
双活跨站点集群配置过程极为简单,只需要将两套存储阵列配置成双活域,即可完成跨站点集群配置。
跨站点集群系统使用阵列间FC或IP链路作为通信链路,完成全局节点视图建立和状态监控。
在全局节点视图基础上,跨站点集群系统提供分布式互斥等能力,支持AA 双活架构。
下图为双活跨站点集群示意图。
图3-4双活跨站点集群集群节点具有并发访问能力。
当出现单个控制器故障时,其承接的业务将被切换到本地集群的其它工作控制器;本地集群工作控制器全故障时,则切换至跨站点集群另一个本地集群。