华为存储双活数据中心规划设计指南
- 格式:pdf
- 大小:841.93 KB
- 文档页数:25
双活数据中心解决方案-通用1·引言在现代信息化时代,数据中心的高可用性和可靠性成为各个行业组织所追求的目标。
为了实现数据中心的高可用性,双活数据中心解决方案被广泛采用。
本文将介绍双活数据中心解决方案的通用架构和实施步骤。
2·概述2·1 解决方案概述双活数据中心解决方案是通过在两个地理位置相距较远的数据中心之间进行数据实时同步,以确保当一个数据中心发生故障时,另一个数据中心可以无缝接替其工作,保证业务系统的连续性运行。
2·2 设计目标双活数据中心解决方案的设计目标包括:●提供连续性的业务运行。
●最小化数据中心之间的数据同步延迟。
●最大化数据恢复速度。
●确保数据的一致性。
3·架构设计3·1 主备数据中心双活数据中心解决方案通常由一个主数据中心和一个备份数据中心组成。
主数据中心负责处理实时业务请求,备份数据中心作为主数据中心的镜像,并负责处理当主数据中心故障时的业务请求。
3·2 数据同步机制为了实现数据中心间的实时数据同步,双活数据中心解决方案通常采用以下机制:●数据异步复制。
●数据同步模式。
●数据冲突解决策略。
4·实施步骤4·1 前期准备在实施双活数据中心解决方案之前,需要进行以下准备工作:●确定主备数据中心的位置和网络架构。
●评估主备数据中心之间的网络带宽和延迟。
●确定数据同步机制和数据冲突解决策略。
4·2 网络连接实施双活数据中心解决方案需要建立可靠的网络连接,确保主备数据中心之间的数据实时同步。
4·3 数据同步配置配置数据同步机制,并根据实际需求进行性能调优和容错配置。
4·4 故障切换测试在实施双活数据中心解决方案之后,需要进行故障切换测试,确保备份数据中心能够无缝接替主数据中心的工作。
4·5 系统监控和运维建立有效的系统监控和运维机制,对主备数据中心进行实时监控,并定期进行数据中心切换和巡检。
华为存储双活方案简介在企业级存储系统中,数据的高可用性和业务的连续性非常重要。
华为存储双活方案提供了一种实现存储系统高可用性和业务连续性的解决方案。
本文将详细介绍华为存储双活方案的原理、特点以及部署步骤。
方案原理华为存储双活方案基于主备复制技术,在两个不同的数据中心部署两个存储系统,分别作为主节点和备节点。
主节点负责接收和处理业务数据的写操作,同时将数据通过复制技术同步到备节点。
备节点只负责接收并处理业务数据的读操作。
当主节点发生故障时,备节点会接管主节点的角色,并继续提供业务服务。
在华为存储双活方案中,主备节点之间通过高速网络连接,采用同步复制技术确保数据的一致性。
当主节点写入一条数据时,会先将数据写入本地存储,并通过网络将数据发送到备节点进行复制。
备节点会确认收到数据后,才会给主节点发送确认消息。
这种同步复制技术保证了主备节点数据的一致性,同时也避免了数据丢失的情况。
特点华为存储双活方案具有以下几个特点:高可用性华为存储双活方案采用主备复制技术,通过备节点接管主节点的角色,实现存储系统的高可用性。
当主节点发生故障时,备节点可以立即接管并继续提供业务服务,不会中断用户的访问。
业务连续性华为存储双活方案可以保证业务的连续性,当主节点发生故障时,备节点会立即接管并继续处理业务请求。
用户可以无感知地继续访问存储系统,不会造成业务中断。
数据一致性华为存储双活方案中的主备节点通过同步复制技术确保数据的一致性。
当主节点写入一条数据时,会先将数据写入本地存储,并通过网络将数据发送到备节点进行复制。
备节点会确认收到数据后,才会给主节点发送确认消息。
这种同步复制技术保证了主备节点数据的一致性,避免了数据丢失的情况。
部署灵活性华为存储双活方案可以根据实际需求进行灵活部署。
用户可以根据业务规模和数据中心的分布情况,在不同地点部署主备节点,以实现全球范围内的高可用性和业务连续性。
部署步骤下面将详细介绍华为存储双活方案的部署步骤:步骤一:选择主备节点根据业务规模和数据中心的分布情况,选择适合的主备节点。
双活数据中心规划设计双活数据中心规划设计文档⒈引言⑴目的⑵范围⑶定义⒉背景⑴组织概况⑵数据中心现状⑶需求分析⒊双活数据中心架构设计⑴双活数据中心概述⑵数据流程分析⑶网络架构设计⑷存储架构设计⑸安全性和高可用性设计⑹容灾和故障恢复设计⒋双活数据中心基础设施设计⑴地理位置选择⑵电力供应设计⑶冷却系统设计⑷网络连接设计⑸计算设备选型⑹存储设备选型⑺安全设备选型⒌参数配置和容量规划⑴服务器数量和配置⑵存储容量规划⑶网络带宽规划⑷功耗和散热规划⒍实施计划⑴项目里程碑⑵活动计划⑶资源分配⒎风险管理和备份策略⑴风险识别与分类⑵应对措施和预案⑶备份策略和恢复方案⒏测试计划与验证⑴测试目标与方法⑵系统集成测试⑶容灾演练与验证⒐项目交付与验收⑴交付标准⑵验收标准和程序⑶文档交付和培训⒑附件附件1:数据中心平面图附件2:网络架构图附件3:存储架构图附件4:容灾和故障恢复流程图法律名词及注释:●数据保护:数据保护是指对数据进行保护和备份,以防止数据丢失、被篡改或意外损坏。
●数据隐私:数据隐私是指个人或组织对其个人信息的隐私权和数据保护的要求。
●可用性:可用性是指系统或服务处于可正常使用状态的能力。
●法规合规:法规合规是指组织履行法律、法规、政策和行业标准等法规要求的过程和实践。
●机密性:机密性是指信息只能被授权的个人或组织访问和使用的属性。
●容灾:容灾是指在发生灾害或故障时,确保系统或服务继续运行的能力。
●故障恢复:故障恢复是指将系统或服务从故障状态恢复到正常状态的过程。
●网络安全:网络安全是指保护计算机网络不受未经授权的访问、破坏、篡改或泄露的保护措施。
●业务连续性:业务连续性是指在发生灾害或故障时维持组织关键业务的能力。
双活数据中心解决方案目录1.行业背景 (3)2.系统建设原则及思路 (3)3.技术方案 (5)双活数据中心基础架构设计 (5)双活数据中心网络设计 (6)双活数据中心系统设计 (6)双活数据中心系统优势 (9)浪擎CDP,最可靠的CDP (9)ACDP-恢复速度最快的CDP (10)ACDP-强大的复制,恢复.容错功能 (10)ACDP-支持报警和一键切换 (11)其他优势 (12)1.行业背景随着全球化信息技术的发展,信息化已经成为各个单位的关注热点,各行各业都在进行着信息化的改革。
信息化系统已经成为企业核心竞争力的关键条件之一。
企业信息化的时代也发生了翻天覆地的变化。
为适应我国改革开放和社会主义现代化建设的新形势对公安执法提出的新要求国家提出了以“公安信息化工作”为核心,以“科技强警”为目标的国家信息化工程—“金盾工程”的建设要求。
“金盾工程”既全国公安信息化工程,是国家电子政务建设“十二金”中重要的一部分,主要是利用现代化信息通信技术增强我国公安机关的统一指挥,快速反应,协同作战,打击罪犯的能力,以适应公安机关动态管理和打击罪犯的需要。
随着金盾工程在全国的展开信息技术的广泛应用,公安信息化建设全面加快各种业务系统的陆续建设投入使用产生了大量的数据。
随着业务数据的增加和应用数据的依赖性的增强,数据已经成为开展业务不可缺少的基础。
数据的有效汇集,集中管理,综合分析以及容灾备份的需要等处理要求日益提高。
因此,通过管理机制与技术手段相结合保障数据的一致性和业务的连续性在建设公安系统容灾机制中势在必行。
2.系统建设原则及思路1)绿色容灾,减少对生产系统的影响双活数据中心在实施和使用的过程中对原有的生产系统、硬件系统、网络系统会造成一定的影响,有的容灾系统可能需要在冻结原有的生产系统的情况下进行数据的复制;有的容灾系统可能要对硬件、网络环境进行改造,改造成系统所要求的条件;有的容灾系统对生产服务器的CPU、内存、网络等资源占用较大,这些影响或者改造对原有的系统和数据都存在一定的风险性。
双活数据中心技术架构双活数据中心技术架构⒈引言在当今的数字化时代,数据中心成为了组织重要的基础设施之一。
为了确保数据中心的高可用性和灾备性,采用双活数据中心架构是一种常见的解决方案。
本文将详细介绍双活数据中心技术架构的设计和实施。
⒉技术架构设计⑴数据中心位置选择在选择双活数据中心的位置时,需要考虑地理位置、可用的网络连接和电力供应等因素。
优选位置可以减少网络延迟和降低灾难发生的风险。
⑵网络架构设计双活数据中心需要建立可靠的网络连接,以确保数据中心之间的实时数据同步。
常见的网络架构设计包括双活软件定义广域网(SD-WAN)和全球负载均衡(GSLB)等。
⑶存储架构设计双活数据中心的存储架构需要支持实时数据同步和容灾恢复。
常见的存储技术包括同步复制、异步复制和镜像等。
⑷服务器架构设计双活数据中心的服务器架构需要考虑负载均衡和故障转移等因素。
常见的服务器技术包括虚拟化、容器化和弹性伸缩等。
⑸数据同步和备份策略双活数据中心需要确保数据的实时同步和定期备份,以保证数据的完整性和可恢复性。
常见的策略包括实时复制和冷备份等。
⑹监控和管理体系双活数据中心的监控和管理体系需要实时监测系统运行状况,并能够及时发现和修复故障。
常见的工具包括监控系统、自动化运维工具和报警系统等。
⒊实施步骤⑴环境准备在实施双活数据中心之前,需要做好环境准备工作,包括建设物理设施、配置网络设备和服务器等。
⑵技术部署根据前面设计的技术架构,逐步部署双活数据中心的各个组件和系统。
需要确保各个组件的正确配置和互相之间的协调配合。
⑶测试和验证在实施完双活数据中心后,需要进行测试和验证,包括功能测试、性能测试和灾难恢复测试等。
确保系统能够满足预期的需求和性能指标。
⑷运维和优化在运行双活数据中心期间,需要不断进行运维和优化工作,包括监控系统运行状况、查找和修复故障、优化系统性能和容量规划等。
⒋附件本文档附带以下附件:●双活数据中心技术架构示意图●数据中心位置选择的评估报告●网络架构设计的详细配置文件●存储架构设计的配置和操作手册●服务器架构设计的部署和运维指南●数据同步和备份策略的执行计划⒌法律名词及注释●双活数据中心:指由两个数据中心组成的架构,用于提高数据中心的可用性和灾备性。
存储双活架构设计规范我们知道,对于容灾架构来讲,脑裂是灾难性的事件。
如果从一个统一集群的调度变成两个相互独立的集群调度,意味着双方的写操作相互也是独立的,但是他们的存储空间是共享的,AA模式下通过锁机制控制并发,HA模式下通过存储卷的Owner控制写的权限。
但是独立之后意味着两个集群可以随时写入同样的存储地址,必然会造成脏写脏读等一系列数据不一致事件,这对业务来讲是灾难性的。
那么存储双活架构的设计当中,应该采用什么样的设计思路或者是方法才能避免这种情况的发生?四:为避免脑裂,存储双活架构设计应遵循哪些思想和方法?本次议题将由本人以及江西农信运维技术经理邓毓、哈尔滨银行系统专家团队存储管理员张鹏分别主张议题下的相关关键点,几位专家的主张在某农信资深技术经理雷智、宁夏银行技术经理陈明福的复议后,最终形成一定的共识供同行参考。
●社区专家主张●赵海某金融系统高级主管:每一种集群都会有相应的解决方法,通常可以通过节点优先级及仲裁的方式来解决,但是我们在利用这些策略进行架构设计的时候必须知道其原理以及最佳实践的方法。
容灾设计过程中避免脑裂问题的思路▪默认优先级解决方案以两个节点的Oracle RAC为例来讲,OracleRAC ASM管理模式下,磁盘组通常有三个(+DATA,+FRA,+OCR),在OCR磁盘组当中所有的磁盘中存储的数据包括两部分,一部分是Vote File,另外一部分就是OCR(Oracle ClusterRegistry)。
Vote File是用来记录集群节点的磁盘心跳信息,而OCR 是保存集群配置信息的数据。
Vote File,以整个文件的方式存储在OCR磁盘上,不做任何条带。
表1是其信息记录的一个说明。
表 1 Oracle 仲裁逻辑信息表1是一个三节点的Oracle RAC集群的VoteFile的一个示意矩阵,每一行是一个节点的写入的信息,例如第一行,Instance1分别把其对集群中的三个成员(1、2、3)进行私网检测的结果写入到仲裁文件当中,Instance2、Instance3同样把其检测结果写入仲裁文件,最终组成了三个节点的仲裁矩阵。
双活数据中心解决方案-通用双活数据中心解决方案-通用一、引言双活数据中心解决方案旨在提供高可用性和容灾性能,确保业务的连续性和数据的安全性。
本文档介绍了一个通用的双活数据中心解决方案,包括设计原则、架构、网络部署、数据同步、故障切换等内容。
二、设计原则1.资源均衡利用:双活数据中心应平衡两个数据中心的负载,确保资源的均衡利用。
2.容灾性能优化:数据中心之间应保持高速、可靠的连接,以确保数据同步的实时性和正确性。
3.快速故障恢复:在数据中心故障发生时,应能够快速切换到备份数据中心并恢复正常运行。
4.数据安全性保障:数据同步时应具备数据一致性和完整性的保障措施,确保数据在传输中不会丢失或损坏。
三、架构设计1.数据中心A:作为主数据中心,负责承载业务的主要运行和数据存储。
2.数据中心B:作为备份数据中心,负责实时备份数据、提供灾难恢复能力。
3.客户端接入:客户端可以通过多种方式接入数据中心A,如私有网络连接、互联网连接等。
四、网络部署1.数据中心连接:数据中心A和数据中心B之间应建立高速、可靠的连接,如光纤链路或专线连接。
2.客户端接入网络:客户端可以通过VPN连接、专线连接等方式接入数据中心A,以实现访问业务的需求。
五、数据同步1.数据同步方式:数据中心A和数据中心B之间应实现实时数据同步,可以采用同步复制或异步复制方式。
2.数据同步工具:可使用常见的数据库同步工具,如Oracle Data Guard、MySQL Replication等,来实现数据的自动同步。
六、故障切换1.故障检测与切换:通过监控系统实时监测数据中心A的故障,并在发生故障时自动切换到数据中心B,以保证业务的连续性。
2.故障恢复流程:一旦故障发生,需要进行故障诊断、数据恢复、服务切换等一系列操作来恢复正常运行。
七、附件八、法律名词及注释1.双活数据中心:指同时运行两个互联的、相互备份的数据中心的解决方案。
2.容灾性能:指系统在面对异常情况和灾害时,仍能保持正常运行的能力。
存储跨中心双活方案设计指南如何攻克十大技术难点?存储跨数据中心双活的方案是双活数据中心架构方案中最重要且最艰难的一项。
为了帮助企业IT架构师理清和解决存储跨中心双活方案架构的难点,twt社区专门邀请了企业IT架构师和存储专家整理出十个方案设计中较为典型的难点,逐一解析和解答,以帮助大家顺利地解决和尽量规避这些难点问题。
并整理为存储跨中心双活方案设计的一篇指南,方便大家收藏转发。
难点一:脑裂风险存储跨中心双活方案设计阶段该如何尽量避免脑裂?如何避免脑裂是每个双机系统都要重视的问题,存储双活系统尤其如此,脑裂会带来长时间的存储读写IO HANG住,轻则导致业务性能下降,重则因磁盘IO超时,导致数据库挂起甚至宕机,对生产业务系统造成重大影响。
所以在存储跨中心双活架构设计时,究竟应该如何尽量避免脑裂?解析和解答▼▼▼■邓毓某农信数据中心脑裂简单说就是两个数据中心间的网络和存储链路同时发生中断,导致两个数据中心内的应用、数据库或者操作系统同时抢占和利用共享的资源,造成资源的数据不一致,产生重大影响。
这个问题是存储跨中心双活方案设计、实施阶段不可避免要遇到的问题。
各个存储厂商、存储虚拟化产品厂商都有自己的避免脑裂的方式:(1)IBM SVC ESC/HYPERSWAP 或者IBM V9000/V7000/V5000 HYPERSWAP对于上述存储双活方案架构来说,呈现的是一种对称式的整体架构,为了防范脑裂,仲裁站点是必需的。
在仲裁站点中,基于IP的quorum节点和物理quorum磁盘都可以提供脑裂的仲裁服务,存储双活集群最多能够拥有3个物理quorum磁盘,也可以选择最多5个基于IP的quorum节点,这个基于IP的quorum节点可以是任何站点的任何服务器,或者公有云的一个虚拟机,在这个服务器内运行一个简单的仲裁JAVA程序即可。
所以可以看到,基于IP的仲裁服务其实大大提高了仲裁站点的选择空间,节省了企业双活建设成本,只要求IP可达,延时在80MS内即可。
双活数据中心方案双活数据中心方案文档1.引言1.1 目的本文档旨在提供一个详尽的双活数据中心方案,用于在灾难恢复和高可用性方面保护组织的关键业务系统和数据。
该方案旨在确保业务连续性,减少停机时间,并提供可靠的数据备份和恢复机制。
1.2 背景随着企业依赖关键业务系统的增加,确保系统的高可用性和容错性变得至关重要。
传统的单活数据中心方案可能因为单点故障而导致停机和数据丢失的风险。
为了解决这些问题,双活数据中心方案应运而生。
通过在两个地理位置上设置相互镜像的数据中心,双活方案可以提供故障转移和灾难恢复能力,以确保业务连续性。
2.方案概述2.1 架构图在双活数据中心方案中,我们将使用两个位于不同地理位置的数据中心(Data Center A和Data Center B),它们通过高速网络连接进行同步和数据复制。
每个数据中心都包含一组服务器、存储设备和网络设备,以及备用电源和冷却系统,以提供高可用性和灾难恢复能力。
2.2 功能要求- 快速故障转移和灾难恢复:当一个数据中心发生故障时,系统可以自动切换到备用数据中心,从而减少停机时间。
- 数据同步和复制:确保数据在两个数据中心之间的同步和复制,使数据丢失最小化。
- 监控和报警:监测数据中心的运行状态和性能参数,及时发现并解决潜在问题。
- 安全性和数据保护:采取适当的安全措施,保护数据的机密性和完整性,并进行定期备份。
3.数据中心架构3.1 数据中心 A数据中心 A 位于位置 X,包含以下组件:- 服务器集群:运行核心业务系统的一组服务器,以提供业务功能。
- 存储设备:用于存储和管理数据的高性能存储设备。
- 网络设备:提供内部和外部网络连接的交换机、路由器和防火墙等。
- 冷却系统:确保数据中心的温度保持在合适的范围内。
- 备用电源:在主电源故障时提供电力供应。
3.2 数据中心 B数据中心 B 位于位置 Y,与数据中心 A 类似,包含以下组件:- 服务器集群:与数据中心 A 同步的一组服务器,用于故障转移和灾难恢复。
双活数据中心技术架构双活数据中心技术架构文档1:引言双活数据中心技术架构是一种高可用性架构,可以实现数据中心之间的实时数据同步和容灾切换。
本文档将详细介绍双活数据中心技术架构的设计和实施方案,以及相关的技术细节和实施步骤。
2:概述双活数据中心技术架构是基于双中心架构的扩展,通过在两个数据中心之间建立高速网络连接和数据同步机制,实现数据的实时复制和同步。
这样可以实现数据的容灾备份和实时切换,减少系统停机时间和数据丢失的风险。
3:双活数据中心架构设计3.1 数据中心架构在双活数据中心架构中,通常有两个数据中心,一个作为主数据中心,另一个作为备份数据中心。
主数据中心负责处理前端的用户请求,备份数据中心则实时同步主数据中心的数据,并在主数据中心发生故障时接管用户请求。
3.2 网络架构双活数据中心之间需要建立可靠的高速网络连接,常见的方式包括跨地域的专线连接或者光纤网络连接。
这样可以保证数据的快速传输和实时同步。
3.3 数据同步机制为了实现数据的实时同步,可以采用多种数据同步机制,如数据库复制、分布式文件系统或者消息中间件等。
具体选择哪种数据同步机制,需要根据具体的应用场景和需求来进行评估和选择。
4:双活数据中心的部署和实施步骤4.1 需求分析和系统设计在部署双活数据中心之前,需要进行需求分析和系统设计,确定数据中心的功能和角色,以及网络架构和数据同步机制等。
4.2 硬件设备选型和采购根据需求分析和系统设计结果,选择合适的硬件设备,包括服务器、网络设备和存储设备等,并进行采购和部署。
4.3 系统配置和软件部署根据系统设计的要求,进行系统配置和软件部署,包括操作系统安装、数据库配置和数据同步软件安装等。
4.4 网络连接和数据同步建立双活数据中心之间的网络连接,并配置数据同步机制,确保数据的实时同步和一致性。
4.5 系统测试和故障演练完成系统部署后,需要进行系统测试和故障演练,验证系统的可用性和容灾切换的可行性。
双活数据中心规划设计本文档涉及附件:附件1:机房设计图纸附件2:网络拓扑图附件3:服务器配置表附件4:电力设备清单附件5:安全控制策略本文所涉及的法律名词及注释:1.数据中心:指为存储、管理和处理大量电子数据提供基础设施和服务的场所。
2.双活架构:双活是指在两个或多个数据中心之间建立的一种高可用性架构,其中所有任务在不同的数据中心之间同时运行,以实现容灾和故障转移。
3.SLA(Service Level Agreement):服务级别协议,用于规定服务提供商和客户之间的契约关系,包括服务可用性、响应时间、故障恢复等方面的约定。
4.RPO(Recovery Point Objective):恢复点目标,指在发生故障时所允许丢失的数据量。
5.RTO(Recovery Time Objective):恢复时间目标,指在发生故障时需要恢复系统正常运行所需的时间。
6.灾备测试:定期对灾备方案进行测试,以验证系统的可用性和恢复能力。
7.数据冗余:通过在多个地点备份数据来确保数据的可靠性和可用性。
8.UPS(Uninterruptible Power Supply):不间断电源,用于提供电力支持并保护设备免受电源波动或停电的影响。
9.精密空调:用于控制数据中心温度和湿度,保持设备正常运行所需的环境条件。
10.防火墙:用于监控和控制网络流量,保护数据中心免受未经授权的访问和攻击。
11.安全监控系统:实施对数据中心物理和网络环境进行监控和管理,确保安全性和可用性。
12.数据备份和还原:定期对数据进行备份,并确保能够恢复和还原数据以应对数据丢失或损坏的情况。
13.数据加密:采用密码学技术对数据进行加密,以确保数据在存储和传输过程中的安全性。
正文:一、引言双活数据中心是一种为了实现高可用性和容灾的架构方案。
本文档旨在提供一个完整的双活数据中心规划设计,包括设备选择、网络架构、电力支持、安全控制等方面的详细内容。
二、需求分析在规划设计双活数据中心之前,需进行需求分析,包括业务需求、可用性要求、安全要求等方面。
华为存储双活数据中心规划设计指南目录 (3)1.华为一体化双活数据中心方案概述1.1.跨中心部署架构 (4)1.2.同机房部署架构 (6) (9)2.华为一体化双活数据中心方案设计1.3.故障域设计 (10)1.4.组网设计 (11)1.4.1.管理网络 (11)1.4.2.存储层主机访问网络 (12)1.4.3.跨中心传输网络 (15)1.4.4.双活复制网络 (16)1.5.应用层设计 (16)1.5.1.数据库集群 (17)1.5.2.虚拟化集群 (19)1.6.多路径规划 (20)1.7.存储层设计 (21)1.8.仲裁设计 (22)1.华为一体化双活数据中心方案概述双活数据中心是指两个数据中心共享存储、网络以及服务器资源,两个数据中心可以同时对外提供服务,整个系统具有业务负载均衡和自动故障切换能力,能够最大限度保证业务持续运行不中断,为业务提供最高级别的业务连续性。
当客户业务需要存储同时提供SAN和NAS双活能力时,而由于业务之间存在的关联性,两者不可以完全割裂,此时我们称为SAN&NAS一体化双活。
例如:某业务由两个业务系统同时提供服务才可以提供服务,其中一个业务系统使用SAN存储,另一个业务系统使用NAS存储,此时,两者均正常运行才可以提供服务。
如果仅仅提供SAN存储双活能力,当单套存储系统故障,NAS无法访问时,将导致业务中断。
存储双活作为整个系统的核心基础架构平台,主要解决以下两个核心问题。
1.两个数据中心间数据实时同步,确保单中心存储部件故障时,零数据丢失(RPO=0)和自动切换。
为了达到这样的目标,NAS除了数据实时同步外,还要保证配置和锁的实时同步。
系统运行过程中,文件系统权限、共享等配置变更支持实时镜像,故障发生时双活自动切换后能立即使用。
2.提供可同时被两个数据中心主机访问的存储共享资源,从而实现主机应用集群的跨站点部署,保证异常情况下,应用的自动切换(RTO≈0)。
图1-1SAN&NAS一体化双活逻辑架构示意图1.1.跨中心部署架构跨中心的两套存储阵列均提供SAN和NAS存储空间,配置为双活Pair。
其中,SAN双活根据业务要求配置双活一致性组,按一致性组进行切换和仲裁;而NAS双活根据业务要求部署不同的租户,按租户粒度进行双活切换和仲裁。
SAN双活由主机层多路径负责主机到存储间具体IO下发路径的管理,推荐配置本地优先路径策略;NAS双活在主机上挂载由存储提供的文件系统网络路径,该路径同一时刻仅在其中一套存储上处于网络激活状态。
SAN和NAS双活只需要配置一台仲裁服务器即可,它们同属于一个双活域。
根据客户组网形态,主要有以下两种组网架构:IP+FC图1-2SAN&NAS一体化双活存储层部署架构示意图存储阵列间同时配置SAN双活和NAS双活时,无需单独为其中一个增值特性配置双活复制链路。
为了双活数据同步性能,同时避免不同类型链路性能差异影响业务,复制链路只能配置一种类型。
SAN&NAS一体化双活为此类组网时,双活复制链路仅需配置FC链路即可,跨中心的IP网络仅作为应用主机跨中心访问NAS存储使用。
每个控制器至少提供2个以太网端口用于主机访问NAS存储,至少提供2个FC 端口用于主机访问SAN存储,至少提供2个FC端口用于双活数据复制。
全IP图1-3SAN&NAS一体化双活存储层部署架构示意图(全IP)全IP组网架构时,SAN&NAS一体化双活跨中心部署时如图2-3所示。
SAN双活与NAS双活共用跨中心IP链路为双活复制链路,如果有其它FC交换机可以作为跨中心传输使用时,亦可单独配置FC链路为双活复制链路。
1.2.同机房部署架构数据中心内两套存储阵列均提供SAN和NAS存储空间,配置为双活Pair。
其中,SAN双活根据业务要求配置双活一致性组,按一致性组进行切换和仲裁;而NAS 双活根据业务要求部署不同的租户,按租户粒度进行双活切换和仲裁。
SAN双活由主机层多路径负责主机到存储间具体IO下发路径的管理,推荐配置全局负载均衡策略;NAS双活在主机上挂载由存储提供的文件系统网络路径,该路径同一时刻仅在其中一套存储上处于网络激活状态。
SAN和NAS双活只需要配置一台仲裁服务器即可,它们同属于一个双活域。
根据客户组网形态,主要有以下两种组网架构:IP+FC图1-4SAN&NAS一体化双活存储层部署架构示意图存储阵列间同时配置SAN双活和NAS双活时,无需单独为其中一个增值特性配置双活复制链路。
为了双活数据同步性能,同时避免不同类型链路性能差异影响业务,复制链路只能配置一种类型。
SAN&NAS一体化双活为此类组网时,双活复制链路仅需配置FC链路即可,支持阵列通过FC直连组网;IP网络仅作为应用主机访问NAS存储使用。
每个控制器至少提供2个以太网端口用于主机访问NAS存储,至少提供2个FC 端口用于主机访问SAN存储,至少提供2个FC端口用于双活数据复制。
全IP图1-5SAN&NAS一体化双活存储层部署架构示意图全IP组网架构时,SAN&NAS一体化双活在数据中心内部署时如图2-5所示。
SAN双活与NAS双活共用IP链路为双活复制链路,如果有FC端口可以作为数据传输使用时,推荐配置FC链路为双活复制链路。
需要注意的是:SAN和NAS不能使用阵列上相同的以太网端口与主机连接。
2.华为一体化双活数据中心方案设计SAN&NAS一体化双活数据中心方案为了确保用户业务连续性,需要根据业务提供相应的基础设施双活和冗余能力。
除应用层集群部署防止应用层单点故障业务中断外,还需要考虑的内容主要涉及以下几个方面:1.故障域:存在单点故障源的区域,例如电源,制冷。
2.组网:主要涉及跨中心网络,主机与阵列间业务网络,仲裁网络及端口规划。
3.应用:跨中心集群部署上的注意事项及其它要求。
4.多路径:路径策略设置建议。
5.存储:存储仲裁优先、一致性组,租户,磁盘和Pool规划建议。
6.仲裁:部署位置及IP网段规划。
2.1.故障域设计跨中心部署双活图1-6双活故障域规划图中所示黄色区域为故障域。
在相同的故障域中的所有设备,存在同时发生故障的可能性,此时业务将无法持续不中断运行。
如图3-1所示,3个故障域各自独立,不存在相同故障源。
为了避免问题发生,规划要点在于故障源的识别,常见的有:1.仲裁服务器不能与任意一个数据中心共用相同供电系统,如果无法避免,供电故障时,双活业务将中断。
2.存储复制网络与仲裁网络要充分考虑网络隔离,不能同时故障。
3.仲裁网络禁止使用VRRP主备网关配置。
4.仲裁服务器是虚拟机时,该虚拟机不能运行在该双活方案存储提供的LUN上。
仲裁服务器是物理机时,不能使用该双活方案存储提供的LUN作为SAN Boot的OS盘。
本地部署双活双活在单数据中心内部署时,由于故障域无法隔离,只能提供设备级或者机架级的可靠性。
为了尽可能提供更高的业务连续性,常见要注意的有:1.仲裁服务器是虚拟机时,该虚拟机不能运行在该双活方案存储提供的LUN上。
仲裁服务器是物理机时,不能使用该双活方案存储提供的LUN作为SAN Boot的OS盘。
2.仲裁网络禁止VRRP主备网关配置。
2.2.组网设计2.2.1.管理网络管理网络指双活方案各物理设备在设备管理时使用的网络,它的主要作用有两个:1.设备正常运行时,日志、告警上报和巡检;2.设备发生故障时,管理员登录设备进行异常状态确认和修复。
存储设备的管理网络目前除了支持进行设备管理外,还可以配置用于仲裁。
管理网络如果用于仲裁,只能两种配置方式:1.两套阵列管理端口和仲裁服务器仲裁端口使用相同网段。
2.两套阵列管理端口分别使用不同网段,且各自与仲裁服务器仲裁端口三层互通,每套阵列管理端口的网关均在各自数据中心内。
2.2.2.存储层主机访问网络使用FC交换机级联进行跨中心组网时,如果数据中心间距离超过级联光模块传输距离(博科或者华为交换机单模光模块最大支持25km),需要通过多模光模块对接波分传输设备,以支持更远的传输距离。
主要业务网络可能包括以下几种:●主机访问存储的网络。
●阵列间双活复制网络。
●主机集群心跳网络。
●主机的业务网络。
我们重点关注的是1和2两项。
3和4则是与应用集群诉求相关,由应用提供商提供部署要求:时延、距离和丢包参数等。
Oracle RAC集群其官方要求节点间时延<1ms,其它数据库集群建议与其保持一致,如有差异请以应用提供商的要求为准。
跨中心双活组网为了尽可能为业务提供最佳的业务连续性,任意一台业务主机要求与两套双活存储有全冗余交叉路径。
如果主机与跨中心存储没有配置逻辑路径,双活发生仲裁时,业务不能保证在原中心继续提供服务,最常见的如虚拟化集群,则会导致虚拟机发生跨中心的HA迁移。
图1-7业务主机与存储间网络(NAS)●每个数据中心内两台以太网交换机堆叠组网。
●主机双端口绑定,交换机上对应端口绑定。
●阵列上每个控制器上两个端口绑定(同一块卡)。
●跨中心每两台交换机间至少1条级联链路。
图1-8业务主机与存储间网络(SAN)●每个数据中心内两台FC交换机不级联,各自独立。
●主机上两个FC端口各连接本数据中心一台FC交换机。
●阵列上每个控制器上两个FC端口各连接本数据中心一台FC交换机。
●跨中心每个交换平面的交换机间至少1条级联链路。
●阵列上用于前端业务主机访问的端口不作为阵列间复制使用。
●如果SAN组网也是IP组网时,交换机与NAS共用,但是阵列用于业务主机访问的端口不能与NAS共用端口。
本地双活组网在单数据中心内部署时,与跨中心部署组网有所不同,只需要双交换机冗余部署即可。
图1-9业务主机与存储间网络(NAS)●数据中心内两台以太网交换机堆叠组网。
●主机双端口绑定,交换机上对应端口绑定。
●阵列上每个控制器上两个端口绑定(同一块卡)。
图1-10业务主机与存储间网络(SAN)●数据中心内两台FC交换机不级联,各自独立。
●主机上两个FC端口各连接一台FC交换机。
●阵列上每个控制器上两个FC端口各连接一台FC交换机。
●阵列上用于前端业务主机访问的端口不作为阵列间复制使用。
●如果SAN双活是IP组网时,交换机可以与NAS双活共用,但是阵列用于业务主机访问的端口不能与NAS共用端口。
2.2.3.跨中心传输网络近距离传输两个数据中心距离在光模块支持的范围内,且单模光纤或者裸纤数量足够时,可以使用交换机直接与对端数据中心SAN网络交换机级联,实现双活的近距离组网。
长距离传输网络波分设备使用场景:●跨中心长距离传输超过交换机上级联端口传输距离上限时(例如博科和华为FC交换机单模光模块传输距离上限25km)。
●跨中心使用裸纤连接,且裸纤数量不足以支持业务层和存储层网络跨中心级联要求时,例如,标准的双活组网,跨中心裸纤至少要求4对。