当前位置：文档之家› Fujitsu 存储双活解决方案

Fujitsu 存储双活解决方案

谈谈Fujitsu 存储双活解决方案

前两天，《高端存储知识》的作者西瓜哥发表了一篇文章《原来富士通ETERNUS DX S3系列已经支持双活，但好像没有看到仲裁机制》，文中对ETERNUS DX S3系列StorageCluster(存储高可用)解决方案进行了相关的介绍和应用场景的分析。在这里要感谢西瓜哥对Fujitsu ETERNUS存储双活解决方案关注和技术普及，同时，我们也将对文中的一些理解偏差(姑且这么说吧)进行进一步的解释和阐述。

问题一：Storage Cluster是否有仲裁机制？

要回答这个问题，我们首先来看看Storage cluster解决方案架构图。

这里仅简单说明一下：生产存储和备用存储之间使用FC链路，通过存储自带的远程复制技术实现LUN数据的实时同步复制，同时生产LUN和备份LUN都Mapping给前端业务主机。当生产存储出现故障时，将自动切换到备用存储上，由于生产存储和备用存储Mapping 给前端主机的端口共享相同的一组逻辑WWPN/WWNN，所以对前端主机来说，后台只有一台存储，且切换是透明的，所以前端绝大多数应用是不会中断的。

那Storage Cluster Controller什么时候干活呢？它如何干活呢？它干些什么事呢？那就进入第二个话题----Storage cluster 故障处理机制。

问题二：Storage Cluster 故障处理机制

在一个SAN环境中基本包含三类组件：主机、交换机、存储。StorageCluster不关心前端的主机和交换机故障，只关注存储故障。也就是说主机链路或者交换机故障，多路径软件负责链路的切换，跟后台存储没有一分钱关系。

现分别介绍存储出现故障时，Storage Cluster Controller怎么来仲裁的？

场景一：生产存储RAID故障

存储阵列硬盘故障造成RAID降级或者数据丢失，这在存储中是最常见的。在StorageCluster环境中，这种处理优先级是最高的，也就是说，当RAID故障时，根本就不需要StorageCluster Controller参与仲裁，系统将自动触发Failover 操作，将业务切换到备用存储上。

场景二：生产存储控制器故障

在这里，控制器故障主要包括如下情形：控制器整体无法工作—offline状态、主机端口故障、缓存故障、BBU等故障。当然，出现这些故障的时候，存储一般会出现故障报警等信息，这时候，生产存储会发生自动Failover操作么？答案是否定的。这是由于这些故障并没有对整个存储造成大的影响，另外一个控制器还可以工作嘛。系统管理人员监测到存储控制器故障，可以执行ManualFailover操作，将生产切换到备用存储上。在这个场景中，Storage ClusterController会监测到这些信息，但不会自动执行任何操作。

场景三：生产存储整体故障

生产存储整体故障，通常情形是系统掉电。这种场景下，将由Storage Cluster Controller 发起仲裁，系统自动执行Auto Failover策略，备用存储将生产接管过来。另外StorageCluster

Controller也同时会记录生产存储、备用存储的状态信息，如果生产存储修复故障，StorageCluster Controller会再次执行Auto Failback策略，太任性，有没有。当然如果不想这么高大上，也可以选择ManualFailback。

场景四：远程复制链路出现故障

在这里还要讨论一种情形，生产和备用存储无故障，但是远程复制路径出现故障，Storage Cluster Controller会如何处理？

StorageCluster Controller会监测到存储复制路径故障，但是不会执行任何仲裁或者操作策略。复制链路的故障处理由REC(Remote Equivalent Copy,Fujitsu 存储远程复制技术)来解决，当复制链路恢复，主备存储将自动进行增量数据同步，数据一致后，StorageCluster Controller会监测主备存储状态，重新回到可切换状态。

FujitsuStorage Cluster解决方案优势：

数据镜像是通过存储功能实现的，不需要特殊的卷管理软件，与前端主机无关:主机不需要安装Agent，不占用主机资源，与操作系统、应用类型、卷管理软件、多路径软件均无关;使用最成熟稳定的存储底层数据复制技术实现主备存储间数据同步。

不改变系统架构，不增加新的故障源，扩容“零”成本:主机直接到存储，不需要串联网关设备，一次性功能收费，与容量无关。

各型号间跨级互备，无需对等型号，减少投入成本:如生产存储是中高端存储，承载多种类型的多个业务，备用存储采用中低端存储，保证生产存储的部分核心应用实现互备;

全闪存阵列也可实现高可用:支持全闪存阵列直接高可用，同时也支持全闪存阵列与传统阵列间高可用，如核心应用部署在全闪存阵列，同时由主生产存储来做互备。

自动存储分层技术同样适用于Storage Cluster:主备存储除实现数据同步外，备用存储还能自动识别生产存储的自动分层信息，同步分层策略及性能监控数据。

富士通ETERNUS存储研发生产已经有三十多年了，Storage Cluster的软件功能是原有功能结合客户实际需求水到渠成之作。这项技术基于原有阵列的底层容灾技术RemoteEquivalent Copy (REC)之上做的增强与优化，实现了自动切换与应用不中断技术是富士通在其原有阵列的底层容灾技术RemoteEquivalent Copy (REC)之上做的增强与优化，实现了自动切换与应用不中断技术是富士通在其原有阵列的底层容灾技术RemoteEquivalent Copy (REC)之上做的增强与优化，实现了自动切换与应用不中断。

西瓜哥的原文如下：

原来富士通ETERNUS DX S3系列已经支持双活，但好像没有看到仲裁机制

今天，西瓜哥才了解到，原来富士通的DX S3平台已经支持阵列的双活的。我们今天就花点时间了解一下。

首先，这个双活的功能，富士通叫Storage Cluster Option，也就是存储集群选项。存储集群目前只支持富士通最新的ETERNUS DX S3硬件平台，因此，其高端存储DX8700 S2不支持。估计今年富士通高端存储也会升级到S3新平台，这样富士通可能成为第二个或者第三个(和华为拼时间)支持双活功能的高端存储。

目前，这个集群只支持FC链路，需要2台ENTERNUS DX S3的阵列，2台博科的FC交换机，必须采用ENTERNUS SF管理软件来进行管理，而且需要购买专业服务。

富士通说其存储集群可以实现透明的切换，支持自动或者手动切换，对称配置保证两边都可以访问，使用简单，支持同机房部署，也支持校园或者同城部署，最大支持100KM距离。

其实集群原理很简单，就是两台阵列采用富士通的同步复制技术来进行数据同步，有一个存储集群控制器(上面安装ENTERNUS SF管理软件)来负责监控集群和控制集群的切换。

富士通声称，切换的时间最大不超过10秒，也就是业务最多中断10秒钟，如果应用不是并行应用的话。

这个就是ENTERNUS SF管理软件的界面，可以选择手动切换。

存储集群支持两种应用场景，一是阵列故障的时候，保证业务不中断。

另外一种就是双活的数据中心，整个主站点故障也不影响业务。

如果再看懂其设计原理图，需要了解一些基本的概念，如TFOV，TFO组，CA端口组等。

切换的原理富士通说得很清楚，就是CA端口组共享WWPN/WWNN。就像我们通常理解的IP集群一样，两个网卡共享同一个IP地址(浮动地址)，当主网卡出现问题，浮动IP从主网卡飘到从网卡，主机因为是通过IP地址访问，因此除了出现短暂的中断外，业务没有受到影响。而WWNN就类似浮动IP地址。

但从富士通的文档，西瓜哥没有看到仲裁机制的设计，这个和HDS VSP G1000不同。富士通没有要求在第三站点设置仲裁设备。估计和富士通定位比较低端有关，因为这样部署的成本比较低。但如果系统发生脑裂，没有第三站点的仲裁判断可能会出现误判，因此西瓜哥不建议在核心系统应用这种方案。

富士通用DX S3平台推出一款全闪存阵列ENTERNUS DX200F，因此，这也是个支持双活的全闪存阵列。我们通过DX200F的集群规格来看看具体的功能。

我们看到，存储集群也可以支持RAID组故障，但主机路径阻塞，系统是不会切换的。

猜想：富士通的存储集群，从原理来看，和国内某厂商的原理非常类似，都没有采用第三方站点设备仲裁。另外，考虑这两个厂商在虚拟化网关方面和杭州的信核科技(Infocore)有合作，西瓜哥有点怀疑这两个厂商的双活实现是否采用了某些Infocore的技术。不过，纯粹猜想而已，原理并不复杂，实现基本功能很简单，但要做得可靠稳定，还是需要下很多功夫的，特别是各种情况的异常处理方面。

EMC的XtremIO要实现双活，需要加VPLEX，而富士通用DX200F就可以搞定了。存储的双活，从高端到中端，甚至全闪存阵列，看来都是一个趋势。

华为存储双活数据中心规划设计指南

目录 (3) 1.华为一体化双活数据中心方案概述 1.1.跨中心部署架构 (4) 1.2.同机房部署架构 (6) (9) 2.华为一体化双活数据中心方案设计 1.3.故障域设计 (10) 1.4.组网设计 (11) 1.4.1.管理网络 (11) 1.4.2.存储层主机访问网络 (12) 1.4.3.跨中心传输网络 (15) 1.4.4.双活复制网络 (16) 1.5.应用层设计 (16) 1.5.1.数据库集群 (17) 1.5.2.虚拟化集群 (19) 1.6.多路径规划 (20) 1.7.存储层设计 (21) 1.8.仲裁设计 (22)

1.华为一体化双活数据中心方案概述双活数据中心是指两个数据中心共享存储、网络以及服务器资源，两个数据中心可以同时对外提供服务，整个系统具有业务负载均衡和自动故障切换能力，能够最大限度保证业务持续运行不中断，为业务提供最高级别的业务连续性。当客户业务需要存储同时提供SAN和NAS双活能力时，而由于业务之间存在的关联性，两者不可以完全割裂，此时我们称为SAN&NAS一体化双活。例如：某业务由两个业务系统同时提供服务才可以提供服务，其中一个业务系统使用SAN存储，另一个业务系统使用NAS存储，此时，两者均正常运行才可以提供服务。如果仅仅提供SAN存储双活能力，当单套存储系统故障，NAS无法访问时，将导致业务中断。存储双活作为整个系统的核心基础架构平台，主要解决以下两个核心问题。 1.两个数据中心间数据实时同步，确保单中心存储部件故障时，零数据丢失（RPO=0）和自动切换。为了达到这样的目标，NAS除了数据实时同步外，还要保证配置和锁的实时同步。系统运行过程中，文件系统权限、共享等配置变更支持实时镜像，故障发生时双活自动切换后能立即使用。 2.提供可同时被两个数据中心主机访问的存储共享资源，从而实现主机应用集群的跨站点部署，保证异常情况下，应用的自动切换（RTO≈0）。

统一存储双活方案

NetAp统一存储双活方案

NetApp统一存储双活方案 1、双活存储架构建设目标系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间（不可忍受）的事故。可能引发系统灾难的因素包括：?系统软、硬件故障，如：软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等； ?机房环境突发性事故，如：电源中断、建筑物倒塌、机房内火灾等； ?人为因素，如：因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等； ?自然灾害：如火灾、地震、洪水等突发而且极具破坏性的事故。其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下，计算中心机房的硬件设备会部分或完全损坏，造成业务的停顿。请参见下图：

当前用户IT系统缺乏有效的灾难防范手段，难以在灾难发生后，不间断或者迅速地恢复运行。灾难恢复就是在IT系统发生系统灾难后，为降低灾难发生后造成的损失，重新组织系统运行，从而保证业务连续性。其目标包括： ●保护数据的完整性、一致性，使业务数据损失最少； ●快速恢复业务系统运行，保持业务的连续性。灾难恢复的目标一般采用RPO和RTO两个指标衡量。技术指标RPO、RTO： RPO (Recovery Point Objective): 以数据为出发点，主要指的是业务系统所能容忍的数据丢失量。即在发生灾难，容灾系统接替原生产系统运行时，容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标，在半同步数据复制方式下，RPO等于数据传输时延的时间；在异步数据复制方式下，RPO基本为异步传输数据排队的时间。在实际应用中，同步模式下，RPO一般为0，而在非同步模式下，考虑到数据传输因素，业务数据库与容灾备份数据库的一致性是不相同的，RPO表示业务数据与容灾备份数据的时间差。换句话说，发生灾难后，启动容灾系统完成数据恢复，RPO就是新恢复业务系统的数据损失量。 RTO (Recovery Time Objective):即应用的恢复时间目标。RTO 主要指的是所能容忍的应用停止服务的最长时间，也是是反映业务恢复及时性的指标，表示业务从中断到恢复正常所需的时间。RTO值越小，代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有

曙光DS800-G25双活数据中心解决方案介绍

曙光DS800-G25 双活数据中心解决案介绍曙光信息产业股份有限公司

1解决案概述在信息社会里，数据的重要性已经毋容置疑，作为数据载体的存储阵列，其可靠性更是备受关注。尤其在一些关键应用中，不仅需要单台存储阵列自身保持高可靠性，往往还需要二台存储阵列组成高可靠的系统。一旦其中一台存储阵列发生故障，另一台可以无缝接管业务。这种两台存储都处于运行状态，互为冗余，可相互接管的应用模式一般称之为双活存储。由于技术上的限制，传统的双活存储案无法由存储阵列自身直接实现，更多的是通过在服务器上增加卷镜像软件，或者通过增加额外的存储虚拟化引擎实现。通过服务器上的卷镜像软件实现的双活存储，实施复杂，对应用业务影响大，而且软件购买成本较高。通过存储虚拟化引擎实现的双活存储，虽然实施难度有一定降低，但存储虚拟化引擎自身会成为性能、可靠性的瓶颈，而且存在兼容性的限制，初次购买和维护成本也不低。曙光DS800-G25双活数据中心案采用创新技术，可以不需要引入任第三软硬件，直接通过两台DS800-G25存储阵列实现两台存储的双活工作，互为冗余。当其中一台存储发生故障时，可由另一台存储实时接管业务，实现RPO、RTO为0。这是一种简单、高效的新型双活存储技术。

2产品解决案曙光DS800-G25双活数据中心案由两台存储阵列组成，分别对应存储引擎A、引擎B。存储引擎A 和B上的卷可配置为双活镜像对，中间通过万兆以太网链路进行高速数据同步，数据完全一致。由于采用虚拟卷技术，双活镜像对中的两个卷对外形成一个虚拟卷。对服务器而言，双活镜像对就是可以通过多条路径访问的同一个数据卷，服务器可以同时对双活镜像对中两个卷进行读写访问。组成双活镜像系统的两台存储互为冗余，当其中一台存储阵列发生故障时，可由另一台存储阵列直接接管业务。服务器访问双活存储系统可根据实际需要，选用FC、iSCSI式，服务器访问存储的SAN网络与数据同步的万兆网络相互独立，互不干扰。组网说明： 1）服务器部署为双机或集群模式，保证服务器层的高可用， 2）存储与服务器之间的连接可以采用FC、iSCSI链路，建议部署交换机进行组网； 3）存储之间的镜像通道采用10GbE链路，每个控制器上配置10GbE IO接口卡，采用光纤交叉直连的式，共需要4根直连光纤； 4）组网拓扑

华为医院“一体化双活”存储系统解决方案

医院“一体化双活”存储系统解决方案医院信息化对存储挑战市县级、三乙医院的信息化系统往往比较完善，已经建成了HIS、PACS、LIS、RIS、手麻等多套信息化系统，涉及到病人挂号、取药、缴费、手术、住院、健康档案等各个环节，并且内容还在医疗健康范围内不断扩大。近几年随着业务规模的不断扩大，信息化系统的压力急剧上升，原有的系统开始逐渐吃力，而新兴业务又在快速增长，严重的卡顿严重影响工作效率甚至影响医患之间的和谐关系，更多的设备增加了管理复杂度，尤其是数据的可靠性和业务的连续性随着设备的增加不断下降。因此，需要对其信息化系统进行升级应对不断增长的业务需求，而作为多系统交互的数据共享平台，如何更加合理的整合，保证数据资产的可靠性、高效性、可用性、可管理性，尤其迫在眉睫。而对于其核心存储平台，承载高性能系统（如HIS），大容量系统（如PACS）等核心业务的运行及存储，其建设需求应能够满足： 1、统一：融合的存储平台，单台设备除了要能够满足业务系统对块数据（数据库等）高性能表现的诉求外，也要满足文件类处理的要求，充分满足块和文件两种类型应用数据的统一管理诉求，最大化减少架构复杂。 2、高可靠：部件、设备、系统级可靠，能够在部件故障、设备故障甚至机房故障时，都不会引起关键信息化系统（如HIS、PACS）的业务停机和数据丢失。 3、高性能：对于HIS核心系统，其业务的时延往往成为影响病人体验的一个重要指标。时延大，病人需要花更多的时间排队等待，医生需要花更多的时间开具处方，这些不仅会影响工作效率，而且会引起矛盾。 4、领先性：新设备无论从架构、系统设计、硬件接口还是软件功能方面均具有前瞻性，保证设备的使用周期内能够满足医院未来的发展需要，同时满足扩容和性能升级等简单的需求。

NetApp统一存储双活方案

NetAp统一存储双活方案 NetApp统一存储双活方案 1、双活存储架构建设目标系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间（不可忍受）的事故。可能引发系统灾难的因素包括：?系统软、硬件故障，如：软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等； ?机房环境突发性事故，如：电源中断、建筑物倒塌、机房内火灾等； ?人为因素，如：因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等； ?自然灾害：如火灾、地震、洪水等突发而且极具破坏性的事故。其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下，计算中心机房的硬件设备会部分或完全损坏，造成业务的停顿。请参见下图：

华为双活数据中心项目解决方案

双活数据中心解决方案

目录 1. 行业背景 (2) 2. 系统建设原则及思路 (3) 3. 技术方案 (4) 双活数据中心基础架构设计 (4) 双活数据中心网络设计 (4) 双活数据中心系统设计 (5) 双活数据中心系统优势 (7) 浪擎CDP，最可靠的CDP (8) ACDP-恢复速度最快的CDP (8) ACDP-强大的复制,恢复.容错功能 (9) ACDP-支持报警和一键切换 (9) 其他优势 (10) 1.行业背景随着全球化信息技术的发展，信息化已经成为各个单位的关注热点，各行各业都在进行着信息化的改革。信息化系统已经成为企业核心竞争力的关键条件之一。企业信息化的时代也发生了翻天覆地的变化。为适应我国改革开放和社会主义现代化建设的新形势对公安执法提出的新要求国家提出了以“公安信息化工作”为核心，以“科技强警”为目标的国家信息化工程—“金盾工程”的建设要求。“金盾工程”既全国公安信息化工程，是国家电子政务建设“十二金”中重要的一部分，主要是利用现代化信息通信技术增强我国公安机关的统一指挥，快速反应，协同作战，打击罪犯的能力，以适应公安机关动态管理和打击罪犯的需要。随着金盾工程在全国的展开信息技术的广泛应用，公安信息化建设全面加快各种业务系统的陆续建设投入使用产生了大量的数据。随着业务数据的增加和应用数据的依赖性的增强，数据已经成为开展业务不可缺少的基础。数据的有效汇集，集中管理，综合分析以及容灾备份的需要等处理要求日益提高。因此，通过管理机制与技术手段相结合保障数据的一致性和业务的连续性在建设公安系统容灾机制中势在必行。

2.系统建设原则及思路 1)绿色容灾，减少对生产系统的影响双活数据中心在实施和使用的过程中对原有的生产系统、硬件系统、网络系统会造成一定的影响，有的容灾系统可能需要在冻结原有的生产系统的情况下进行数据的复制；有的容灾系统可能要对硬件、网络环境进行改造，改造成系统所要求的条件；有的容灾系统对生产服务器的CPU、内存、网络等资源占用较大，这些影响或者改造对原有的系统和数据都存在一定的风险性。 2)保证容灾数据可靠性对于需要恢复的系统采用应用级捕获和分析引擎能找到数据库完整性点,恢复数据时只恢复到数据库完整的点。所以备用数据库一定是可靠的。对于无需恢复的系统采用应用层事务级复制技术，保证复制的数据都是数据库所能理解的事务对象。备用数据库一直处于可用状态，所以是可靠的。 3)可见的容灾，保证效果可见可验证容灾可见性是指双活数据中心的容灾效果是不是可见、可查询的。有的容灾系统的容灾效果要等灾难发生之后，备用系统恢复之后才能验证是不是真做到了数据零丢失的效果。如果数据复制失败不能马上反应出来同样达不到容灾的效果。我们设想构建一个容灾效果实时可见的容灾系统，让其容灾结果的好与坏透明化。 4)高性价比首先，我们提供软件解决方案，从而避免了购买具有存储数据复制功能的智能高档阵列。对主备系统硬件一致性无要求，目标端无需购置昂贵的存储设备或光纤通信设备等，极大的降低系统投入成本，充分保护现有设备投资。其次，通过基于逻辑的数据复制原理，极大的减少了复制过程中需要传输的数据量，从而要求更低的双活数据中心网络带宽。避免了基于智能存储技术中的高带宽需求，大大降低了双活数据中心需要的带宽成本。 5)可管理性一个双活数据中心涉及的系统比较复杂，对于一个庞大和复杂的系统运行环境，灾备系统的可管理性直接影响到这个备份系统的效率和功能的灵活性。一个好的双活数据中心，可以满足用户针对不同的容灾需要，针对不同的容灾对象，提供灵活的备份策略机制。 6)可扩展性一个好的双活数据中心，不仅能够满足目前的灾备需要，同时应该能够方便的添加灾备对象以满足将来的灾备需要。灾备软件的升级换代不仅仅是简单的软件更换，它涉及到管理方式的变更，管理程序的变更，员工的技能培训的变更，以及员工积累的故障诊断经验。为了有效的保护这些软投资，在一开始选择灾备系统的阶段，考虑长远的灾备体系扩展能力，将有效的保护这些投资。

“双活”容灾引领现代备份技术

“双活”容灾引领现代备份技术虽然每周全量夜间增量备份仍是常态，但很多组织机构逐渐发现他们的数据（以及恢复那些数据所需的条件）打破了长久以来传统备份所依赖的模型。存储管理人员备份操作不当，意味着困难并关键的备份现代化任务迎面而来。备份现代化将是一个有点痛苦的过程，不仅需要选择一项备份技术，还需要考虑这种转变对关键业务处理和需求的影响。备份替代技术考量就备份现代化来讲，有各种各样的解决方案，无论经济实用型方案，还是舶来品。不过，当今有三类主要的数据保护策略： ·持续数据保护 ·快照 ·基于镜像的备份 CDP技术对数据进行近乎连续不断地保护。并非在夜间进行大型备份，CDP产品的备份全天候执行，每隔几分钟就进行一次。CDP产品首先将数据以块的方式复制到磁盘备份介质中。当某个块被创建或更改时，该块被备份。CDP有对版本信息进行跟踪的索引，而数据重删技术能够保证只有不重复的块会被存储到备份介质中。快照与备份有所不同，前者并不创建数据的拷贝，而是提供将虚拟机、文件或应用回滚到先前某点状态的方法。快照是使用磁盘差分或指针的技术。由于快照并不进行实际备份，一些备份厂商将快照作为一种提高自身产品恢复能力的方式，而不是将其用作单独的数据保护策略。基于镜像的备份代表着备份领域一种新的策略，并应用于虚拟机备份中。此类备份源于这样一种思想即备份处理对虚拟机进行整体数据捕获。如果需要进行恢复操作，将虚拟机的拷贝挂载至沙盒环境中用以承载数据。沙盒挂载能力有时也用来提供本地恢复测试甚至模拟实验能力。只要你受保护的资源全部部署在虚拟服务器上，基于镜像的备份就能够提供显著的灵活性。

重大业务考量。不管你选择使用哪种备份技术，都有一些与公司业务需求相关的重要因素需要考虑。一些因素在购买一个新的备份系统前就需要考虑，另外一些在新的备份系统安装完毕时，就需要立即考虑。保留需求。选择一个现代备份系统时你最先需要考虑的你的备份保留要求，换句话说，你在多长的时间之内会需要检索数据。这样的考虑很是重要，因为大多数现代备份方案都是基于磁盘或云服务，或者两者都是。以磁带为基础的备份能够提供近乎无限的保留跨度，因为你能备份到磁带上，而你想将磁带保留多久都可以，而基于磁盘的备份却并非如此。磁盘的容量是有限的，而容量会影响能够保留在备份中历史数据的总量。快照的回滚可能引起数据库崩溃，除非该快照产品经过特殊设计，能够与你服务器上运行的应用一起工作。即使磁盘的容量不是一个问题，一些现代备份应用也会有各种限制。比如，一些CDP 产品区分短期保存（磁盘）和长期保存（磁带），并对前者存储介质上的恢复点数量有十分严格的限制。代理软件兼容性。如果你正在考虑的备份方案是基于代理的，那么就必须在购买之前把代理软件的兼容性当做一个首要考虑因素。尽管大部分备份软件提供商都会提供适用于大多数流行的操作系统的代理软件，你仍需要核实在你自己的环境下运行的操作系统中，该软件是否能正常使用。业务识别性。在选择一个备份业务时，业务识别性是最重要的一个标准之一。如果你的备份不仅仅是文件数据，那么你的备份软件都必须支持你所运行的业务。对于CDP或基于镜像的备份产品，业务识别性的确认通常意味着验证某备份产品是否包含一个Microsoft卷影复制服务（VSS），服务器上你所备份业务的运行需要它。对于快照产品，你则需要找寻细粒度应用回滚功能。尽管大多数快照应用支持整个服务器的回滚，但可能会对数据库应用造成很严重的后果。因为在获取快照时，快照并不能捕捉储存在服务器内存中的处理状态。因此，快照回滚可能引发数据库崩溃，除非某快照产品对你服务器上的应用进行了定制化设计。初始备份。在你付费并部署了现代备份解决方案之后，关于你的首次备份，有些事情需

浪潮双活存储解决方案

浪潮双活存储解决方案 Prepared on 22 November 2020

浪潮数据中心存储双活解决方案【需求分析】大数据时代，数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。传统数据中心存储灾备一般采用主备模式，只有当生产数据中心存储故障后，灾备中心存储才会接管数据访问业务，并且此过程需要手动执行，将灾备中心对应的业务Lun手动激活读写服务；此外，主备数据中心的模式，在正常业务运转情况下，只有主中心发挥作用，备中心的资源一直处于“待命”模式，无法最大程度发挥所有资源的效率。双活数据中心将是未来数据中心发展的趋势，而存储双活又是数据中心双活的重要基础。【浪潮存储双活方案设计】浪潮AS8000-M3使用虚拟卷镜像与节点分离两个核心功能实现数据存储的双活构建： ?AS8000-M3虚拟卷镜像功能实现：浪潮AS8000-M3作为异构存储整合的专业设备，可以实现在两台存储设备之间实现逻辑卷的镜像。保障单个磁盘的故障或单台存储的故障都不造成对前端服务器性能的影响，实现业务连续性。上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图，对于底层的磁盘阵列来说，其使用方式与现在相同，对其内部的磁盘先进行RAID，然后在RAID组上进行逻辑磁盘（LUN）的划分。如上图的例子中，首先对两个阵列的磁盘做RAID5，然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘，同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后，形成了虚拟卷为虚拟卷1，然后再将虚拟卷1映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。使用AS8000-M3进行跨阵列镜像后，对于服务器获得的虚拟卷来说，不会因为任何一个后端磁盘存储系统的故障而出现问题。 ?AS8000-M3节点分离功能实现：浪潮AS8000-M3拥有节点分离功能，可以把AS8000-M3一个节点组中的两个控制器节点分开放置，两个节点间最远距离可以达到100KM，AS8000-M3节点分离功能只是物理节点的分开放置，但是在用户对于数据的访问以及在 AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同，如果一个

浪潮双活存储解决方案

上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图，对于底层的磁盘阵列来说，其使用方式与现在相同，对其内部的磁盘先进行RAID，然后在RAID 组上进行逻辑磁盘（LUN）的划分。如上图的例子中，首先对两个阵列的磁盘做RAID5，然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘，同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后，形成了虚拟卷为虚拟卷1，然后再将虚拟卷1 映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。使用AS8000-M3进行跨阵列镜像后，对于服务器获得的虚拟卷来说，不会因为任何一个后端磁盘存储系统的故障而出现问题。 AS8000-M3 节点分离功能实现：浪潮AS8000-M3拥有节点分离功能，可以把AS8000-M3一个节点组中的两个控制器节点分开放置，两个节点间最远距离可以达到100KM，AS8000-M3 节点分离功能只是物理节点的分开放置，但是在用户对于数据的访问以及在AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同，如果一个AS8000-M3节点故障，将由另外一个站点的AS8000-M3 节点接管数据IO，所有应用系统将不受影响。

存储双活架构对比分析

存储双活架构对比分析世界上没有完美的东西，所有东西都有利弊两个方面。双活项目的建设也是同样。双活是要提升系统的健壮性，进而保证业务的连续性，而双活的弊端是少有人提及的就是要牺牲一部分性能和容量，同时如果较远，还涉及到链路成本。目前主流的存储双活解决方案，主要有存储网关双活解决方案和存储阵列双活解决方案两类，其中，存储阵列双活解决方案又可以分为双读双写的真正双活解决方案和读写一台仅能够做故障切换的伪双活解决方案。如下图所示：存储虚拟化网关的双活存储阵列伪双活解决方案存储阵列双读双写解决方案代表厂家：代表厂家：代表厂家： EMC VPLEX IBM DS8000 HyperSwap HDS VSP GAD IBM SVC HP Peer Persistence EMC VMAX SRDF/Metro

HW Hyper Metro HP XP7 GAD Netapp Metro Cluster 我们可以从如下几个方面来看： 1、发展趋势 EMC和IBM均有采用网关方式实现双活的解决方案，但是，通常是与中低端存储相结合的廉价解决方案。对于较大负载的企业级应用，通常采用存储阵列双活解决方案。伪双活解决方案代表产品是已经基本停止存储研发的IBM的DS8000的HyperSwap、HP中端存储的Peer Persistence、Netapp的Metrocluster和华为的Hyper Metro都是可以实现单台阵列故障另外一台自动接管，但是日常应用读写只能够使用一台，另外一台仅作为备用，这样在做真正的较远距离双活集群时会遇到很尴尬的问题，如果是Oracle RAC分布在两个机房，总有一端的oracle数据库无法读写本地磁盘，而要经过漫长的中间链路去读写远端磁盘，性能会成为极大的瓶颈。相比较而言，高端存储的双活技术包括HDS的VSP GAD、EMC VMAX的SRDF/Metro和HP的XP7 GAD，都是不仅能够实现故障自动切换，而且可以同一业务的双读双写，可以与各类集群软件相互配合实现负载均衡。当然，目前的产品形态，还有如下原因。 2、系统可靠性任何复杂系统都是由多个部件组成的，在常见系统中，系统控制理论将系统分为串行系统和并行系统，结构如下图所示：

统一存储双活方案

统一存储双活方案1、双活存储架构建设目标系统灾难是指IT系统发生重要业务数据丢失或者使业务系统停顿过长时间（不可忍受）的事故。可能引发系统灾难的因素包括：?系统软、硬件故障，如：软、硬件缺陷、数据库或其他关键应用发生问题、病毒、通信障碍等； ?机房环境突发性事故，如：电源中断、建筑物倒塌、机房内火灾等； ?人为因素，如：因管理不完善或工作人员操作不当、人为蓄意破坏、暴力事件等； ?自然灾害：如火灾、地震、洪水等突发而且极具破坏性的事故。其特点是突发性、高破坏强度、大范围。在灾难性事故的影响下，计算中心机房的硬件设备会部分或完全损坏，造成业务的停顿。请参见下图：

排队的时间。在实际应用中，同步模式下，RPO一般为0，而在非同步模式下，考虑到数据传输因素，业务数据库与容灾备份数据库的一致性是不相同的，RPO表示业务数据与容灾备份数据的时间差。换句话说，发生灾难后，启动容灾系统完成数据恢复，RPO就是新恢复业务系统的数据损失量。 RTO (Recovery Time Objective):即应用的恢复时间目标。RTO 主要指的是所能容忍的应用停止服务的最长时间，也是是反映业务恢复及时性的指标，表示业务从中断到恢复正常所需的时间。RTO值越小，代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别，基于光通道技术的同步数据复制，配合异地备用的业务系统和跨业务中心与备份中心的高可用管理，这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO，需要投入大量资金。各种用户的应用对RTO要求不同，业务繁忙的关键业务需要较小的RTO，如果系统恢复时间过长就会影响到业务运行，而许多业务系统的RTO较长，如果一些较小灾难发生在非业务运行时间，那么对业务连续性几乎不会造成任何影响。各种容灾解决方案的RTO有较大差别，基于光通道技术存储区域网（SAN）的同步数据复制，配合远程备用业务系统和跨生产中心与容灾中心的高可用管理系统，这种容灾解决方案具有最小的RTO。相比较而言，普通磁带备份的RTO较长，当灾难发生时需要更长的时间恢复系统。两存储之间为双活互备工作模式

曙光DS800-G25双活数据中心解决方案介绍

曙光DS800-G25 双活数据中心解决方案介绍曙光信息产业股份有限公司

1解决方案概述在信息社会里，数据的重要性已经毋容置疑，作为数据载体的存储阵列，其可靠性更是备受关注。尤其在一些关键应用中，不仅需要单台存储阵列自身保持高可靠性，往往还需要二台存储阵列组成高可靠的系统。一旦其中一台存储阵列发生故障，另一台可以无缝接管业务。这种两台存储都处于运行状态，互为冗余，可相互接管的应用模式一般称之为双活存储。由于技术上的限制，传统的双活存储方案无法由存储阵列自身直接实现，更多的是通过在服务器上增加卷镜像软件，或者通过增加额外的存储虚拟化引擎实现。通过服务器上的卷镜像软件实现的双活存储，实施复杂，对应用业务影响大，而且软件购买成本较高。通过存储虚拟化引擎实现的双活存储，虽然实施难度有一定降低，但存储虚拟化引擎自身会成为性能、可靠性的瓶颈，而且存在兼容性的限制，初次购买和维护成本也不低。曙光DS800-G25双活数据中心方案采用创新技术，可以不需要引入任何第三方软硬件，直接通过两台DS800-G25存储阵列实现两台存储的双活工作，互为冗余。当其中一台存储发生故障时，可由另一台存储实时接管业务，实现RPO、RTO为0。这是一种简单、高效的新型双活存储技术。

2产品解决方案曙光DS800-G25双活数据中心方案由两台存储阵列组成，分别对应存储引擎A、引擎B。存储引擎A和B上的卷可配置为双活镜像对，中间通过万兆以太网链路进行高速数据同步，数据完全一致。由于采用虚拟卷技术，双活镜像对中的两个卷对外形成一个虚拟卷。对服务器而言，双活镜像对就是可以通过多条路径访问的同一个数据卷，服务器可以同时对双活镜像对中两个卷进行读写访问。组成双活镜像系统的两台存储互为冗余，当其中一台存储阵列发生故障时，可由另一台存储阵列直接接管业务。服务器访问双活存储系统可根据实际需要，选用FC、iSCSI方式，服务器访问存储的SAN网络与数据同步的万兆网络相互独立，互不干扰。组网说明： 1）服务器部署为双机或集群模式，保证服务器层的高可用， 2）存储与服务器之间的连接可以采用FC、iSCSI链路，建议部署交换机进行组网； 3）存储之间的镜像通道采用10GbE链路，每个控制器上配置10GbE IO接口卡，采用光纤交叉直

宏杉科技双活存储解决方案介绍

MacroSAN 双活存储解决方案介绍杭州宏杉科技有限公司

1. 解决方案概述在信息社会里，数据的重要性已经毋容置疑，作为数据载体的存储阵列，其可靠性更是备受关注。尤其在一些关键应用中，不仅需要单台存储阵列自身保持高可靠性，往往还需要二台存储阵列组成高可靠的系统。一旦其中一台存储阵列发生故障，另一台可以无缝接管业务。这种两台存储都处于运行状态，互为冗余，可相互接管的应用模式一般称之为双活存储。由于技术上的限制，传统的双活存储方案无法由存储阵列自身直接实现，更多的是通过在服务器上增加卷镜像软件，或者通过增加额外的存储虚拟化引擎来实现。通过服务器上的卷镜像软件实现的双活存储，实施复杂，对应用业务影响大，而且软件购买成本较高。通过存储虚拟化引擎实现的双活存储，虽然实施难度有一定降低，但存储虚拟化引擎自身会成为性能、可靠性的瓶颈，而且存在兼容性的限制，初次购买和维护成本也不低。宏杉科技的对称双活存储（Symmetrical Dual Active Storage，简称SDAS）是一项专门针对双活存储方案的创新技术。通过宏杉科技对称双活存储技术，可以不需要引入任何第三方软硬件，直接通过两台同档次的MS系列存储阵列实现两台存储的双活工作，互为冗余。当其中一台存储发生故障时，可由另一台存储实时接管业务，实现RPO、RTO为0。这是一种简单、高效的新型双活存储技术。宏杉科技的SDAS技术，不仅支持近距离的双活存储系统，而且支持上百公里甚至更远的远距离双活数据中心。近距离的双活存储可以采用更加高效的光纤交叉直连的方式进行组网部署，远距离的双活数据中心采用交换机连接方式，再配以仲裁者机制进行组网部署。宏杉科技的SDAS两套存储之间的链路不仅可以支持10GE以太网，而且在业界率先支持40GE以太网技术。40GE具有目前以太网应用领域中的最高的传输带宽，可以大大降低同步数据传输时延。目前宏杉科技的MS3000、MS5500、MS7000存储产品都已经支持对称双活存储技术。

某某集团云计算数据中心和双活灾备x-io解决方案--5word版本

某某集团云计算数据中心解决方案 xxxx电子科技有限公司 2014年4月25日

目录 1.方案背景及用户需求 (4) 1.1.方案背景 (4) 1.2.需求分析 (4) 2.双活数据中心解决方案的优势 (6) 3.X-IO双活数据中心解决方案 (7) 3.1.拓扑结构图 (7) 3.2.双活数据中心配置 (8) 3.2.1.方案配置 (8) 3.2.2.智能DNS多站点选择器：跨数据中心基于域名的多活 (10) 3.2.3.VMware虚拟化平台：数据中心虚拟化互联 (8) 3.2.4.虚拟化服务器 (8) 3.2.5.光纤通道交换机：SAN扩展存储 (9) 3.2.6.X-IO ISE高性能存储阵列 (9) 3.2.7.AAM双活软件 (9) 3.3.相关技术参考 (10) 3.3.1.双活数据中心路径优化（Internet） (10) 3.3.2.双活数据中心应用网络 (11) 3.3.3.双活数据中心数据同步 (12) 4.X-IO 存储介绍 (13) 4.1.背景 (13) 4.2.目标 (14)

4.3.架构 (16) 4.3.1.X-IO 网格云存储体系架构 (16) 4.3.2.系统部署架构 (17) 4.4.功能 (17) 4.4.1.ISE Manager (17) 4.4.2.网格Matrix RAID (17) 4.4.3.RAGS (17) 4.4.4.CADP (18) 4.4.5.AAM (18) 4.5.特点 (20) 5.配置列表 (22)

1.方案背景及用户需求 1.1.方案背景随着企业的商业活动越来越依赖于网络，因此越来越多的企业在寻找一种强大的数据中心架构，这种高可用的结构能够减少甚至消除正常和非正常的停机对业务可用性造成的影响。这意味着无论是否有中断，关键任务应用系统都能够不间断地创造产值并提高公司的业务持续性底线。而在面对大数据时代的来临，和云时代的来临，数据中心里不同的环节都需要考虑如何融入大数据和云时代的需求，所以在系统架构上就有云化的必要性。因此建立多个数据中心来实现业务的容灾成为必然的选择。而企业建立多个数据中心来承载业务系统的主要目的是为了实现应用的高可用性，因此根据数据中心之间的关系，通常将数据中心分为以下两个类型：主数据中心/灾备数据中心双运营双活数据中心 1.2.需求分析企业建立多个数据中心来承载业务系统的主要目的是为了实现应用的高可用性，因此根据数据中心之间的关系，通常将数据中心分为以下两个类型：主数据中心/灾备数据中心，双运营双活数据中心主数据中心/灾备数据中心：

浪潮双活存储解决方案

浪潮数据中心存储双活解决方案【需求分析】大数据时代，数据已经成为各行业至关重要的核心资产。传统的灾备方案中存在着资源利用率低、可用性差、出现故障时停机时间长、数据恢复慢、风险高等问题。数据是否安全、业务是否连续运行无中断成为用户衡量一个灾备方案的关键。传统数据中心存储灾备一般采用主备模式，只有当生产数据中心存储故障后，灾备中心存储才会接管数据访问业务，并且此过程需要手动执行，将灾备中心对应的业务Lun手动激活读写服务；此外，主备数据中心的模式，在正常业务运转情况下，只有主中心发挥作用，备中心的资源一直处于“待命”模式，无法最大程度发挥所有资源的效率。双活数据中心将是未来数据中心发展的趋势，而存储双活又是数据中心双活的重要基础。【浪潮存储双活方案设计】浪潮AS8000-M3使用虚拟卷镜像与节点分离两个核心功能实现数据存储的双活构建： AS8000-M3虚拟卷镜像功能实现：浪潮AS8000-M3作为异构存储整合的专业设备，可以实现在两台存储设备之间实现逻辑卷的镜像。保障单个磁盘的故障或单台存储的故障都不造成对前端服务器性能的影响，实现业务连续性。上图是通过AS8000-M3实现两台阵列之间存储镜像的示意图，对于底层的磁盘阵列来说，其使用方式与现在相同，对其内部的磁盘先进行RAID，然后在RAID 组上进行逻辑磁盘（LUN）的划分。如上图的例子中，首先对两个阵列的磁盘做RAID5，然后在左边阵列中再作成LUNa和LUNb两个逻辑磁盘，同样在右边阵列中可以作成LUN1和LUN2两个逻辑磁盘。AS8000-M3将从左边磁盘阵列获得的管理磁盘a和从右边阵列获得的管理磁盘1进行镜像后，形成了虚拟卷为虚拟卷1，然后再将虚拟卷1映射给服务器。服务器就像使用本地磁盘一样的使用虚拟卷1。使用AS8000-M3进行跨阵列镜像后，对于服务器获得的虚拟卷来说，不会因为任何一个后端磁盘存储系统的故障而出现问题。 ?AS8000-M3节点分离功能实现：浪潮AS8000-M3拥有节点分离功能，可以把AS8000-M3一个节点组中的两个控制器节点分开放置，两个节点间最远距离可以达到100KM，AS8000-M3节点分离功能只是物理节点的分开放置，但是在用户对于数据的访问以及在AS8000-M3对于后挂存储空间的管理上与一个节点组处理方式相同，如果一个AS8000-M3

HDS双活解决方案,1

真正的双活解决方案——HDS全局动态存储虚拟化技术 “双活”近年来一直是业界的热门词汇，特别是在金融业。商业银行多年来致力于容灾备份系统的建设，但确保业务连续性仍是银行信息化需要持续研究的课题。为建立一套真正的双活数据中心，HDS提供的不是一个“封装”解决方案，也不是“外部虚拟化”解决方案，HDS提供的是全局动态存储虚拟化技术（包括双活镜像）——一个真正的双活方案！这不仅实现了IT系统管理的大幅简化与自动化，并具有高可用性特征，可确保关键数据和应用程序的永续运行。 HDS在2014年上半年领先发布了一款革命性产品HDS Virtual Storage Platform G1000（VSP G1000），VSP G1000中的Storage Virtualization Operating System （SVOS）即提供了双活数据中心技术（Global Active Device，GAD）。零停机，业务永续 GAD功能支持同时在两个地方保存同一数据的读/写副本。其双活设计可以在两个VSP G1000系统之间实现镜像存储卷，这两个VSP G1000系统能够在两端同时接受读/写操作并持续进行更新。如果一个站点的磁盘控制柜发生故障，另一个站点的控制柜将自动接管并继续接受读/写操作。双活数据中心方案可确保最新的存储卷始终可用，并在这两个系统上支持生产工作负载，同时保持完整的数据一致性和数据保护能力。对于许多关键业务应用而言，任何妨碍数据访问的故障都会导致应用中断，并可能需要进行手动故障切换，以切换到灾备中心。GAD可以在本地及同城提供双活延伸集群，利用双活延伸集群可以实现不停机的工作负载迁移和数据迁移。同时配合使用多路径软件，可以让应用从最短路径访问数据，以获得最高性能。零RPO / RTO，高枕无忧银行容灾系统建设的终极目标是实现数据保护和持续不间断的对外服务。传统容灾系统可以做到RPO为零，很难做到RTO为零，因为系统恢复需要时间。而一旦实现双活，RPO和RTO在某些场景下都可以做到“零“，这对于用户来说是一项革命性的进步。数据中心双活技术可以协助银行IT部门实现无缝容灾，业务和服务完全无感知。零锁定，面向多供应商 HDS GAD面向VMware, Microsoft Hyper-V 以及Oracle 也实现“始终可用”。 HDS 双活技术优势可以概括为以下几方面。（1）VSP G1000全交换架构，高性能，高可靠性，存储虚拟化整合，分开摆放；（2）Array-SAN-Host 三层架构，结构简单，无四层架构性能瓶颈点和风险点，便于实施，基于存储实现企业级双活；（3）支持结构化和非结构化数据，实现全业务的双活；（4）仲裁机制，避免“脑裂”；（5）就近读，精简配置卷，保障最佳性能；（6）未来扩展N 活，双活+远程异步容灾，实现最佳的系统可用性。 HDS正在利用 GAD技术使存储虚拟化架构实现跨多个企业级存储系统的横向扩展。到目前为止，国内已经有诸多大型银行、医疗机构、教育机构在研究和部署HDS双活解决方案，HDS将全力协助更多客户实现业务与服务的永续运行！FCC 82FINANCIAL?COMPUTER?OF?CHINA

Fujitsu 存储双活解决方案

谈谈Fujitsu 存储双活解决方案前两天，《高端存储知识》的作者西瓜哥发表了一篇文章《原来富士通ETERNUS DX S3系列已经支持双活，但好像没有看到仲裁机制》，文中对ETERNUS DX S3系列StorageCluster(存储高可用)解决方案进行了相关的介绍和应用场景的分析。在这里要感谢西瓜哥对Fujitsu ETERNUS存储双活解决方案关注和技术普及，同时，我们也将对文中的一些理解偏差(姑且这么说吧)进行进一步的解释和阐述。问题一：Storage Cluster是否有仲裁机制？要回答这个问题，我们首先来看看Storage cluster解决方案架构图。这里仅简单说明一下：生产存储和备用存储之间使用FC链路，通过存储自带的远程复制技术实现LUN数据的实时同步复制，同时生产LUN和备份LUN都Mapping给前端业务主机。当生产存储出现故障时，将自动切换到备用存储上，由于生产存储和备用存储Mapping 给前端主机的端口共享相同的一组逻辑WWPN/WWNN，所以对前端主机来说，后台只有一台存储，且切换是透明的，所以前端绝大多数应用是不会中断的。

上图中的工作站Storage Cluster Controller就是存储双活解决方案中的仲裁者，它时刻监控着生产存储、备用存储的健康状态，当生产存储或者备用存储出现问题，它就开始执行Failover策略。这里需要说明的是Storage Cluster Controller并不是一个单独的软件，它只是一个后台服务进程，该服务进程集成在ETERNUSSF Storage Cruiser Agent软件中，需要单独准备一台工作站或者服务器安装ETERNUSSF Storage 管理套件。那Storage Cluster Controller什么时候干活呢？它如何干活呢？它干些什么事呢？那就进入第二个话题----Storage cluster 故障处理机制。问题二：Storage Cluster 故障处理机制在一个SAN环境中基本包含三类组件：主机、交换机、存储。StorageCluster不关心前端的主机和交换机故障，只关注存储故障。也就是说主机链路或者交换机故障，多路径软件负责链路的切换，跟后台存储没有一分钱关系。现分别介绍存储出现故障时，Storage Cluster Controller怎么来仲裁的？场景一：生产存储RAID故障