VMWARE用Replication方式的SRM实施容灾要点
- 格式:doc
- 大小:1.78 MB
- 文档页数:13
VMware虚拟化及容灾解决方案CommVault虚拟化数据管理解决方案目录一、VMware云计算数据中心解决方案 (5)1.1 服务器虚拟化 (5)1.1.1 概述 (6)1.1.2 计算功能特性 (7)1.1.3 存储功能特性 (13)1.1.4 网络和安全功能特性 (21)1.1.5 管理和自动化 (27)1.2 网络与安全虚拟化 (29)1.2.1 概述 (29)1.2.2 主要价值 (29)1.2.3 工作原理 (30)1.2.4 应用场景 (32)1.2.5 主要功能 (33)1.2.6 本地高可用 (42)1.3 运维管理 (48)1.3.1 概述 (48)1.3.2 功能特性 (49)1.3.3 运营可见性和性能管理 (51)1.3.4 变更、配置和合规性管理 (55)1.3.5 性能监控、分析、告警 (57)1.3.6 应用依赖关系映射 (60)二、VMware SRM灾难恢复解决方案 (63)2.1 vCenter Site Recovery Manager (63)概述 (63)Site Recovery Manager的主要功能特性 (64) SRM支持灵活的拓扑 (66)超越灾难恢复:灾难规避和计划内迁移 (66)VMware Site Recovery 的工作方式 (67)灾难恢复自动化和利用软件定义的存储 (67)2.2 vSphere Replication (68)概览 (68)利用vSphere Replication来扩大灾难恢复的覆盖范围 (69) 实现原理与工作机制 (71)vSphere Replication的优势 (72)2.3 方案架构设计 (72)三、HDS HUS 130技术的技术优势 (73)3.1、独特的动态虚拟控制器和自动负载均衡 (73)前端的自均衡路径分配 (73)后端的自均衡LUN调整 (74)3.2、系统架构和硬件增强 (74)高速SAS后端技术 (74)新一代专用I/O处理器 (74)全新的通用处理器和内部总线 (75)3.3、软件增强部分 (75)3.4、面向服务优化的系统 (76)3.5、HUS与VMWare的紧密结合 (77)VMware 环境性能的提高 (77)快速部署VMware存储环境 (78)VMware自动的负载均衡 (78)1)前端的自均衡路径分配 (78)2)后端的自均衡LUN调整 (79)动态容量分配优化VMware存储配置 (79)VMware环境的数据迁移 (80)HDS 对VMware API特性的支持 (80)1. VMware VAAI 支持 (80)VMware VADP的支持 (81)VMware VASA的支持 (82)VMware SRM支持 (82)VMware虚拟化环境的数据保护CommVault? Simpana? 软件革命性的数据管理解决方案,不仅定位于现阶段数据环境遇到的问题,更可以帮助用户快速过渡到未来数据中心的虚拟化和云环境,利用各种技术,使用户享受现代化数据中心带来的种种益处。
江苏电信SRM容灾方案江苏电信SRM容灾方案目录1背景说明 (2)2方案概述 (2)2.1基于虚拟化平台(vSphere Replication)的复制+SRM技术(3)2.2基于存储复制+SRM技术 (6)3SRM方案实施要求 (8)3.1环境要求 (8)3.2许可要求 (9)4SRM方案安装、配置手册 (9)5服务与培训 (9)6SRM方案中其它需要注意的问题 (10)6.1数据的一致性要求 (10)6.2计划内迁移和计划外迁移的RPO (10)6.3定期的容灾演练 (11)6.4生产站点和恢复站点关系 (12)1背景说明江苏电信作为国内领先的私有云实践者,近两年内,运营的规模不断扩大,拥有上千个虚拟机,支撑大量的关键应用,随着业务规模的发展,借鉴同行的最佳实践和实际经验教训,计划通过技术手段提高对虚拟机的灾难保护。
保证在单个站点出现故障时可以将虚拟机系统在另一站点快速恢复运行。
2方案概述本次提供的产品为VMware SRM(vCenter Site Recovery Manager)。
vCenter Site Recovery Manager 是一款面向虚拟化环境的市场领先的灾难恢复产品。
它作为VMware vSphere 的有益补充,可确保为所有虚拟化应用程序提供最简单、最可靠的灾难防护。
SiteRecovery Manager 提供经济高效的内置vSphere Replication,并支持使用广泛的基于存储的高性能复制产品集将虚拟机复制到辅助站点。
Site Recovery Manager 与VMware vSphere、VMware vCenter Server 和底层复制产品紧密集成,可以自动执行端到端恢复流程。
Site Recovery Manager 提供一个简单的界面,可用于设置跨所有基础架构层协调操作的恢复计划,从而取代传统的容易出错的操作手册。
用户可以根据所需频率无中断地测试恢复计划,以确保它们符合业务目标。
用于VMware Site Recovery Manager 5的vSphere Replication工作原理、其关键特性和使用要求。
VMware的Site Recovery Manager(SRM)为虚拟机环境的故障切换至恢复站点提供自动化的解决方案。
其上一版本(版本4)并不能称之为一个完整的灾难恢复解决方案,其依赖第三方存储应用程序来处理虚拟机数据至恢复站点间的复制操作。
这意味着你需要在主站点和备份站点都配置一台昂贵的存储阵列,来支持虚拟机数据存储的复制。
VMware在vSphere 5.0和SRM 5.0发布中引入了一个全新的特性,称之为vSphere Replication,可以在虚拟层之间进行虚拟机的复制,而不是在存储层进行。
vSphere Replication是一项比存储阵列级别复制更为经济的方式,因为SRM中具备内置的复制功能意味着你不必购置存储阵列来支持复制功能。
在许多存储阵列中,复制功能都是一项需要额外支付费用的特性。
兼容性是vSphere Replication的另一项优势。
如果使用存储复制,你只能选择具有Storage Replication适配器(SRA)的存储设备,才能和SRM协同工作,这限制了你选择存储设备的范围。
同时,这也使得你必须依赖存储供应商来提供并随着SRM的新版本发布更新SRA。
通过vSphere Replication,你无须再担心这点,因为复制功能都是内置在Hypervisor之中的。
这同时提供了更好的集成度并降低部署过程中的复杂度。
vSphere Replication特性vSphere Replication利用vSphere中的数据块变革跟踪技术(CBT),可以只将变更的数据块复制到恢复站点。
利用CBT技术可以实现更低的带宽使用,并且和拷贝整个系统的虚拟机相比,可以提供更高的恢复点目标(RPO)。
vSphere Replication还提供以下特性:•在每次复制周期之前,vSphere Replication通过VMware工具组利用V olume Shadow Copy (VSS),确保客户机处于静止状态,以确保数据的一致性。
VMware服务器虚拟架构容灾解决方案目录1. VMWARE连续性解决方案 (1)1.1.基于虚拟机的集群冗余简化 (2)1.2.无须原硬件的数据恢复 (2)1.3.失败转移服务器的整合和自动化 (3)2. VMWARE服务器虚拟架构方案设计 (5)2.1.需求分析 (5)2.2.方案介绍 (5)2.2.1. 服务器硬件配置建议 (6)2.2.2. 软件配置 (6)2.3.方案拓扑 (6)2.4.方案构成部分详细说明 (8)2.4.1. 虚拟架构VMware vSphere配置说明 (8)2.4.2. SAN集中存储实现虚拟服务器的文件共享 (10)2.4.3. 虚拟架构环境的集中管理、自动化及优化运行 (11)2.4.4. 容灾设计原理 (14)2.4.5. 容灾节点的存储规划建议采用备份的方式 (15)2.4.6. SRM容灾管理 (18)2.4.7. 虚拟架构环境的集中监控 (23)2.4.8. 为Tier2和Tier3应用提供数据保护 (23)2.9.方案优势 (23)3. 配置和报价 (25)4. 附件:VMWARE企业级虚拟化产品介绍 (26)4.1.VSPHERE5产品介绍 (26)4.1.1. VMware Infrastructure 介绍 (26)4.1.2. VMware VSphere5介绍 (29)4.1.3. VMware Virtual Center Server 介绍 (36)4.1.4. Site Recovery Manager介绍 (41)1.VMware连续性解决方案VMware的服务器虚拟架构解决方案能够帮助用户进行服务器整合、创建可升级的开发/测试环境;以及实现商业连续性的策略等..在同一台物理服务器上安装多个虚拟服务器操作系统;无论是出于测试还是使用的目的;都能够以一种很经济的方式达到商业扩展或者增加服务器资源的目的..每年成百上千的全球数据中心遭遇重大的服务中断..这些商业运行将受到用户错误;病毒;硬件故障和自然灾害等问题的影响..当前商业连续性处于企业IT策略的最前沿;并且从管理层到CEO的所有人都非常重视它..成功的商业连续性策略元素包含:•应用程序可用计划•包含监控和平台冗余的预防措施•数据保护•灾难恢复策略•有效的人员计划使用虚拟构架;IT管理员能改进商业连续性的所有方面;例如:•由于主备服务器之间的硬件独立性;使得灾难恢复更快而花费不多•排除计划内的硬件当机;并明显的减少计划内的软件当机•管理所有虚拟机和监控宿主机的单点控制技术•为了实现捕捉和恢复;完全的把主机压缩到文件里去•简化和可重复的自动程序1.1.基于虚拟机的集群冗余简化为了实现高可用性;企业使用中间软件例如微软和Veritas的集群软件;把两台服务器绑定在一个热备环境..即使运行在服务器上的应用程序有集群感知能力;万一主服务器遭遇硬件或软件错误;这样的安排仍然会导致非应用程序当机..冗余能消除单点失败..随着IT对企业运作而言变得更加重要;高水平的服务普遍成为企业的需求;越来越多的应用则被要求高度可用..然而;为了实现如上所述的高可用性集群;就像很多服务器运行应用一样;企业需要预备和管理两次..有了虚拟化;IT管理员能在运行重要应用的实体机和同等配置的虚拟机上创建集群..在待机状态下;虚拟机并不消耗计算机资源;并且能以非常高的比例整合到一个或几个实体平台上去..结果;企业无须在硬件数量或管理和安装补丁上投入双倍的人力和物力;从而实现高可用性..冗余的方式将由2N 变为N+1..实体到虚拟的集群和实体到实体的集群一样都支持同样的集群软件..同时;节省的成本能为更多的负载实现高可用性并签署更多的高水平服务协议..1.2.无须原硬件的数据恢复大多数企业IT部门使用常用的备份软件;例如Tivoli Storage Manager; Legato Networker; 或者Veritas NetBackup来创建数据和应用程序备份..既然备份策略能抵御用户错误和某些情况下的软硬件故障;比较长的恢复时间和多恢复点是能被接受的..然而;为了获得备份所带来的好处;企业必须确保数据确实能被恢复..业余备份;专业恢复为了测试数据恢复;IT管理员需要为每个已备份的主机提供一台测试的失败转移服务器;安装操作系统;安装备份代理;尝试在测试失败转移服务器上调整Windows注册表和其他系统配置..如果系统调整成功;备份服务器和备份代理才能被用来测试数据恢复..预制新的服务器和调整Windows注册表是一个漫长的手工过程并且有时并不可能..这样;在不同的失败转移服务器实现数据恢复是存在疑问的..这些问题将被虚拟失败转移硬件给解决了..此外;操作系统安装;备份代理的安装和Windows注册表的调整只需做一次..此后;一个完整的已配置的VM模板将被存储在VM模板库内..Vmware软件能确保企业:•为灾难后的测试和恢复;消除硬件资源方面的障碍•避免系统和备份代理的安装;用虚拟机模板来缩短恢复周期•用标准的虚拟化硬件;使得灾难恢复更加可靠和可重复1.3.失败转移服务器的整合和自动化对于关联在存储域网SAN上重要应用的部署;企业灾难恢复策略通常包含一个灾难恢复的热站;这个站点有在主备之间的完全同步的数据复制..这种策略提供很少的恢复点对象PRO..然而;出于恢复时间对象RTO的考虑;恢复时间非常依赖于除了数据恢复之外的恢复实体服务器;操作系统;系统参数和应用程序的能力..为了维持较少的恢复时间对象RTO;硬件和系统的同一配置需要被维护在失败转移站点上..这样的配置无论在初始资本投入阶段还是在项目运作;升级;维护和支持阶段费用都是很昂贵的..这种方案的两个明显缺点在于预制了太多的新服务器以及通常没有可能为数据恢复去调整Windows注册表和对不同的失败转移服务器的其他系统参数进行配置•部署在整个企业内的虚拟构架能确保企业:•避免在失败转移站点上停滞不前•在主备站点上;从服务器整合角度来减少投入成本•使恢复过程自动化;并实现存储管理软件的集成•改进恢复过程的可靠性2.VMware服务器虚拟架构方案设计2.1.需求分析目前用户正在计划存储备份虚拟系统服务器整合项目;以前共有数十台服务器用于生产与办公使用..如果按照传统的方式;如此数量的服务器;将会造成如下的众多问题:1.成本高•硬件成本较高..•运营和维护成本高;包括数据中心空间、机柜、网线;耗电量;冷气空调和人力成本等..2.可用性•可用性低; 因为每个服务器都是单机; 如果都配置为双机模式成本更高..•系统维护和升级或者扩容时候需要停机进行;造成应用中断..3.缺乏可管理性•数量太多难以管理;新服务器和应用的部署时间长;大大降低服务器重建和应用加载时间..•硬件维护需要数天/周的变更管理准备和数小时的维护窗口..4.兼容性差•系统和应用迁移到新的硬件需要和旧系统兼容的系统..2.2.方案介绍根据用户的需求情况;对于开发测试环境;建议配置VMware最新的企业版软件;每台物理服务器上都安装配置虚拟架构套件vSphere企业版软件;这样生产及维护人员就可以自助地创建自己的测试配置和虚拟机;这些虚拟机运行在;从功能、性能和操作方式上;等同于传统的单台物理服务器;在每个虚拟服务器上;从而大大提高资源利用率;降低成本;增强了系统和应用的可用性;提高系统的灵活性和快速响应..在具体实现中;为了实现数据的集中存储、集中备份以及充分利用VMware虚拟架构中虚拟机可动态在线从一台物理服务器迁移到另一台物理服务器上的特性等;建议配置一套光纤存储阵列产品;同时配置冗余的光纤交换机;组成标准的SAN集中存储架构;由VMware虚拟架构套件生产出来的虚拟机的封装文件都存放在SAN存储阵列上..通过共享的SAN存储架构; 可以最大化的发挥虚拟架构的优势;进行在线地迁移正在运行的虚拟机VMware VMotion;进行动态的资源管理VMware DRS; 和集中的基于虚拟机快照技术的Lan Free的整合备份VMware VCB等;而且为以后的容灾提供扩展性和打下基础..另外;如果需要对VMware ESX的服务器进行监控的话;建议单独配置一套服务器安装Window系统;用于安装VSPHERE套件中的Virtual Center软件;对VMware ESX的服务器及其虚拟机进行监控..2.2.1.服务器硬件配置建议2.2.2.软件配置vCenter Server 5 Standard for vSphere 5; 3 year Subscription VCS5-STD-3P-SSS-C2VMware vSphere 5 Enterprise for 1 processor VS5-ENT-C40Production Support/Subscription for VMware vSphere 5 Enterprise for 1 processor for 1 year VS5-ENT-P-SSS-C40Production Support/Subscription for VMware vSphere 5 Enterprise for 1 processor for 3 years VS5-ENT-3P-SSS-C402.3.方案拓扑1.中心节点拓扑2、容灾节点拓扑示意图2.4.方案构成部分详细说明2.4.1.虚拟架构VMware vSphere配置说明vSphere是VMware虚拟架构套件的基础组成部分;是动态、自我优化的IT 基础结构的基础..VMware VSphere是一个强健、经过生产验证的虚拟层;它直接安装在物理服务器的裸机上;将物理服务器上的处理器、内存、存储器和网络资源抽象到多个虚拟机中..通过跨大量虚拟机共享硬件资源提高了硬件利用率并大大降低了资金和运营成本..通过高级资源管理、高可用性和安全功能提高了服务级别-- 对于资源密集型的应用程序也不例外..单台物理服务器配置多个虚拟服务器的性能依据根据统计;对于传统的服务器应用方式;通常服务器的平均利用率在5-15%之间;而采用虚拟架构整合后;服务器的平均利用率可达到60%-80%..我们完全可以通过在两台高配置的八路双核服务器上创建40个虚拟服务器的方式;来完成传统方式需要40多台的低配置的双路双核服务器才能完成的工作;用户在降低成本的方式;还大大减少了环境的复杂性;降低了对机房环境的需求;同时具有更灵活稳定的管理特性..采用VMware虚拟架构相比于传统单台服务器部署单一应用方式的另外一个好处是;可以充分满足不同应用对系统资源的不同要求;如有的应用只需要一个3.0 GHz CPU;512MB的内存就可以很好的运行;而有的高访问率、高吞吐量的应用则需要2个甚至是4个双核的CPU;8GB的内存才能保证稳定的运行;在传统方式下;往往不可能针对每一种应用来采购服务器;而是用一种或几种标准配置的服务器来统一采购;这样;势必会造成某些应用资源富裕;而另一些应用面临资源紧张的情况;且应用之间不能互相调配资源..采用虚拟架构后;由于每个虚拟机所需使用的系统资源都是由虚拟架构软件统一调配;这种调配可以在虚拟机运行过程中在线的发挥作用;使得任何一个应用都可以有充分保证的资源来稳定运行;同时;该应用在此时用不到的资源又可以被其他更需要资源的应用临时借用过去;最大限度的提高了整体系统的资源利用率..每一台虚拟服务器都可以利用VMware 虚拟对称式多重处理SMP技术;通过使单个虚拟机能够同时使用多个物理处理器;增强了虚拟机性能..作为一项独特的VMware 功能;Virtual SMP 支持虚拟化需要多处理器和密集资源的企业应用程序如数据库、企业资源计划和客户关系管理..2.4.2.SAN集中存储实现虚拟服务器的文件共享方案中;我们建议采用SAN集中存储方式;这样可以将每个虚拟机的文件系统创建在共享的SAN集中存储阵列上;VMware VMFS 虚拟机文件系统;是一种高性能的群集文件系统;允许多个VSphere 安装同时访问同一虚拟机存储..支持通过VMware VirtualCenter、VMware VMotion™ 技术、VMware DRS 和VMware HA 提供的基于虚拟化的分布式基础结构服务..由于VMware的虚拟架构系统中的虚拟机实际上是被封装成了一个档案文件和若干相关环境配置文件;通过将这些文件放在SAN存储阵列上的VMFS文件系统中;可以让不同服务器上的虚拟机都可以访问到该文件;从而消除了单点故障..存储系统推荐使用光纤通道交换机接存储服务器的架构;存储空间需要增加扩展柜来扩展容量..建议品牌: 共享存储解决方案2.4.3.虚拟架构环境的集中管理、自动化及优化运行为了对服务器虚拟架构进行有效的管理和监控;方案中配置了一台VirtualCenter服务器;VirtualCenter服务器为IT 环境提供了集中化管理、操作自动化、资源优化和高可用性..基于虚拟化的分布式服务为数据中心提供了前所未有的响应能力、可维护性、效率和可靠性级别..以下VirtualCenter附属产品提供了资源优化和高可用性特征..•使用VMware DRS将可用资源与预定义的业务优先事务协调起来;同时使用VMware分布式资源调度程序优化劳动力密集型和资源密集型操作..•使用VMotion™ 迁移运行中的虚拟机和执行无中断的IT 环境维护..•使用VMware HA 实现经济高效、独立于硬件和操作系统的应用程序可用性..VirtualCenter 提供了管理任意规模的虚拟IT 环境所需的最高级别的简便性、效率、安全性和可靠性..异地备份高可用性架构基于VMware特有的HA高可用性功能;借助存储设备的异地同步功能;VMware可以帮助用户以较低的成本构建完善的异地虚拟化容灾解决方案..2.4.4.容灾设计原理数据中心的容灾解决方案是新的增值业务手段;而VMWARE容灾系统涉及的两个关键参数是RPO和RTO:•RTO;Recover Time Object;恢复时间指标;是指当灾难发生后;生产系统需要多长时间能够恢复生产;它是衡量企业在灾难发生后多长时间能重新开始运转的指标..•RPO;Recover Point Object;恢复点指标;是指灾难发生后;容灾系统能把数据恢复到灾难发生前的哪一个时间点的数据;它是衡量企业在灾难发生后会丢失多少生产数据的指标..据国际标准SHARE 78的定义;灾难恢复解决方案可根据以上的主要问题所达到的程度而分为七级;即从低到高有七种不同层次的灾难恢复解决方案;具体可根据企业数据的重要性以及需要恢复的速度和程度;来设计选择并实现灾难恢复计划..针对重点大客户如ICP群体;因其系统庞大;应用实时性要求高;容灾级别要求高;因此具体的按需定制容灾解决方案是客户的首选..针对众多的中小型SMB客户群体;满足其功能要求是重点;重点是通过本地集中存储备份;虚拟计算技术把用户的本地单体设备的故障机率减少;实现高可用性;然后通过远程异地异步容灾为客户提供安全保险..一个完善的容灾系统主要包括三个层次:数据容灾;应用容灾和网络容灾;两个级别:本地高可用性HA或者备份;异地容灾..•数据容灾就是指建立一个异地的数据系统;该系统是本地关键应用数据的一个同步或异步复制..•应用容灾是在数据容灾的基础上;在异地建立一套完整的与本地生产系统相当的备份应用系统可以是互为备份;在灾难情况下;远程系统迅速接管业务运行..•网络容灾是指在灾难发生后;当应用系统完成正确的迁移后;将访问应用系统的网络流量正确的导向远程的容灾系统..本地高可用性可通过高可靠性的集中存储;高可靠性的虚拟计算体系为客户提供本地高可用性..应用级别的容灾可通过VMWARE体系实现;具有如下特点:对物理主机及虚拟机的完整保护•与VMware vSphere完全集成•7×24小时备份及可用性集成VMware vSphere提供持续可用性•通过最新的完整备份;从虚拟机恢复系统及服务•利用VMware Converter为不同规格的服务器提供快速恢复•三个简单步骤;10分钟完成物理主机到虚拟机P2V转换;可实现在线P2V 转换;立即启动备份服务器直接升级到远程容灾机制•直接将完整VMware系统及数据复制到灾备中心;有效利用硬件资源•利用VMware SRM快速实现站点间的切换利用存储的Snapmirror技术最大化网络效率;实现存储级别的硬件级数据传输2.4.5.容灾节点的存储规划建议采用备份的方式生产环境组成部分描述:生产环境四台高配物理服务器安装VMware企业版;做成一个虚拟群;共虚拟约个虚拟机..●每台物理服务器本地硬盘安装VMware的VSphere;VSphere上创建的虚拟机VM则放在共享的FC存储上..●一台低配服务器作为安装第三方备份软件的备份服务器和VMware整个备份VCB的Proxy..VCB实现的功能是不需要在每个虚拟机上安装备份代理;而是将整个虚拟机作为一个文件供第三方备份软件来备份..●一台台式机或者笔记本作为VMware的集中控制窗口;即VirtualCenter..Virtual Center用来控制和管理整个虚拟环境;包括生产环境和灾备中心环境..因此Virtual Center必须能够通过网络访问到生产环境和灾备中心环境上的所有共享存储和VSphere..●一台备份带库用来备份生产环境上的虚拟机..具体的备份策略可以根据实际情况确定..比方说每天对整个虚拟机做一个全备份;共保留30个全备份..备份软件推荐使用XXXX是经VMware认证的..灾备中心环境组成部分描述:●两台高配物理服务器安装VMware企业版;做成一个虚拟群;共虚拟约XX个虚拟机..●每台物理服务器本地硬盘安装VMware的VSphere;VSphere上创建的虚拟机VM则放在共享的FC存储上..容灾过程描述:在生产环境;装在VSphere上的每个虚拟机运行各自的操作系统、应用程序以及数据库..对于虚拟机的Virtual Center来看;每个虚拟机即是一个打包的文件;如下图所示..这个文件会随着每天的运行而逐渐变大..VMware的VCB可以与第三方备份软件XXXX实现虚拟机的整合备份..即VCB将打包的虚拟机文件先做一个快照SnapShot;然后经备份服务器备份到带库中..在做完虚拟机的备份后;可以马上恢复到灾备中心的共享存储上..当发生灾难时;Virtual Center可以控制灾备中心的VSphere启动相应的虚拟机;从而实现灾难的恢复..由于所有备份工作及相应的负载由VCB Proxy主机来承担;整合备份不需要占用生产机VSphere的资源;;因此备份和恢复工作均可以在白天工作;不会影响到业务..方案优点:费用低:由于两套存储使用低端FC存储;存储的采购费用低廉;且由于每台VSphere服务器只需要用内置的1000M自适应集成网卡;因此也节省了组建SAN 网的费用..灾难恢复过程简单:当灾难发生时;只需要通过Virtual Center将灾备中心的共享FC存储里的虚拟机供其VSphere启动即可..方案缺点:带宽资源紧张:由于生产中心与灾难中心的连接是通过XMbit的LAN专线实现;而每天对生产环境中虚拟机文件的备份和恢复都需要用到这条LAN专线;因此这条LAN的速率成为备份恢复过程的瓶颈..RPO较差;即如果发生灾难时;丢失的数据量较多..2.4.6.SRM容灾管理VMware Site Recovery Manager 提供开创性的解决方案;可自动执行并简化灾难恢复计划的管理和执行工作;帮助您摆脱传统灾难恢复中的诸多不便..由于VMware Site Recovery Manager 省去了复杂的手动恢复步骤;能够对恢复计划执行无中断测试;并且可以自动执行恢复过程;因此能够在整个数据中心高效地进行灾难恢复..VMware Site Recovery Manager 还有助于进行数据中心的计划内故障切换;例如数据中心迁移..VMware Site Recovery Manager 与VMware Infrastructure、VMware VirtualCenter 及其他主要存储供应商提供的存储备份软件紧密集成;让灾难恢复变得快捷、可靠、经济;而且便于管理..这样;灾难恢复便不存在任何风险和后顾之忧;还可将所有重要的系统和应用程序纳入保护之列..主要优势和功能管理灾难恢复计划:通过VMware VirtualCenter 管理VMware 虚拟环境的过程中即可创建、更新及记录恢复计划..对故障切换和恢复执行无中断测试: 使用VMware Site Recovery Manager 可以对恢复过程执行自动化测试..利用针对实际故障切换创建的恢复计划执行测试;而不会对环境造成任何中断..自动执行故障切换和恢复:通过自动执行恢复过程;省去传统灾难恢复中许多常见的速度慢又不可靠的手动处理过程;从而确保恢复过程始终能正确执行..SRM可以使灾难恢复变得快捷、可靠又便于管理;让企业达到其恢复目标..SRM可以让用户集中管理恢复计划;还可以自动执行恢复过程..它将传统灾难恢复中使用的复杂的纸质操作手册;转换成虚拟基础架构管理软件中的集成元素;并显著改善恢复计划的测试效果..SRM是为VSPHERE提供的一款领先的灾难恢复管理和自动化解决方案..SRM通过自动执行恢复过程来加快恢复的速度;并将灾难恢复作为VMware 虚拟基础架构管理的集成要素;从而简化灾难恢复计划的管理工作..该解决方案省去复杂的手动恢复步骤;支持无中断的恢复计划测试;确保恢复过程的安全可靠..SRM紧密集成VMware VSPHERE、VMware VirtualCenter及其他领先存储供应商提供的存储复制软件;使故障切换和恢复变得快捷、可靠和经济;而且便于管理..因此;企业不仅无需担心灾难恢复的风险;还可将所有重要的系统和应用程序纳入保护范围..1.SRM应用场景SRM可以帮助企业应对传统灾难恢复方法的各种挑战;满足恢复时间目标RTO和恢复点目标RPO以及法规遵从的要求..利用SRM;企业可以管理从生产数据中心到灾难恢复站点的故障切换;同时还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换..SRM还可以自动执行及简化故障切换至新数据中心的过程..企业利用SRM可以实现以下诸多功能..管理灾难恢复计划SRM支持企业将创建、更新和记录恢复计划作为VMware虚拟环境管理的集成部分..传统的灾难恢复解决方案往往需要将故障切换的所有步骤和所需资源记录到操作手册中;而这很难保证准确无误和及时更新..采用SRM;可直接在VMware VirtualCenter中管理故障切换过程..对故障切换和恢复执行无中断测试使用SRM;企业可以执行恢复计划的自动测试;而不会对环境造成任何中断..SRM可以利用实际故障切换的恢复计划;轻松创建一个隔离的测试环境..自动执行故障切换和恢复SRM可以自动执行恢复计划;排除传统灾难恢复中常见的缓慢且不可靠的手动处理..同时;SRM可以确保按照预期执行恢复计划..2.SRM工作原理SRM可以为用户提供创建、管理和执行灾难恢复计划的主要环节..该解决方案已经集成到VMware VirtualCenter管理界面中;可以统一管理虚拟基础架构及该架构的灾难恢复计划..SRM可以简化并自动执行设置、测试和执行恢复计划的主要环节..设置恢复基础架构SRM可指导用户完成远程站点的连接;并连接使用的存储复制软件;还可让用户轻松地将生产资源映射到恢复站点上..创建恢复计划SRM具有直观的界面;可以协助用户创建适用于不同故障切换情况和基础架构的恢复计划..用户可以指定一些虚拟机暂停或关闭;从而释放可用资源以供恢复使用;还可以指定虚拟机启动的顺序、设置用户定义的脚本自动执行..测试恢复计划SRM可以利用存储阵列的快照功能;在恢复站点上自动创建无中断的、隔离的测试环境;然后将虚拟机连接到用户的隔离测试网络中..它将自动执行在实际故障切换中使用的恢复计划;并在测试结束后清除测试环境..测试结果会被保存;以便随时查看和导出..自动执行故障切换管理员从VMware VirtualCenter 启动恢复计划后;SRM 会自动执行恢复计划中的所有步骤;保证恢复完全按照预期执行..管理员通过VirtualCenter可以看到恢复计划的执行情况;并可以随时暂停或停止执行..随着环境的变化;用户也可以通过VirtualCenter随时更新和修改恢复计划..3.SRM的主要功能灾难恢复管理利用存储供应商认证的集成功能;查找并显示受存储备份保护的虚拟机;直接在VirtualCenter中创建及管理恢复计划;利用定制脚本扩展恢复计划;监视远程站点的可用性;并提示用户可能会发生的站点故障;存储、查看和导出测试结果;并在VirtualCenter中执行故障切换;利用基于角色的访问控制方法来控制对恢复计划的访问..无中断测试利用存储快照功能执行恢复测试;而不会丢失备份数据;将虚拟机连接至现有的隔离网络;以便进行测试;自动执行恢复计划;定制针对不同测试情况的恢复计划;完成故障切换测试之后;自动清除测试环境..自动执行故障切换只要按一下按钮;用户即可从VirtualCenter中执行恢复计划;利用领先的存储供应商为其备份平台创建的适配器;自动提升备份的数据。
SRM使用手册是在上篇安装文档基础上制作邓新日期:2016年1月5日欢迎加QQ群276783670交流技术问题1SRM介绍VMware vCenter Site Recovery Manager可提供先进的复制、灾难恢复管理、无中断测试、故障切换和故障恢复以及计划内迁移功能。
它可以管理从生产数据中心到灾难恢复站点的故障切换,以及两个具有活动工作负载的站点之间的故障切换。
2SRM所需条件本文通过对一个虚拟机进行从中山机房到拱北机房的容灾和灾难恢复的实现过程来讲述如何通过VMware SRM搭建容灾方案。
本文着重于具体操作使用,对于理论概念请参考其它资料。
一个完整的SRM容灾环境需要若干个组件。
下面先介绍下所需环境。
1.两个机房,两套网络,网络互通2.每个机房都要部署vMware虚拟化环境(后面称之为站点),需要先安装和配置好vSphere三大组件,vCenter Server,Replication,SRM。
关于如何安装这三大组件请参见本次项目交付的安装配置手册。
对于SRM容灾方案,我们应该分两部分来看,一部分是vCenter Server+Replication实现的异地复制方案;别一部分是利用SRM组个来调用Replication实现2个vCenter站点之间的灾难恢复管理。
所以我们本次实例先介绍vCenter Server+Replication实现异地复制和恢复。
在此基础上再介绍利用SRM实现的容灾。
3用Replication实现异地复制和恢复3.1用Replication实现异地复制第一步:环境检查。
10.5.112.197是位于中山机房的vCenter Server站点;10.5.5.66是位于拱北机房的vCenter Server站点。
通过看截图上的IP地有助于我们理解当前操作的对象是谁,这点比较重要。
通过以下几个图我们可以看到这是一个新搭建的环境,在10.5.112.197站点(中山机房)上有一个10.5.112.198的复制服务器(即我们安装的Replicatione服务器),他的目标站点为空;此时位于10.5.5.66站点(拱北机房)有一个10.5.5.67的复制服务器(即我们安装的Replicatione服务器),他的目标站点也为空。
目录1 概述 (3)1.1灾难恢复的重要意义 (3)1.2XXX企业容灾方案现状分析 (4)2灾难恢复解决方案 (6)2.1vCenter Site Recovery Manager (6)2.1.1概述 (6)2.1.2Site Recovery Manager的主要功能特性 (8)2.1.3SRM支持灵活的拓扑 (9)2.1.4超越灾难恢复:灾难规避和计划内迁移 (10)2.1.5VMware Site Recovery 的工作方式 (11)2.1.6灾难恢复自动化和利用软件定义的存储 (11)2.2vSphere Replication (13)2.2.1概览 (13)2.2.2利用vSphere Replication来扩大灾难恢复的覆盖范围 (14)2.2.3实现原理与工作机制 (18)2.2.4vSphere Replication的优势 (20)3方案架构设计 (21)3.1客户容灾设计要求 (21)3.2实施方案选择 (22)3.2.1将基于阵列的复制与 SRM 结合使用 (22)3.2.2将vSphere Replication 与SRM 结合使用 (23)3.2.3将基于阵列的复制和vSphere Replication 与SRM 结合使用 (24)3.3网络设计 (25)3.3.1在恢复站点配置相同或不同的IP地址 (25)3.3.2SRM通讯端口设置 (27)3.4存储设计 (29)3.4.1存储复制 (29)3.4.2占位虚拟机 (30)3.4.3快照空间 (30)4配置清单及说明 (31)4.1硬件配置需求 (31)4.2虚拟化软件配置需求 (31)5方案总结 (33)5.1方案要点 (33)5.2方案优势 (33)6专业服务 (35)6.1VMware专业服务介绍 (35)6.2专业咨询服务内容 (35)6.2.1VMware Accelerate咨询服务 (35)6.2.2技术咨询服务 (36)6.2.3技术客户经理(TAM)服务 (36)6.3专业服务实施流程 (37)6.3.1评估 (38)6.3.2规划与设计 (38)6.3.3实施 (38)6.3.4运维 (39)7支持服务概述 (40)7.1VMware支持的角色和职责 (40)7.2全球技术支持服务 (40)7.3自助服务支持 (41)7.3.1社会支持 (41)7.3.2其他资源 (42)8缩略语解释 (43)1 概述1.1 灾难恢复的重要意义统计数据表明:93%的企业,一旦发生数据中心失效达 10 天的情况,通常在一年内就会破产。
VMWare SRM容灾方案建议书【VMWare SRM容灾方案建议书】一、概述本旨在为您提供一份详细的VMWare SRM容灾方案建议书。
通过使用VMWare SRM,您可以保护您的虚拟化环境,确保业务连续性,并最大程度地减少系统中断和数据丢失的风险。
二、容灾需求分析2.1 业务需求分析在容灾方案设计之前,我们首先需要明确您的业务需求。
请提供以下信息:- 业务系统的可用性要求是什么?- 您的业务系统中哪些部分对于业务连续性至关重要?- 容灾恢复时间目标(RTO)是多少?- 容灾恢复点目标(RPO)是多少?2.2 系统环境分析建立容灾方案之前,我们需要对您的系统环境进行全面的分析。
- 详细描述您的虚拟化环境,包括物理服务器数量、存储配置、网络拓扑等。
- 列出关键业务应用和服务器及其依赖关系。
- 评估您的网络带宽和延迟情况。
三、容灾方案设计3.1 虚拟化环境设计- 根据您的业务需求和系统环境分析结果,提供一份针对您的环境的VMWare SRM容灾方案设计。
- 包括虚拟化集群的划分、ESXi主机的配置、存储配置、网络拓扑等。
3.2 存储配置设计- 根据您的业务需求,设计适合的存储配置方案,包括主存储和备份存储的选型和架构。
- 结合VMWare SRM提供的存储复制功能,确保数据在主备站点之间的实时同步和一致性。
3.3 网络配置设计- 根据您的网络环境和业务需求,设计合适的网络配置方案,确保主备站点之间的网络通信稳定可靠。
- 考虑网络带宽、延迟、QoS设置等因素。
3.4 容灾测试计划- 建议定期进行容灾测试,以验证容灾方案的有效性。
- 提供一份容灾测试计划,包括测试的目的、步骤和时间计划。
四、实施步骤4.1 系统准备工作- 在实施容灾方案之前,需要进行系统准备工作,包括VMWare SRM的安装和配置,存储复制的设置等。
4.2 主备站点设置- 根据容灾方案设计,设置主备站点的虚拟化环境和存储环境,确保主备站点能够顺利运行。
mwre基于vSphere Replication方式的SRM 5搭建手册
一、部署数据库实例
分别在两端的数据库服务器上建立vSphere SRM数据库实例和VRM数据库实例如下图:
二、安装vSphere Site Recovery Manager5.0 插件
分别在两端的vCenter服务器上安装vSphere SRM插件完成后如下图:
安装完成后,进入本地站点SRM界面,与远程站点进行连接,如下图:
四、通过SRM 界面部署VRMS 服务器
分别在两端部署vSphere Replication Managerment Server
注:1)部署时必须从SRM管理界面中导入ovf
2)部署时两个站点VRMS的名称不能相同,由于部署后无法改名,因此需要重新部署。
(建议站点名称可以取名称+数字如:vSphere Replication Management Server (VRMS)-00)DB Type 选择SQL SERVER
DB Host 填写数据库IP
DB Port 默认为1433
DB Username 填写为sa
DB Name 填写建库时的instance名
VRM HOST 填写为vSphere Replication Managerment Server IP
VRM Site Name 填写自定义的站点名称(注意:本地和远程站点名字不可相同,如相同则无
法继续,且其中一节点必须重新通过ovf方式部署一次进行改名)
进入本地站点SRM界面,点击配置VRMS连接,如下图:
六、通过SRM 界面部署VR服务器
分别在两端部署vSphere Replication Server,部署完成后如下图:
(注:如果无需Failback操作,则只需在远程恢复站点安装该服务器)
七、通过SRM 界面将VR服务器注册到VRMS服务器中
分别在两端的vSphere Replication Managerment服务器中注册vSphere Replication服务器,
部署完成后如下图:
八、指定两端站点的占位数据存储
分别在两端为需要保护的虚拟机指定远程站点的占位数据存储,完成后如下图:
为本地站点设置了在远程站点中存放占位数据存储的空间datastorage48.2-2
(注:如果无需Failback操作,则只需在远程恢复站点设置本地站点需要恢复主机的占位数
据存储)
占位数据存储概念:在确定存放占位虚拟机的数据存储后,SRM 会在恢复站点
的清单中为受保护虚拟机预留一个位置。
通过在恢复站点的指定数据存储上创建虚拟机文件的子集,然后使用该子集向恢复站点vCenter 注册占位虚拟机。
九、指定两端站点的资源映射
为本地ESX 10.197.48.9 设置了对应的远程站点资源ESX 10.197.48.2,完成后如下图:
十、为需要保护的虚拟机执行vSphere Replication复制
在vCenter 主机与存储页面,鼠标右键点击需要vr 复制的虚拟机,在弹出的对话框中选择vSphere Replication…选项,弹出如下对话框。
目标文件位置:选择远程站点存放虚拟机文件的位置
选择启用磁盘复制
目标磁盘类型:选择使用现有磁盘模式或是精简模式。
选择对端执行vr复制的vr服务器
执行vr复制时间根据实际的数据占用空间确定,完成后如下图:
选择本地站点作为受保护站点,类型选择vSphere复制
添加已进行过vr复制的虚拟机到保护组中
为保护组输入自定义的名称
十二、制定灾难恢复计划
选定远程站点作为灾难恢复站点
选取需要保护的保护组
选取在测试过程中自动创建的隔离网络
为恢复计划输入自定义的名称
十三、执行灾难恢复计划
测试恢复计划:测试恢复计划时,可以在恢复站点中使用测试网络和复制的数据的临时快照。
受保护站点中未中断任何操作。
测试恢复计划会运行计划中的所有步骤,其中关闭受保护站点中虚拟机电源以及强制恢复站点中的设备对复制数据的监控除外。
如果计划请求暂停恢复站点上的本地虚拟机,则会在测试期间挂起这些虚拟机。
测试不会对任一站点中的生产环境进行其他任何更改。
运行恢复计划:运行恢复计划时,会将恢复计划中的所有虚拟机迁移至恢复站点。
对应的受保护站点虚拟机将会关闭。
如果这是已计划的迁移,则会尝试复制所有虚拟机并正常关闭受保护的虚拟机。
如果在已计划的迁移期间出现错误,则计划会暂停,以便用户可以解决这些错误。
通过复制和关闭虚拟机并提供解决错误的机会,可以重新保护这些虚拟机。
如果是灾难恢复,则会尝试关闭所有虚拟机。
如果无法关闭虚拟机,仍会启动恢复站点上的副本,并且可能无法进行自动重新保护。
执行完成后步骤显示情况如下图:
本地端仍然存在虚拟机图标,但已无法启动
可见虚拟机已在远程恢复站点启动
对于已进过VR 复制受保护的虚拟机可以实施定期的增量同步,如下图:
也可在恢复计划时对于需要保护的主机指定不同的恢复网段,以及添加需要另外执行的脚本语句等配置。