HDS灾备技术及特点
- 格式:pdf
- 大小:1.35 MB
- 文档页数:36
HDSGAD双活数据中心颠覆传统数据容灾在当今数字化时代,数据已成为企业和组织的核心资产,其重要性不言而喻。
数据的安全性、可用性和完整性对于企业的正常运营和持续发展至关重要。
然而,自然灾害、人为错误、硬件故障、网络攻击等各种风险随时可能导致数据丢失或业务中断,给企业带来巨大的损失。
为了应对这些挑战,数据容灾技术应运而生。
传统的数据容灾方案在一定程度上保障了数据的安全性和可用性,但随着业务的发展和技术的进步,其局限性也日益凸显。
HDSGAD 双活数据中心的出现,彻底颠覆了传统数据容灾的模式,为企业的数据保护和业务连续性带来了全新的解决方案。
传统数据容灾方案通常采用备份和恢复的方式,将数据定期备份到异地存储介质中,当主数据中心发生故障时,再将备份数据恢复到备用数据中心,以恢复业务运行。
这种方式存在着诸多问题。
首先,备份和恢复过程往往需要较长的时间,无法满足业务连续性的要求。
在竞争激烈的市场环境中,业务中断几分钟甚至几秒钟都可能导致客户流失、声誉受损和巨大的经济损失。
其次,备份数据可能存在一定的滞后性,导致恢复后的业务数据不完整,影响业务的正常开展。
此外,传统方案中的备用数据中心在平时处于闲置状态,资源利用率低下,增加了企业的成本。
HDSGAD 双活数据中心则完全不同,它实现了两个数据中心同时处于运行状态,并且能够实时同步数据和业务。
当一个数据中心出现故障时,另一个数据中心能够无缝接管业务,实现业务的零中断和数据的零丢失。
这种双活模式大大提高了业务的连续性和数据的安全性,为企业提供了更可靠的保障。
HDSGAD 双活数据中心的核心技术包括数据同步、应用切换和网络优化等。
数据同步是实现双活的关键,通过先进的复制技术,确保两个数据中心的数据实时保持一致。
应用切换技术则能够在故障发生时,快速将业务从故障数据中心切换到正常数据中心,确保业务的连续性。
网络优化技术则保障了数据在两个数据中心之间的快速传输,提高了系统的性能和响应速度。
信息系统灾难备份技术综述灾备是确保数据和信息系统安全、稳定运行的一个极为重要的因素,对支撑管理起到十分重要的作用。
本文介绍了信息系统建设与灾难备份的背景,讨论了灾备系统的主要指标和基本类型,在此基础上论述了灾备系统的关键技术和实现方法,提出了灾备技术未来的发展方向和趋势。
1 背景党中央和国务院十分重视信息安全工作。
2003年,中办发[2003127号文《国家信息化领导小组关于加强信息安全保障工作的意见》,要求各基础信息网络和重要信息系统建设要充分考虑抗毁性与灾难恢复,制定和不断完善信息安全应急处置预案。
2004年,国家网络与信息安全协调小组办公室发12004]11号文《关于做好重要信息系统灾难备份工作的通知》。
明确指出,提高抵御灾难和重大事故的能力,减少灾难打击和重大事故造成的损失、确保重要信息系统的数据安全和作业连续性,避免引起社会重要服务功能的严重中断,保障社会经济的稳定。
2005年,国务院信息化工作办公室出台了《重要信息系统灾难恢复规划指南》,为灾难恢复工作提供了一个操作性较强的参考思路。
2007年,国家标准《信息系统灾难恢复规范》(GB/T20988—2007)正式颁布,这是灾备建设中具有里程碑意义的重要大事。
该标准对灾难备份、灾难恢复相关术语进行了规范和梳理,指明了灾难恢复工作的流程,明确了灾难恢复的等级和相关要素,制订了灾难恢复工作的主要环节及各环节具体工作等。
在2010年召开的第五届中国灾难恢复行业高层论坛上,提出了我国将全面启动灾难恢复体系建设,制定强制性灾备建设规范,完善灾备标准体系并及时出台灾难恢复服务资质管理办法,以促进政府相关部门、行业用户、企业灾难恢复保障体系的发展。
目前,许多政府部门和重要行业已经开始积极有序进行应急管理、灾难备份与恢复体系的建设工作。
近十年来,国土资源信息化建设发展十分迅猛,数据积累不断丰富,政务信息系统日渐增多,其安全性和稳定性显得愈来愈重要。
一旦发生人为或自然等突发性灾难,造成数据丢失或信息系统严重故障或瘫痪,将会直接影响到国土资源管理工作的正常运转以及一些企业和广大民众的利益。
HDS存储高可用技术介绍
一、概述
HDS存储高可用技术是指在HDS存储系统上实现高可用性的技术。
HDS存储系统是一种多媒体存储系统,采用先进的存储技术,可以满足各种不同场景及应用环境的需求,同时也可以灵活地实现高可用性技术。
HDS存储高可用技术主要通过HDS存储系统架构、HDS存储系统技术、多媒体存储系统等技术来实现高可用。
二、HDS存储系统架构
HDS存储系统采用多节点联网的分布式架构,可以实现高可用性。
多节点联网可以实现同步备份,当主节点故障时,备份节点可以及时切换,保证系统高可用性;另外,HDS存储系统采用虚拟存储、数据备份和存储池的技术方案,可以有效降低系统故障的风险,从而实现高可用性。
三、HDS存储系统技术
HDS存储系统采用先进的多媒体存储技术,包括RAID技术、数据复制技术、虚拟化技术等,可以高效实现数据容灾、复制、分布式集群等技术,实现高可用性。
特别是RAID技术,可以通过多种RAID等级来实现磁盘阵列技术,高效实现数据访问和容灾。
四、多媒体存储系统。
真正的双活解决方案——HDS全局动态存储虚拟化技术作者:暂无来源:《中国金融电脑》 2014年第12期“双活”近年来一直是业界的热门词汇,特别是在金融业。
商业银行多年来致力于容灾备份系统的建设,但确保业务连续性仍是银行信息化需要持续研究的课题。
为建立一套真正的双活数据中心,HDS 提供的不是一个“封装”解决方案,也不是“外部虚拟化”解决方案,HDS提供的是全局动态存储虚拟化技术(包括双活镜像)——一个真正的双活方案!这不仅实现了IT 系统管理的大幅简化与自动化,并具有高可用性特征,可确保关键数据和应用程序的永续运行。
HDS 在2014 年上半年领先发布了一款革命性产品HDS Virtual Storage Platform G1000(VSP G1000),VSP G1000 中的Storage Virtualization Operating System (SVOS)即提供了双活数据中心技术(Global Active Device,GAD)。
零停机,业务永续GAD 功能支持同时在两个地方保存同一数据的读/ 写副本。
其双活设计可以在两个VSPG1000 系统之间实现镜像存储卷,这两个VSP G1000 系统能够在两端同时接受读/ 写操作并持续进行更新。
如果一个站点的磁盘控制柜发生故障,另一个站点的控制柜将自动接管并继续接受读/ 写操作。
双活数据中心方案可确保最新的存储卷始终可用,并在这两个系统上支持生产工作负载,同时保持完整的数据一致性和数据保护能力。
对于许多关键业务应用而言,任何妨碍数据访问的故障都会导致应用中断,并可能需要进行手动故障切换,以切换到灾备中心。
GAD 可以在本地及同城提供双活延伸集群,利用双活延伸集群可以实现不停机的工作负载迁移和数据迁移。
同时配合使用多路径软件,可以让应用从最短路径访问数据,以获得最高性能。
零RPO / RTO,高枕无忧银行容灾系统建设的终极目标是实现数据保护和持续不间断的对外服务。
HD存储解决方案优势日立数据系统公司(其前身是美国国家半导体子公司),成立于1989年,总部位于美国加州Sata Clara市。
HDS公司的业务涉及企业级存储系统、存储软件、全球存储解决方案服务等各个专业领域以及售后服务与支持,产品线覆盖高端、中端市场以及中小型企业,是全球成长速度最快的存储企业。
采用直销及分销模式,HDS活跃在公众企业、政府及私营领域,业务遍及170多个国家和地区。
全球一半以上的财富100强企业是HDS的客户。
一、HDS是专注技术创新的先进存储厂商秉持“应用为先”的理念,HDS发挥其全球研发资源优势,在业界领先的存储技术基础上开发具有高性能、高可用性和可扩展性的存储解决方案,HDS存储采用先进的紧耦合交换式构架,保证可靠性同时,满足容量与容量的线性增长。
最大化地实现用户的投资回报率(ROI),并将用户风险降到最低水平。
作为Application Optimized Storage™(面向应用而优化)解决方案的提供商,以独特的存储解决方案满足用户的业务应用需求。
该方案核心是在全线存储产品中采用了存储分区技术,在存储领域是唯一的厂商能够将主机的的分区技术,移植到全线阵列产品中。
作为存储行业的技术创新者和思想领导者,HDS借助独特的智能存储虚拟控制器,将存储的“大脑”(智能控制器)和“身体”(磁盘介质)分开的基于控制器的存储虚拟化技术创新领先整个存储业界。
HDS的高端阵列虚拟化技术能将数据中心的中端和高端阵列有序整合,并在国内有大量成功案例,领先友商EMC、IBM等厂商的产品。
HDS虚拟化产品迄今已成功交付超过上万台,确立了虚拟化存储的领先地位。
高端阵列可实现闭环的三中心容灾方式,可通过时间戳与分组号保证数据的一致性,同时支持基于磁盘日志卷的远程数据复制技术,节省远程复制带宽,生产系统压力,提高了异步容灾的数据可靠性。
HDS致力于缩短用户业务需求与其IT部署之间的差距,从而帮助用户达到业务与IT 的完美结合。
HDS HNAS技术特色1 HNAS体系结构HDS高性能NAS平台是面向高性能、大数据量、大用户访问环境的增强型NAS 解决方案,能够提供全面的NAS服务、文件服务器整合、数据保护和超强负载的NAS环境。
HDS HNAS采用机架式构架,包括四大模块:NIM网络接口模块,提供4个10/100 M以太网接口,用于网络管理;同时提供一个串行接口,用于设备管理和调试;另外,可以最大配置6个GbEt接口,用于直接连接到用户骨干网,提供NAS接入;FSA/X和FSB文件系统模块,提供最核心的NAS功能处理和运算;SIM存储接口模块,提供最大4个4Gb FC接口,用于连接存储系统;同时还可选配用于多个HNAS节点内部互连的10GbEt接口。
HDS HNAS可以提供业界最高的40Gb的背板交换能力,配合HDS USP的106.4Gb背板交换能力,可以为性能要求最苛刻的用户环境提供高性能的NAS及SAN存储服务。
2 HNAS的主要功能HDS HNAS的主要功能如下:●统一命名空间。
统一命名空间能够在存储池与服务器之间创建一个统一的目录结构。
统一的命名空间可以将多个文件系统相连接,并使它们共存于一个单一、公用的根目录下,通用互联网文件系统(CIFS) 和网络文件系统(NFS) 客户端都可以通过集群中的任何节点实现全局接入。
这一特性能够实现更简单的资源分配、更快速的性能和更稳定的数据保护●分层存储管理。
分层存储管理功能根据用户定义的文件政策将数据文件迁移到其它存储层,并将文件指针留在原有文件系统中,从而使用户实现在所有存储层之间对数据进行识别和迁移。
●虚拟文件系统。
通过对CIFS 和NFS 协议的支持,这种文件系统提供了处理超大型文件、数百万个小文件、和多个并行文件系统操作所需的灵活性与能力,而且不会对性能产生任何影响。
●虚拟卷。
通过虚拟卷,存储管理员能够为不同应用和用户迅速分配所需的存储。
虚拟卷掩盖了底层物理磁盘的复杂程度,同时还能对用户的容量变化作出自动的反映。
数据中心灾备技术基础介绍在当今数字化的时代,数据中心扮演着至关重要的角色,存储着企业的关键业务数据和信息。
然而,各种自然灾害、人为失误、硬件故障、网络攻击等风险随时可能威胁到数据中心的正常运行,导致数据丢失或业务中断。
为了应对这些潜在的灾难,数据中心灾备技术应运而生。
本文将为您介绍数据中心灾备技术的基础知识,帮助您了解其重要性、类型和实施要点。
一、数据中心灾备技术的重要性想象一下,一家银行的数据中心突然遭遇火灾,所有客户的账户信息丢失;或者一家电商企业在购物高峰期间,服务器崩溃且数据无法恢复,导致大量订单流失和客户不满。
这些场景并非危言耸听,而是可能真实发生的灾难。
数据中心灾备技术的重要性就在于能够在灾难发生时,迅速恢复数据和业务,减少损失,保障企业的正常运营和声誉。
灾备技术不仅可以帮助企业应对突发的灾难事件,还能在日常的运营中提供数据的备份和保护,防止因误操作、病毒感染等原因造成的数据损坏。
此外,拥有完善的灾备方案也是企业满足合规要求、提升客户信任度的重要手段。
二、数据中心灾备技术的类型1、数据备份数据备份是灾备技术的基础,它将数据复制到另一个存储介质或位置,以便在原始数据丢失或损坏时进行恢复。
常见的数据备份方式包括全量备份、增量备份和差异备份。
全量备份会复制所有的数据,恢复速度快,但备份时间长,占用存储空间大。
增量备份只备份自上次备份以来更改的数据,备份时间短,存储空间占用少,但恢复时需要依赖之前的备份。
差异备份则备份自上次全量备份以来更改的数据,综合了全量备份和增量备份的优点。
2、数据复制数据复制是将数据实时或定期地从一个数据中心复制到另一个数据中心,以保持数据的同步。
数据复制可以分为同步复制和异步复制。
同步复制在数据写入主数据中心的同时,将数据实时复制到备份数据中心,确保数据的一致性,但对网络带宽和延迟要求较高,可能会影响主数据中心的性能。
异步复制则先将数据写入主数据中心,然后在一定的时间间隔内将数据复制到备份数据中心,对网络要求较低,但可能会存在一定的数据延迟。
容灾备份技术及特点2007.3议程•容灾的技术介绍•HDS容灾技术特点•HDS容灾的实现与切换过程(SHARE 78)个级别(容灾的7个级别投资vs 恢复时间Recovery TimeImportance of DataImmediateDaysTape Back-Up Offsite (via PTAM)Electronic Tape Vaulting LessMoreRemote DB LoggingHoursRemote Disk Copy (Asynchronous)Remote Disk Copy (Synchronous)Remote Disk Copy withExtended Server ClusterMinutes灾难备份等级与业务恢复情况对照表灾难备份等级与业务恢复情况对照表等级/描述RPO RTO企业百分比0/无灾备计划--<0.3%1/车辆运送方式24~48小时>48小时<0.1%2/车辆运送+热备份24~48小时24小时90%3/电子传送<24小时<24小时6%4/活动状态备份中心秒级<24小时<0.5%5/两中心、两阶段确认秒级<2小时<0.1%6/零数据丢失零丢失<2小时3%容灾系统的设计目标•恢复时间:Recovery-time Objective (RTO)–应用系统的停机时间•丢失数据量:Recovery-point Objective (RPO)–丢失的数据•网络恢复时间:Network Recovery Objective(NRO)–网络切换所需时间–应小于RTO•基于投资vs. 恢复时间–If I spend a little more, how much faster is recovery?–If I spend a little less, how much slower is recovery ?恢复时间vs.投资-评估每个应用系统C o s tRecovery Time ObjectiveAcceptable Cost/Time WindowMinutes Hours DaysBack office,BatchApplicationsCost of outage over time数据远程备份需考虑的方面•数据完整性–时间戳和写顺序技术•数据的丢失情况•应用系统的恢复:这是数据备份的唯一目的容灾系统分类•根据生产中心与灾备中心距离分–同城容灾(几十公里):可容灾难包括火灾、雷击、区域性供电故障、建筑故障、蓄意破坏、恐怖活动等–远程容灾(百公里以上):可容灾难包括水灾、地震、台风、暴风雪等灾难,以及战略性容灾,如预防战争等–三数据中心:同城+异地远程容灾的实现方式1.基于应用程序容灾解决方案–应用程序在本地、远端双写I/O –复杂、麻烦、不稳定、效率低2.基于数据库复制的远程容灾解决方案–数据库本身的远程复制(Oracle DB Guard )–不稳定、只能复制数据库文件3.基于主机的远程数据复制软件容灾解决方案–复制软件在卷管理器层面截获I/O ,远程复制–低效率、占用主机资源、价格昂贵4.基于存储的远程数据复制容灾解决方案–智能存储远程数据复制–安全、成熟、简单、高效、节省资源存储系统存储系统1234应用系统数据库卷管理器生产主机灾备主机应用系统数据库卷管理器基于存储实现的远程数据复制技术同步方式同步方式--“推”(Push )•USP -USP•USP -9900、9900V •9900V -9900、9900V异步方式异步方式--“推”(Push )•USP -USP•USP -9900、9900V •9900V -9900、9900V异步UR 方式方式--“拉”(Pull )•USP -USP•异构存储远程复制生产卷备份卷JNL4231生产卷备份卷2341生产卷备份卷15423JNL实时Push 实时Push 实时Pull 批量异步方式批量异步方式--“推+拉”(Push +Pull )•推:USP 、9900V -9500V •拉:9500V -USP 、9900V快照生产卷备份卷12快照批量Push批量Pull9500V9900V异步数据复制的优点•灾备的目的–数据可用,可用于主机紧急启动–最少的数据丢失–最少的解决方案与资源的投资•同步数据复制的缺点–难以忍受的I/O响应时间延迟–高带宽要求,距离限制(25公里)•异步数据复制关键点–数据一致性,在远端保证与生产端相同I/O顺序生产中心ShadowImageBC保护拷贝Win2K/WinNTShadowImageA快速恢复拷贝D备份中心通道负载均衡与故障回切HDS 容灾技术特点HDS TrueCopy 同步方式Same as PPRC 和SRDF13b1bLOGDB生产中心远程备份中心DBLOG2b发生灾难DB的LOG文件认为DB已经修改了x32123•DBMS自身保证数据更新的一致性和恢复机制,DBMS并不知道还有一个远程数据库拷贝•远端磁盘写I/O的关联性或顺序性可能被破坏--> 结果:当前数据备份被破坏,用以前的数据库备份,花长时间恢复非同步数据传输对数据库恢复的影响HDS TrueCopy 异步方式使用SMS 时间标记和consistency group 来保证数据完整性通用拷贝工具•关键技术–生产端写入的数据通过日志卷(journal volumes)传到备份端–日志卷保证多个逻辑卷的一致性–日志被拷贝到远端存储–按照时间戳和序列号排序Journal is transferred asynchronouslyPrimary site Secondary site Journal data is stored inthe journal volumeTransfer of the journal file tothe remote subsystemJournal Data is written toapplication volumeJNLTagmaStore UniversalStorage PlatformJNLTagmaStore UniversalStorage PlatformApplicationVolumeApplicationVolumeWRT•远端存储采用“吸”的方式拷贝jounal,按照时间戳、顺序号更新备份卷•最小的对生产系统的性能冲击•解决链路故障、cache容量、链路带宽对复制的影响•异构存储平台通过USP进行复制Journal 以异步方式传输生产中心备份中心写I/O按顺序记入jounal卷远端存储远端存储““吸入”jounal卷Journal 数据按顺序写应用卷写IOUSP USPJNL JNL应用卷减少的缓存平均峰值时间减少的带宽成本写I/O通用复制软件通用复制软件(HUR)(HUR)(HUR)远程异步数据复制原理远程异步数据复制原理三数据中心Production site Intermediate site Remote siteTC SyncS-VOLURS-VOLJNLJNLP-VOLTC SyncSecondary VolumeURS-VOLJournalPrimary VolumeJournalTC SyncSecondary VolumeURJournalPrimary VolumeJournalSecondary VolumeTakeoverLightning9900 VSeriesAMS500EMCSymmetrix异构存储远程数据复制SecondaryVolumePrimaryVolumeRemoteCopy•通过UVM+HUR实现异构存储远程数据复制SecondaryBackup SAN北京广州WindowsHostExchangeUNIXHostSAPUNIXHostSAPUSPUSPLightning9900 VSeriesAMS500EMCSymmetrixWindowsHostExchangeUNIXHostSAPUNIXHostSAPSAN远程数据复制所支持的通讯链路–Fibre Channel–ESCON®–Internet Protocol (IP)–Dense Wavelength Division Multiplexer (DWDM)–T1/E1, T3/E3–Synchronous Optical Network (SONET)–Asynchronous Transfer Mode (ATM)CNT InrangeCNTInrangeHDS 9900VHDS 9900V•Spoofing,•可支持在远程的效率不及FC •理论上没有距离的限制FC SwitchFC SwtichHDS 9900V打包到专线内HDS容灾的实现与切换过程ShadowImage ShadowImageDuplex DuplexSuspended Suspended Difference Kept in local bit mapDifference Kept in local ResynchronizeDifferenceDuplex DuplexCESTPAIR (MODE=RESYNC) ORPAIRRESYNCPrimary Site Failed - Recover at Remote1. 挂起或删除所有的卷对 2. 如有必要,运行 如有必要,运行ICKDSF Reformat命令改变 命令改变RVOLS的 命令改变 的 卷标HDS 99003. 在RVOLS上启动应用系统 上启动应用系统Simplex Duplex© 2006 Hitachi Data Systems31灾难发生后切换到数据备份中心的操作流程• • • • • • • • 步骤 步骤 步骤 步骤 步骤 步骤 步骤 步骤 1 2 3 4 5 6 7 8 分离镜像对(挂起或删除镜像对) 切换主机系统到备份中心 ONLINE RVOLs 激活RVOLs,使备份中心RVOLs可读写 在恢复模式下启动数据库 利用数据库日志文件恢复数据库(Redo、Rollback) 切换数据库至“打开”模式 启动用户应用 同时,用户IP网络进行相应的切换处理 上述步骤可编写脚本文件批量处理© 2006 Hitachi Data Systems32Primary Site Restored1. 确认生产中心所有的部件可 以正常操作 2.确认所有的卷的状态都是 确认所有的卷的状态都是 Simplex .否则,强制删除卷 否则, 否则 使所有卷对处于Simplex 对,使所有卷对处于 状态Duplex3. 反向 反向TrueCopy设置,同步数 设置, 设置 据从备份中心到生产中心. 据从备份中心到生产中心Simplex Duplex© 2006 Hitachi Data Systems33Back to Primary Site1. 在备份中心暂停所有的应用 2. 在备份中心将 在备份中心将RVOLs Offline 3. 删除所有卷对,将所有卷变 删除所有卷对, 成 Simplex 状态 4.反向 TrueCopy 设置 反向 5.建立 TrueCopy 卷对,使用 建立 卷对, No Copy参数 参数TrueCopyDuplexDuplex© 2006 Hitachi Data Systems34灾难后的回切操作过程• 步骤 1 确认生产中心所有部件处于可操作状态 • 步骤 2 在所有的卷对处于Simplex状态下,设置TrueCopy环境,将 数据从备份中心 同步到生产中心(备份中心作主点,生产中心作 备份点) • 步骤 3 当所有卷对状态处于Duplex状态后,暂停应用系统 • 步骤 4 将所有RVOLs 卷Offline • 步骤 5 删除所有卷对关系,使所有卷处于Simplex状态 • 步骤 6 建立Truecopy环境,使用No Copy参数使数据从生产中心同 步到备份中心 • 步骤 7 ONLINE PVOLs,在生产中心启动应用系统(完成回切) 由于数据库正常的结束,所以上述过程中数据库可以正常启动, 由于数据库正常的结束,所以上述过程中数据库可以正常启动,不需要 进行恢复的操作。