应用级灾备的实现方法V1.0
- 格式:doc
- 大小:170.00 KB
- 文档页数:7
应用级灾备的实现方法当前,灾备系统建设主要分为数据级灾备和应用级灾备两大类。
数据级灾备关注数据的备份和恢复,是应用级灾备的基础和前提;而应用级灾备则在数据级之上,进一步提供业务接管和恢复能力。
应用级灾备包括两个方面:数据同步和应用接管。
数据同步是应用接管的前提。
在保证数据同步基础上,要实现应用接管,还要能实现灾难发生时的网络切换和应用切换。
本文将从数据同步和应用接管这两个方面来讨论应用级灾备的实现方法。
1数据同步数据的同步是应用接管的基础,保障数据同步的完整性和实时有效性才能使得应用的接管有意义。
数据的同步主要分为两大类,第一类是基于磁盘阵列的复制软件实现,比如EMC MirrorView镜像功能、H3C ReplicationIP复制功能等,第二类是基于服务器或者应用软件(应用层)实现,比如Oracle DataGuard组件、GoldenGate数据库复制软件、Veritas VVR软件等。
不管采用何种技术,都只是在不同的层面实现了数据的同步,要达到应用接管的目的,还需要实现网络切换和应用切换。
从中我们可以了解到,应用层的数据同步和应用级灾备是有区别的,这也是经常会被混淆的地方。
在现实环境中,我们最常见的应用级灾备方案是“磁盘阵列的数据复制+备用服务器”,也就是通过磁盘阵列来实现数据同步,通过备用服务器提供业务接管能力。
磁盘阵列同步有以下主要特点:可以实现对所有数据的灾备,支持所有的数据类型,是最全面的灾备保护方式;基于存储设备进行灾备,可以有效的解决对数据库服务器和各种应用服务器的计算资源的占用问题;部署简单,无需更改原来的文件系统。
维护也更加简单,维护好存储灾备系统就可以。
基于服务器或应用软件的灾备,例如VVR主机复制方式,有以下特点:对原系统改动巨大,需要重建原系统的数据和文件系统,对原有数据造成破坏,需要提前做好大量的数据迁移工作;对软件要求较高,生产中心和灾备中心的每一台服务器上都要安装专门的软件,部署成本较高,在服务器扩展的时候,成本会直线上升;灾备软件和应用软件、操作系统之间可能存在版本冲突、兼容性问题,这个问题长期存在,在扩容的时候更加需要考虑,有可能导致应用系统受到限制或扩展受到影响;对主机的性能占用和消耗;每个服务器对应一个节点,在管理和维护方面增加了复杂性;数据复制采用异步的方式,在网络故障的情况下,会造成同步数据的不一致,导致数据不可用或无法访问;因此,数据同步从实现效果、成本、维护、资源占用、对原系统的影响几个角度来看,从磁盘阵列层面实现都要优于通过主机软件方式实现。
专栏·安全与视频铁路综合视频监控系统云技术关键问题探讨■中关村轨道交通视频与安全产业技术联盟,本刊记者中图分类号:U298;TP39文献标识码:A文章编号:1001-683X (2021)10-0146-08DOI :10.19549/j.issn.1001-683x.2021.10.146当前铁路建设飞速发展,铁路综合视频平台的规模越来越大,视频监控系统逐渐从数字化走向结构化、智能化,在铁路运输中的作用也越来越重要。
随着智能高铁及5G 的建设,视频系统向云平台发展已成为必然趋势,但目前铁路视频云的建设面临很多新问题,为此,邀请中铁二院工程集团有限责任公司通信信号研究设计院副总工程师余超、中国铁路哈尔滨局集团有限公司电务部高级工程师王二力、中国软件与技术服务股份有限公司通信事业本部经理乔实、河南辉煌科技科股份有限公司集成技术部经理何伟等行业内专家,就大家关心的部分热点问题提出真知灼见。
希望引起大家对视频云建设的关注,今后我们还将继续开展相关研究讨论,共同推进铁路视频云的发展。
综合视频监控系统在中国国家铁路集团有限公司(简称国铁集团)和各铁路局集团公司应用多年,基本上实现了基础视频资源的联网互通以及重要视频数据的逐级上报。
随着系统建设规模不断升级扩大,接入的前端资源数量日益增多。
原有视频数据通过IP-SAN 存储方式、业务软件通过独立服务器部署的方案,在后期节点扩容、系统维护、故障处理等方面,存在视频资源人工配置效率低、海量存储管理繁琐、丢失视频修复时间长等困难。
采用云技术可有效解决系统大规模数据处理、分发、存储。
余超先生认为,近年来云计算技术逐渐成熟,在余超王二力乔实何伟铁路综合视频监控系统云技术关键问题探讨专栏·安全与视频各行业应用日益广泛,公安、城轨及政府部门已纷纷出台建设标准和技术规范。
京张高铁、京雄城际铁路、呼和浩特城轨、大兴机场等工程均已采用云技术构建了视频监控系统,具有成功的应用经验。
在数据容灾中最常采用,也是最有效的方案是异地容灾。
这种容灾方案最有保障,因为它是把数据备份保存在另一地方,甚至另一个国家,这样数据就会更安全。
试想一下在伊拉克这样连成战争不断的国家,即使把数据保存在了本国其它地方也是不安全的,所以有许多数据存储厂商提出了全球容灾的方案。
从本篇起要向大家介绍几个典型的数据存储厂商的异地容灾方案,本篇所介绍的是全球最为著名的数据存储厂商--IBM的几种异地容灾方案。
针对不同的用户需求,IBM公司的异地容灾方案产品线非常丰富,各种数据备份技术和应用方案层出不穷,处于全球领先地位。
它的这些容灾方案不可能全在本文中介绍清楚,所以只选三个常见的方案类型向大家介绍。
一、数据级灾备--PPRCIBM的PPRC(Peer to Peer Remote Copy,点对占点远程复制)复制技术是基于ESS企业级数据存储服务器,通过ESCON(Enterprise Systems Connection,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。
这是IBM的最高级别容灾方案,主要适用于大、中型和电信企业选用。
它的网络结构(如图1所示)。
在图中数据中心A和数据中心B可以是两相隔上百公里的网络系统,既可以单独把某个数据中心的数据备份到另一个远程数据中心中,也可以实现相互远程备份。
在标准的实时备份方案中,服务器主机通过SAN与IBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现同步远程拷贝。
受ESCON传输距离的限制,当主、备机房的距离超过2公里时,需要加光纤延伸器。
光纤延伸器可以从多个不同的厂商购得,比如IBM 2029 Fibre Saver、INRANGE的9801等。
在光纤延伸器的帮助下,PPRC数据备份可达到100公里以上。
在这种容灾方案中,核心设备就是IBM的ESS的企业级存储服务器,目前最新的型号主要有IBM TotalStorage Enterprise Storage Server (ESS) Model 750/800这两种,(如图2所示)。
灾备介绍灾备关于数据中心建设来说,地位十分重要,依照业常规,依照对数据及业务的保障程度来说,一般能够分为三个等级:数据级灾备、应用级灾备和业务级灾备。
我们常常听到有关灾备建设方案就是将异地应用级灾备放在首选,但这实质上是灾备建设的一个误区,灾备固然十分重要,可是其实不是说进行灾备建设就必定要建设应用级的,进行灾备建设必定要从自己的实质需求出发,找到适合自己业务系统需求的灾备建设方案,这才是灾备建设合理思路。
关于灾备的级别,可能好多人都只认识此中的一两种,可是不可以够认识的比较全面,而这几种灾备之间实质上是存在联系的,所以想要完全的认识灾备,就需要进行多方面的认识。
那么第一我们来看三个不一样样级的灾备方式的关注点在哪里:数据级灾备、应用级灾备关注点都在 IT 信息系统自己,而业务级灾备则除了充足考虑 IT 系统外也关注了其余外面业务要素诸如办公环境、系统有关人员等。
下边我就介绍一下上边提到的三个不一样级其余灾备方式。
数据级灾备主要关注点是数据,即在灾害发生以后,能够保证用户原有数据不遇到破坏。
关于级别较低的数据级灾备来说,能够将需要备份的数据经过人工的方式保留到异地实现:如将备份的磁带 ( 盘或光盘 ) 准时运送到异地保留就是方法之一。
而较高级的数据灾备方案则依靠鉴于网络的数据复制工具,实现生产中心不一样备份设备之间或是生产中心与灾备中心之间的异步/ 同步的数据传输,如采纳鉴于磁盘阵列的数据复制功能。
应用级灾备是成立在数据级灾备的基础上的,对应用系统进行复制,以实现应用接收。
而在异地灾备中心再建立一套应用支撑系统是应用级灾备常常采纳的方式。
支撑系统包含数据备份系统、备用数据办理系统、备用网络系统等部分。
应用级灾备能供给给用系统接收能力,即在生产中心发生故障的状况下,灾备中心便能够接收应用,进而尽量减少系统停机时间,保障业务连续性。
业务级灾备是最高等其余灾备系统。
它包含除了保障 IT 系统业务连续性外也供给非 IT 系统保障,如当发生大的灾害时,用户的办公场所可能会被破坏,用户除了需要本来的数据之外,还需要工作人员在一个备份的工作场所能够正常地展开业务。
商业银行应用级灾备规划和建设经验1 、灾备定义灾备顾名思义,就是灾难备份,对于银行业来说,无论是监管机构的规定,还是出于银行重要业务的可靠性要求,都是一件必须要考虑的事情。
银行业的灾备建设,从原始的灾难备份要求,逐渐演变为灾难快速响应及快速切换要求。
通俗来讲,就是从数据级灾备过渡到应用级灾备的需求。
灾备建设主要有以下几个要点。
数据:无论是哪种灾备建设要求,都是基于数据出发的,数据保护是灾备建设的基本。
数据级灾备是要求灾备数据的存在性,当然,还需要定期的验证计划来保证这部分数据时可用的。
应用级灾备就要求在保证数据存在前提下,向灾备数据持续可用性转变的过程。
相对地对系统建设的要求和成本,也就要高很多。
数据同步:保证数据同步的一致性和实时性才能使灾备应用的接管有效。
目前主要的数据同步方式有两种,应用层同步和存储阵列同步。
考虑到目前城商行规模和实际场景,大部分都已经实现了共享的开放平台存储,所以基本上都采用了各存储厂商提供的数据复制技术来实现(同步异步可选),如 EMC 的 SRDF、IBM 的 metro mirror、HDS 的true copy 等,使用下来可以说同步复制技术几乎没有差别,都是基于一致性写实现的;异步复制技术区别也不大。
存储:简单来说,存储是所有数据的载体,是现在灾备建设基础设备。
实践经验告诉我们,对于有建设同城灾备甚至两地三中心需求的机构,尽量能够采用各型存储中的高端型号,避免在中端存储的复制稳定性和 license 限制上受局限。
网络:网络环境是灾备建设最底层的需求。
灾备网络需要满足这么几个要点:生产隔离+网络联通性,网络对称性+适量冗余,安全访问+自动分发。
2 、灾备建设原则2.1、数据一致性。
实时检验数据复制的状态,保证数据传输链路的稳定。
并建立应用校验机制,定期验证数据的一致性2.2、完善的流程。
建设灾备,就必须同步建设相应的灾备切换流程和应用同步流程,这有助于降低日常灾备维护压力,提高灾备中心规范化同步,保证双中心的系统能够同步上线。
云灾备同城应用及解决方案云灾备同城应用是在云计算技术基础之上,建立灾备系统应用的一种方式。
灾备系统是为了防止在出现灾难或者意外情况时,能够迅速的实现业务连续性和数据安全性。
在同城情况下的云灾备应用,主要是为了应对地区性的事故和灾难,确保业务在瞬间切换的同时,数据还能够保持安全。
一般情况下,云灾备同城应用可以通过异地冗余或者热备等方式来实现。
云灾备同城的解决方案1. 分布式架构方案:采用分布式架构可以减少数据中心的单点故障,实现数据的备份和镜像,用于灾难时备份数据的快速转换。
2. 多层备份方案:在架构上采用多层备份,并且在备份过程中分别备份数据和应用程序,以确保数据安全和业务的连续性。
3. 自动化切换方案:利用自动化切换技术,实现自动化、秒级或者毫秒级的切换,以提高业务的连续性和可用性。
4. 虚拟化方案:通过虚拟化技术可以实现业务的高可用性,利用虚拟化技术实现实时同步和数据的互备,实现业务的快速切换和恢复。
5. 全面安全防护方案:采用全面安全防护方案可以有效的防止各种漏洞的攻击和数据盗窃,保证数据的保密性和完整性。
6. 多层网络隔离方案:通过网络结构的隔离和分层,实现数据的隔离和保护,以保证数据的安全性和完整性。
云灾备同城应用的优势1. 快速切换:同城灾备系统具有快速切换的能力,可以帮助企业快速应对突发事件和灾难。
2. 业务连续性:在出现灾难或其他意外情况时,同城灾备系统可以确保业务连续性,避免业务中断造成的经济损失。
3. 数据安全:同城灾备系统可以保证数据的备份和恢复,即使主机数据丢失,也可以通过备份数据快速恢复数据。
4. 经济实用:采用云灾备同城应用可以大大降低企业的投资成本和运维成本,从而提高企业的核心竞争力。
5. 服务可靠性:采用专业的云灾备同城应用服务提供商可以保证服务的可靠性和稳定性,确保企业业务的正常运转。
总之,云灾备同城应用是一种切实可行的技术方案,它可以为企业提供强大的灾备保障,确保企业数据的备份和恢复,同时提高企业的业务连续性和可靠性,减少企业因灾难和其他意外事故造成的经济损失。
应用级灾备的实现方法
当前,灾备系统建设主要分为数据级灾备和应用级灾备两大类。
数据级灾备关注数据的备份和恢复,是应用级灾备的基础和前提;而应用级灾备则在数据级之上,进一步提供业务接管和恢复能力。
应用级灾备包括两个方面:数据同步和应用接管。
数据同步是应用接管的前提。
在保证数据同步基础上,要实现应用接管,还要能实现灾难发生时的网络切换和应用切换。
本文将从数据同步和应用接管这两个方面来讨论应用级灾备的实现方法。
1 数据同步
数据的同步是应用接管的基础,保障数据同步的完整性和实时有效性才能使得应用的接管有意义。
数据的同步主要分为两大类,第一类是基于磁盘阵列的复制软件实现,比如EMC MirrorView镜像功能、H3C ReplicationIP复制功能等,第二类是基于服务器或者应用软件(应用层)实现,比如Oracle DataGuard组件、GoldenGate数据库复制软件、Veritas VVR软件等。
不管采用何种技术,都只是在不同的层面实现了数据的同步,要达到应用接管的目的,还需要实现网络切换和应用切换。
从中我们可以了解到,应用层的数据同步和应用级灾备是有区别的,这也是经常会被混淆的地方。
在现实环境中,我们最常见的应用级灾备方案是“磁盘阵列的数据复制+备用服务器”,也就是通过磁盘阵列来实现数据同步,通过备用服务器提供业务接管能力。
磁盘阵列同步有以下主要特点:
➢可以实现对所有数据的灾备,支持所有的数据类型,是最全面的灾备保护方式;
➢基于存储设备进行灾备,可以有效的解决对数据库服务器和各种应用服务器的计算资源的占用问题;
➢部署简单,无需更改原来的文件系统。
维护也更加简单,维护好存储灾备系统就可以。
基于服务器或应用软件的灾备,例如VVR主机复制方式,有以下特点:
➢对原系统改动巨大,需要重建原系统的数据和文件系统,对原有数据造成破坏,需要提前做好大量的数据迁移工作;
➢对软件要求较高,生产中心和灾备中心的每一台服务器上都要安装专门的软件,部署成本较高,在服务器扩展的时候,成本会直线上升;
➢灾备软件和应用软件、操作系统之间可能存在版本冲突、兼容性问题,这个问题长期存在,在扩容的时候更加需要考虑,有可能导致应用系统受到限制
或扩展受到影响;
➢对主机的性能占用和消耗;
➢每个服务器对应一个节点,在管理和维护方面增加了复杂性;
➢数据复制采用异步的方式,在网络故障的情况下,会造成同步数据的不一致,导致数据不可用或无法访问;
因此,数据同步从实现效果、成本、维护、资源占用、对原系统的影响几个角度来看,从磁盘阵列层面实现都要优于通过主机软件方式实现。
通过磁盘阵列进行数据同步之后,可以通过备用服务器的启用实现应用的切换,配合管理者的切换决策也更加方便,并能够有效降低误切换带来的风险。
2 应用接管
在数据同步基础上,可进一步考虑网络切换和应用切换,来实现应用级灾备。
2.1 网络切换技术
应用级灾备要求提供冗余的网络线路和设备。
正常情况下,客户端通过生产中心的业务网络访问生产中心的应用服务器;在发生灾难时,通过网络切换,客户端能够访问到灾备中心的备用服务器。
目前,网络切换技术主要有以下三种:
(1)基于IP地址的切换
生产中心和灾备中心主备应用服务器的IP地址空间相同,客户端通过唯一的IP 地址访问应用服务器。
在正常情况下,只有生产中心应用服务器的IP地址处于可用
状态,灾备中心的备用服务器IP地址处于禁用状态。
一旦发生灾难,管理员手工或通过脚本将灾备中心服务器的IP地址设置为可用,实现网络访问路径切换。
(2)基于DNS服务器的切换
在这种方式下,所有应用需要根据主机名来访问,而不是直接根据主机的IP地址来访问,从而通过域名实现网络切换。
对于对外提供服务的业务,可通过向运营商申请相应的DNS服务器,对主生产中心和备用生产中心各申请相应的DNS服务,通过运营商DNS切换机制实现对外服务的切换。
对于内部提供的业务,生产中心和灾备中心各自部署一台DNS服务器,负责所有主机的域名解析。
生产中心的为主DNS服务器,灾备中心的为备份DNS服务器,两台DNS服务器的内容自动保持完全同步。
对于每个应用服务器的域名,DNS服务器上可以保存两个IP地址,主IP地址指向生产中心应用服务器的IP地址,备份IP地址指向灾备中心服务器的IP地址。
在所有的客户端上设置这两个DNS服务器(可通过DHCP服务器自动分配)。
系统首先查询主DNS服务器,如果没有应答,就查询备份DNS服务器。
当生产中心的主服务器出现故障,主DNS服务器发现无法联系到主服务器时,会自动将DNS请求解析至灾备中心服务器的IP地址,从而实现单个应用的自动切换。
当生产中心发生火灾、地震等灾难,导致整个生产中心不可用时,客户端因为联系不上主DNS服务器,会自动将地址解析的请求发往备份DNS服务器。
备份DNS服务器通过存活状态检查确认生产中心的主服务器已经不可用,就将灾备中心的服务器IP 地址作为DNS应答,从而将所有应用切换到灾备中心。
(3)基于负载均衡设备的切换
通过在服务器集群前端部署一台负载均衡设备,根据已配置的均衡策略将用户请求在服务器集群中分发,为用户提供服务,并对服务器可用性进行维护。
负载均衡能够按照一定的策略分发到指定的服务器群中的服务器或指定链路组的某条链路上,调度算法以用户连接为粒度,并且可以采取静态设置或动态调配的方式。
负载均衡设备能够针对各种应用服务状态进行探测,
收集相应信息作为选择服务器或链路的依据,包括ICMP、TCP、HTTP、FTP、DNS等。
通过对应用协议的深度识别,能够对不同业务在主生产中心和灾备中心之间进行切换。
这三种网络切换方式比较如下:
网络切换方式基于IP地址基于DNS服务器基于负载均衡
切换方式手动或半自动自动自动
切换时间10-30分钟左
右,与服务器数
量相关
10分钟左右分钟级
技术成熟度成熟成熟一般
实施案例较多多较多
设备投资无增加2台DNS服
务器在数据中心前端交换机上增加负载均衡板卡
单个应用和整个子网的切换适合整个子网
切换
适合单个应用和
整个子网切换
适合单个应用和
整个子网切换
在以上三种网络切换方式中,基于IP地址的切换方式较简单,实现成本低,但是对于拥有较多服务器的灾备中心而言,手工更改大量IP地址和网络配置需要比较长时间,因此这种方式适合于只有少数应用服务器的场合;基于DNS的切换方案,从技术上讲较成熟,应用也较多,而且能够实现网络切换的全自动,但是需要增加两台DNS服务器的投资;而基于负载均衡的切换,需要增加负载均衡板卡,但是切换能够精细到业务和服务内容,因此,在大型数据中心情况下,也可采用负载均衡的方式进行应用之间的切换。
2.2 应用切换技术
应用切换是指生产中心由于发生灾难而瘫痪时,可由灾备中心的备用服务器提供业务接管,确保业务运行的高连续性。
实现应用切换的前提条件是:
●数据已经从生产中心同步到灾备中心;
●灾备中心配置与生产中心对应的应用软件服务器、数据库服务器和中间件服
务器等,且运行正常;
●灾备中心网络运行正常或能够实现正常切换。
应用切换技术主要有以下几种:
(1)双活数据库技术
部分数据库复制容灾软件,能够实现生产中心和灾备中心数据库双活,即灾备中心的备份数据库也处于Open状态,客户端可对灾备数据库进行只读访问(例如GoldenGate、DSG等数据库复制软件)。
生产中心和灾备中心数据库保持双活,可提高灾备中心的资源利用率,分担生产中心的业务负担,在发生灾难时,自然也可以实现应用和业务的接管。
H3C作为GoldenGate、DSG等数据库复制容灾软件厂商的合作伙伴,对于基于数据库复制的应用级灾备解决方案进行过严格的测试验证,能够保证方案的快速正确的实施。
这种方式的缺点之一是只适合于特定的数据库应用,不适合文件系统等应用,有一定的局限性。
(2)远程集群技术
运行风险低高,可能误切换低
实施成本高较高低
维护工作量较高较高低
通过对以上应用切换技术的分析,建议首选手动切换方式,针对个别核心数据库应用,也可选择数据库双活技术,提高灾备中心的利用率。