商业银行灾备体系建设方法分析
- 格式:doc
- 大小:105.00 KB
- 文档页数:5
新冠肺炎疫情视角下浅谈基层商业银行灾备中心建设及运维管理随着新冠肺炎疫情的全球蔓延,各行各业都受到了前所未有的冲击。
金融行业作为社会经济的重要支柱,更是承受了巨大的压力。
在这样的情况下,基层商业银行的灾备中心建设及运维管理显得尤为重要。
本文将从新冠肺炎疫情的视角出发,浅谈基层商业银行灾备中心建设及运维管理,探讨其在当前形势下的重要性和具体实施方法。
新冠肺炎疫情的爆发给金融行业带来了前所未有的挑战,基层商业银行作为金融系统的基础组成部分,也受到了严重的影响。
在这样的情况下,建立健全的灾备中心显得尤为重要。
灾备中心是指在发生重大灾害时,为保障银行业务的连续性和稳定运行而设立的备份系统,其建设和运维管理对于确保银行业务的正常运转至关重要。
基层商业银行必须加强灾备中心的建设和运维管理,以提升自身的抗风险能力。
随着金融科技的快速发展,基层商业银行的业务越来越依赖于信息技术系统。
而信息技术系统一旦发生故障,将直接影响到商业银行的运营和客户利益。
建设灾备中心是保障基层商业银行信息技术系统高可用性和稳定运行的必然选择。
在疫情期间,员工的健康和安全问题也备受关注。
基层商业银行可以通过建设灾备中心,实现部分业务的人员异地办公,降低员工感染风险,保障员工的生命安全,同时保障银行业务的持续运行。
灾备中心建设的意义在于保障基层商业银行的持续运营,确保客户资金安全和服务质量,提升银行的抗风险能力,提高金融系统的韧性和可持续发展能力。
二、基层商业银行灾备中心建设的具体要求1. 多备份、多副本:建设灾备中心时,应该采用多备份、多副本的方式对核心业务系统数据进行备份,以确保在灾害发生时能够及时恢复数据,保障业务的连续性和稳定运行。
2. 异地布局:灾备中心的位置应该选择在本行总部所在地以外的地方,以防止发生地方性灾害对灾备中心的影响。
应保证灾备中心与总部的通讯联络畅通,确保业务运行的及时处理。
3. 安全防护:灾备中心应该配备完备的安全设施,包括防火、防水、防盗等措施,确保备份数据和设备的安全。
栏目编辑:梁丽雯 E-mail:liven_01@商业银行分行级灾备机房建设探讨*■ 兴业银行广州分行 陈庆聪摘要:人民银行、银监会等监管机构对商业银行信息科技及业务连续性等方面发布了多个监管指引,如2017年6月1日正式施行的《网络安全法》对重要行业和领域的关键信息基础设施的运行安全提出了较高要求。
本文分析了分行灾备建设的必要性及分行灾备机房候选方案,立足兴业银行广州分行实际情况提出了分行灾备机房建设实施方案,并探讨了分行灾备机房有效利用等问题。
关键词:灾备机房;数据大集中;商业银行作者简介: 陈庆聪(1973-),男,福建仙游人,工程师。
收稿日期: 2017-10-10*本文仅代表作者个人观点,不代表作者所在单位意见。
一、商业银行分行机房灾难恢复问题为降低IT建设成本,保障数据安全,各商业银行陆续将分布在各个分支机构的业务数据集中到总行。
通过数据大集中,商业银行实现了数据的集中和整合,并通过对数据深层次的挖掘,对银行的客户数据、业务数据进行系统的分析和评价,推动了商业银行向决策科学化方向迈进,提高了商业银行的经营管理水平。
数据大集中后,商业银行分行中心机房除了供配电、制冷等配套基础设施外,剩下就是网络设备、少量前置服务器、部分分行特色业务系统服务器及管理类服务器。
机房的供配电、制冷、网络、服务器可以通过多种方式实现备份。
比如供配电可以通过双回路供电、2N模式UPS等实现高可用性,空调可以采用冗余配置。
由于数据的集中处理,机房对网络系统的依赖性更强,要求也更高。
网络系统可以通过选择不同运营商的主备线路、动态路由、QoS、网络设备双机热备等技术手段,实现网络系统的高可用性。
而服务器也可以通过负载均衡、双机热备、双机冷备等方式实现备份功能。
但是承载上述设备的中心机房本身如果发生灾难性事件,所有的高可用性将无从谈起。
省级分行的中心机房作为全省的中心节点,其地位举足轻重。
一旦发生灾难性事件,将导致全省所有的业务中断,这将触发银监会《银行业重要信息系统突发事件应急管理规范(试行)》规定的Ⅲ级突发事件,对商业银行的业务发展、企业声誉等都将造成不栏目编辑:梁丽雯 E-mail:liven_01@可估量的损失。
华夏银行数据中心灾备体系建设实践华夏银行作为中国领先的银行机构,在金融行业中扮演着重要的角色。
随着信息技术的发展,数据中心的重要性日益凸显。
为了保障系统安全和业务连续性,华夏银行积极进行数据中心灾备体系的建设,并取得了显著的实践成果。
一、灾备体系建设背景和意义1.1 背景说明随着金融业务的不断拓展和海量客户的数据需求增长,华夏银行数据中心承载着极其庞大的信息系统,其中包括高频的交易系统、客户资料管理系统等核心系统。
在技术日新月异的今天,数据中心的稳定与安全对于银行的正常运营尤为重要。
1.2 意义灾备体系的建设能够有效提供数据中心的可用性和可靠性,确保业务的连续性,并在灾害事件发生时迅速恢复。
在金融领域,保护客户的财产安全和信息安全至关重要,同时也能减少业务中断对银行声誉和市场竞争力的负面影响。
二、灾备体系的架构设计2.1 业务需求分析根据华夏银行的业务特点和数据中心运营需求,进行了全面的业务需求分析。
通过对业务影响性、恢复优先级和系统关联程度的评估,确定关键业务系统和数据,以确保在灾备时优先确保核心业务的连续性。
2.2 灾备体系架构华夏银行灾备体系采用了主备互备的架构设计。
通过在两个地理位置相距较远的数据中心之间建立主备关系,确保数据实时备份和容灾切换。
同时,通过引入云计算和虚拟化技术,提高数据中心的资源利用率和灵活性,确保系统的高可用性和弹性扩展性。
2.3 储备设备和带宽灾备体系建设过程中,华夏银行缺乏备用设备和带宽将会成为一个关键挑战。
为了应对这个问题,银行充分调研市场,选择了稳定可靠的供应商,提前储备了冗余设备,并通过优化网络架构来增加网络带宽的可靠性和容量,以满足灾备时的数据传输需求。
三、关键技术支持3.1 数据同步技术为了保持主备数据的同步,华夏银行采用了实时数据同步技术。
通过使用高性能异步复制和快照复制技术,实现了数据在主备数据中心之间的实时复制,并确保主备数据的完整性和一致性。
3.2 虚拟化技术虚拟化技术在华夏银行的灾备体系建设中起到了重要的作用。
商业银行应用级灾备规划和建设经验1 、灾备定义灾备顾名思义,就是灾难备份,对于银行业来说,无论是监管机构的规定,还是出于银行重要业务的可靠性要求,都是一件必须要考虑的事情。
银行业的灾备建设,从原始的灾难备份要求,逐渐演变为灾难快速响应及快速切换要求。
通俗来讲,就是从数据级灾备过渡到应用级灾备的需求。
灾备建设主要有以下几个要点。
数据:无论是哪种灾备建设要求,都是基于数据出发的,数据保护是灾备建设的基本。
数据级灾备是要求灾备数据的存在性,当然,还需要定期的验证计划来保证这部分数据时可用的。
应用级灾备就要求在保证数据存在前提下,向灾备数据持续可用性转变的过程。
相对地对系统建设的要求和成本,也就要高很多。
数据同步:保证数据同步的一致性和实时性才能使灾备应用的接管有效。
目前主要的数据同步方式有两种,应用层同步和存储阵列同步。
考虑到目前城商行规模和实际场景,大部分都已经实现了共享的开放平台存储,所以基本上都采用了各存储厂商提供的数据复制技术来实现(同步异步可选),如 EMC 的 SRDF、IBM 的 metro mirror、HDS 的true copy 等,使用下来可以说同步复制技术几乎没有差别,都是基于一致性写实现的;异步复制技术区别也不大。
存储:简单来说,存储是所有数据的载体,是现在灾备建设基础设备。
实践经验告诉我们,对于有建设同城灾备甚至两地三中心需求的机构,尽量能够采用各型存储中的高端型号,避免在中端存储的复制稳定性和 license 限制上受局限。
网络:网络环境是灾备建设最底层的需求。
灾备网络需要满足这么几个要点:生产隔离+网络联通性,网络对称性+适量冗余,安全访问+自动分发。
2 、灾备建设原则2.1、数据一致性。
实时检验数据复制的状态,保证数据传输链路的稳定。
并建立应用校验机制,定期验证数据的一致性2.2、完善的流程。
建设灾备,就必须同步建设相应的灾备切换流程和应用同步流程,这有助于降低日常灾备维护压力,提高灾备中心规范化同步,保证双中心的系统能够同步上线。
云存储项目大数据平台解决方案目录1概述21.1建设背景21。
2设计范围21。
3总体设计原则22云存储系统平台设计42.1项目需求52。
2设计思想62。
3云存储系统方案72。
4系统优势和特点73系统架构83.1系统基本组成93。
2系统功能描述94系统安全性设计124.1安全保障体系框架124。
2云计算平台的多级信任保护134。
3基于多级信任保护的访问控制164。
4云平台安全审计185工作机制215。
1数据写入机制215.2数据读出机制216关键技术216.1负载自动均衡技术216.2高速并发访问技术226.3高可靠性保证技术226。
4高可用技术236.5低功耗存储技术236.6分布式、分级、动态存储技术237接口描述257。
1POSIX通用文件系统接口访问257。
2应用程序API接口调用258本地容错与诊断技术268.1 cStor高可靠性268.2 cStor数据完整性268。
3 cStor快照技术279异地容灾与恢复技术279。
1cStor数据备份与恢复系统功能279。
2cStor异地文件恢复289。
3cStor数据迁移归档281概述1.1建设背景随着银行数据集中处理的实施,银行业务运作、经营管理将越来越依赖于计算机网络系统的可靠运行。
银行所提供金融服务的连续性以及业务数据的完整性、正确性、有效性,会直接关系到银行的生产、经营与决策活动.一旦因自然灾害、设备故障或人为因素等原因引起计算机网络系统停顿导致信息数据丢失和业务处理中断,将会给银行造成巨大的经济损失和声誉损害,受到致命的打击.生产运行系统的灾难备份系统就显得格外重要。
我们认为,一旦实施银行数据集中,灾难备份系统应该与生产运行应用系统同步投入使用,保证银行数据集中处理系统的运行安全。
1.2设计范围本技术解决方案针对海量数据集中存储与共享,提供从系统软硬件技术架构、原理、硬件选型、网络接入以及软件与应用之间的接口等方面的全面设计阐述。
1.3总体设计原则针对本次工程的实际情况,充分考虑系统建设的建设发展需求,以实现系统统一管理、高效应用、平滑扩展为目标,以“先进、安全、成熟、开放、经济”为总体设计原则.1.3.1先进性原则在系统总体方案设计时采用业界先进的方案和技术,以确保一定时间内不落后。
1、概述随着计算机技术和通讯技术的高速发展,以计算机和通讯技术为基础的金融电子化系统得到了飞速发展。
XXXX银行XXXX省分行为了发挥计算机城市综合网系统的最大优势,在市场竞争中保持XXXX银行现有的科技优势,能够给大行业大企业提供全省范围内的优质服务,加强城市综合网系统的安全运行。
规划将XXXX银行XXXX省分行全省范围内的客户数据帐务信息,集中到省分行运行中心统一处理,这是计算机应用技术发展的必然,也是XXXX银行XXXX省分行业务发展的需要。
随着数据集中处理的实施,可以预计,XXXX的业务运作、经营管理将越来越依赖于计算机网络系统的可靠运行。
XXXX银行所提供金融服务的连续性以及业务数据的完整性、正确性、有效性,会直接关系到我们XXXX的生产、经营与决策活动。
一旦因自然灾害、设备故障或人为因素等原因引起计算机网络系统停顿导致信息数据丢失和业务处理中断,将会给XXXX银行XXXX省分行造成巨大的经济损失和声誉损害,受到致命的打击。
将全省客户帐务数据集中统一处理,因数据集中处理伴随而来的运行风险将因为灾难发生大大增加。
生产运行主机系统及其配套设备一旦发生故障,就会导致在全省XXXX银行范围内所有营业柜台停止营业的风险。
会计、储蓄、信用卡等XXXX银行的三大主营业务的停业,XXXX银行XXXX省分行面临的将是灾难性打击。
因此,生产运行系统的灾难备份系统就显得格外重要。
我们认为,一旦实施全省数据集中,灾难备份系统应该与生产运行应用系统(全省集中)同步投入使用,保证全省数据集中处理系统的运行安全。
根据XXXX银行XXXX省分行数据集中处理领导小组的统一安排,1999年10月10日到10月20日,分行科技处组织人员在XXXX市龙泉,进行封闭式工作,制定城市综合网系统全省数据集中处理规划,本应用系统灾难备份系统XXXX规划是其中很重要的分部。
1.1 计算机系统灾难备份概念简介1.1.1 计算机系统灾难定义计算机系统灾难是指造成重要业务数据丢失,使业务中断了不可忍受的一段时间的计算机系统事故,这些事故导致银行丧失了全部或部分业务处理能力,引起企业营业收入下降、信誉降低和形象受损,甚至威胁其生存。
商业银行灾备体系建设方法分析(发表于《金融电子化》2010年10月刊)2012-03-23 16:26阅读(31)评论(0)商业银行灾备体系建设方法分析随着金融业务对信息系统的依赖性日益增强,商业银行越来越重视生产中心信息系统的高可用性,投入了大量资源和人员。
但是,在灾备体系建设方面,一方面由于起步较晚,另一方面由于我国还没有发生过导致银行生产中心瘫痪的灾难性事件,所以各家商业银行的经验并不是很丰富。
本文在分析并明确灾备工作定位的基础上,归纳设计了灾备体系框架,并介绍了建设灾备体系的基本步骤,以供参考。
一、灾备工作定位对企业来说,造成关键业务功能或流程中断的时间超过企业最大容忍程度的突发事件,都可以认为是灾难。
对商业银行来说,由于几乎所有金融业务都依赖于信息系统的支撑,所以灾备管理通常是指信息系统的灾难备份与恢复管理,目的是为了应对生产中心信息系统发生严重故障或者瘫痪,已不能在可接受的时间内在生产中心本地恢复,通常需要将信息系统切换到灾备中心运行的情况。
灾备管理、应急管理、业务连续性管理和风险管理是经常容易混淆的几个概念。
根据巴塞尔协议,商业银行风险管理包括对市场风险、信用风险和操作风险的识别、评估、监控、缓释和控制。
业务连续性管理主要针对可能导致业务中断的风险或者已经发生并导致业务中断的事件进行管理。
应急管理主要关注对各种突发事件的应急处置,该突发事件不一定会导致业务中断,但一定会对业务造成影响。
可见,业务连续性管理和应急管理都是风险管理的组成部分,并且业务连续性管理与应急管理之间存在一部分交集,这个交集就是对导致业务中断的突发事件的管理。
灾备管理是业务连续性管理和应急管理交集中的一种极端特殊情况,是专门针对IT灾难的。
上述各个概念之间的关系及举例如下图所示:二、灾备体系参考框架灾备体系建设是一项庞大而复杂的系统工程,必需在清晰、合理的框架指导下,协调有序地开展工作。
灾备体系建设需要从管理技术、管理和业务三个方面进行,三者之间相辅相成,是灾备体系不可或缺的有机组成部分。
(一)技术体系灾备技术体系包括恢复信息系统所需的数据、人员、系统、网络、环境和预案等,其中数据和人员是灾难恢复的前提条件,系统、网络和环境是灾难恢复的技术资源保障,预案是灾难恢复的行动方案。
1、数据备份数据备份是灾难恢复的最基本前提,但银行普遍存在数据总量非常大的情况,所以必需按照成本与风险平衡的原则,对不同数据采取不同的备份策略,包括数据备份范围、备份周期、备份技术、备份介质、备份线路带宽、保存时间等。
比如,对核心账务数据要采用实时的远程备份,尽量保证数据的完整性;对经营管理数据采用定期批量备份,容忍少量的数据丢失;对可以通过备份数据生成的其它数据不做备份。
2、运行和技术保障运行和技术保障是灾难恢复的另一前提,因为人是实施灾难恢复工作的主体。
灾难恢复后,灾备生产运行需要运行人员来操作,灾备系统的维护管理需要技术保障人员来支持。
合理设置灾备组织机构和岗位,对运行和技术保障人员进行生产技能培训,都是灾备体系建设的重点工作内容。
3、备用数据处理系统备用数据处理系统指备用的计算机软硬件及外围设备等。
为节约成本,灾备中心的设备资源配置一般会低于生产中心,并且在平时可以用于软件开发和测试,只是在演练或发生灾难时,才进行资源临时调配,暂停开发和测试工作,全力支持灾备生产运行。
4、备用网络系统备用网络系统的关键是要使灾备中心的网络架构能够支持应急生产,比如当生产中心的网络中断时,各分行可以通过参数配置的调整,改连灾备中心。
备用网络系统与生产网络系统应该作为一个整体同时规划,否则灾难发生后再向运营商紧急申请线路,或者紧急调整灾备网络架构,将是非常耗时的工作。
5、备用基础设施备用基础设施主要是指灾备机房、办公场地、生活设施等,其中最重要的是灾备机房。
一般来说,灾备机房都是提前准备好的,并且一直在使用当中,用于支持开发和测试工作。
所以,灾备机房的重点工作就是提前规划好在不同情况下的机房使用策略。
6、灾难恢复预案灾难恢复预案是定义信息系统灾难恢复所需组织、流程、资源等预先制定的行动方案,用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。
预案应准确描述灾难恢复组织机构及职责,准确描述灾备基础资源的技术配置和恢复流程。
(二)管理体系灾备管理体系主要是指组织机构的各个层面,在日常状态和灾难状态下的各种管理工作,至少包括以下方面:1、灾难恢复组织机构商业银行应结合本行机构设置的具体情况,设立灾难恢复组织机构,包括灾难恢复规划建设、运行维护、应急响应和灾难恢复等各阶段工作所需的人员,有关人员可为专职,也可为兼职,关键岗位的人员应有备份。
商业银行可以参考《JR/T0044 2008银行业信息系统灾难恢复管理规范》,设置灾难恢复组织机构,包括决策层、管理层和执行层,各层之间分工明确、职责清晰。
2、岗位与培训管理灾备中心的应急生产岗位应与生产中心对等,只不过可以按照人员复用的原则,由灾备管理人员、开发测试人员或系统运维人员专职或兼职担任。
对不同层次、不同部门的岗位,在灾难恢复策略规划、系统建设与运维、预案制定、演练和更新维护等不同阶段,应按照不同的培训目标,安排不同的培训计划。
3、灾难恢复预案管理与演练灾难恢复预案要长期保持有效性,必需在灾难恢复策略发生变化、演练发现问题、生产系统发生变更、人员出现调整等情况下,及时修订维护预案,做好变更管理、版本管理,以及发布管理等,确保合适的人员及时获得最准确、最合适的信息。
演练验证灾难恢复预案有效性的最佳手段。
演练管理就是要对演练的计划、场景、人员、过程、总结评估和后续完善调整等进行全面管理,通过演练来培养灾难恢复团队面对复杂环境的信心和冷静心态,验证灾难恢复能力,改进灾难恢复流程,发现并纠正灾备体系中的缺陷。
4、灾备中心日常运维、灾难响应与重续运行管理灾备中心应随时做好接替生产中心的准备,因此,必须象生产中心一样,对灾备中心的系统、网络和环境等基础资源进行运行维护,按照备份策略按时完成数据备份,完成灾备系统与生产系统的同步。
当灾难发生后,灾难恢复组织机构的各层人员立即响应,在指挥报告、协调、联络、保障等工作机制的保障下,按照灾难恢复流程步骤,一步步地恢复信息系统及其支撑的关键业务功能。
在生产系统成功切换到灾备中心运行后,要按照生产中心的规章制度、操作流程、技术规范来管理,保障生产系统安全稳定运行,直至生产中心重建并恢复了生产运行能力。
5、外部资源管理外部资源主要指商业银行的合作伙伴、服务商、设备商和外协人员等。
当发生灾难时,可能需要这些外部资源的支持才能完成灾难恢复,比如,从设备供应商紧急采购灾备生产设备,从电信运营服务商紧急租用通信线路,从银联借调交易流水等。
因此,需要与这些外部资源建立日常联系或签订协议,并不定期地测试其支持能力,以保证在灾难恢复期间,外部资源可以提供有效的支持。
(三)业务体系业务体系主要指业务恢复预案。
在极端灾难情况下,业务处理流程可能会与正常情况下有所不同,比如无卡取现、无证挂失等。
因此,要制定灾难情况下的业务管理制度或操作流程,使得业务可以依法办理;要提前思考灾难情况下的业务流程变化,并改造相应的信息系统或做好相应的技术准备,以适应新的业务流程;另外,有些通过技术手段不能解决或者非常难以解决的问题,可能需要从业务角度寻找解决方案。
三、灾备体系建设步骤灾备体系建设是一项复杂的系统工程,必须按照一定的策略,在灾备体系框架的指导下,由简单到复杂,从小范围到全局,优先为关键信息系统建设灾备系统,有计划地不断建设和完善灾备体系。
具体步骤如下:步骤1:制定灾难恢复策略。
极端的灾难情况属于极小概率事件,我国商业银行在当前发展阶段,尚不可能为应对这种极小概率事件而安排与生产中心对等的成本,所以必须按照灾难恢复所需的资源成本与灾难可能造成的损失之间取得平衡的原则,即成本风险平衡原则,制定灾难恢复策略,不同的业务功能采用不同的灾难恢复策略,包括布局模式、资源保障策略、业务恢复范围和恢复时间目标等。
灾难恢复策略是灾备体系建设的指导方针,应由商业银行的风险管理部门、业务管理部门、技术管理部门、资源管理部门等共同参与制定。
步骤2:按照灾备体系框架,从技术、管理和业务三个方面建设灾备体系,实现灾难恢复策略。
在技术层面,需要建设或租用灾备机房,培养运行和技术保障团队,搭建数据备份系统、备用数据处理系统和备用网络系统,制定灾难恢复预案等。
在管理层面,要成立灾难恢复组织机构,制定并执行灾备管理制度。
在业务层面,要制定业务恢复预案,并且要特别注重在没有信息系统支撑的情况下如何开展业务,以及如何从业务操作上配合信息系统恢复,比如手工补录数据。
步骤3:组织灾难恢复演练。
通过坚持不懈地组织不同形式、不同深度、不同范围的灾难恢复演练,检验灾难恢复组织机构、灾备系统和灾难恢复预案的有效性,并不断完善和改进。
演练可以是桌面演练、模拟演练、实战演练等多种形式,可以是系统级演练、应用级演练和业务级演练等不同深度,可以是计划内演练和计划外演练等。
步骤1到步骤3是一个循环迭代、不断完善和演进的过程。
如果灾难恢复策略进行了调整,就需要重新审视和调整灾备体系,重新组织演练,并对灾备管理制度进行适应性修订。
四、小结灾备体系作为生产运行体系的重要组成部分,是商业银行全面风险管理体系的重要一员。
在商业银行竞争日趋激烈的今天,构建完善的灾备体系成为了提高银行核心竞争能力的重要手段之一。
正所谓“居安思危,思则有备,有备无患”,商业银行灾备体系建设工作任重而道远。