当前位置:文档之家› 信息系统的灾难恢复规范

信息系统的灾难恢复规范

信息系统的灾难恢复规范
信息系统的灾难恢复规范

信息系统的灾难恢复工作包括灾难恢复规划和灾难备份中心的日常运维,关键业务功能在灾难备份中心的恢复和重续运行,以及主系统的灾后重建和回退工作,还涉及突发事件发生后的应急响应,灾难恢复是一个周而复始,持续改进的过程,包括以下几个阶段:

1、灾难恢复需求的确定

2、灾难恢复策略的制定

3、灾难恢复策略的实现

4、灾难恢复预案的制定、落实和管理。

灾难恢复的组织架构中的人员有管理、业务、技术和行政后勤等人员组成,一般设定灾难恢复领导小组和灾难恢复规划实施小组和灾难恢复日常允许组。

组织可以聘请具有相应资质的外部专家协助灾难恢复实施工作,也可以委托具有相应资质的外部机构承担实施组织,以及日常运行组的部分或全部工作。

灾难恢复领导小组的职责:

是信息系统灾难恢复工作的组织领导机构,组长应由组织最高管理层成员担任。领导小组的职责是领导和决策信息系统灾难恢复重大事宜,主要如下:

审核并批准经费预算

审核并批准灾难恢复预案

批准灾难恢复预案的执行

灾难恢复实施组

灾难恢复规划实施组的主要职责是负责:

灾难恢复的需求分析

提出灾难恢复策略和等级

灾难恢复策略的实现

制定灾难恢复预案

组织灾难恢复预案的测试和演练

灾难恢复日常运行组

灾难恢复日常运行组的主要职责是负责

协助灾难恢复系统实施

灾难备份中心日常管理

灾难备份系统的运行和维护

灾难恢复的专业技术支持

参与和协助灾难预案的教育、培训和演练

维护和管理灾难恢复预案

突发时间按发生时的随时控制和损失评估

灾难发生后信息系统和业务功能的恢复。

灾难发生后的外部协作。

灾难恢复需求的确定

风险分析的主要内容包括:标识信息系统的资产价值,识别信息系统面临的自然的和人为的威胁,识别信息系统的脆弱性,分析各种威胁发生的可能性并定量或定性描述可能造成的损失,识别现有的风险防范和控制措施。通过技术和管理手段,防范或控制信息系统系统的风险。依据防范或控制风险的可行性和残余的可接受程度,确定对风险的防范和控制措施。业务影响分析

分析业务功能和相关资源配置

对组织的各项业务功能及各项业务功能之间相关性进行分析,确定支持各种业务功能的相应信息系统资源及其他资源,明确相关信息的保密性、完整性和可用性要求。

评估中断影响

应该采用如下的定量和定性的方法,对各种业务功能的中断造成的影响进行评估:

定量分析:以量化方法(数字,统计、数学模型),评估业务功能的中断可能给组织带来的直接经济损失和间接经济损失;

定性分析:运用归纳与演绎、分析与综合以及抽象与概括等方法,评估业务功能的中断可能给组织带来的非经济损失,包括组织的声誉、顾客的忠实度、员工的信心、社会和政治影响等。

确定灾难恢复目标

包括关键业务功能及恢复的优先顺序;灾难恢复时间范围,及RTO和RPO的范围

灾难恢复策略制定的要素:

数据备份系统

网络

备用基础实施

专业技术支持能力

运行维护管理能力

灾难恢复预案

灾难恢复策略的实现

技术方案的设计

信息系统灾难恢复方案

信息系统灾难恢复方案(总6 页) -CAL-FENGHAI.-(YICAI)-Company One1 -CAL-本页仅作为文档封面,使用请直接删除

信息系统灾难恢复方案 第一章总则 第一条为规范并指导我公司生产系统灾难恢复工作,提高防范灾难风险的能力,保障持续运营,保护客户的合法权益,根据国家信息安全法律法规及有关规定,制定本预案。 第二条生产系统灾难恢复工作应坚持“统筹规划、平战结合、等级灾备”的原则,平衡成本与风险,确保工作的有效性。 第三条本指引所称灾难恢复为生产系统灾难恢复。灾难恢复工作是指,为保障生产系统持续运营,防范灾难风险并减轻灾难造成的损失和不良影响而开展的一系列工作,包括:组织机构设立和职责、灾难恢复需求分析、灾难恢复策略制定、灾难备份系统实施、灾难备份中心的建设与运行维护、灾难恢复预案管理、应急响应和恢复。 第二章总体工作要求 当生产系统及相关业务流程发生重大变更时,应立即启动灾难恢复需求的再分析,并根据最新的灾难恢复需求分析重审和修订灾难恢复策略。根据灾难恢复策略定期复审和调整灾难恢复技术方案、灾难恢复预案,并定期开展灾难恢复预案培训和演练工作。加强与业务密切相关的机构间的协调,共同评估面临的风险,协同制定灾难恢复策略,提高整体风险防范和灾难恢复能力。

第三章灾难恢复项目小组的制定和职能 1.管理组:小组人员:职责:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组小组成员:职责:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:小组成员:职责:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组: 小组成员: 职责:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组: 小组成员职责:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组: 小组成员:职责:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组: 小组成员:职责:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。

XX财产保险股份有限公司信息系统灾难恢复预案

XX财产保险股份有限公司信息系统灾难恢复预案 2014-11

目录 1目标与范围 (2) 1.1灾难的定义............................................................................ 错误!未定义书签。 1.2容灾目标 (4) 1.3容灾范围 (5) 1.4灾难恢复演习执行周期 (5) 1.5灾难恢复计划启动决策流程 (5) 1.6灾难声明的内容 (5) 1.7灾难恢复指挥中心和异地灾备中心 (5) 2组织与职责 (6) 2.1团队组织图 (6) 2.2灾难恢复团队 (6) 2.3全部成员通讯录 (17) 3紧急响应流程 (17) 3.1灾难预警 (17) 3.2人员疏散 (17) 3.3损害评估 (17) 3.4研判和灾难宣告 (17) 4恢复及重续运行流程 (18) 4.1恢复 (18) 4.2重续运行 (18) 5灾后重建和回退 (19) 5.1生产系统的重建工作流程 (19) 5.2专业技术保障........................................................................ 错误!未定义书签。 5.3通信保障................................................................................ 错误!未定义书签。

1目标与范围 1.1灾难恢复预案中的相关术语 1)灾难备份中心backup center for disaster recovery 用于灾难发生后接替主系统进行数据处理和支持关键业务功能运作的场所,可提供灾难备份系统、备用的基础设施和专业技术支持及运行维护管理能力,此场所内或周边可提供备用的生活设施。 2)灾难备份系统backup system for disaster recovery 用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。 3)业务连续管理business continuity management 为保护组织的利益、声誉、品牌和价值创造活动,找出对组织有潜在影响的威胁,提供建设组织有效反应恢复能力的框架的整体管理过程。包括组织在面临灾难时对恢复或连续性的管理,以及为保证业务连续计划或灾难恢复预案的有效性的培训、演练和检查的全部过程。 4)业务影响分析business impact analysis 分析业务功能及其相关信息系统资源、评估特定灾难对各种业务功能的影响的过程。 5)关键业务功能critical business functions 如果中断一定时间,将显著影响组织运作的服务或职能。 6)数据备份策略data backup strategy 为了达到数据恢复和重建目标所确定的备份步骤和行为。通过确定备份时间、技术、介质和场外存放方式,以保证达到恢复时间目标(3.17)和恢复点目标(3.18)。 7)灾难disaster 由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。通常导致信息系统需要切换到灾难备份中心运行。

保监会 保险业信息系统灾难恢复管理指引 - 2008

关于印发《保险业信息系统灾难恢复管理指引》的 通知 2008-03-27 【字体:大中小】【打印本页】【关闭窗口】 保监发〔2008〕20号 各保险公司、保险资产管理公司: 为加强保险信息安全基础设施建设,推进信息系统灾难恢复工作,根据《中华人民共和国保险法》和国家有关信息安全法律法规,我会制订了《保险业信息系统灾难恢复管理指引》,现印发给你们,请遵照执行。 二○○八年三月二十一日 保险业信息系统灾难恢复管理指引 第一章总则 第一条为规范并指导我国保险业信息系统灾难恢复工作,提高防范灾难风险的 能力,保障持续运营,保护客户和股东的合法权益,根据《中华人民共和国保险法》、国家信息安全法律法规及有关规定,制定本指引。 第二条保险业信息系统灾难恢复工作应坚持“统筹规划、资源共享、平战结合、 等级灾备”的原则,平衡成本与风险,确保工作的有效性。 第三条本指引所称保险机构是指,经中国保险监督管理委员会(以下简称“中国 保监会”)批准设立,并依法登记注册的保险公司、保险资产管理公司、外国保险公司 分公司及港、澳、台地区保险公司在大陆地区的分公司。 第四条本指引所称灾难恢复为信息系统灾难恢复。灾难恢复工作是指,为保障信息系统持续运营,防范灾难风险并减轻灾难造成的损失和不良影响而开展的一系列工作,包括:组织机构设立和职责、灾难恢复需求分析、灾难恢复策略制定、灾难备份系统实施、灾难备份中心的建设与运行维护、灾难恢复预案管理、应急响应和恢复。 本指引所称区域性灾难是指,造成所在地区或有紧密联系的邻近地区的交通、电讯、电力及其它关键基础设施受到严重破坏,关键信息网络设备毁损、重大故障或大规模人口疏散的事件,将会导致信息系统无法正常运行。例如:地震、大型公共卫生事

灾难恢复管理流程

罕王实业集团有限公司 信息中心 灾难恢复管理流程 编号及版本号:HK 责任部门:信息中心 发布(施行)日期:2015年1月 4 日编制人: 审核人: 批准人:

《信息中心灾难恢复管理流程》履历表 表单编号: 第一章总则 目的 确保公司业务的持续性,避免人为和自然灾害带来的风险。具体目标如下:1)将信息系统运行的中断降到最低; 2)限制中断和损害的范围;

3)将中断的经济影响降到最低; 4)预先建立备用操作方法; 5)培训人员处理紧急过程; 6)提供顺利快速的恢复服务。 适用范围 本流程适用于信息中心负责的所有信息系统。 职责 1 表 2 表 第二章细则 流程说明 资产列表 在此列出了公司业务持续所必须依赖的信息系统和重要数据,下列各表应6个月核查一次。1)基础硬件:包括服务器、磁盘阵列、个人计算机、打印机、传真机、磁带机、常规数据 表 2 表 3 表

灾难恢复计划 自然灾害 这里的自然灾害指造成公司所在建筑物毁灭性损失的火灾、地震、水灾、地面塌陷等灾害。自然灾害在灾难分类中出现几率最小,但造成损失是最大的。流程说明如下: 1)确定损失情况。 自然灾难发生后,灾难恢复小组成员立即建立联系,具体了解公司的损失情况,了解的范围包括:人员、物理设备、数据。 小组成员根据了解到的损失情况编制《损失一览表》。 2)通知用户服务中断。 损失情况了解清楚后,灾难恢复小组成员讨论预估的恢复时间。 灾难恢复小组组长根据《损失一览表》确定有哪些服务不能正常提供,马上联系用户通知服务中断并告知估计的恢复时间。通知用户可以通过电话联系、张贴通知、电子邮件等方式。 3)联系保险公司。 发布服务中断的信息后,灾难恢复小组组长根据《损失一览表》中记录的损失情况检查是否有财产投保,如果有则应马上联系保险公司申请理赔。 4)联系服务商。 灾难恢复小组确定损失情况后,小组成员根据《损失一览表》中记录的设备损失列表,联系该设备的提供商,重新购置或者租用设备,并确定设备的到货日期和地点。 5)确定新的机房和办公地点。 如果公司原先的机房和办公地点已经无法使用,灾难恢复小组组长应向总裁提出申请,确定新的机房和办公地点。 6)安装调试新的物理设备。 新设备到货后,灾难恢复小组组长部署新设备的安装和调试工作。安装调试任务明确后,灾难恢复小组组长应和各信息系统管理员确定完成部署的时间,如果完成时间和前期通知用户的时间不同,应通知用户最后确定的系统恢复时间。 7)恢复系统数据。 新设备安装完成后,IT(网络、操作系统)工程师取出备份的最新数据,执行数据恢复操作,各应用系统的数据恢复参照各应用系统的操作手册。 8)告知用户服务已恢复。 系统恢复运行后,恢复小组组长向用户发布通知,告知系统已经恢复运行。 9)填写《灾难恢复报告》。 流程图请见图1。 电力故障 UPS能够避免短时间的电力中断故障造成的损失。这里的电力故障指超出UPS承受范围的大范围停电事故,这种长时间的停电会造成业务停止和数据的丢失。流程说明如下: 1)确定恢复时间。 IT(网络、操作系统)工程师在明确电力中断故障后,立即联系电力供应部门,了解电力故障的原因,确定电力恢复的时间。并立即通知各信息系统管理员。 2)关闭设备。 IT(网络、操作系统)工程师在UPS供电期内关闭所有服务器设备,防止断电造成损失。3)通知用户。 系统管理员通知用户因电力故障服务中断,并告知用户恢复的大概时间。通知的方式可以是电话、张贴通知、邮件等。 4)启动服务器。 在电力供应恢复正常后,IT(网络、操作系统)工程师按照手册启动设备,并通知各个应用管理员检查各自负责的应用系统是否已经正常启动。如果应用管理员发现应用程序没有

计算机系统灾难恢复计划

嘉兴冠誉时装有限公司 计算机系统灾难恢复计划 一、灾难的定义 灾难分为自然灾害和非自然灾害。 自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。 非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。 二、灾难恢复项目小组的制定和职能 1.管理组:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。 8、市场和客户关系组:负责对外进行信息发布、制定相应应急措施应对客户疑问等。 各小组共同职能: a)负责计划的执行 b)与其它组之间进行信息交流,监督计划的测试和执行 c)所有或是某一个成员可能领导特定的组 d)协调恢复过程 e)评估灾难,执行恢复计划,联系组长 f)监控并记录恢复的过程 三、业务恢复流程 (一)自然灾害引起的灾难恢复流程 由自然灾害引起的灾难往往影响较大,可能会直接导致一些基础设施的无法使用,甚至会对导致人员减少。因此对于自然灾害引发的灾难恢复流程相对特殊且繁琐。 1.数据抢救 灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救,抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。 2.损坏评估及启动应预案 灾难发生后各小组需根据情况汇报损失情况给损坏评估组,损坏评估组根据汇总信息进行消息告知披露。披露损坏信息包括: a)公司重要生产、监视测量、办公设备

重要信息系统灾难恢复指南-2007年版

重要信息系统灾难恢复指南 作者:国务院信息化办公室 引言 灾难恢复是确保信息和信息系统安全的一项重要措施。遵从重要信息系统灾难恢复指南的要求,是做好重要信息系统灾难恢复工作的基础。 本指南用于规范和指导重要信息系统的使用和管理单位对信息系统灾难恢复的规划和准备工作。本指南主要从灾难恢复规划的管理、灾难恢复的需求分析、灾难恢复等级的确定、灾难恢复等级的实现、灾难恢复预案的制订、落实和管理等方面,对灾难恢复的规划和准备活动的规范化要求进行全面描述。本指南还以规范性附录的形式对灾难恢复的等级划分进行了描述,并以资料性附录的形式对灾难恢复预案的框架进行了说明。 1-1 1 范围 本指南规定了对重要信息系统的灾难恢复应遵循的基本要求。 本指南适用于指导重要信息系统的使用和管理单位(以下简称“单位”)进行灾难恢复的规划和准备工作,对重要信息系统灾难恢复规划项目的审批和监督管理也可参照使用。 2 规范性引用文件 下列文件中的条款通过本指南的引用而成为本指南的条款。凡是注日期的引用文件,其随后所有的修改单(不包含勘误的内容)或修订版均不适用于本指南,然而,鼓励根据本指南达成协议的各方研究是否可适用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本指南。GB/T 5271.1—2000 信息技术词汇第1 部分:基本术语 GB/T 5271.9—2000 信息技术词汇第9 部分数据通信 GB/T 5271.12—2000 信息技术词汇第12 部分外围设备 GB/T 5271.20—94 信息技术词汇20 部分系统开发 GB/T 2887-2000 电子计算机场地通用规范 3 术语和定义 GB/T 5271.1—2000 第1 部分、GB/T 5271.9—2000 第9 部分、GB/T 5271.12—2000 第12 部分和GB/T 5271.20—94 第20 部分确立的术语和定义,以及下列术语和定义适用于本指南。 3.1灾难disaster 由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件,通常导致信息系统需要切换到备用场地运行。 3.2灾难恢复disaster recovery 将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难

灾难恢复计划

灾难恢复计划 一、灾难的定义 灾难分为自然灾害和非自然灾害。 自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。 非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。 二、灾难恢复项目小组的制定和职能 1.管理组:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。

8、市场和客户关系组:负责对外进行信息发布、制定相应应急措施应对客户疑问等。 各小组共同职能: a)负责计划的执行 b)与其它组之间进行信息交流,监督计划的测试和执行 c)所有或是某一个成员可能领导特定的组 d)协调恢复过程 e)评估灾难,执行恢复计划,联系组长 f)监控并记录恢复的过程 三、业务恢复流程 (一)自然灾害引起的灾难恢复流程 由自然灾害引起的灾难往往影响较大,可能会直接导致一些基础设施的无法使用,甚至会对导致人员减少。因此对于自然灾害引发的灾难恢复流程相对特殊且繁琐。 1.数据抢救 灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救,抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。 2.损坏评估及启动应预案 灾难发生后各小组需根据情况汇报损失情况给损坏评估组,

应用系统灾难恢复设计方案(SSR)

应用系统灾难恢复 设计方案 方案供应商:赛门铁克软件(北京)有限公司

目录 一、需求分析 (3) 二、设计方案 (4) 三、功能设计 (5) 3.1、主要功能概述 (6) 3.2、灾难恢复工作流程 (9) 3.3、Backup Exec System Recovery管理平台 (9) 3.4、异机恢复功能选件 (10) 四、方案总结 (14)

一、需求分析 一些常见的情况:无论是相关的硬件问题、配置改变、应用程序故障、病毒攻击,还是恶意黑客攻击-都可以使企业的服务器瘫痪。如果服务器瘫痪了,那么至关重要的问题是:在业务受到影响之前有多少时间来恢复数据与应用程序。传统的方法可能需要几个小时到几天来恢复服务器、重装软件、配置应用程序、设置用户,将您的系统恢复到正常状态-假设此过程没有其它错误出现的话。因此,很有必要简化这一高度复杂而且耗费大量精力的过程,满足企业对恢复时间目标的要求。 图:Symantec灾难恢复技术列表 灾难恢复就是为恢复计算机系统而提供的技术保证。事实上,灾难恢复计划要求有周详的事前准备,尤其是灾难所引起的对业务的冲击程度的分析,并相应制定灾难后的恢复策略,利用可行的信息技术,提出最佳的恢复方案。 作为业内领先的存储软件厂商,Symantec公司已经能够解决这个长期困扰用户的问题。在其最近所发布的企业级数据保护方案中,Symantec System Recovery是目前业界速度最快的数据保护解决方案,它引入了创新的、配合磁盘的裸机恢复技术,可显著增强Windows操作系统的备份和恢复功能。

二、设计方案 如上图所示,在所以需要作系统灾难恢复的服务器上安装Symantec System Recovery。通过Symantec System Recovery可以把系统从一个硬件平台迁移到另外一个硬件平台而不需要重新安装操作系统,整个恢复时间仅需短短的几分钟,所有操作系统、系统配置、应用系统、个性化配置全部恢复如初;更可以通过把系统恢复到虚拟平台之上供用户测试补丁,以避免为真实系统贸然安装补丁后导致的系统不稳定。 Symantec System Recovery的远程恢复能力可以让管理员在任何时间、任何地点、对任何设备(包括虚拟设备)进行备份或恢复操作,此时管理员仅需要一个远程的Windows工作站、笔记本或者是Pocket PC。 另外,Symantec System Recovery也针对企业服务器数量众多的情形提供了中央视图管理功能,IT 管理员不仅可以在中央管理台上监控和报告高达上千台电脑的每一个恢复点的状态,并且可以自动地发现不受保护的系统。

信息系统灾难恢复方案

信息系统灾难恢复方案 第一章总则 第一条为规范并指导我公司生产系统灾难恢复工作,提高防范灾难风险的能力,保障持续运营,保护客户的合法权益,根据国家信息安全法律法规及有关规定,制定本预案。 第二条生产系统灾难恢复工作应坚持“统筹规划、平战结合、等级灾备”的原则,平衡成本与风险,确保工作的有效性。 第三条本指引所称灾难恢复为生产系统灾难恢复。灾难恢复工作是指,为保障生产系统持续运营,防范灾难风险并减轻灾难造成的损失和不良影响而开展的一系列工作,包括:组织机构设立和职责、灾难恢复需求分析、灾难恢复策略制定、灾难备份系统实施、灾难备份中心的建设与运行维护、灾难恢复预案管理、应急响应和恢复。 第二章总体工作要求 当生产系统及相关业务流程发生重大变更时,应立即启动灾难恢复需求的再分析,并根据最新的灾难恢复需求分析重审和修订灾难恢复策略。根据灾难恢复策略定期复审和调整灾难恢复技术方案、灾难恢复预案,并定期开展灾难恢复预案培训和演练工作。加强与业务密切相关的机构间的协调,共同评估面临的风险,协同制定灾难恢复策略,提高整体风险防范和灾难恢复能力。 第三章灾难恢复项目小组的制定和职能

1.管理组:小组人员:职责:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组小组成员:职责:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:小组成员:职责:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组: 小组成员: 职责:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组: 小组成员职责:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组: 小组成员:职责:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组: 小组成员:职责:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。 8、市场和客户关系组: 小组成员:职责:负责对外进行信息发布、制定相应应急措施

系统灾难恢复计划

一、目的 建立一个可行的灾难恢复计划,在发生重大事件时启动该该灾难恢复计划使经济损失降到最低,对关键人员进行培训,随时准备应对灾难,执行有效的恢复动作,恢复关键业务操作。 二、范围 本计划适用于华为RTC业务 三、程序 3.1 IT 关键接入点 3.1.1 计算机基本系统 ?工厂基本数据信息 ?每日做本地备份 ?一个小型PC平台服务器 ?数据库可以加载到不同的PC系统并持续运行 ?在杭州东信放置一个备份服务器 3.1.2 Email 公司总部有专用的邮箱服务器提供给员工与客户、员工和供应商通信 ?可通过本地ISP 3.2任务和职责

3.2.1灾难声明 以下人员是由公司授权认定,可声明公司灾难。 授权人员名单 3.2.2 华为客户联系人 3.2.3 灾难沟通流程 灾难事件发生时,将会公布以下时间表: ?在发布紧急声明时,所有受影响客户将会被通知,并立刻给出一个有效的影响评价。?所有受影响的客户在1小时内通知到位(或更快,依事件而定) ?和每个客户的沟通根据他们选择的形式(例如,座机,手机,Email) 3.2.4 各业务持续性团队 3.3恢复程序 业务持续性/恢复行动:客户记录

恢复行动:方法检索试验程序和服务手册 第二设施联系人 3.4:测试程序 :3.4.1 引言 定期测试很重要,因为它证实了备份和恢复程序的有效性。预期的系统和网络环境会改变。 3.4.2 测试方法 ?测试恢复必须成功地完成与硬件,系统,网络,应用程序,数据恢复和应用程序的功能验证的业务或应用支持区域内的恢复时间框架中对业务影响评估过程的定义。测试失败必须重新测试,对于区域业务在一个时间范围内成功完成是令人愉快的。当一个系统、应用程序或网络经历了一个高程度的变换,频繁测试将被考虑。 ?测试事件日志必须包含时间框架,遇到的问题和改进建议。该日志应该扩展开,对事件回顾并用于问题的跟踪和解决。

《保险业信息系统灾难恢复管理指引》

《保险业信息系统灾难恢复管理指引》 各保险公司、保险资产管理公司: 为加强保险信息安全基础设施建设,推进信息系统灾难恢复工作,根据《中华人民共和国保险法》和国家有关信息安全法律法规,我会制订了《保险业信息系统灾难恢复管理指引》,现印发给你们,请遵照执行。 二○○八年三月二十一日 保险业信息系统灾难恢复管理指引 第一章总则 第一条为规范并指导我国保险业信息系统灾难恢复工作,提高防范灾难风险的能力,保障持续运营,保护客户和股东的合法权益,根据《中华人民共和国保险法》、国家信息安全法律法规及有关规定,制定本指引。 第二条保险业信息系统灾难恢复工作应坚持“统筹规划、资源共享、平战结合、等级灾备”的原则,平衡成本与风险,确保工作的有效性。 第三条本指引所称保险机构是指,经中国保险监督管理委员会(以下简称“中国保监会”)批准设立,并依法登记注册的保险公司、保险资产管理公司、外国保险公司分公司及港、澳、台地区保险公司在大陆地区的分公司。 第四条本指引所称灾难恢复为信息系统灾难恢复。灾难恢复工作是指,为保障信息系统持续运营,防范灾难风险并减轻灾难造成的损失和不良影响而开展的一系列工作,包括:组织机构设立和职责、灾难恢复需求分析、灾难恢复策略制定、灾难备份系统实施、灾难备份中心的建设与运行维护、灾难恢复预案管理、应急响应和恢复。 本指引所称区域性灾难是指,造成所在地区或有紧密联系的邻近地区的交通、电讯、电力及其它关键基础设施受到严重破坏,关键信息网络设备毁损、重大故障或大规模人口疏散的事件,将会导致信息系统无法正常运行。例如:地震、大型公共卫生事件、恐怖袭击、区域性通信网故障、区域性电网故障、机房内关键设备毁损等。 本指引所称同城灾备是指,生产中心与灾难备份中心处于同一地理区域,面临同一区域性灾难风险,能够抵御小范围区域内的灾难,例如小面积停电、火灾、设备故障等,距离通常在数十公里左右。 本指引所称异地灾备是指,生产中心与灾难备份中心处于不同地理区域,一般不会同时面临同一区域性灾难风险,能够抵御较大范围区域内的灾难,例如大面积停电、地震、战争等,距离通常在数百公里以上。 本指引所称自建是指,自行出资建设和拥有灾难备份中心,为自身提供灾难恢复服务。 本指引所称共建是指,多个机构共同出资建设和拥有灾难备份中心,为参与单位提供灾难恢复服务。 本指引所称外包是指,选择外部资源来承担或协助完成信息系统灾难恢复的规划、实施、运营维护,以及应急响应和恢复工作。 第五条中国保监会负责对保险业信息系统灾难恢复工作实施监督和管理。 第六条《信息安全技术信息系统灾难恢复规范》(GB/T 20988-2007)中的条款通过本指引的引用而成为本指引的条款。 第二章总体工作要求 第七条保险机构应统筹规划信息系统灾难恢复工作,自本指引生效起五年内至少达到本指引规定的最低灾难恢复能力等级要求。 保险机构新建信息系统时,应同步规划和实施灾难备份系统建设。本指引生效后新成立

QSY 1332-2010 信息系统灾难恢复管理规范

信息系统灾难恢复管理规范 Specifications for information system disaster management

Q/SY 1332—2010 目次 前言................................................................. 1 范围 (1) 2 规范性引用文件 (1) 3 术语和定义 (1) 4 灾难恢复的组织机构 (3) 4.1 综述 (3) 4.2 构成及职责 (3) 5 灾难恢复需求分析 (4) 5.1 风险分析 (4) 5.2 业务影响分析 (5) 5.3 确定灾难恢复需求 (6) 6 灾难恢复策略制定 (7) 6.1 灾难恢复能力等级 (7) 6.2 灾难备份中心布局 (7) 6.3 灾难备份中心建设模式 (7) 6.4 对灾难备份中心的要求 (8) 7 灾难备份中心运行维护 (8) 7.1 运行维护目的 (8) 7.2 运行维护内容 (8) 7.3 运行维护管理信息系统 (8) 7.4 灾难恢复预案的演练 (8) 8 灾难恢复预案 (9) 8.1 预案的目的 (9) 8.2 预案的制定 (9) 8.3 预案的管理 (9) 9 应急响应和灾难恢复 (9) 9.1 应急响应流程 (9) 9.2 灾难恢复流程 (10) 9.3 重建与回退 (11) 10 演练及培训 (11) 10.1 灾难恢复演练 (11) 10.2 认知与培训 (13) 附录A(资料性附件)灾难恢复预案框架 (14) 参考文献 (16) I

Q/SY 1332—2010 II 前言 本标准是中国石油天然气集团公司信息标准体系管理与服务规范系列标准之一。 本标准的附录A为资料性附录。 本标准由中国石油天然气集团公司信息技术专业标准化技术委员会提出并归口。 本标准起草单位:中国石油集团东方地球物理勘探有限责任公司。 本标准主要起草人:周晓松、冯梅、王雨、李闻喜、胡革强、辛麒、于普漪、徐刚、颜伟海、李颖琦、秦侃、魏占玲。

System-Recovery-2020系统灾难恢复

生产故障恢复修订日期

第1 部分灾难恢复 (3) 1.1 灾难描述 (3) 1.2 灾难恢复 (3) 1.3 域名映射 (4) 第2 部分单点故障恢复 (5) 2.1 单点故障描述 (5) 2.2 单点故障恢复 (5) 第3 部分数据库单点故障恢复 (6) 3.1 数据库单点故障描述 (6) 3.2 数据库单点故障恢复 (6)

第 1 部分灾难恢复 1.1 灾难描述 当整个区域因重大自然灾难或大规模服务中断而发生中断时的真实灾难恢复方 案。这些情况极少发生,当然为了交易安全/数据安全/交易稳定性,如果整个区域的服务中断,但须对这种可能性做出准备。如果整个VM区域的网络中断,会暂时无法交易,数据的安全也无法保障。如果启用了异地复制,则会在其他区域额外存储的交易数据/业务重新上线并实现灾难恢复。 1.2 灾难恢复 为VM 配置Azure Site Recovery,从而只需单击一下便可在几分钟内恢复应用程序。可复制到所选的VM 区域(并不局限于配对区域)。通过创建恢复计划,以便自动进行应用程序的整个故障转移过程。可事先测试故障转移从而避免影响生产应用程序或正在进行的复制。若主要区域发生中断,只需启动故障转移并将应用程序带到目标区域。因此次展示为生产环境,只能通过截图展示恢复的可能性。如下 图: 可以通过CLI一键转移所有VM到指定区域,如下图所示:

1.3 域名映射 使用Azure DNS区域,针对内部API接口地址进行统一管理和调用,执行灾难恢复后无须修改程序配置中心地址,通过Azure DNS区域进行统一修改管理,能够快速恢复生产系统业务的运行。如下图展示为Azure区域API接口地址的管理: 以上灾难恢复,均为生产测试通过。

灾难恢复计划

灾难恢复计划 文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

灾难恢复计划一、灾难的定义 灾难分为自然灾害和非自然灾害。 自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。 非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。 二、灾难恢复项目小组的制定和职能 1.管理组:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。

8、市场和客户关系组:负责对外进行信息发布、制定相应应急措施应对客户疑问等。 各小组共同职能: a)负责计划的执行 b)与其它组之间进行信息交流,监督计划的测试和执行 c)所有或是某一个成员可能领导特定的组 d)协调恢复过程 e)评估灾难,执行恢复计划,联系组长 f)监控并记录恢复的过程 三、业务恢复流程 (一)自然灾害引起的灾难恢复流程 由自然灾害引起的灾难往往影响较大,可能会直接导致一些基础设施的无法使用,甚至会对导致人员减少。因此对于自然灾害引发的灾难恢复流程相对特殊且繁琐。 1.数据抢救 灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救,抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。 2.损坏评估及启动应预案

灾备方案

1.数据中心容灾备份解决方案 随着社会的发展和科技的进步,政府日常工作越来越依赖于数据处理来进行,政务系统的连续性依赖于数据中心系统的稳定运行。然而,灾难就像灰尘一样伏击在运营环境周围,政务系统的数据中心可能正在一个充满风险和威胁的环境下运行。如果不能对这些风险采取有效治理,一旦数据由于某种原因丢失,就很有可能对政府的日常工作造成严重的影响。如果核心数据丢失,将会使得某些核心功能陷入瘫痪,造成不可估量的损失。因此,保证政务的连续性和数据的高可靠性和可用性,已经成为政府部门在数据中心建设中,必须要考虑的问题。 1.1灾备解决方案原则 首先,在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响。比如,采用数据复制技术对系统I/O带来的延迟,应用数据同步对日常业务处理系统带来的压力等。因此,企业要通过周密的测试和分析来规避容灾系统建设时带来的这些风险,以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。 第二,数据状态要保持同步。为保证在灾难发生时,业务可以成功地切换到备份中心,就必须保证容灾系统数据同步机制的可靠性。因此,建立可靠的数据同步校验机制是必须的; 同时,还要考虑建立定时的、自动的数据同步核查对比机制,以检验两个中心数据的一致性,这是数据容灾工作中非常重要的一部分。 第三,容灾系统的日常维护工作要尽可能轻,并能承担部分业务处理和测试的工作。容灾系统的维护和管理是容灾切换成功的重要保证,在系统建设中,就必须要考虑系统的维护管理流程。生产中心任何业务处理过程的改变都必须完整地复制到备份中心; 所有新业务系统上线时,必须通知备份中心,并在备份中心配置好数据同步机制; 对原程序的改动也必须保证两个中心同时上线。 第四,系统恢复时间要尽可能短。容灾系统主要是为了实现在主中心系统发生灾难时,可以在规定时间切换到备份中心,保证数据不会丢失,并且继续向用户提供服务。但往往在灾难发生时,主要技术人员不能及时到达现场,为了顺利实现系统间的切换,应该让系统切换操作尽可能地简单; 并建立固定化的、标准化的切换流程,要求维护人员在切换演习时严格按照流程的指导步骤进行操作。 第五,可实现部分业务子系统的切换和回切。当人事变动、业务变化、IT设施变化以及其 他可能引起恢复规划文档失效的变化发生时,应及时更新各恢复规划文档,并在必要时启动模拟测试或演习,确保业务连续性系统的工作能力。 第六,技术方案选择要遵循成熟稳定、高可靠性、可扩展性、透明性的原则。目前,国际上比较成熟的容灾技术包括:SAN/NAS技术、远程镜像技术、虚拟存储、基于IP的SAN互连技术以及快照技术等。其中基于IP的SAN远程数据容灾备份技术应用比较广泛,其是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备份中心的SAN中的。当备份中心存储的数据量过大时,可利用快照技术将其备份

2021年信息系统灾难恢复方案

信息系统灾难恢复方案 欧阳光明(2021.03.07) 第一章总则 第一条为规范并指导我公司生产系统灾难恢复工作,提高防范灾难风险的能力,保障持续运营,保护客户的合法权益,根据国家信息安全法律法规及有关规定,制定本预案。 第二条生产系统灾难恢复工作应坚持“统筹规划、平战结合、等级灾备”的原则,平衡成本与风险,确保工作的有效性。 第三条本指引所称灾难恢复为生产系统灾难恢复。灾难恢复工作是指,为保障生产系统持续运营,防范灾难风险并减轻灾难造成的损失和不良影响而开展的一系列工作,包括:组织机构设立和职责、灾难恢复需求分析、灾难恢复策略制定、灾难备份系统实施、灾难备份中心的建设与运行维护、灾难恢复预案管理、应急响应和恢复。 第二章总体工作要求 当生产系统及相关业务流程发生重大变更时,应立即启动灾难恢复需求的再分析,并根据最新的灾难恢复需求分析重审和修订灾难恢复策略。根据灾难恢复策略定期复审和调整灾难恢复技术方案、灾难恢复预案,并定期开展灾难恢复预案培训和演练工作。加强与业务密切相关的机构间的协调,共同评估面临的风险,协同制定灾难恢复策略,提高整体风险防范和灾难恢复能力。 第三章灾难恢复项目小组的制定和职能

1.管理组:小组人员:职责:统筹规划,指挥各小组按照既定计划进行执行。 2.部门恢复组小组成员:职责:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。 3.计算机恢复组:小组成员:职责:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。 4.损坏评估组: 小组成员: 职责:负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。 5.安全组: 小组成员职责:负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。 6.设备支持组: 小组成员:职责:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。 7、数据恢复组: 小组成员:职责:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。 8、市场和客户关系组: 小组成员:职责:负责对外进行信息发布、制定相应应急措施应对客户疑问等。各小组共同职能:

信息系统的灾难恢复规范

信息系统的灾难恢复工作包括灾难恢复规划和灾难备份中心的日常运维,关键业务功能在灾难备份中心的恢复和重续运行,以及主系统的灾后重建和回退工作,还涉及突发事件发生后的应急响应,灾难恢复是一个周而复始,持续改进的过程,包括以下几个阶段: 1、灾难恢复需求的确定 2、灾难恢复策略的制定 3、灾难恢复策略的实现 4、灾难恢复预案的制定、落实和管理。 灾难恢复的组织架构中的人员有管理、业务、技术和行政后勤等人员组成,一般设定灾难恢复领导小组和灾难恢复规划实施小组和灾难恢复日常允许组。 组织可以聘请具有相应资质的外部专家协助灾难恢复实施工作,也可以委托具有相应资质的外部机构承担实施组织,以及日常运行组的部分或全部工作。 灾难恢复领导小组的职责: 是信息系统灾难恢复工作的组织领导机构,组长应由组织最高管理层成员担任。领导小组的职责是领导和决策信息系统灾难恢复重大事宜,主要如下: 审核并批准经费预算 审核并批准灾难恢复预案 批准灾难恢复预案的执行 灾难恢复实施组 灾难恢复规划实施组的主要职责是负责: 灾难恢复的需求分析 提出灾难恢复策略和等级 灾难恢复策略的实现 制定灾难恢复预案 组织灾难恢复预案的测试和演练 灾难恢复日常运行组 灾难恢复日常运行组的主要职责是负责 协助灾难恢复系统实施 灾难备份中心日常管理 灾难备份系统的运行和维护 灾难恢复的专业技术支持 参与和协助灾难预案的教育、培训和演练 维护和管理灾难恢复预案 突发时间按发生时的随时控制和损失评估 灾难发生后信息系统和业务功能的恢复。 灾难发生后的外部协作。 灾难恢复需求的确定 风险分析的主要内容包括:标识信息系统的资产价值,识别信息系统面临的自然的和人为的威胁,识别信息系统的脆弱性,分析各种威胁发生的可能性并定量或定性描述可能造成的损失,识别现有的风险防范和控制措施。通过技术和管理手段,防范或控制信息系统系统的风险。依据防范或控制风险的可行性和残余的可接受程度,确定对风险的防范和控制措施。业务影响分析 分析业务功能和相关资源配置 对组织的各项业务功能及各项业务功能之间相关性进行分析,确定支持各种业务功能的相应信息系统资源及其他资源,明确相关信息的保密性、完整性和可用性要求。

公司灾备方案

公司灾备方案 The latest revision on November 22, 2020

企业灾备需求 某企业众多的业务系统中,由于前期都是分批进行搭建,每年产品选型也都有变化,业务系统的主机包括windows、linux、unix系统,存储产品也包括了IBM、EMC、HDS等,在面临众多产品及不同的生产环境时,灾备的需求需要进行细致的分析,其中包括以下几个步骤: 1、灾备咨询 2、容灾技术选型 3、生产系统整合 4、灾备系统投产 5、演练 1.1.1 灾备咨询 建设初期需要对生产系统进行全面的调研,不仅仅包括硬件信息的收集,更包括业务风险分析,业务关联性分析等。 通过对现有系统数据的收集,充分分析现有生产系统面临的挑战,以及生产中心所处位置的地理、天气、社会环境进行充分的分析,最终对同城灾备中心及异地灾备中心的选址给出合理的咨询交付物。 业务关联性分析方面需要跟业务部门进行沟通,梳理出关联业务的数据流向和数据依赖性,用来确认容灾最终的范围及重要程度,避免因为某些特定关联业务的梳理不到位,导致核心应用因为关联性问题,容灾级别降低或灾备项目建设失败情况的发生。 1.1.2 关键技术的选型 近几年来,容灾已经成为信息数据中心建设的热门课题。很多容灾技术也快速发展起来,对用户来说也有很广阔的选择余地。由于容灾方案的技术复杂性和多样性,一般用户很难搞清其中的优劣以确定如何选择最适合自己状况的容灾解决方案。下面就容灾建设中的备份及复制技术做一个深入探讨,最终为本次容灾中的各系统选择适合的容灾方式。

容灾系统要求生产中心和灾备中心同时工作,生产中心和灾备中心之间有传输链路连接。数据自生产中心实时复制传送到灾备中心。在此基础上,可以在应用层进行集群管理,当生产中心遭受灾难出现故障时可由灾备中心接管并继续提供服务。 和数据备份相比,数据复制技术具有实时性高、数据丢失少或零丢失、容灾恢复快、投资较高等特点。 但是数据复制技术不能代替数据备份技术,因为数据复制技术保证的是两地的数据一致及完整,但是他不能避免因为人员误操作、病毒或其他方式带来的数据丢失或破坏,所以就算有了完整的数据复制技术,也不能放弃数据备份。 根据数据复制的层次,数据复制技术的实现可以分为三种:存储系统层数据复制、操作系统数据复制和数据库数据复制。 数据复制技术的比较 下面对数据复制的三种技术做一个简单比较:

相关主题
文本预览
相关文档 最新文档