计算机系统灾难恢复计划
- 格式:doc
- 大小:18.50 KB
- 文档页数:3
计算机系统及网络设备灾难恢复计划一、灾难定义灾难分为自然灾害和非自然灾害。
自然灾害是指由火灾、地震、战争等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。
非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。
二、灾难恢复项目小组的制定和职能行政部下属IT组作为项目负责小组,主要职能有:1、根据公司实际情况制定应急备案,确定数据和财产的保护方式并执行保护,确定数据的恢复方式并执行恢复;2、负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件;3、负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案;4、负责对公司各平台数据进行损坏评估,并制定相应数据恢复方案;5、负责发布受灾通知,并制定相应应急措施应对客户疑问等。
三、业务恢复流程(一)自然灾害引起的灾难恢复流程1.数据抢救灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救,抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。
此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。
2.损坏评估及启动应预案灾难发生后应急小组需根据情况汇报损失情况给损坏评估组,损坏评估组根据汇总信息进行消息告知披露。
披露损坏信息包括: a)公司重要生产、监视测量、办公设备b)拥有在可以执行计划之内的关键性功能的员工c)保存公司重要数据的介质d)网络、通讯设备小组根据披露的损坏信息情况进行应急预案启动,如选举临时领导、使用备份服务器、备份通讯设备进行替代等。
3.业务恢复计划业务恢复计划总体可划分为以下几个阶段:a)IT基础设施恢复阶段:此阶段主要的目标是将对于保存数据的基础设施、业务系统所在的主机、公司网络架构进行恢复。
首先须根据损失评估报告分析可继续利用的IT基础设施,如供电设施、交换机、服务器、防火墙等。
硬件应急预案方案有哪些硬件应急预案方案有哪些介绍硬件是计算机系统的重要组成部分,扮演着传输、处理和存储数据的角色。
然而,硬件故障是常见的问题,可能会导致数据丢失、停机时间增加和生产中断。
为了应对这些问题,组织需要制定硬件应急预案方案,以在硬件故障发生时能够快速恢复和恢复业务运作。
本文将介绍一些常见的硬件应急预案方案,帮助组织更好地准备和应对硬件故障的情况。
1. 数据备份和恢复数据备份是一项基本的应急预案措施,用于保护重要数据并在硬件故障发生时恢复数据。
以下是一些常见的数据备份和恢复方案:- 定期备份:定期备份数据,可以选择每天、每周或每月备份。
备份可以存储在本地设备(如外部硬盘)或远程服务器上。
- 增量备份:在完整备份之后,只备份修改的、新增的或变动的数据。
这种备份方式可以节省存储空间和备份时间。
- 离线备份:将数据备份存储在不与主硬件系统连接的独立存储设备上,可以避免备份数据与主数据同时被损坏的风险。
数据备份方案应根据组织的需求和数据敏感性进行定制化设置,并定期测试用于恢复备份数据以验证其可行性。
2. 冗余备份冗余备份是一种通过复制硬件来提供故障容错和高可用性的方法。
以下是一些常见的冗余备份方案:- RAID(磁盘阵列):使用多个硬盘组成磁盘阵列,实现数据的分布存储和冗余备份。
常见的RAID级别包括RAID 0、RAID 1、RAID 5和RAID 10,每种级别都具有不同的容错能力和性能。
- 冗余电源供应:使用备用电源单元(如UPS)来保证电力供应的连续性。
在主电源故障或停电时,备用电源可以提供临时电力,以避免数据丢失和设备损坏。
- 冗余网络连接:通过连接到多个网络接口或使用多个ISP(互联网服务提供商)来提供网络连接的冗余性。
在一个网络连接故障时,另一个连接可以提供继续工作的能力。
冗余备份方案可以提高硬件系统的可靠性和可用性,并减少故障对业务运作的影响。
3. 硬件故障诊断和维修当硬件出现故障时,快速诊断问题并进行维修是恢复业务运作的关键。
服务器灾难恢复范文在信息化时代的今天,服务器已经成为了企业、组织以及个人重要的计算资源,承担着存储和处理大量重要数据的任务。
然而,服务器灾难是不可避免的,可能由硬件故障、自然灾害、网络攻击等原因引起。
为了保障数据的安全和业务的正常运行,服务器灾难恢复至关重要。
其次,进行定期的备份是确保服务器灾难恢复的基础。
组织应该设定备份策略,根据数据的重要性和变化频率选择适当的备份频率。
备份的存储位置应该分散在不同的地理位置,以防止地区性的自然灾害对备份数据的损坏。
而且,备份数据的完整性和可用性也需要定期测试,确保备份数据可以顺利恢复。
第三,组织应该建立一个灾难恢复团队或部门,负责处理服务器灾难的应急情况。
这个团队应该由熟悉服务器系统和网络架构的专业人员组成,可以迅速诊断问题、采取相应的措施并协调其他相关人员和资源。
该团队还应该定期进行培训和演练,以确保在发生灾难时能够迅速、有效地响应。
此外,组织还应该考虑在灾难恢复过程中使用虚拟化和云计算等技术。
虚拟化可以帮助组织快速恢复服务器环境,减少对硬件的依赖。
云计算可以提供更灵活和弹性的计算和存储资源,在灾难发生时可以轻松地迁移和扩展服务器环境。
最后,组织应该进行灾难恢复计划的定期测试和评估。
这可以确保计划的有效性和可靠性,发现并纠正潜在的问题。
测试还可以帮助组织熟悉整个恢复过程,提高团队的应急响应能力。
评估可以根据测试结果和实际情况,对计划进行及时修订和改进。
总之,服务器灾难恢复是确保数据安全和业务连续性的关键步骤。
组织应该制定完善的灾难恢复计划,定期备份数据,建立专业的灾难恢复团队,并考虑利用虚拟化和云计算等技术来提高恢复能力。
定期测试和评估计划是不可或缺的,确保计划的有效性和可靠性。
只有做好了这些准备和措施,才能在服务器灾难发生时迅速、有效地恢复,并最大程度地减少损失。
事故恢复演练方案目录1 .............................................................................................................. 信息系统灾难恢复演练概述1.1 灾难的定义 (3)1.2 灾难典型案例 (3)1.3 灾难恢复演练的含义和目标 (6)2 灾难恢复的管理 (8)2.1 灾难恢复管理的目标 (8)2.2 灾难恢复对组织机构的管理要求 (8)2.3 灾难恢复的外部协助 (8)3 灾难恢复演练策略规划 (9)3.1 灾难恢复资源要素 (9)3.2 灾难恢复演练流程 (10)1信息系统灾难恢复演练概述1∙1灾难的定义由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。
这个定义不仅给出了灾难的范围,也给出了灾难的判断标准。
灾难不只包括自然灾难(地震、海啸等),也包括人为的灾难(如恐怖袭击、误操作、病毒等)。
1.2灾难典型案例2(X)1年9月11日,美国世贸中心双子大厦遭受了谁也无法预料的恐怖打击。
根据GartnerGroup的相关调查统计,在这两栋大楼中,共有1200家公司,其中仅400家公司执行了他们的灾难恢复计划,而大多数公司因为没有建立灾难恢复系统,数据损毁、丢失,导致业务无法恢复,最后只能宣布倒闭。
除了“9.11”,在2001年发生的主要灾难事件还包括:2001年2月,Delta航空公司下属的大西洋东南航空由于计算机故障导致400多个航班被取消和延误;2001年6月,热带风暴淹没了得克萨斯州医疗中心,关闭了54家医疗机构;2001年11月,由于对炭疽热的恐慌,临时关闭了帝国蓝十字/蓝盾数据中心;据统计,美国年均处理灾难性事件40余宗。
AOL(美国在线),在1996年8月,由于维护工作中的人为错误造成24小时停机,直接损失达300—500万美元,股票价格相对于前一天下降26%o 2003年,当AT&T无线试图对SiebeI客户关系管理(CRM)软件进行升级的时候,原定一个周末就能完成的项目演变为一场历时六个星期的灾难。
本标准的附录A是规范性附录,附录B和附录C是资料性附录。
本标准是由全国信息安全标准化技术委员会提出并归口。
本标准起草单位:中国信息安全产品评测认证中心。
本标准主要起草人:汪琪、熊四皓、张利、刘艳、郭全明、许强、李伟华、李建彬、谈松、刘建明、刘祖泷、江志强、徐强、冷飚、刘山泉、黄伟、于健、刘东红、上官晓丽。
本标准参照和借鉴GB/T19716《信息技术信息安全管理实用规则》、GB/T20984《信息安全技术信息安全风险评估规范》、DRJ International(国际灾难恢复协会)《Professional Practices for Business Continuity Planners》和《Business Continuity Glossary》、ISACA(信息系统审计与控制协会)、NIST(美国国家标准和技术学会)《SP 800-34 Contingency Planning Guide for Information Technology Systems》和在1992年SHARE78会议议题M028上提出的远程站点分级等的有关内容和思想,结合国家重要信息系统行业技术发展和实践经验制定而成。
信息系统灾难恢复能力等级与恢复时间目标(RTO)和恢复点目标(RPO)具有一定的对应关系,各行业可根据行业特点和信息技术的应用情况制定相应的灾难恢复能力等级要求和指标体系。
信息安全技术信息系统灾难恢复规范1 范围本标准规定了信息系统灾难恢复应遵循的基本要求。
本标准适用于信息系统灾难恢复的规划、审批、实施和管理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 5271.8 信息技术词汇第8部分:安全GB/T 20984 信息安全技术信息安全风险评估规范3 术语和定义GB/T 5271.8确立的以及下列术语和定义适用于本标准。
1、独立的DI测试
如果针对安全需要、隐私和ER/ES的测试没有包含在OQ、PQ 或OPQ阶段,那么可以针对这些需求单独起草一份DI测试方案,并完成测试。
DI测试方案/报告和测试记录构成验证交付的一部分。
2、灾难恢复计划(DRP)(包括备份和还原)
在灾难恢复过程过程中,会使用的软硬件列表、系统配置规格文件、账户列表和备份的系统安装文件和数据。
在一个具体的灾难恢复计划里,应当描述一下内容:
1>恢复过程
2>备份还原过程
备份程序
还原程序
核实过程
灾难恢复计划的测试
通常情况下,灾难恢复计划(DRP)不是验证交付的一部分。
但是灾难恢复计划(DRP)应当在系统放行之前得到起草、批准和测试。
系统放行之后,也应当定期测试。
3、业务可持续计划(BCP)
业务可持续计划(BCP)是为了确保万一系统不可用的情况下,保证必要的业务能正常运行。
在实践上,从计算机化系统生命周期的概念阶段就应当引入业务可持续计划(BCP)。
通常情况下,业务可持续计划(BCP)不是验证交付的一部分。
但是业务可持续计划(BCP)应当在系统放行之前得到起草、批准和测试。
系统放行之后,也应当定期测试。
灾难恢复名词解释灾难恢复是指在某些特殊事件或故障之后,使系统达到或超过最大允许工作状态所采取的必要措施和手段。
主要包括故障前和故障后两个方面:故障前,即故障前所采取的防范措施,如故障前进行的操作及检查,对维修工作所需的工具设备进行全面的维护检查等;故障后,即故障发生后所采取的紧急措施,如备用系统或部件的投入、控制程序重新启动以保证继续正常工作等。
1、避免人为或自然的危害性后果,尽量减少或消除失误,提高系统可靠性,即使出现失误,也要力争将失误限制在最小范围内,不至于造成较大的损失。
2、加强预防管理,平时应加强日常维护管理工作,针对薄弱环节和有可能发生故障的部位,要进行定期或不定期检查,做好记录。
对关键的计算机设备要专门配备技术水平高、责任心强的值班操作人员,实行集中管理。
3、加强培训,提高技术人员和维修工人的素质,要定期开展对职工的培训教育,建立各种规章制度,严格按规章制度办事,遵守劳动纪律。
要根据生产的需要选派有经验的工人参加各类相关培训学习,并定期轮换调整,同时也要做好岗位练兵工作。
4、制定维修和安全操作规程,明确规定检修项目和步骤,注意解决生产与检修的矛盾。
5、完善设备、工具的备品备件,加强计划供应,合理储备,使设备、工具处于良好状态,以适应紧急情况的处理。
6、在出现事故的情况下,应迅速将故障排除,不得影响其他生产活动。
7、当紧急故障不能马上排除时,应采取措施,对电网、供水、供气等加强监视,注意外来干扰,防止故障蔓延扩大。
8、快速判断故障的原因,区分硬件和软件故障,对关键部件进行替换和修理,确认故障已经排除,并经现场试验正常后,才能向系统恢复正常运行。
9、要及时采取措施,避免故障再次发生,保持连续生产,一旦发现异常,应及时查找原因,快速恢复系统正常工作。
10、当出现紧急故障,经判断,由于更换备件、组装调试等措施难以恢复系统功能时,应按报告制度向上级汇报,请求上级支援。
11、对系统运行情况进行跟踪了解,及时总结运行状况,不断优化运行程序,使系统运行状况始终保持在最佳状态。
嘉兴冠誉时装有限公司
计算机系统灾难恢复计划
一、灾难的定义
灾难分为自然灾害和非自然灾害。
自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。
非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。
二、灾难恢复项目小组的制定和职能
1.管理组:统筹规划,指挥各小组按照既定计划进行执行。
2.部门恢复组:负责制定各部门情况制定应急备案,确定各部门数据和财产的保护方式并执行保护,确定各部门数据的恢复方式并执行恢复。
3.计算机恢复组:负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。
4.损坏评估组:负责对公司损失的重要数据、财务进行总体评估。
并针对相应损失的财产进行汇总并结合拥有的保险进行申报。
5.安全组:负责灾难发生后的人员、数据、财务的安全进行保护。
并制定相应的安全策略。
6.设备支持组:负责对公司服务器、网络设备、交换机的故障进行排除,制定相应解决重建方案。
7、数据恢复组:负责对公司各平台数据进行恢复,并制定相应数据恢复方案。
8、市场和客户关系组:负责对外进行信息发布、制定相应应急措施应对客户疑问等。
各小组共同职能:
a)负责计划的执行
b)与其它组之间进行信息交流,监督计划的测试和执行
c)所有或是某一个成员可能领导特定的组
d)协调恢复过程
e)评估灾难,执行恢复计划,联系组长
f)监控并记录恢复的过程
三、业务恢复流程
(一)自然灾害引起的灾难恢复流程
由自然灾害引起的灾难往往影响较大,可能会直接导致一些基础设施的无法使用,甚至会对导致人员减少。
因此对于自然灾害引发的灾难恢复流程相对特殊且繁琐。
1.数据抢救
灾难发生时,需在保证人身安全的情况对公司的重要数据进行抢救,抢救的范围主要包括:记录公司重要信息的文件、资料,存储公司重要数据的磁带,存放重要数据的硬盘、服务器。
此过程需由安全组进行统筹指挥,按照既定的计划执行,各组成员、公司员工必须服从安全组的统一调度和指挥。
2.损坏评估及启动应预案
灾难发生后各小组需根据情况汇报损失情况给损坏评估组,损坏评估组根据汇总信息进行消息告知披露。
披露损坏信息包括:
a)公司重要生产、监视测量、办公设备
b)拥有在可以执行计划之内的关键性功能的员工
c)保存公司重要数据的介质
d)网络、通讯设备
各小组人员根据披露的损坏信息情况进行应急预案启动,如选举临时领导、使用备份服务器、备份通讯设备进行替代等。
3.业务恢复计划
业务恢复计划需要多个小组支持与配合,总体可划分为以下几个阶段:
a)IT基础设施恢复阶段:
此阶段主要的目标是将对于保存数据的基础设施、业务系统所在的主机、公司网络架构进行恢复。
首先须根据损失评估小组给出的报告分析可继续利用的IT基础设施,如供电设施、交换机、服务器、防火墙等。
若有损坏不可用的设备,需及时同代理商进行沟通借用或新购相应设备。
此阶段由设备支持组执行。
b)系统恢复阶段:
系统恢复主要针对关键应用主机,如Rasd-server、IBM、Center-server、BJTCT。
为节约时间需同时针对各个服务器系统进行快速恢复。
此阶段由数据恢复组执行。
c)网络恢复阶段:
网络恢复阶段的主要针对以下几点进行:
关键商业应用系统的内部局域网和网络设备的支持
外部广域网和电信服务
l 待恢复系统和终端用户(公司同事)间的通讯
此阶段由数据恢复组同设备支持组共同执行。
d)业务平台恢复阶段:
在此阶段的恢复工作主要围绕日常工作常用的业务平台进行,常用的业务平台主要为:Winmail、Change、Doors、Synergy、OA、ERP等。
平台恢复的工作分为两个部分:l 业务系统数据恢复
l 业务系统重搭建
l 业务系统数据导入
业务系统数据恢复:
数据恢复小组首先须对业务系统的数据进行恢复,需要寻找相应的恢复设备完成此操作,目前我们主要利用磁带机和可正常工作的主机进行数据恢复工作。
需要将抢救出的磁带和硬盘接连在对应设备上恢复出数据。
业务系统重搭建:
为提高业务恢复效率,数据恢复小组成员需分工协作,共同完成业务系统的重搭建工作,由于一些业务系统的特殊性,需尽快与相应平台的供应商接口人取得联系,并申请临时可用的加密狗、许可文件等。
各个平台负责人需对自己管理的平台在短时间内进行重搭建。
业务系统数据导入:
数据恢复小组成员需根据导出的数据结合自己管理的业务平台进行数据导入,并测试可行性。
再导入成功并可使用后及时同个小组成员负责人进行通知。
(二)非自然灾害引起的灾难恢复流程
非自然灾害引起的灾难恢复通常破坏较小,但是风险程度仍不可忽视,如电力故障导致的关键业务系统无法运行同样会给我们的公司带来一定的影响。
但由于破坏程度的不同,我们将引入业务持续计划(BCP)这样一个概念。
业务持续计划是为了防止正常业务行为的中断而被建立的计划。
当面对由于人为造成的故障
或灾难以及由此造成的财产损和正常业务不能正常使用时,BCP主要被设计用来保护关键业务步骤。
BCP是最小化对于业务的干扰效果和使业务能恢复正常运行的计划。
RTO (Recovery Time Object)恢复时间是指EIA部门同公司签订的故障响应恢复时间,如确保在1小时内排除故障,使业务系统重新恢复工作。
RPO (Recovery Point Objective)恢复点目标,该指标规定在灾难发生后,公司所能够容忍的数据丢失量,该指标由EIA部门同公司签订。
对于RTO和RPO目标的实现,需要人力、物力的支持,因此对于高效,最小化的BCP指标,往往也会花费大量的财力资源。
在执行业务持续计划的同时,由于造成的灾难和破坏性并不严重,因此可直接进入业务平台恢复阶段。
嘉兴冠誉时装有限公司
2012-5-15。