信息系统灾难恢复模型研究
- 格式:pdf
- 大小:461.79 KB
- 文档页数:4
互联网网络信息安全中的灾难恢复技术一、灾难恢复的定义灾难恢复( Disaster Recovery)就是将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。
灾难恢复所需的时间是灾难恢复中最关键的性能指标。
灾难恢复系统是为了保障计算机系统和网络系统在发生灾难的情况下,能够迅速地得以恢复到原来状态而特意建立的一整套完整的系统,它包括备份运行系统、可重置路由的数据通信线路、电源以及数据备份等。
此外,灾难恢复系统的制定还应该包括对该系统的测试和对使厢人员的培训,这将有助于参与灾难恢复系统的人们能够更好地对灾难的发生作出合理的反应。
二、灾难恢复的种类按照数据恢复范围的大小,保护缓冲区免受缓通常可以分为三类:一类是个别文件恢复,另一类是全盘恢复,还有一类是重定向恢复。
个别文件恢复。
如果系统受到的破坏不是很严重,或者是攻击刚刚开始就被阻止,攻击造成的破坏仅仅是小部分范围,就可以实施个别文件恢复。
针对受损的个别文件,只需浏览备份数据库的目录,找到该文件,触发系统的恢复功能,恢复软件将可以自动恢复指定的文件。
全盘恢复。
全盘恢复一般用在服务器发生意外灾难导致数据全部丢失、系统崩溃或是有计划的系统升级、系统重组等情况,也称为系统恢复。
重定向恢复。
重定向恢复是将备份的文件恢复到另一个不同的位置或系统上去,而不是进行备份操作时它们当时所在的位置。
重定向恢复可以是对整个系统进行恢复,也可以是针对个别受损文件单独进行恢复。
三、灾难恢复的步骤1.切断入侵者的访问途径这个步骤的目的是要阻止入侵者继续入侵,避免入侵者对系统造成更严重的破坏。
如果在恢复过程中没有切断入侵者的访问途径,入侵者就可能干扰并破坏恢复工作,导致恢复操作失败。
2.复制一份被侵入的系统在进行入侵分析之前,先备份被入侵过的系统,保留一份原始的入侵数据和记录,以便作分析。
如果将来决定要对入侵行为进行法律诉讼,这些数据也将成为有力的证据。
重要信息系统灾难恢复指南在现代社会,信息系统对组织和企业的运营起着至关重要的作用。
然而,灾难事件可能会导致信息系统中断或数据丢失,对组织造成巨大的影响。
因此,建立一套健全的重要信息系统灾难恢复指南至关重要。
本文将介绍一套包含重要信息系统灾难恢复指南的方法,以帮助组织应对可能出现的灾难事件。
1.风险评估与业务连续性计划在建立重要信息系统灾难恢复指南之前,组织需要进行全面的风险评估。
这包括确定潜在的灾难事件,如自然灾害、黑客攻击等,并评估其对信息系统的威胁程度。
根据风险评估的结果,组织可以制定适当的业务连续性计划,以确保即使在灾难事件中也能够继续运营。
2.信息系统备份与恢复组织应定期进行信息系统备份,并将备份数据存储在安全可靠的地方。
备份数据可以用于在灾难事件中恢复信息系统。
组织应制定备份策略,包括备份频率、备份存储位置、备份数据的完整性验证等。
4.灾难恢复计划测试与演练灾难恢复计划的有效性需要通过定期测试和演练来确保。
组织应定期组织模拟灾难事件的演练,以检验灾难恢复计划的可行性和有效性。
这将帮助团队了解应急响应程序、恢复过程以及相互之间的协作方式,并及时发现和解决问题。
5.异地备份与云存储除了本地备份外,组织还应考虑将信息系统数据备份到异地存储或云存储中。
这样即使发生本地灾难,数据仍可恢复。
异地备份和云存储可以提高数据的安全性和可靠性,确保信息系统灾难恢复的成功。
6.完善的安全措施信息系统的安全是组织应急响应和灾难恢复的重要一环。
组织应采取各种安全措施,如防火墙、入侵检测系统、数据加密等,以提高信息系统的安全性并减少黑客攻击和数据泄露的风险。
7.持续监测和改进建立一套重要信息系统灾难恢复指南后,组织需要持续监测信息系统的安全和有效性,并根据新的威胁和技术变化进行不断改进。
这可以通过定期的风险评估、安全演练和技术更新来实现。
总之,建立一套重要信息系统灾难恢复指南对于组织的稳定运营至关重要。
通过风险评估、备份与恢复、灾难恢复团队、计划测试与演练、异地备份与云存储、安全措施以及持续监测和改进,组织可以有效地应对灾难事件,并尽快恢复信息系统的运行。
信息系统灾备与恢复计划制定方法信息系统是现代企业不可或缺的重要资产之一,而系统灾备与恢复计划的制定是保障信息系统运行连续性和业务稳定性的基础。
本文将介绍信息系统灾备与恢复计划的制定方法,旨在帮助企业构建强大的灾备机制和高效的恢复能力。
一、风险评估和业务影响分析信息系统灾备与恢复计划的制定需要基于充分的风险评估和业务影响分析。
首先,利用专业工具对当前的信息系统进行全面的风险评估,确定系统运行过程中可能面临的各类风险和威胁。
其次,对企业的核心业务进行深入分析,确定系统中断、故障或数据丢失等灾难性事件对业务造成的潜在影响。
只有充分了解风险和业务影响,才能制定恰当的灾备与恢复计划。
二、应急响应和紧急措施信息系统灾备与恢复计划制定时,需要建立起完善的应急响应和紧急措施。
首先,确定一个响应团队,指定责任人,明确各成员的职责和权限。
其次,制定各类灾难事件的应急预案和紧急措施,包括如何快速部署备用设备,如何备份和恢复数据,如何切换业务流程等。
应急响应和紧急措施的制定可以有效减少灾难事件带来的影响,确保系统故障时能够迅速采取行动。
三、备份与恢复策略备份与恢复策略是信息系统灾备与恢复计划的核心内容。
根据评估和分析结果,确定合适的备份策略和数据恢复策略。
备份策略应包括:备份频率、备份介质、备份存储地点、备份数据的验证与完整性检查等。
同时,制定数据恢复策略,包括数据恢复的顺序、恢复时间目标(RTO)和恢复点目标(RPO)等。
合理的备份与恢复策略可以最大程度地降低数据丢失风险,并在系统故障后快速恢复数据。
四、灾备设施和应急设备建设信息系统灾备与恢复计划的制定还需要考虑建立相应的灾备设施和应急设备。
根据风险评估的结果,选择合适的灾备设施,如备用数据中心、云平台或异地备份机房,并确保其拥有足够的硬件和软件资源。
此外,应配置应急设备,如备用服务器、网络设备和电源设备等,以便在系统故障时能够及时切换并提供必需的服务。
五、测试与演练信息系统灾备与恢复计划的制定并不仅仅是个静态的文件,更需要经过周期性的测试与演练。
重要信息系统灾难恢复指南重要信息系统灾难恢复指南1. 灾难恢复计划1.1 定义灾难恢复计划的目标和范围1.2 制定灾难恢复责任人和团队1.3 风险评估和业务连续性分析1.4 制定恢复策略和步骤1.5 确定灾难恢复的时间目标1.6 制定通信和协调机制1.7 灾难恢复计划的测试和演练1.8 定期评估和更新灾难恢复计划2. 灾难通知和报告程序2.1 灾难事件的识别和报告责任2.2 灾难事件通知的流程和渠道2.3 灾难事件的紧急联系人清单2.4 灾难事件的报告和更新要求2.5 灾难事件报告的格式和内容要求3. 数据备份和恢复策略3.1 确定关键数据和系统资源3.2 设计备份策略:全量备份、增量备份、差异备份3.3 确定备份存储介质和位置3.4 确保备份数据的完整性和可用性3.5 制定数据恢复计划:备份数据的恢复顺序和策略3.6 制定数据恢复的测试和验证过程4. 灾难恢复设施和资源准备4.1 建立灾难恢复中心和备份站点4.2 配置必要的服务器、网络设备和存储设备4.3 灾难恢复设施和资源的维护和管理4.4 灾难恢复设施的可靠性和容错性评估5. 灾难恢复团队的组织和培训5.1 灾难恢复团队的组织结构和职责5.2 灾难恢复培训和技能要求5.3 灾难恢复团队的演习和评估5.4 灾难恢复团队的持续改进和发展6. 监控和评估6.1 灾难恢复计划的监控机制6.2 监控恢复进度和效果6.3 灾难恢复计划的评估和审查6.4 灾难恢复计划的改进和更新附件:灾难恢复计划模板、数据备份策略模板、灾难事件通知流程图、灾难恢复团队联系人清单法律名词及注释:1. 灾难恢复计划:指组织为保障重要信息系统连续运行,在灾难事件发生时采取的一系列措施和步骤。
2. 业务连续性分析:指对组织的关键业务进行分析和评估,确定其对灾难的敏感程度及恢复的优先级。
3. 数据备份:指将组织的重要数据复制到备份介质中,以备灾难事件发生时恢复使用。
4. 备份策略:指根据组织的业务需求和恢复要求制定的数据备份的操作流程和规则。
信息系统灾难恢复方案信息系统是现代社会运行的重要支撑,一旦发生灾难,将严重影响社会正常运行和个体的生产生活。
因此,建立一个完善的信息系统灾难恢复方案至关重要。
下面,我将从建立灾难恢复团队、灾难评估和预警、备份和恢复、通信设备和物资准备等方面,进行详细阐述。
首先,建立一个专门的灾难恢复团队,该团队应由具备技术能力和相关经验的人员组成,包括系统管理员、数据恢复专家、网络工程师等。
团队成员需定期接受培训,了解最新的系统架构和灾难恢复技术,以应对各种可能的灾难情况。
其次,进行灾难评估和预警。
通过定期的灾难演练和风险评估,发现潜在的灾难风险和薄弱环节,并采取相应的风险控制措施。
在建立预警机制,及时获取灾难信息,做好预警工作,以提前做好准备工作。
再次,备份和恢复是信息系统灾难恢复的关键步骤。
对关键数据和系统进行定期备份,确保数据的完整性和可靠性。
备份数据应存储在不同的物理位置,以免单点故障造成数据灾难。
同时,建立一个高效的恢复流程,能够快速恢复系统和数据,减少停机时间,从而减少损失。
最后,灾难恢复方案需要定期检查和更新。
由于信息系统和灾难恢复技术在不断发展,方案中的技术和流程也需要不断的更新和改进。
定期的测试和演练可以有效地发现问题和薄弱环节,并对方案进行修订,以确保方案的有效性和实用性。
综上所述,信息系统灾难恢复方案是确保信息系统能够在灾难中快速恢复并实现正常运行的重要保障。
通过建立灾难恢复团队、灾难评估和预警、备份和恢复、通信设备和物资准备等措施,可以大大提高灾难恢复的效率和可靠性,减少灾难带来的损失。
但需要强调的是,方案的有效性还需通过定期的演练和测试来验证,以保证在真正的灾难中能够得到有效应用。
信息系统灾难恢复计划一、引言信息系统的稳定运行对于现代企业的正常运转至关重要。
然而,灾难随时可能发生,如自然灾害、人为破坏、硬件故障等,这些灾难都有可能导致信息系统的中断,给企业带来重大损失。
为了确保信息系统的连续性运行,企业需要建立一个完善的信息系统灾难恢复计划(Disaster Recovery Plan, DRP),以应对各种突发情况。
二、目标和原则1.目标:确保信息系统在灾难发生后能够快速、有效地恢复运行,最小化业务中断时间和损失。
2.原则:a.及时性:对灾难的应对措施要快速启动,减少业务中断时间;b.完整性:恢复后的信息系统要保证功能完整,数据准确;c.灵活性:应对各种不同类型的灾难情况,采取相应的措施;d.系统化:全面覆盖信息系统各个方面,包括硬件、软件、数据、人员等;e.可展示性:计划要经过测试验证,确保可行性,同时要定期修订和更新。
三、组织机构1.灾难恢复团队:由跨职能部门的成员组成,包括技术人员、管理人员等;3.备份和恢复团队:负责定期备份数据和恢复数据的技术人员。
四、灾难类型和风险评估1.灾难类型:包括自然灾害(地震、火灾、水灾等)、人为破坏(黑客攻击、恶意破坏等)、硬件故障(服务器故障、存储设备故障等)等;2.风险评估:对各类灾难进行评估,确定其对信息系统的影响程度和可能带来的损失。
五、恢复策略1.数据备份:定期对关键数据进行备份,并将备份数据存储在远离灾害区域的地方,确保数据可以快速恢复;2.硬件备份:备份关键硬件设备,如服务器、交换机等,以备灾难发生时使用;3.灾难恢复设施:建立备用数据中心或恢复站点,用于灾难发生后的信息系统恢复;4.人员可替代性:确保信息系统的关键人员具备备份,并培养和训练新的技术人员,以保证业务的连续性;5.灾难演练:定期进行灾难演练,测试灾难恢复计划的有效性。
六、恢复流程1.灾难发生后立即启动灾难恢复计划;2.确定灾难类型和影响范围,评估影响程度;3.启动恢复设施,恢复关键硬件设备,优先保证系统运行;4.恢复数据备份,并确保数据的安全性和完整性;5.恢复应用和系统功能,确保业务能够正常运行;6.持续监控系统运行情况,确保恢复后的系统稳定。
数据中心是集成化的IT应用环境,并且随着业务的整合以及新业务的不断涌现,数据中心变得愈加庞大和复杂,业务数据也变得愈加关键。
任何断电、系统故障和人为操作不当都有可能造成关键数据的丢失,继而造成企业业务的停滞和不可估量的经济损失。
如何应对数据大集中所带来的风险已成为人们关注的重点。
为了应对各种自然灾难(火灾、水灾、地震等)和人为灾难(误操作、病毒等)对企业数据中心的安全和正常运行带来的冲击,近年来,信息系统灾难恢复(通常也称为“灾备”)建设日益受到社会的关注和重视。
信息系统灾难恢复是指将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态而设计的活动和流程。
为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、技术支持能力和运行管理能力进行备份的过程称为灾难备份。
正常情况下,对生产系统运行进行数据处理和支持关键业务功能运作的场所被称为生产中心。
在灾难发生时接替生产系统运行进行数据处理和支持关键业务功能运作的场所被称为灾难备份中心(简称“灾备中心”),它包括备用的数据处理中心、备用的工作环境、备用的生活设施和技术支持及运行管理人员。
生产中心是信息系统灾难恢复的对象,而灾备中心是信息系统灾难恢复的基础,生产中心和灾备中心是数据中心的不同形态,而数据中心则是信息系统灾难恢复的载体。
对于那些高度依赖其信息系统运作的行业和企业而言,为保障信息系统安全稳定运行,人们采用了从技术、管理直至备份等诸方面的措施。
其中数据中心基础设施是保障信息系统安全运行最重要的基础。
从国际行业经验来看,大部分引发信息系统灾难的事件完全可以通过加强数据中心基础设施建设及运维管理来消除、或者减轻其不良影响。
因此,对于业务连续性要求较高的行业和企业来说,选择高可用性数据中心作为生产中心和灾备中心是抵御灾难风险,保障业务持续运行的前提和根本。
9.2?数据中心的灾难恢复策略信息系统灾难恢复起源于20世纪70年代,目前在政府、金融、电信、交通、能源、公共服务业以及大型制造、零售业等对信息化依存程度高的行业应用极其广泛。
信息系统的灾难恢复规范信息系统的灾难恢复工作包括灾难恢复规划和灾难备份中心的日常运维,关键业务功能在灾难备份中心的恢复和重续运行,以及主系统的灾后重建和回退工作,还涉及突发事件发生后的应急响应,灾难恢复是一个周而复始,持续改进的过程,包括以下几个阶段:1、灾难恢复需求的确定2、灾难恢复策略的制定3、灾难恢复策略的实现4、灾难恢复预案的制定、落实和管理。
灾难恢复的组织架构中的人员有管理、业务、技术和行政后勤等人员组成,一般设定灾难恢复领导小组和灾难恢复规划实施小组和灾难恢复日常允许组。
组织可以聘请具有相应资质的外部专家协助灾难恢复实施工作,也可以委托具有相应资质的外部机构承担实施组织,以及日常运行组的部分或全部工作。
灾难恢复领导小组的职责:是信息系统灾难恢复工作的组织领导机构,组长应由组织最高管理层成员担任。
领导小组的职责是领导和决策信息系统灾难恢复重大事宜,主要如下:审核并批准经费预算审核并批准灾难恢复预案批准灾难恢复预案的执行灾难恢复实施组灾难恢复规划实施组的主要职责是负责:灾难恢复的需求分析提出灾难恢复策略和等级灾难恢复策略的实现制定灾难恢复预案组织灾难恢复预案的测试和演练灾难恢复日常运行组灾难恢复日常运行组的主要职责是负责协助灾难恢复系统实施灾难备份中心日常管理灾难备份系统的运行和维护灾难恢复的专业技术支持参与和协助灾难预案的教育、培训和演练维护和管理灾难恢复预案突发时间按发生时的随时控制和损失评估灾难发生后信息系统和业务功能的恢复。
灾难发生后的外部协作。
灾难恢复需求的确定风险分析的主要内容包括:标识信息系统的资产价值,识别信息系统面临的自然的和人为的威胁,识别信息系统的脆弱性,分析各种威胁发生的可能性并定量或定性描述可能造成的损失,识别现有的风险防范和控制措施。
通过技术和管理手段,防范或控制信息系统系统的风险。
依据防范或控制风险的可行性和残余的可接受程度,确定对风险的防范和控制措施。
业务影响分析分析业务功能和相关资源配置对组织的各项业务功能及各项业务功能之间相关性进行分析,确定支持各种业务功能的相应信息系统资源及其他资源,明确相关信息的保密性、完整性和可用性要求。
收稿日期:2005-12-19;修订日期:2006-04-19 基金项目:国家/十五0重点科技攻关计划(2002AA1Z67101)作者简介:王琨(1973-),男,陕西西安人,博士研究生,主要研究方向:网络与信息安全; 周利华(1942-),男,江苏苏州人,教授,博士生导师,主要研究方向:网络与信息安全、网络多媒体; 袁峰(1970-),男,河北石家庄人,高级工程师,主要研究方向:网络与信息安全.文章编号:1001-9081(2006)06-1324-04信息系统灾难恢复模型研究王 琨1,周利华1,袁 峰2(1.西安电子科技大学计算机网络与信息安全教育部重点实验室,陕西西安710071;2.国家信息安全工程技术研究中心,北京100093)(w angkun @m a i.l x i d i a n .edu .cn)摘 要:为保障业务系统在灾难状态下具备持续服务能力,提出健壮的灾难恢复系统模型。
模型强化通信保障能力以提供安全可靠的灾难恢复控制;提出自我监测能力监测灾难恢复系统自身的完整性和安全性;使用可视技术使灾难恢复系统易于使用、管理和维护。
模型适用于电子政务、银行等安全级别较高的环境。
在模型的指导下某电子政务灾难恢复系统已经建设完毕。
实践和仿真实验证明系统能够满足网络收敛和应用响应时间要求。
关键词:信息安全;电子政务;持续服务;灾难恢复中图分类号:TP309 文献标识码:AStudy on disaster recovery model for infor mati on syste mWANG Kun 1,Z HOU L-i hua 1,YUAN Feng2(1.K e y Laboratory of Co mp uter N et w ork and Infor m ati on Secur ity of theM i nistry of Education,X i dian University,X i p an Shannx i 710071,China ;2.N ati onal Information Securit y E ngineer i ng and T echno l ogy Research C enter,Beijing 100093,China )Abstract :A robust disaster recovery system m ode l w as presented to m ake infor m ati on syste m s own conti nuous se rv ice ta lent even under disaster cond iti on .The sa fe communicati on ab ilit y w as strengthened to guarantee t he secure co mm and on disaster recovery .T he se l-f superv i s i on ta lent w as introduced to w atch the i ntegra lity and the secur ity o f disaster recovery syste m itsel.f R ea-l ti m e v i s i ble p l a tfor m w as suggested to m akes disaster recovery sy stem s eas i er to use ,m anage and m a i nta i n .Th ism odel suits cr iti ca l secur it y env iron m ents such as e -gove rn m en t and bank .A key e -government d isaster recovery syste m of China has been constructed gu i ded by t he m ode.l It is ver ified t hat t he net w ork converg ence and applica ti on response ti m e can sa tisfy the syste m requests through the practi ce and ma tch i ng si m ulati on .K ey words :i nfor m ation secur i ty ;e -govern m ent ;conti nuous serv ice ;disaster recove ry0 引言随着各种应用日益严重依赖信息技术,信息系统失效也会直接影响应用。
对于某些关键应用,即使短时间失效也是无法忍受的,必须建设灾难恢复系统(D isaster R ecovery Syste m,DR S)保障关键应用具备持续服务能力。
这里/灾难0已经超出了自然灾害的范畴,它指任何有可能导致信息系统持续一段时间失效的危害,包括病毒、黑客攻击、误操作、火灾、地震等。
如何更好地保护系统,提供灾难恢复和持续服务能力已经成为国际上的研究热点,灾难恢复系统模型研究就是其中的关键研究之一。
目前已经有一些灾难恢复系统模型,例如Business Con tinu it y P lanning (BCP)[1]、R oboCup -R escue [2]、CoStore[3,4]、D isaster M anage m en t Syste m (DM S)[5]、Con tinu it y of O perati onsP lanni ng (COOP )[6]、D i saste r R ecovery C l uste r So ft wa re Syste m(DR CSS)[7]。
BCP 是一种过程驱动的通用模型,它通过分析和更新商业持续计划实现灾难恢复。
由于它侧重于商业领域,对一些安全问题涉及不够,不能保障系统自身的安全性和完整性,不适用于对安全性要求非常高的环境。
并且它没有涉及系统管理,不便于系统的使用与维护。
R oboCup -R escue论述了使用机器人和人工智能技术应对灾难的重要性,在系统的可视化方面有很好的表现。
CoStore 研究建设可靠、高可用的存储系统。
在校园网规模的环境中,它可以在不影响系统性能的情况下提高存储系统的待命性。
D M S 被设计用于减少重大灾难中人员生命损失,降低灾难恢复的代价。
它集成传感器技术、建模和仿真工具、遥感和计算平台,为决策者提供预警、灾难发生中和灾难恢复中的信息,提高应对灾难的能力。
COOP 能够保障政府处理和应对各种突发事件的能力。
它包含开始持续应对计划、标识应急时间、明确部门职能、确定保护重要系统和部门、开发高效通信方案、测试评估和修改持续应对计划。
DM S 和C OO P 都不是专门为保护信息系统而设计的。
DRCSS 试图解决软件系统的灾难恢复问题。
用户系统使用DR CSS 编程接口初始化多个同时分散在网络中不同节点的应用程序实例,DRCSS 同步这些应用实例的状态,检测网络节点的失效,使应用系统能够容忍网络和计算结点灾难。
这些灾难恢复模型有的不适于保护信息系统;有的模型虽然可以保护信息系统,但由于它基于应用服务供应商[8,9],安全性不高;有的模型无法承受重大灾难;还有的第26卷第6期2006年6月计算机应用C o mpu ter App licationsV o.l 26No .6June 2006模型不便于系统的使用、管理和维护。
由于对安全性、可靠性和系统性能要求高,加之国内缺乏可借鉴的成功经验,在深入研究中国电子政务体系[10,11]、多种灾难和灾难恢复系统的基础上,本文提出健壮的灾难恢复系统模型(R obust D i saste r R ecovery Sy stem M ode,l RDRS M )以指导EEDP 中DRS 的建设。
与其它模型相比,RDR S M 强化了安全性和可靠性,创新地提出系统模拟与监测,实现对系统自身完整性和安全性监测和对灾难的模拟;RDRS M 格外强调通信系统的可靠性;它重视结合地理信息系统(G eograph i c Infor m a ti on Syste m,G IS)提供实时的2D 、3D 操作平台,更易于DR S 的使用、管理和维护。
在论文研究工作的帮助下,我们制订了国家电子政务安全支撑平台规范,该规范已经正式发布,用于指导我国电子政务项目的建设。
1 健壮的灾难恢复系统模型RDR S M 模型如图1所示,它包括咨询与培训(Cons u ltation and T ra i ning ,CT )、风险评估(R i sk A ssess m ent ,RA )、灾难恢复计划(D isaster R ecovery P l ann i ng ,DRP )、模拟与检测(Si m ulati on and Superv i sion ,SS )、灾难恢复控制(D i saster R ecovery Contro,l DRC )和系统管理(Syste m M anagem ent ,S M )这几个环节。
由于性能、安全性、带宽等众多因素的互相制约,为实现业务可持续性,设计DR S 上的应用系统时不得不权衡高性能与高可靠性之间的关系。
对于高安全性的应用可以使用2-safe ,它的原子特性能保证数据中心与备份中心数据的一致性,避免损失已经处理完毕的事务。
但它会增加资源竞争的冲突,减少吞吐量,而且备份中心出现故障时,数据中心必须改变它正常的工作方式。
1-safe 可以减少由于资源竞争带来的事务处理延迟,即使备份中心不可用时数据中心仍然可以正常工作,更容易实现一个数据中心支持多个备份中心,但是灾难发生时会丢失一部分未来得及传输的事务。
为实现安全性与系统性能的折中,可以在关键部分使用2-sa fe ,次要的地方使用1-safe 。
此外,在保障DRS 及时有效地切换系统、指挥调度、故障排除的同时,为实现DRS 的安全、可靠和易用,RDRS M 还有如下总体要求:图1 健壮的灾难恢复系统模型1)安全可靠的通信保障是灾难恢复的关键,必须尽可能利用多种通信手段,确保通信的畅通无阻。
尽可能采用不同安全级别的密码技术保护数据的存储、传输和访问控制。
2)采用决策支持系统(D ec i s i on Suppo rt Syste m,D SS)分析海量数据,为决策者提供科学的决策依据。
3)DRS 通常覆盖范围较大,使用G IS 提供直观的操作平台,便于DRS 的使用、管理和维护。