运维系统及中心机房应急预案
- 格式:doc
- 大小:173.00 KB
- 文档页数:12
一、预案背景随着信息化技术的不断发展,机房作为企业信息系统的核心,其稳定性和安全性日益受到重视。
为提高机房应对突发事件的能力,确保信息系统正常运行,特制定本预案。
二、预案目的1. 提高机房应对突发事件的能力,降低损失;2. 确保信息系统在突发事件发生时能够迅速恢复正常运行;3. 提高机房运维人员应对突发事件的应急处置能力。
三、预案适用范围本预案适用于我公司所有机房,包括数据中心、服务器房、网络设备间等。
四、组织机构及职责1. 成立机房应急演练领导小组,负责统筹协调、指挥调度和监督指导;2. 设立应急演练办公室,负责具体实施和协调;3. 各部门、班组根据职责分工,负责应急演练的组织实施和配合。
五、应急响应流程1. 情报收集与报告(1)发现机房异常情况,立即上报应急演练领导小组;(2)应急演练领导小组根据情况启动应急预案,并通知相关部门和人员。
2. 应急处置(1)根据预案要求,迅速采取相应措施,如断电、停机等;(2)组织专业人员对异常情况进行排查,找出问题根源;(3)根据排查结果,采取针对性措施,如更换设备、修复故障等;(4)恢复正常运行后,进行系统检查,确保信息安全。
3. 应急结束(1)应急演练领导小组宣布应急结束;(2)各部门、班组恢复正常工作秩序;(3)应急演练办公室对应急演练进行总结评估,提出改进措施。
六、应急演练内容1. 机房设备故障应急演练;2. 网络中断应急演练;3. 突发停电应急演练;4. 火灾应急演练;5. 其他突发事件应急演练。
七、应急演练实施1. 演练前,应急演练办公室负责制定详细的演练方案,包括演练时间、地点、人员、设备等;2. 各部门、班组根据演练方案,做好演练前的准备工作;3. 演练过程中,严格按照预案要求进行,确保演练效果;4. 演练结束后,应急演练办公室负责总结评估,提出改进措施。
八、预案修订本预案根据实际情况进行修订,如有变动,应及时通知相关人员。
九、附则1. 本预案自发布之日起实施;2. 本预案由机房应急演练领导小组负责解释。
机房维护应急预案一、前言机房作为信息系统的核心枢纽,承载着大量关键业务和数据。
为了确保机房的稳定运行,预防和应对可能出现的各类故障和紧急情况,特制定本机房维护应急预案。
二、应急组织机构及职责1、应急指挥小组由机房主管领导担任组长,成员包括技术负责人、运维人员等。
其职责是全面负责应急处理工作的指挥和协调,制定应急策略,下达应急指令。
2、技术保障小组由资深技术人员组成。
负责对机房设备和系统进行故障诊断和修复,提供技术支持和解决方案。
3、后勤保障小组负责应急物资的准备和调配,保障应急处理过程中的物资供应和人员生活需求。
4、安全保障小组负责维护应急处理现场的安全秩序,防止意外事故的发生。
三、预防措施1、设备定期巡检制定详细的设备巡检计划,对服务器、网络设备、电力设备等进行定期检查,及时发现潜在问题并进行处理。
2、数据备份建立完善的数据备份策略,定期对重要数据进行备份,并将备份数据存储在安全的地方,以防止数据丢失。
3、环境监控安装环境监控系统,实时监测机房的温度、湿度、电力等参数,确保机房环境处于正常范围。
4、应急预案演练定期组织应急预案演练,让相关人员熟悉应急处理流程,提高应对紧急情况的能力。
四、应急响应流程1、故障监测与报告通过监控系统或用户反馈,及时发现机房故障。
运维人员应立即向应急指挥小组报告故障情况。
2、故障评估应急指挥小组组织技术人员对故障进行评估,确定故障的严重程度和影响范围。
3、应急启动根据故障评估结果,启动相应的应急预案。
通知各应急小组进入应急状态,按照分工开展工作。
4、故障处理技术保障小组迅速采取措施进行故障处理,尝试恢复系统正常运行。
在处理过程中,要及时记录处理步骤和结果。
5、恢复与验证故障排除后,对系统进行全面的恢复和验证,确保系统稳定运行。
同时,对故障原因进行深入分析,总结经验教训,完善应急预案。
五、常见故障及应急处理方法1、电力故障(1)若出现市电停电,立即切换到备用电源(如 UPS 电源),并通知电力部门尽快恢复市电供应。
运维系统及中心机房应急预案运维中心机房是企业信息化建设的重要组成部分,同时也是企业支持业务稳定运行的核心数据中心。
然而,由于机房内设备众多,运行环境复杂,遇到紧急情况可能造成严重的后果。
因此,建立完善的应急预案非常必要。
本文将围绕运维系统及中心机房的应急预案展开。
一、应急预案的必要性1、降低事故造成的损失任何机房事故都可能对企业信息安全和业务运行造成损失。
建立应急预案,提前对各种应急情况进行规划和预测,可以最大限度地减少机房事故带来的影响和损失。
2、提高应对突发事件的能力建立应急预案可以统筹规划各种应急情况的应对措施,让事故发生时机房管理人员能够快速、准确地做出决策,控制事态发展,最大限度地保障业务运转。
3、提升机房的安全性机房是企业信息化建设的核心,建立应急预案不仅可以提高机房的应急响应能力,还可以更好地保障机房的安全和稳定。
二、应急预案的主要内容应急预案通常包括以下几部分:1、应急组织机构应急组织机构是整个应急预案的核心部分,需要明确各级机构的组成、职责、联系方式等信息。
具体包括应急指挥中心、应急领导小组、应急专家组、应急技术组、部门应急小组等。
2、应急响应流程应急响应流程是应急预案的重要组成部分,需要制定各种突发事件的应对流程和具体步骤,并明确应急响应的级别、响应时间、决策程序、应急措施等信息。
3、应急资源清单应急资源清单是按照应急预案建立的资源储备库。
需要对机房的各种设备和资源进行详细的梳理整理,并明确资源的使用条件和分配方式。
4、应急测试计划应急测试计划是在平时需要对应急预案进行演练和测试,以便发现短板和问题,并及时修复。
测试计划需要确定测试的内容、时间、测试方式及测试人员等信息。
5、应急修复记录应急修复记录是每次应急事件的过程和结果的详细记录,可以为今后类似事件的应急处理提供参考和借鉴。
三、应急预案实践实践证明,应急预案仅仅是纸面文件是远远不够的,只有在平时的日常管理工作中,把应急预案落实到实践操作中,才能提高应急响应的能力和效率。
运维系统及中心机房应急预案一、前言随着信息化建设的快速发展,网络和服务器已经成为很多企业的核心资产和重要业务支持系统。
在企业运营过程中,如何保障网络和服务器的正常运行,及时应对各种运维问题和突发事件,成为了企业运维中心不可避免的任务。
本文主要介绍运维系统及中心机房应急预案,以期为企业运维工作提供一定参考。
二、运维系统应急预案1.应急响应计划在运维系统的应急响应计划中,应包含以下内容:(1)对应急事件的分类,如故障、攻击、病毒等,以及对每种事件的响应措施;(2)明确各责任人员的职责和应急流程,确保应急响应过程中能够快速高效地响应和处理问题;(3)明确联系人和联系方式,建立紧急联系渠道,以便在发生应急事件时能够及时通知相关人员;(4)制定排查故障的步骤和方法,明确故障处理的流程和时间;(5)建立应急响应规范和标准,指导工作人员根据标准进行应急响应。
2.数据备份和恢复在运维系统中,数据备份和恢复是非常重要的。
应按照以下步骤进行:(1)制定数据备份策略,明确备份的内容、时间和方法;(2)确保备份数据可靠,可用,易恢复,避免出现数据丢失或损坏的情况;(3)测试数据恢复的过程和时间,确保数据能够及时恢复,并且不会对生产和业务造成影响。
3.安全控制和监控在运维系统中,安全控制和监控也是非常重要的。
应包含以下内容:(1)制定安全策略,确保网络和服务器的安全,建立安全控制和监控机制;(2)设定安全阈值和监控指标,及时发现安全漏洞和异常情况;(3)定期进行安全风险评估,及时调整安全控制和监控策略。
三、中心机房应急预案中心机房是企业的重要资产,应急预案的制定也相当重要。
以下为应急预案的内容:1.机房环境应急预案(1)确定环境监测指标,如温度、湿度、电压和电流等数据的监测和记录;(2)定期维护和保养空调和UPS设备,确保中心机房稳定运行;(3)制定环境漏水、火灾等灾害的应急预案,及时处理突发事件,避免设备损坏。
2.网络应急预案(1)确保网络设备的正常运行,及时检查网络设备的安全性和稳定性;(2)设定网络访问控制规则,防止非法入侵和黑客攻击;(3)定期测试网络安全漏洞并及时修复。
一、目的为确保机房在发生突发事件时,能够迅速、有效地进行应急处理,最大限度地减少损失,提高机房运维人员的应急处理能力,特制定本方案。
二、适用范围本方案适用于我公司所有机房。
三、组织机构1. 演练领导小组(1)组长:XXX(运维部门负责人)(2)副组长:XXX(运维部门副负责人)(3)成员:XXX(运维部门全体人员)2. 演练指挥部(1)指挥长:XXX(运维部门负责人)(2)副指挥长:XXX(运维部门副负责人)(3)成员:XXX(运维部门全体人员)四、演练内容1. 演练场景(1)机房电源故障(2)机房火灾(3)机房漏水(4)机房设备故障2. 演练科目(1)应急响应(2)设备故障排查与处理(3)人员疏散与救援(4)信息报送与协调五、演练实施步骤1. 演练准备(1)制定演练方案,明确演练目的、内容、时间、地点、人员安排等。
(2)通知参演人员,组织参演人员学习演练方案,熟悉演练流程。
(3)准备演练所需的物资、设备、工具等。
2. 演练实施(1)启动演练程序,宣布演练开始。
(2)参演人员按照演练方案要求,进行应急响应、设备故障排查与处理、人员疏散与救援、信息报送与协调等科目演练。
(3)演练过程中,指挥长负责协调各部门工作,确保演练顺利进行。
3. 演练总结(1)演练结束后,参演人员集合,进行演练总结。
(2)演练领导小组对演练过程进行评估,提出改进意见。
(3)整理演练记录,归档备查。
六、演练评估与改进1. 评估内容(1)应急响应速度(2)设备故障处理能力(3)人员疏散与救援效果(4)信息报送与协调能力2. 改进措施(1)针对评估中发现的问题,制定改进措施。
(2)对演练过程中出现的问题,及时进行整改。
(3)定期组织演练,提高机房运维人员的应急处理能力。
七、附则1. 本方案由运维部门负责解释。
2. 本方案自发布之日起实施。
3. 如有未尽事宜,另行通知。
机房应急处置预案一、背景介绍随着信息技术的快速发展,机房逐渐成为企事业单位和政府机构关键的信息中心。
然而,机房在运行过程中难免会遇到各种故障和突发事件,如停电、网络故障、设备故障等,对正常的运行造成了严重威胁。
为了保障机房运行的安全和稳定,建立一套完善的机房应急处置预案势在必行。
二、应急处置流程1. 应急响应一旦发生机房故障或突发事件,应立即启动应急响应流程。
首先,通过监控系统获取故障信息,并及时通知相关人员,包括机房管理员、IT技术人员等。
同时,启动备用设备,确保机房运行不中断。
2. 问题分析与定位在收到故障信息后,相关人员需快速分析和定位问题。
通过检查设备运行状态、网络连接状况等,确定故障的具体原因和范围。
在此过程中,需保持清晰的思路和快速反应能力,以便尽快恢复机房正常运行。
3. 应急措施与故障解决针对不同的故障类型,制定相应的应急措施。
比如,对于设备故障,可尝试重新启动或更换备用设备;对于网络故障,可进行线路检测和调试;对于停电问题,需与供电部门紧急联系,争取尽快恢复供电。
4. 恢复与验证在确定故障已经解决后,需对机房进行全面检查和验证。
确保所有设备和网络连接正常,以免留下潜在的问题。
同时,对故障的原因进行总结和分析,为后续的防范工作提供经验和教训。
三、应急预案的制定与演练为了保障机房应急工作的有效性,机构应制定详细的应急预案,并且定期进行演练和验证。
应急预案应包括以下内容:1. 应急团队及职责:明确应急团队的组成和成员的职责分工,确保各岗位职责明确,配合默契。
2. 应急联系人员:列出应急联系人员的名单和联系方式,包括机房管理员、IT技术人员、供电部门等。
3. 应急设备备份:明确备用设备的存放地点和维护保养方式,保障备用设备的可用性。
4. 应急演练计划:制定详细的应急演练计划,包括演练时间、内容和评估要点,确保演练的科学性和有效性。
5. 应急处置流程:定义详细的应急处置流程,包括故障响应、问题分析定位、应急措施与故障解决、恢复与验证等环节。
一、预案背景随着信息技术的快速发展,机房已成为企业、机构等单位的重要基础设施。
机房突发故障可能导致数据丢失、系统瘫痪、业务中断等问题,给企业或机构带来巨大的损失。
为保障机房安全稳定运行,提高应急处置能力,特制定本预案。
二、预案目标1. 保障机房设备正常运行,确保业务连续性。
2. 快速定位故障原因,采取有效措施进行修复。
3. 最大程度降低故障对业务的影响,减少损失。
4. 提高机房运维人员应对突发故障的能力。
三、组织机构1. 成立机房故障应急处理小组,负责组织、协调、指挥机房故障应急处理工作。
2. 小组成员包括:机房运维负责人、网络工程师、安全工程师、业务部门负责人等。
四、应急响应流程1. 故障发现(1)机房运维人员发现故障时,应立即向应急处理小组报告。
(2)应急处理小组接到报告后,应迅速展开调查,初步判断故障原因。
2. 故障确认(1)应急处理小组根据初步判断,进行故障确认,确定故障范围。
(2)通知相关业务部门,做好业务调整准备。
3. 应急处置(1)根据故障原因,采取相应措施进行修复。
(2)对故障设备进行检测、维护、更换等操作。
(3)确保故障设备恢复正常运行。
4. 业务恢复(1)故障设备恢复正常后,通知相关业务部门,进行业务恢复。
(2)对业务恢复情况进行跟踪,确保业务正常运行。
5. 故障总结(1)应急处理小组对故障原因、处理过程、恢复情况进行总结。
(2)提出改进措施,防止类似故障再次发生。
五、应急保障措施1. 建立机房设备台账,确保设备信息准确、完整。
2. 定期对机房设备进行巡检、维护,确保设备正常运行。
3. 加强机房安全管理,防止人为因素导致故障。
4. 定期对应急处理小组成员进行培训,提高应急处置能力。
5. 配备必要的应急物资,如备用电源、网络设备等。
六、预案实施与修订1. 本预案由机房运维负责人负责组织实施。
2. 本预案自发布之日起实施,如有需要,可进行修订。
通过本预案的实施,提高机房运维人员应对突发故障的能力,确保机房安全稳定运行,为业务连续性提供有力保障。
一、前言为确保运维作业过程中发生突发事件时,能够迅速、有效地进行处置,最大限度地减少事故损失,保障员工生命财产安全,根据国家有关法律法规和公司相关规定,特制定本运维作业应急预案。
二、适用范围本预案适用于公司所有运维作业现场,包括但不限于数据中心、机房、网络设备、服务器、存储设备等。
三、组织架构1. 应急指挥部:负责统一指挥、协调、决策和指挥应急响应行动。
2. 应急救援组:负责现场救援、人员疏散、医疗救护等工作。
3. 技术保障组:负责现场设备、系统故障的排查、修复和恢复。
4. 信息保障组:负责应急信息收集、发布、报送和舆论引导。
5. 后勤保障组:负责应急物资、车辆、通信设备等后勤保障。
四、应急预案内容1. 事故预警(1)加强日常巡检,及时发现异常情况,提前预警。
(2)建立应急值班制度,确保24小时有人值班。
2. 事故响应(1)接到事故报告后,立即启动应急预案。
(2)应急指挥部迅速组织相关人员赶赴现场。
(3)应急救援组立即开展现场救援、人员疏散和医疗救护。
(4)技术保障组立即排查故障原因,进行修复和恢复。
(5)信息保障组及时收集、发布和报送应急信息。
3. 事故处理(1)针对不同类型的事故,采取相应的处置措施。
(2)对事故原因进行调查分析,制定整改措施。
(3)对事故现场进行清理,确保恢复正常运行。
4. 应急结束(1)事故得到有效控制,恢复正常运行。
(2)应急指挥部宣布应急结束。
(3)对应急响应过程进行总结,评估应急效果。
五、应急保障措施1. 物资保障:储备必要的应急物资,如急救药品、食品、饮用水、帐篷等。
2. 人员保障:组织应急队伍,明确各岗位职责。
3. 车辆保障:配备应急车辆,确保应急物资和人员快速到达现场。
4. 通信保障:确保应急通信畅通,确保信息及时传递。
六、培训与演练1. 定期组织应急培训,提高员工应急意识和应急处置能力。
2. 定期开展应急演练,检验应急预案的可行性和有效性。
3. 根据演练情况,不断优化应急预案,提高应急响应能力。
一、总则1. 为确保机房设备安全、保障网络正常运行,提高应对突发事件的能力,特制定本预案。
2. 本预案适用于机房各类突发事件,包括但不限于火灾、停电、设备故障、人为破坏等。
3. 预案实施遵循“预防为主,快速响应,科学处置,减少损失”的原则。
二、组织机构及职责1. 机房应急处置领导小组(1)组长:由机房管理部门负责人担任,负责全面协调、指挥应急处置工作。
(2)副组长:由相关部门负责人担任,协助组长工作。
(3)成员:由机房管理部门、运维部门、安全部门等相关人员组成。
2. 机房应急处置小组(1)组长:由机房管理部门负责人担任,负责应急处置工作的具体实施。
(2)副组长:由运维部门负责人担任,协助组长工作。
(3)成员:由运维人员、安全人员、技术支持人员等组成。
三、应急处置流程1. 火灾应急处置(1)发现火情,立即启动火灾报警系统,同时报告应急处置领导小组。
(2)立即切断电源,确保人员安全。
(3)使用灭火器、消防栓等灭火设备进行灭火。
(4)如火势无法控制,立即组织人员撤离,并拨打119报警。
2. 停电应急处置(1)发现停电,立即启动备用电源。
(2)如备用电源无法启动,立即报告应急处置领导小组。
(3)在确保安全的前提下,尽快恢复供电。
3. 设备故障应急处置(1)发现设备故障,立即报告应急处置小组。
(2)应急处置小组迅速排查故障原因,采取相应措施进行处理。
(3)如无法自行处理,及时联系设备厂商或专业维修人员进行维修。
4. 人为破坏应急处置(1)发现人为破坏,立即报告应急处置领导小组。
(2)采取措施,保护现场,防止事态扩大。
(3)协助公安机关调查处理。
四、应急处置措施1. 火灾应急处置措施(1)组织人员迅速撤离,确保人员安全。
(2)切断电源,防止火势蔓延。
(3)使用灭火器、消防栓等灭火设备进行灭火。
(4)如火势无法控制,立即拨打119报警。
2. 停电应急处置措施(1)启动备用电源,确保关键设备正常运行。
(2)检查设备运行状态,发现异常立即处理。
运维小组应急预案随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。
为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。
本预案共分为应用系统故障应急流程和机房突发事件应急流程系统故障应急流程一、系统故障应急流程说明1、故障发生系统运维服务小组可从以下途径得知故障的发生:1.1、运维服务中心通过网管告警发现故障1.2、维护站点通过维护巡检发现故障1.3、用户发现故障,报给呼叫中心1.4、驻场工程师发现故障2、报障受理监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。
3、信息研判运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。
4、预案启动如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。
5、资源确认系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源:我公司技术支持人员;相关厂家技术支持人员;我公司聘请的技术专家6、预案执行按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。
7、预案终止预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。
8、结果上报预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。
然后集中上报至系统突发故障应急领导小组。
二、系统故障应急处理流程图机房突发事件应急流程一、机房突发事件分类1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。
2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。
3、人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。
二、应急处理人员组织机构三、应急机构人员岗位职责1、应急总指挥职责1.1、保证在任何时间,及时协调应急行动所有涉及的岗位人员;1.2、提供必须的紧急响应设备;1.3、在紧急情况下全面负责紧急行动;1.4、在必要时向外界求救,例如:119、110、120等。
2、应急副总指挥职责2.1、在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;2.2、根据获得的应急信息下达命令。
3、各相关设备负责人职责3.1、负责尽快收集信息向应急总指挥汇报事故情况;3.2、负责现场临时设备抢救和对事态的控制;3.3、听从上级指挥人员的指挥。
四、突发事件处理原则1.预防为主。
立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑安全保障体系。
2.快速反应。
突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。
3.分级负责。
按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。
根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。
4.以人为本。
把保障人员以及公共利益的安全作为首要任务。
5.常备不懈。
加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规范化。
五、机房应急开关机具体措施机房各设备关闭顺序如下:六、机房日常维护1、建立健全机房管理制度1.1在正常工作日内,信息技术部人员负责对机房进行监控,主要职责是:巡视网络设备及系统的运行情况,发生异常情况及时处理,消除网络故障隐患。
1.2节假日期间技术人员轮流值班,负责处理有关异常情况。
1.3机房采取来人来访登记制度,未经允许,无关人员不得进入公司机房区域。
2、机房内严格采取防雷、防火、防尘、防静电等措施以及机房24小时监控等措施。
3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况。
4、对机房的主要网络设备(路由器、主干交换机等)进行工作时间内全程监控,发现异常情况应及时进行处理,确保整个网络的正常运行。
七、服务器及存储设备故障处理1、排错流程2、应急处置具体措施2.1 机房漏水应急预案(1)发生机房漏水时,第一目击者应立即通知运维服务小组,并及时报告监控系统突发故障应急领导小组。
(2)若空调系统出现渗漏水,运维服务小组负责人应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进行降温。
(3)若为墙体或机房门渗漏水,运维服务小组负责人应立即采取有效措施确保机房安全,及时清除积水,维修墙体或门窗,消除渗漏水隐患。
2.2 设备发生被盗或人为损害事件应急预案(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告系统突发故障应急领导小组,同时保护好现场。
(2)系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
(3)事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系统突发故障应急领导小组汇报。
(4)系统突发故障应急领导小组安排运维服务小组、事发单位及时恢复系统正常运行,并对事件进行调查。
运维服务小组和事发单位应在调查结束后一日内书面报告系统突发故障应急领导小组。
事态或后果严重的,应向相关领导汇报。
2.3 机房长时间停电应急预案(1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案进行处置:(2)当机房发生市电供电突然停电或是电源异常时。
首先应和后勤部门联系确认正常停电以及预计停电时间。
检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电范围内的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。
(3)当确定停电时间超出机房UPS承载范围后,首先确定停电的范围以及受影响的设备范围。
并及时通知各部门做好停电应急准备。
然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。
在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。
(4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。
对于恢复时间无法预计的,要通知后勤部门做好柴油机发电及移动电源车供电准备(5)恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。
2.4 通信网络故障应急预案(1)发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应及时通知本单位信息系统管理员,经初步判断后及时上报运维服务小组和系统突发故障应急领导小组。
(2)运维服务小组接报告后,应及时查清通信网络故障位置,隔离故障区域,并将事态及时报告系统突发故障应急领导小组,通知相关通信网络运营商查清原因;同时及时组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
(3)事态或后果严重的,应向应急指挥办公室和相关领导汇报。
(4)应急处置结束后,运维服务小组应将故障分析报告,在调查结束后一日内书面报告系统突发故障应急领导小组。
2.5 不良信息和网络病毒事件应急预案(1)发现不良信息或网络病毒时,信息系统管理员应立即断开网线,终止不良信息或网络病毒传播,并报告指挥调度中心运维服务小组和系统突发故障应急领导小组。
(2)运维服务小组应根据系统突发故障应急领导小组指令,采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。
(3)事态或后果严重的,应向监控中心办公室和相关领导汇报。
(4)处置结束后 ,运维服务小组应将事发经过、造成影响、处置结果在调查工作结束后一日内书面报告系统突发故障应急领导小组。
2.6 服务器软件系统故障应急预案(1)发生服务器软件系统故障后,运维服务小组负责人应立即组织启动备份服务器系统,由备份服务器接管业务应用,并及时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据。
(2)运维服务小组应根据系统突发故障应急领导小组的指令,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理。
(3)事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。
(4)处置结束后,运维服务小组应将事发经过、处置结果等在调查工作结束后一日内报告系统突发故障应急领导小组。
2.7 黑客攻击事件应急预案(1)当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告系统突发故障应急领导小组。
(2)接报告后,系统突发故障应急领导小组应立即指令运维服务小组核实情况,关闭服务器或系统,修改防火墙和路由器的过滤规则,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道。
(3)运维服务小组应及时清理系统,恢复数据、程序,恢复系统和网络正常;情况严重的,应向监控中心应急指挥办公室和相关领导汇报,并请求支援。
(4)处置结束后 ,运维服务小组应将事发经过、处置结果等在调查工作结束后一日内报告系统突发故障应急领导小组。
2.8 核心设备硬件故障应急预案(1)发生核心设备硬件故障后,运维服务小组应及时报告系统突发故障应急领导小组,并组织查找、确定故障设备及故障原因,进行先期处置。
(2)若故障设备在短时间内无法修复运维服务小组应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。
(3)运维服务小组故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联系相关厂商,认真填写设备故障报告单备查。
(4)事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。
2.9 业务数据损坏应急预案(1)发生业务数据损坏时,运维服务小组应及时报告系统突发故障应急领导小组,检查、备份业务系统当前数据。