当前位置:文档之家› 机房应急预案(内部)

机房应急预案(内部)

机房应急预案(内部)
机房应急预案(内部)

应急处置方案

第一节总则

1、保证人员和财产的安全为前提的原则:在由于火灾或电力问题造成的主机故障,在解决故障前,应以保证人员的生命安全和财产的安全为前提,然后进行故障的解决。

2、最快时间恢复业务的原则:本着先想尽一切方法,尽快恢复业务的原则来处理故障,如在有备用设备的情况下,主设备产生了故障,应先尽快将应用切换到备用机上,使业务能够运行,再对故障设备进行诊断和维修。

3、故障应急人员高度负责的原则:当故障应急人员在节假日接到故障通知时,本着高度负责的态度,应迅速接手处理障碍,如远程无法处理解决,应迅速赶到故障设备所在地,进行现场处理,处理故障的同时应及时向领导汇报。应急人员不可互相推卸责任,如因特殊情况,确实无法处理障碍,部门领导必须安排好其他人员处理。

4、尽可能全面的保留故障现场的原则:当故障发生后,应急人员应尽可能全面的备份出能够反映故障现象的各种日志、记录、受损文件等,便于业务恢复后,对故障的分析、解决,杜绝故障的再次发生。

应急方案的目标:保证预付卡运营系统连续安全稳定地运行。

第二节应急领导小组

应急领导小组成员:

组长:

副组长:

成员:

第三节电源系统故障应急处理

定期检查信息中心机房电源设备的运行状况,当发生下列突发事件时,按以下方案进行处置:

当中心机房发生市电供电突然停电或远程报警电源异常时。首先确认是否为正常停电及预计停电时间。检查不间断电源的电池可供电时间,需在不间断电源供电时效内关闭所有服务器及网络设备。

联系工程部查看停电原因,尽快恢复供电,并将情况报告相关领导

工程部联系电话:

第四节空调系统故障应急处理

定期对空调的运行情况进行检查,如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。

当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,并关闭所有服务器及网络设备。对于无法自行处置的空调系统异常情况,及时与设备提供商联系,并报告公司领导。

空调问题联系人:

第五节中心机房自动消防系统应急处理

当中心机房发生火警时,按以下方案进行处置:

1.上班工作时间发生火警,听到自动消防系统发出的声光报警后,中心机房附近办公室人员应及时紧急撤离,避免气体自动消防系统启动后,消防气体对附近人员造成人身伤害。确认火警后,立刻拨打119报警,并说明尽量使用气体灭火器进行灭火,减少电子设备的损坏。

2.发生火警后,信息中心相关人员应马上赶赴现场,并向有关领导报告事故情况。同时立即联系联通等相关公司,及时评估事故损失情况,研讨尽快恢复信息系统正常运行的最佳方案。

安保消防中控电话:

第六节设备、网络系统故障应急处理

设备、网络应用系统故障应由发现人通知技术部,技术部门立即检查故障,进行初步故障定位,解决;

1.网络设备、服务器、储存设备均有备份,当设备存在硬件问题时,可随时把业务切换到备份主机上,保证业务正常运行;

2.应用系统每更新一次则做一次远程备份,在远程主机上分别备份旧的应用系统和更新后的应用系统,以当天的更新日期命名;

3.对磁盘柜上的数据库文件有定时任务,每天凌晨4:00会把数据库里的数据文件倒出到远程备份主机上,以确保磁盘柜出现硬件故障的时候,数据文件不丢失;对于网络、应用系统出现硬件方面的故障,比较严重的问题,对业务的正常运行造成较大的影响,立即向有关领导报告。

4、网络中有监控服务器,运用Cacti v10最新的版本,监控网络所有设备(路由器,防火墙,交换机以及服务器设备);对设备本身的硬件检测、外部入侵检测、外部攻击等多种对系统不利因素以发送mail的形式报警;相关人员收到报警信息,分析收到的log 日志以做出相应的处理。

5、每周周五对网络设备进行日志及配置文件采集,对数据库数据文件定期下载,和远程备份;在本地电脑上保存最近的配置文件,以便在发生毁灭性的灾难时,用来重组。

对简单故障,运维人员应迅速排除故障,解决问题并记录。如果需要更换设备,应上报有关领导,经批准后马上更换故障设备,尽快恢复网络、应用系统运行。运维部门判断无法及时修理时,应立即通知相关的系统运行服务提供商,在最短的时间内安排修理或更换系统。

如发现属外部线路的问题,应与线路服务提供商联系,敦促对方尽快恢复故障线路。

启用备份线路、设备、系统,迅速恢复相关的应用。

联通联系电话:

第七节黑客入侵的应急处理

发现网络上有黑客攻击行为,任何人员都有义务向技术部门报告。技术部立即启动应急响应,切断受攻击计算机与网络的连接,停止一切操作、保护现场,并上报有关领导。

对于黑客攻击,由计算中心组织应急响应专家小组查找入侵踪迹,分析入侵方式和原因。由安全管理员根据对入侵事件的分析,组织相关人员对内部网计算机整改,防止黑客用同样的手段再次入侵其他系统。安全管理员检查确定无安全隐患后,才可将受攻击计算机重新连接网络,或启用备份计算机来恢复应用。

安全管理员应做好记录,保护现场,进行日志收集等工作。如果能追查到攻击者的相关信息,可以对其发出警告,必要时可以采取进一步的行动,乃至采取法律手段。根据破坏程度,经有关领导同意后,上报公安部门。

若系统已被黑客破坏,无法恢复,应将受黑客攻击的计算机上的重要数据备份到其他存储介质,确保计算机内重要的数据不丢失。如果数据无法恢复,经有关领导同意后,可与国家指定的部门联系,由他们来协助恢复,为保证数据信息安全,需在安全管理部门作记录。

第八节生产系统、数据库故障处理

生产系统出现故障,技术部做出应急处理

1.因软件设计缺陷、设计漏洞等引起的故障,通知公司研发部门

在2小时内查明原因,解决问题。

2.数据库出现故障,运维人员应在2小时内查清故障原因,其他

相关部门应积极配合,解决问题。

3.如出现数据丢失情况,确认不能自行恢复后,启用备份恢复数

据,24小时内恢复运营。

本方案自发布之日起施行

通讯机房消防应急预案

通讯机房火灾事故应急预案 为了提高通讯机房对各类火灾事故的应急响应和处理能力,提高我公司重点要害部位特大安全事故应急处理能力,努力减少各类特大安全事故所造成的损失,消除火灾事故的隐患,保障公司财产和员工的生命安全,特制定本预案。 二、本预案针对我公司通信要害机房的火灾而制定。 通信机房灭火流程如下: (1)值班人员发现机房火情要立即到现场查看。值班人员通过监控发现无人值守机房发生烟尘等火警时,立即拨打119报警,并通知维护人员迅速到达机房现场。 (2)如果是机房内个别设备着火,值班人员可以自灭自救的,应立即将设备断电,用1211或二氧化碳灭火器将火扑灭。 (3)如果机房内机架机柜着火,值班人员无力自灭自救时,应切断机架机柜电源或机房电源,关闭空调,严禁开窗,拨打119报警,及时向公司安全生产管理领导小组报告。 (4)公司安全生产管理领导小组指挥机关义务消防队队员进行灭火,组织值班人员立即撤离现场,封闭门窗,大声呼救,报告公司主管领导或安保值班室,监控室广播火警。 (5)在消防队到达后,应积极配合,简明扼要说明着火位置,火势情况和已采取的补救措施。 (6)用1211或二氧化碳灭火器喷射灭火剂能把火扑灭的,应配合消防队保护现场和消除隐患,防止再次着火。 (7)用1211或二氧化碳灭火器不能把火扑灭时,为防止烟熏引起人员中毒,应组织人员有序疏散,使用相应的灭火器材灭火,尽快将火扑灭。 (8)应保护好现场,按照事故调查处理办法执行。

(9)火灾报警电话:119 三、火灾事故应急成员联系电话办 公 科室 电 姓名 经理 副经理 副书记 副经理话移动电话住宅电话 信息管理科 数据网络部 运行维护部 运行维护部 线务工区 四、流程图

数据中心机房应急预案培训讲学

数据中心机房应急预案

目录 一、基本原则 (3) 二、应急事件级别定义 (3) 三、组织机构及职责 (4) 3.1应急领导小组组织机构 (4) 3.2 应急领导小组职责 (4) 3.3应急小组成员职责 (5) 四、应急响应机制 (6) 4.1基本处理流程 (6) 4.2机房应急开关机具体措施 (7) 4.3服务器及存储设备故障处理 (7) 五、应急方案 (8) 5.1网络故障事件应急预案 (8) 5.2服务器故障应急预案 (8) 5.3灾害性事件应急预案 (10) 5.4其他突发事件应急预案 (10) 六、后期处置 (10) 七、应急保障 (11)

一、基本原则 (1)居安思危,预防为主。实行突发事件统一管理、统一指挥、各级负责的原则; (2)统一领导,分级负责,全面规划、及时发现、快速反应、措施果断的原则,并按照事件级别迅速上报相关领导和责任人。 (3)制度规范,加强管理。严格按照事件处理流程规范操作,使突发应急的工作规范事件化、制度化。 (4)快速反应,协同应对。当突发事件发生时,各级要立即按应急预案,投入应急工作;加强各个部门配合协作。形成统一指挥、反应灵敏、功能齐全、协调有序、运转高效的应急管理机制。 (5)主动报告原则:当突发事件发生后,要及时报告应急预案实施情况。 二、应急事件级别定义 根据网络与信息安全突发公共事件的可控性、严重程度和影响范围,一般分为四级:I级(特别重大)、II级(重大)、III级(较大)、IV级(一般)。国家有关法律法规有明确规定的,按国家有关规定执行。 (1)I级(特别重大):重要网络与信息安全系统发生全市性大规模瘫痪,事态发展超出相关主管部门的控制能力,对国家安全、社会秩序、经济建设和公共利益造成特别严重损害的突发公共事件。 (2)II级(重大):重要网络与信息安全系统造成全市性瘫痪,对国家安全、社会秩序、经济建设和公共利益造成严重损害,需要跨部门、跨地区协同处置的突发公共事件。 (3)III级(较大):某一区域的重要网络与信息安全系统瘫痪,对国家安全、社会秩序、经济建设和公共利益造成一定损害,但不需要跨部门、跨地区协同处置的突发公共事件。

数据中心机房应急预案

数据中心机房应急预案 目录 一、基本原则 3 二、应急事件级别定义 3 三、组织机构及职责 4 3.1 应急领导小组组织机构 4 3.2 应急领导小组职责 4 3.3应急小组成员职责 5 四、应急响应机制 6 4.1基本处理流程 6 4.2机房应急开关机具体措施 7 4.3服务器及存储设备故障处理 7 五、应急方案 8 5.1网络故障事件应急预案 8 5.2服务器故障应急预案 8 5.3灾害性事件应急预案 10

5.4其他突发事件应急预案 10 六、后期处置 10 七、应急保障 11 一、基本原则 (1)居安思危,预防为主。实行突发事件统一管理、统一指挥、各级负责的原则; (2)统一领导,分级负责,全面规划、及时发现、快速反应、措施果断的原则,并按照事件级别迅速上报相关领导和责任人。 (3)制度规范,加强管理。严格按照事件处理流程规范操作,使突发应急的工作规范事件化、制度化。 (4)快速反应,协同应对。当突发事件发生时,各级要立即按应急预案,投入应急工作;加强各个部门配合协作。形成统一指挥、反应灵敏、功能齐全、协调有序、运转高效的应急管理机制。 (5)主动报告原则:当突发事件发生后,要及时报告应急预案实施情况。 二、应急事件级别定义 根据网络与信息安全突发公共事件的可控性、严重程度和影响范围,一般分为四级:I级(特别重大)、II级(重大)、III级(较大)、IV级(一般)。国家有关法律法规有明确规定的,按国家有关规定执行。

(1)I级(特别重大):重要网络与信息安全系统发生全市性大规模瘫痪,事态发展超出相关主管部门的控制能力,对国家安全、社会秩序、经济建设和公共利益造成特别严重损害的突发公共事件。 (2)II级(重大):重要网络与信息安全系统造成全市性瘫痪,对国家安全、社会秩序、经济建设和公共利益造成严重损害,需要跨部门、跨地区协同处置的突发公共事件。 (3)III级(较大):某一区域的重要网络与信息安全系统瘫痪,对国家安全、社会秩序、经济建设和公共利益造成一定损害,但不需要跨部门、跨地区协同处置的突发公共事件。 (4)IV级(一般):重要的网络与信息安全系统受到一定程度的损坏,对公民、法人和其他组织的权益有一定影响,但不危害国家安全、社会秩序、经济建设和公共利益的突发公共事件。 三、组织机构及职责 3.1 应急领导小组组织机构 3.2 应急领导小组职责 1、应急总指挥职责

中心机房应急预案及管理办 法

上海市********** 中心机房应急预案及管理办法 文件编号: 版次: 受控状态: 密级: 编制/日期: 校对/日期: 审核/日期:

第一章总则 第一条为规范我所网络中心机房设备管理,提高处理机房突发事件的能力,形成科学、有效、反应迅速的应急工作机制,确保重要计算机信息系统的实体安全、运行安全和数据安全,最大限度地减少突发事件造成的危害,根据《中华人民共和国计算机信息系统安全保护条例》、《信息化建设员工遵循守则》及《企业信息安全管理制度》等相关管理规定等,制定《网络中心机房应急预案及管理办法》(以下简称管理办法)。 第二条本文件适用于有计划性、有预防性地管理我所的网络中心机房以及发生和可能发生的与机房有关的突发事件。 第三条信管部负责编制、修订网络中心机房管理办法及所辖范围内突发机房事件应急预案。 周期性或即时性地向局域网用户发布系统安全警示;对异常流量来源进行监控,并妥善处理各种异常情况。及时组织专业技术人员对所辖范围内机房突发事件进行应急处置;负责调查和处理机房突发事件,及时上报并按照相关规定作好善后工作。 第二章中心机房管理办法 第四条机房内的所有设备需要定期保养,应指定人员做维护、清洁工作,做到两天一收拾,一周一打扫;严禁将各种食物、饮用品带入机房,在机房内禁止吸烟。 第五条计算机设备维修工作由专门人员进行,管理人员应把设备的检修情况记录在相应的设备卡上,以便统一归档管理。如发现机房设备故

障应及时向上级领导报告,并负责计算机及外设的日常维护与排除故障,在遇到设备保修范围内的故障时,应及时催促供应单位上门或将机器送修; 第六条系统管理人员必须严格遵守有关机房、设备及系统运行管理规定,不得在机房内从事与系统管理、运行维护、系统安装和调测等无关的工作; 第七条如其他人员需使用机房内设备应向机房负责人提交申请,经主管人员审核签字后,将书面申请提交信管部存档后方可借用机房内的设备; 第八条做好防火、防雨、防湿、防盗工作,注意用电安全;机房内的环境要每周检查温度、湿度、电力系统、是否满足机房相关的标准要求; 第九条系统管理人员应定时对机房供电系统及其他运行中的系统、设备进行巡视和检查,建立档案,做好系统日志。要对发生的故障以及排除故障情况做好详细记录;机房管理人员每日检查UPS电源的状态,确保在突发停电时,UPS电源能自动供应机房设备正常工作半个小时,保证机房设备的数据及时保存。 第十条要统一管理机房内的设备,计算机及其相关设备的驱动程序、保修卡等随机文件与资料要保存完整。要明确专人负责计算机文档、信息化等资料的保管,要做到资料齐全,存放安全; 第十一条机房内的交换机和服务器系办公自动化的关键设备,任何人不得自行配置或更改系统参数; 第十二条要做好机房的安全工作,对服务器的各种帐户、密码严格保密。对网络运行做好监控、做好记录; 第十三条应及时做好数据的备份工作,保证在系统发生故障时,数据能够快速、安全的恢复。所有备份数据不得更改,并要求做到本地和异地分别备份保存。 第十四条为了更好的为所里的业务服务,确保我所网络正常运行,每

机房安全应急预案

机房安全应急预案 一、触电处置步骤(1)一旦发生触电事故,任课教师人应迅速安全切断电源,切忌直接接触触电者。(2)即刻通知校医务室及相关部门,同时开展现场应急救护。(3)教师要稳定课堂秩序安抚其他学生的情绪,必要时应及时、有序疏散学生。(4)协同电工查找原因,本着解决问题以及妥善处理问题的态度与事件起因当事人进行公正、公开、公平的协商姿态解决事后问题。 二、火灾处置(1)任课教师及机房管理员一旦发现火情后,应即刻切断电源。(2)任课教师组织学生进行疏散并自救,疏散时机房前排学生走前门,后排学生走后门。(3)即刻通知后勤处及相关部门,根据火情大小如需报警立即就近用电话或手机报告消防中心(电话119),报告内容为:“某地二楼机房发生火灾,请迅速前来扑救”,待对方放下电话后再挂机。 (4)在向院领导汇报 的同时,派出人员到各路口等待引导消防车辆。(5)在消防车到来之前,以院安全消防组织成员为主,其余人员(尤其是教师)均有义务参加扑救。(6)消防车到来之后,一切听从消防指挥人员的指挥,校内人员配合消防专业人员扑救或做好辅助工作。(7)使用器具:灭火器、水桶、脸盆、铁锨,水浸的棉被等。(8)无关人员要远离火场和校内的固定消防栓,以便于消防车辆驶入。

4、扑救方法: (1)扑救固体物品火灾,如木制品,棉织品等,可使用各类灭火器具。 (2)扑救液体物品火灾,如汽油、柴油、食用油等,只能使用灭火器、沙土、浸湿的棉被等,绝对不能用水扑救。 三、设备问题(1)应每周检查机房的设备软硬件,确保事件早知道、早报告、早解决。(2)出现软件问题自己解决(回复、杀毒、安装、同传等)。(3)找到硬件问题原因,并协同教辅组老师一同解决。(4)查找问题出现的原因,本着实事求是以合作的姿态解决问题。(5)在正常工作日期间管理教师在规范使用的前提下,设备由于配件使用寿命到期等自然原因造成的损耗应作设备自然损耗处理。该机房管理教师只负责及时记录和报修。(6)在非工作日期间机房出现问题。比如说周末、寒假和暑假如何处理。需要建立工作日与非工作日交接制度。在非工作日期间由机房接收人负责管理并做相关记录,防止出现管理空白。

XX数据中心机房应急预案

数据中心机房应急预案 一、系统故障应急流程 1.1 系统故障应急流程说明 一、故障发生 XX运维服务人员可从以下途径得知故障的发生: 1)中心内场人员通过运维平台发现故障 2)外场人员通过维护巡检发现故障 3)用户发现故障,报给应急领导小组,或者XX运维微信群上报给中心服务工程师。 4)驻场工程师发现故障 二、报障受理 监控系统运维服务人员得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。 三、信息研判 运维服务人员根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。 四、预案启动 如需启动应急预案,则立刻通知应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。 五、资源确认 系统突发故障应急预案启动后,首先是根据现场突发故障实际状

况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源: 我公司技术支持人员; 相关厂家技术支持人员; 我公司聘请的技术专家 六、预案执行 按照既定的预案进行突发故障抢修,如遇到问题及时向应急领导小组汇报。 七、预案终止 预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报应急领导小组决定。 八、结果上报 预案中止后,相关预案参与人员将整个事件过程中所有收发信息、领导批示、事故调查报告、现场录像、图片等材料及时整理归档,并总结事件处理过程中的经验和教训,修改、完善事件应急预案。然后集中上报至应急领导小组。 应急流程管理报告填写指南 编号:(格式为D0405-日期+两位序列号,其中日期按“yyyy+mm+dd”格式,2位序列号根据日期从01起顺序递增,例如D0405-2010031401,表示2010年3月14日第1张应急流程管理报告。)报告日期:年月日至年月日(统计时间段)

机房应急预案-详细版

机房应急预案 随着我院信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是信息部门目前面临的一项重要任务。 为应对机房可能发生的突发事件,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。 1.1 机房突发事件分类 1.自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。 2.事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。 3.人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。 1.2 应急处理人员组织机构 1.3 应急机构人员岗位职责

1、应急总指挥职责 (1)保证在任何时间,及时协调应急行动所有涉及的岗位人员; (2)提供必须的紧急响应设备; (3)在紧急情况下全面负责紧急行动; (4)在必要时向外界求救,例如:119、110、120等。 2、应急副总指挥职责 (1)在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责; (2)根据获得的应急信息下达命令。 3、各相关设备负责人职责 (1)负责尽快收集信息向应急总指挥汇报事故情况; (2)负责现场临时设备抢救和对事态的控制; (3)听从上级指挥人员的指挥。 1.4 信息与网络安全突发事件处理原则 1.预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑信息与网络安全保障体系。 2.快速反应。突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。 3.分级负责。按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。 4.以人为本。把保障人员以及公共利益的安全作为首要任务。 5.常备不懈。加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规范化。

机房应急预案

机房应急预案 医院机房突发事故应急处理预案为确保医院机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,特制定本预案。 一、机房日常维护 1、建立健全机房管理制度 1.1 在正常工作日内,信息科负责对机房进行监控,主要职责是:巡视网络设备及系统的运行情况,发生异常情况及时处理,消除网络故障隐患。 1.2 节假日期间信息技术科人员轮流值班,负责处理有关异常情况。 1.3 机房采取来人来访登记制度,未经允许,无关人员不得进入医院机房区域。 2、机房内严格采取防雷、防火、防尘、防静电等措施。 3、认真做好数据备份工作,定期做一次数据库完全备份。 4、信息科对机房的主要网络设备(路由器、主干交换机等)发现异常情况应及时进行处理,确保整个医院网络的正常运行。 二、机房突发事件应急处置方案 1、电源系统应急预案 (1)当机房发生市电供电突然停电或是电源异常时。首先应和供电局联系确认正常停电以及预计停电时间。检查不间断电源的电池可

供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS 电源供电范围内的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。 (2)当确定停电时间超出机房UPS承载范围后,首先确定停电的范围以及受影响的设备范围。并及时通知各部门和支医院营销部做好停电应急准备。然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。 (3)在UPS 供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。 (4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。 (5)恢复供电后,严格按照操作程序逐步恢复机房设备和UPS 的供电,以防瞬间电流过大造成设备损坏。 2、网络和服务器络系统应急预案 (1)发生网络故障时,首先检查机房设备情况,确定网络故障的原因。 (2)确认原因后,首先启动备用线路和设备,保证网络的正常运行。然后联系网络维护人员,及时处理和排除故障。 (3)当确认原因为短时间无法恢复,应该及时向负责领导汇报,并向省医院相关部门汇报。然后通知各部门和支医院营销部,做好应急准备。然后再联系维护人员,及时处理故障。 (4)当人为或病毒破坏的故障发生时,具体按以下顺序进行:

机房应急处置预案_详细版

机房应急预案 随着XXX信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是信息部门目前面临的一项重要任务。 为应对机房可能发生的突发事件,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。 1.1机房突发事件分类 1?自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。 2.事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。 3.人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。 1.2应急处理人员组织机构

纽织机构框架图 1.3应急机构人员岗位职责 1、应急总指挥职责 (1)保证在任何时间,及时协调应急行动所有涉及的岗位人员; (2)提供必须的紧急响应设备; (3)在紧急情况下全面负责紧急行动; (4)在必要时向外界求救,例如:119、110、120等。 2、应急副总指挥职责 (1)在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;(2)根据获得的应急信息下达命令。 3、各相关设备负责人职责 (1)负责尽快收集信息向应急总指挥汇报事故情况; (2)负责现场临时设备抢救和对事态的控制;

(3)听从上级指挥人员的指挥 1.4信息与网络安全突发事件处理原则 1?预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信 息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑信息与网络安全保障体系。 2?快速反应。突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。 3.分级负责。按照谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。 4?以人为本。把保障人员以及公共利益的安全作为首要任务。 5.常备不懈。加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规范化。 1.5机房应急开关机具体措施 机房各设备关闭顺序如下:

数据中心应急预案[07]word版本

XX数据中心应急预案(试行) 江苏金智教育信息技术有限公司2011-07 一、紧急状态的界定 1.网络机房发生长时间停电(1 小时以上)、火灾、洪水、雷击以及其他外力破坏事件如人员触电事故等。 2.数据中心UPS 系统故障(逆变器告警、充电器告警、电池告警、以及旁路电源告警),UPS电池热熔起火,电池泄露。 3.主要网络设备、服务器设备1 台或以上严重故障或者被黑客攻击及病毒爆发。 4.重要设备发现被盗。 5.重大政治事件或紧急事件的发生。 上述情况任意一项发生界定为紧急状态,需要根据情况启动应急预案。 二、应急预案处理的组织实施流程 1.紧急状态发生后,值班人员应立即通知部门负责人和专责人员,并做适当的应急处理,部门负责人应该立即通知上级领导。 2.专责人员应立即赶到现场,确定事故处理方案并向部门负责人汇报情况。 3.部门负责人收到通知后应立即赶到现场并组织相关专业维护人员实施应急处理或故障处理。 4.部门负责人和专责人员在事故处理完毕后要向直接领导详细汇报情况,在领导的主持下对应急预案的执行情况进行分析、评估、总结。 5.每年应至少进行一次预案演练,必须保证相关成员参加。 三、应急预案处理的技术实施流程 (一)电源系统 1. 中心机房发生长时间停电(1小时以上)时,值班人员或UPS专责人员应及时通知数 据中心有关人员关掉UPS所供电的服务器设备,保证在UPS电池供电结束

前完成设备关闭。当电池容量告警时,UPS专责人员按操作程序逐一关闭系统 设备,恢复送电时及时启动系统并进行系统及业务使用验证工作,防止系统瘫痪。 2. 中心UPS系统故障(逆变器告警、充电器告警、电池告警,以及旁路电源告警) 时,UPS专责人员应认真检查设备的告警信息并做好记录。在不能及时维修好时 应及时与设备供货商联系尽快修复。 3. UPS系统在旁路工作状态时,应特别引起重视。如此时发生突然停电,将有可能 造成系统瘫痪。 4. 专责人员要做好UPS的日常检查,并做好记录。发现UPS电池泄露应联系厂家处 理。 5. UPS电池出现热熔冒烟,值班人员或UPS专责人员应立即关闭相关电池组供电开关, 切断直流供电系统。 (二)火灾事件 1.处置火灾事故的组织:物业管理值班人员,保卫处值班人员,数据中心人员。发现火情后应迅速组织有关人员携带消防器具赶赴现场采取必要的隔离措施隔离火灾并进行扑救, 及时关闭应用服务器和网络设备,断开事故部位电源。 2.报警程序:即刻通知部门领导、保卫处及相关部门值班人员,根据火情大小如 需报警立即就近用电话或手机报告消防中心(电话119),报告内容为:“xx 楼栋xxx机房发生火灾,请迅速前来扑救”,待对方放下电话后再挂机,派出人员到各 路口等待引导消防车辆。 3.扑救方法: 1)扑救固体物品火灾,如木制品,棉织品等,可使用各类灭火器具。 2)扑救液体物品火灾,如汽油、柴油、食用油等,只能使用灭火器、沙土、浸湿的棉被等,绝对不能用水扑救。 3)扑救UPS电池火灾,只能使用1211型灭火器或者干粉灭火器。 4 .注意事项:

机房火灾应急预案(精选5篇)

机房火灾应急预案(精选5篇) 机房火灾应急预案(精选5篇) 在平日的学习、工作和生活里,有时会突发一些不在预期的事故,为了避免事情更糟,时常需要预先编制应急预案。那么编制应急预案需要注意哪些问题呢?下面是WTT帮大家整理的机房火灾应急预案(精选5篇),仅供参考,大家一起来看看吧。 机房火灾应急预案1 第一条机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的物理破坏、人为失误造成的安全事件等等。针对突发事件的预防措施如下:建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘;建立备份电源系统;加强防火、防盗意识。 第二条机房漏水应急预案如下: 一、发生机房漏水时,第一目击者应立即通知机房管理人员。 二、若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,必要情况下可临时用电扇对服务器进行降温。 三、若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知工程人员及时清除积水,维修墙体或窗户,消除渗漏水隐患。

第三条机房火灾应急预案如下: 一、完善机房环境,确保机房放置灭火器;禁止携带易燃易爆物品进入机房。 二、机房管理人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理,掌握消防应急处理步骤、措施和要领,懂得灭火的方法,会扑救初起火源。 三、一旦发生火灾,迅速切断机房电源,避免灾情的扩散,并迅速和保安部联系必要时立即报火警。 第四条机房停电应急预案如下: 一、接到停电通知后,应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求在停电前停止业务、保存数据。 二、机房管理人员每日检查UPS电源的状态,确保在突发停电时,UPS电源能自动供应服务器正常工作15分钟以上,保证员工工作的数据及时保存。 第五条通信网络故障应急预案如下: 一、发生通信线路中断、流量异常等故障后,发现状况的员工或部门领导应及时通知网络管理员。二、网络管理员了解情况后,迅速组织检测故障区域,并作相关故障处理,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。 第六条服务器故障应急预案如下: 一、机房管理人员每日检查机房内各服务器状态。

机房应急预案处理办法

机房应急预案 随着我公司信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是信息部门目前面临的一项重要任务。 为应对机房可能发生的突发事件,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。 1.1 机房突发事件分类 1.自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。 2.事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。 3.人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。 1.2 应急处理人员组织机构员组织机构 1.3 应急机构人员岗位职责 1、应急总指挥职责 (1)保证在任何时间,及时协调应急行动所有涉及的岗位人员;(2)提供必须的紧急响应设备;(3)在紧急情况下全面负责紧急行动;(4)在必要时向外界求救,例如:119、110、120等。 2、应急副总指挥职责 (1)在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职

责;(2)根据获得的应急信息下达命令。 3、各相关设备负责人职责 (1)负责尽快收集信息向应急总指挥汇报事故情况;(2)负责现场临时设备抢救和对事态的控制;(3)听从上级指挥人员的指挥。 1.4 信息与网络安全突发事件处理原则 1.预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑信息与网络安全保障体系。 2.快速反应。突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。 3.分级负责。按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。 4.以人为本。把保障人员以及公共利益的安全作为首要任务。 5.常备不懈。加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规范化。 1.5 机房应急开关机具体措施 机房各设备关闭顺序如下:

机房应急预案

机房应急预案 机房应急预案 随着我中心信息化建设的不断深入,加强机房各类设备、系统以及信息网络安全等方面应对突发事件的处理能力将是信息部门目前的一项重要任务。 为应对机房可能发生的突发事件,将正在发生的或者已经发生事故 的损害程度减轻到最低,确保交易中心软硬件正常运行网络畅通,特制定本应急处置预案。 1.1机房突发事件分类 1.自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。 2.事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏 3.人为破坏:指人为破坏网络线路、通信设施、黑客攻击、病毒攻击、恐 怖袭击等引起的网络与信息系统的损坏 1.2应急处理人员组织机构

组织机构图 1.3信息与网络安全突发事件处理原则 1.预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各个方面的作用,共同构筑信息与网络安全保障体系。 2?快速反应。突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,快速处置,最大程度地减少危害和影响 3.分级负责。按照“谁主管,谁负责”的原则,建立和完善安全责

任制及联动工作机制。根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。 4.常备不懈。加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件的应急处置的科学化、程序化与规范化。 1.4网络设备、服务器及存储设备故障处理 1.4.1排错流程 硬件故障 服务器前面板相关 指示灯异常显示 查看系统日志、任务 管理器、程序状 态等 L 综合判断,列出原因 编写故障文档 故障发生 软件故障 判定 结束

机房应急预案

机房应急预案 第一章总则 第一条为确保XXXX单位机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建 立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体 系的目标,特制定本预案。 第二章机房突发事件分类 第二条自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。 第三条事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。 第四条人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。 第三章应急处理人员组织机构 第五条组织机构框架图:

第四章应急机构人员岗位职责 第六条应急总指挥职责 (一)保证在任何时间,及时协调应急行动所有涉及的岗位人员; (二)提供必须的紧急响应设备; (三)在紧急情况下全面负责紧急行动; (四)在必要时向外界求救,例如:119、110、120等。 第七条应急副总指挥职责 (一)在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;(二)根据获得的应急信息下达命令。 第八条各相关设备负责人职责 (一)负责尽快收集信息向应急总指挥汇报事故情况; (二)负责现场临时设备抢救和对事态的控制; (三)听从上级指挥人员的指挥。 第五章信息与网络安全突发事件处理原则 第九条预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应 急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥 各方面的作用,共同构筑信息与网络安全保障体系。 第十条快速反应。突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危 害和影响。 第十一条分级负责。按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。根据各负责人的职能,各司其职,加强各负责 人的协调与配合,共同履行应急处置工作的管理职责。 第十二条以人为本。把保障人员以及公共利益的安全作为首要任务。 第十三条常备不懈。加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公

机房停电事件应急预案

XXXXXX机房停电应急预案 (V 1.0) IT 运维 2008-11-4 目录

机房停电事件应急预案 1.总则 1.1目的 为更好的应对机房停电此类突发事件,提高处理各类停电事件的能力,建立健全可靠的应急机制,最大限度地降低各类停电事件对公司各部门的影响,参照《XXXX数据中心突发事件应急处理程序V2.1》,特制定《XXXX 机房停电事件应急预案》(以下简称预案)。 1.2工作原则 (1)预防为主。立足安全防护,加强预警,重点保护公司重要系统信息,数据安全。 (2)快速反应。发生突发事件时,《XXXX数据中心突发事件应急处理程序V2.1》,及时获取充分而准确的信息,迅速处置,最大程度地减少突发事件影响。 (4)坚持“统一领导、协调配合、明确责任、坚守岗位”的原则。 1.3适用范围 所有机房临时停电,突发停电以及较长时间停电的事件。 2.组织机构及职责 2.1组织机构(联系人名单及联系方式每半年更新一次) 规划运营:主要联系人及联系方式: IT 主要联系人及联系方式 Helpdesk:分机:XXXX。(7 X 24工作) 各主要设备供应商联系人及联系方式:

2.2各组织机构职责 1).规划运营部门应尽可能及时通知所有部门停电信息,且准备好应急措施,若需要柴油发电机工作应提前检查柴油机性能,输出电压是否稳定以及柴油等辅助设备是否充足。 2).IT部门应及时做好停电应急措施,通知各相关部门做好重要数据备份,并通知到机房设备供应商,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,IT所有相关人员在此期间必须保持随时待命状态。 3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;突发临时停电应尽可能做好远程技术支持工作。 3. IT部门应急预案 3.1机房长时间停电应急预案 ⑴接到长时间停电通知后,应询问停电原因及具体停电时间并及时通过System Helpdesk发布或电话通知停电公告,要求各部门尽可能在停电前停止业务、保存数据,关闭所有能关闭的用电设备。 ⑵根据停电时间长短情况,协同规划运营部门部署应急措施,检查应急设备是否正常,若时间条件许可模拟停电测试应急设备性能。 (3) 对机房设备用电做好统计,做好拉闸限电预案。 (4) 各相关技术支持人员部署到位,确保停电期间重要系统和设备运行正常,以及恢复供电后所有系统,设备运行正常。 (5)通知相关部门,停电期间加强对存在安全隐患的设备及区域的巡查(如电梯间,水房等),保障公司人员和财产安全。 (6) 机房管理人员详细记录事件原因及此期间采取的应急措施,备

信息化管理中心机房故障应急预案

信息化管理中心机房故障应急预案 为科学应对网络与信息安全突发事件,提高信息化管理中心机房处理突发信息化网络事件的能力,建立健全信息化安全机制,有效预防、及时控制和最大限度地消除信息化安全各类突发事件的危害和影响,特制订信息化管理中心机房故障应急预案。 本预案坚持“统一领导、协调配合、明确责任、依法规范、条块结合、整合资源、防范为主、加强监控”的原则。适用于信息化管理中心机房可能发生的网络与信息化安全突发事件。 信息化管理中心成立信息化安全小组,为信息化管理中心常设机构。应急小组组长:冯立强;副组长:郭永明;组员:李松洋,宋智恒。 一、机房漏水防治应急预案 ⑴ 发生机房漏水后,第一目击者应立即通知网络与信息化安全小组。 ⑵ 若空调系统出现渗漏水,应立即停止故障空调,将机房内的积水清除干净,并及时联系设备供应方进行处理,必要情况下可以临时用电扇对服务器进行降温。

⑶ 若为墙体或窗户渗漏水,应立即通知总公司办公室,及时清除积水,进行墙体或窗户维修,避免不必要的损失。 二、设备发生被盗或人为损害事件应急预案 ⑴ 发生设备被盗或有人为损害设备情况时,使用者或管理者应立即报告信息化安全小组,同时保护好现场。 ⑵信息化安全小组接报后,通知安全保卫部门及公安部门,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。 ⑶ 事件当事人应当积极配合公安部门进行调查,并将有关情况向信息化安全小组汇报。 ⑷ 信息化安全小组召开会议研讨,事态严重时,应向集团总公司相关领导报告,请示进一步处理的决策。 三、机房长时间停电应急预案 接到长时间停电通知后,应及时通过网站发布或电话通知停电通告,要求内网用户在停电前停止办公、保存数据并正常关机。由于中心机房UPS供电设计时间为2小时,故在停电1小时50分后,应当关闭所有机房内设备。 四、通信网络故障应急预案 ⑴ 发生通信网络故障后,计算机操作员应及时将信息告知信息化安全小组,并通知负责人员进行处理。

网络运维-机房应急预案

网络运维小组应急预案 随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。 本预案共分为应用系统故障应急流程和机房突发事件应急流程 系统故障应急流程 一、系统故障应急流程说明 1、故障发生 系统运维服务小组可从以下途径得知故障的发生: 1.1、运维服务中心通过网管告警发现故障 1.2、维护站点通过维护巡检发现故障 1.3、用户发现故障,报给呼叫中心 1.4、驻场工程师发现故障 2、报障受理 监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。 3、信息研判 运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。 4、预案启动 如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。 5、资源确认

系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源: 我公司技术支持人员; 相关厂家技术支持人员; 我公司聘请的技术专家 6、预案执行 按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。 7、预案终止 预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。 8、结果上报 预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领导小组。

数据中心机房应急预案23920

中心机房应急预案及管理办法 第一章总则 第一条为规范我所网络中心机房设备管理,提高处理机房突发事件的能力,形成科学、有效、反应迅速的应急工作机制,确保重要计算机信息系统的实体安全、运行安全和数据安全,最大限度地减少突发事件造成的危害,根据《中华人民共和国计算机信息系统安全保护条例》、《信息化建设员工遵循守则》及《企业信息安全管理制度》等相关管理规定等,制定《网络中心机房应急预案及管理办法》(以下简称管理办法)。 第二条本文件适用于有计划性、有预防性地管理我所的网络中心机房以及发生和可能发生的与机房有关的突发事件。 第三条信管部负责编制、修订网络中心机房管理办法及所辖范围内突发机房事件应急预案。周期性或即时性地向局域网用户发布系统安全警示;对异常流量来源进行监控,并妥善处理各种异常情况。及时组织专业技术人员对所辖范围内机房突发事件进行应急处置;负责调查和处理机房突发事件,及时上报并按照相关规定作好善后工作。 第二章中心机房管理办法 第四条机房内的所有设备需要定期保养,应指定人员做维护、清洁工作,做到两天一收拾,一周一打扫;严禁将各种食物、饮用品带入机房,在机房内禁止吸烟。 第五条计算机设备维修工作由专门人员进行,管理人员应把设备的检修情况记录在相应的设备卡上,以便统一归档管理。如发现机房设备故障应及时向上级领导报告,并负责计算机及外设的日常维护与排除故障,在遇到设备保修范围内的故障时,应及时催促供应单位上门或将机器送修; 第六条系统管理人员必须严格遵守有关机房、设备及系统运行管理规定,不得在机房内从事与系统管理、运行维护、系统安装和调测等无关的工作; 第七条如其他人员需使用机房内设备应向机房负责人提交申请,经主管人员审核签字后,将书面申请提交信管部存档后方可借用机房内的设备; 第八条做好防火、防雨、防湿、防盗工作,注意用电安全;机房内的环境要每周检查温度、

中心机房应急预案

中心机房应急预案 一、系统故障应急流程 1.1 系统故障应急流程说明 一、故障发生 系统运维服务小组可从以下途径得知故障的发生: 1)运维服务中心通过网管告警发现故障 2)维护站点通过维护巡检发现故障 3)用户发现故障,报给呼叫中心 4)驻场工程师发现故障 二、报障受理 监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。 三、信息研判 运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。 四、预案启动 如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。 五、资源确认 系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源: 我公司技术支持人员; 相关厂家技术支持人员; 我公司聘请的技术专家

另外,如果现有资源不能满足应急需要的,可同时启动我公司内部的资源应急调度流程。 六、预案执行 按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。 七、预案终止 预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。 八、结果上报 预案中止后,相关预案参与人员将整个事件过程中所有收发信息、领导批示、事故调查报告、现场录像、图片等材料及时整理归档,并总结事件处理过程中的经验和教训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领导小组。 应急流程管理报告填写指南 编号:(格式为D0405-日期+两位序列号,其中日期按“yyyy+mm+dd”格式,2位序列号根据日期从01起顺序递增,例如D0405-2010031401,表示2010年3月14日第1张应急流程管理报告。) 报告日期:年月日至年月日(统计时间段) 报告人签名:服务主管签名:

相关主题
文本预览
相关文档 最新文档