网络运维与机房应急处置预案
- 格式:doc
- 大小:181.00 KB
- 文档页数:12
机房维护应急预案一、前言机房作为信息系统的核心枢纽,承载着大量关键业务和数据。
为了确保机房的稳定运行,预防和应对可能出现的各类故障和紧急情况,特制定本机房维护应急预案。
二、应急组织机构及职责1、应急指挥小组由机房主管领导担任组长,成员包括技术负责人、运维人员等。
其职责是全面负责应急处理工作的指挥和协调,制定应急策略,下达应急指令。
2、技术保障小组由资深技术人员组成。
负责对机房设备和系统进行故障诊断和修复,提供技术支持和解决方案。
3、后勤保障小组负责应急物资的准备和调配,保障应急处理过程中的物资供应和人员生活需求。
4、安全保障小组负责维护应急处理现场的安全秩序,防止意外事故的发生。
三、预防措施1、设备定期巡检制定详细的设备巡检计划,对服务器、网络设备、电力设备等进行定期检查,及时发现潜在问题并进行处理。
2、数据备份建立完善的数据备份策略,定期对重要数据进行备份,并将备份数据存储在安全的地方,以防止数据丢失。
3、环境监控安装环境监控系统,实时监测机房的温度、湿度、电力等参数,确保机房环境处于正常范围。
4、应急预案演练定期组织应急预案演练,让相关人员熟悉应急处理流程,提高应对紧急情况的能力。
四、应急响应流程1、故障监测与报告通过监控系统或用户反馈,及时发现机房故障。
运维人员应立即向应急指挥小组报告故障情况。
2、故障评估应急指挥小组组织技术人员对故障进行评估,确定故障的严重程度和影响范围。
3、应急启动根据故障评估结果,启动相应的应急预案。
通知各应急小组进入应急状态,按照分工开展工作。
4、故障处理技术保障小组迅速采取措施进行故障处理,尝试恢复系统正常运行。
在处理过程中,要及时记录处理步骤和结果。
5、恢复与验证故障排除后,对系统进行全面的恢复和验证,确保系统稳定运行。
同时,对故障原因进行深入分析,总结经验教训,完善应急预案。
五、常见故障及应急处理方法1、电力故障(1)若出现市电停电,立即切换到备用电源(如 UPS 电源),并通知电力部门尽快恢复市电供应。
运维系统及中心机房应急预案运维中心机房是企业信息化建设的重要组成部分,同时也是企业支持业务稳定运行的核心数据中心。
然而,由于机房内设备众多,运行环境复杂,遇到紧急情况可能造成严重的后果。
因此,建立完善的应急预案非常必要。
本文将围绕运维系统及中心机房的应急预案展开。
一、应急预案的必要性1、降低事故造成的损失任何机房事故都可能对企业信息安全和业务运行造成损失。
建立应急预案,提前对各种应急情况进行规划和预测,可以最大限度地减少机房事故带来的影响和损失。
2、提高应对突发事件的能力建立应急预案可以统筹规划各种应急情况的应对措施,让事故发生时机房管理人员能够快速、准确地做出决策,控制事态发展,最大限度地保障业务运转。
3、提升机房的安全性机房是企业信息化建设的核心,建立应急预案不仅可以提高机房的应急响应能力,还可以更好地保障机房的安全和稳定。
二、应急预案的主要内容应急预案通常包括以下几部分:1、应急组织机构应急组织机构是整个应急预案的核心部分,需要明确各级机构的组成、职责、联系方式等信息。
具体包括应急指挥中心、应急领导小组、应急专家组、应急技术组、部门应急小组等。
2、应急响应流程应急响应流程是应急预案的重要组成部分,需要制定各种突发事件的应对流程和具体步骤,并明确应急响应的级别、响应时间、决策程序、应急措施等信息。
3、应急资源清单应急资源清单是按照应急预案建立的资源储备库。
需要对机房的各种设备和资源进行详细的梳理整理,并明确资源的使用条件和分配方式。
4、应急测试计划应急测试计划是在平时需要对应急预案进行演练和测试,以便发现短板和问题,并及时修复。
测试计划需要确定测试的内容、时间、测试方式及测试人员等信息。
5、应急修复记录应急修复记录是每次应急事件的过程和结果的详细记录,可以为今后类似事件的应急处理提供参考和借鉴。
三、应急预案实践实践证明,应急预案仅仅是纸面文件是远远不够的,只有在平时的日常管理工作中,把应急预案落实到实践操作中,才能提高应急响应的能力和效率。
机房应急预案(通用8篇)第一篇:机房应急预案—总则1.目的与依据为确保机房运营的安全及稳定,迅速应对突发事件,减少故障对业务的影响,制定本应急预案,旨在提供详细的应急管理流程和操作指南。
2.适用范围本预案适用于所有机房工作人员,包括但不限于操作维护人员、管理人员、安全人员等。
3.术语与缩略语3.1 应急预案:为有效应对突发事件而制定的一系列应急管理措施和操作指南。
3.2 机房:指存放计算机设备、网络设备及相关设备的房间。
3.3 突发事件:指可能影响机房运营的紧急情况,包括但不限于火灾、水灾、停电等。
4.责任分工4.1 机房经理:负责指导机房日常运维工作及应急响应。
4.2 安全专员:负责机房安全检查、应急培训等工作。
4.3 运维人员:负责机房设备的日常管理维护。
4.4 其他相关人员:按照职责进行应急任务执行和配合。
5.紧急联系人员5.1 机房经理:姓名、联系方式5.2 安全专员:姓名、联系方式5.3 运维人员:姓名、联系方式6.机房应急设备6.1 灭火器材:火灾报警器、灭火器、灭火器柜等。
6.2 应急照明设备:应急照明灯、应急出口指示灯等。
6.3 紧急通信设备:手机、对讲机、应急广播设备等。
附件:1. 突发事件应急处置流程图2. 机房紧急联系人名单法律名词及注释:1. 突发事件应急处置法:根据突发事件的性质和程度,针对突发事件的发生和处置提供法律保障。
2. 《安全生产法》:中华人民共和国国家立法,旨在保障生产经营单位的人员安全和设施设备安全,维护社会稳定和人民生命财产安全。
一、编制目的为确保网络机房设备稳定运行,提高网络服务质量和用户满意度,制定本应急预案,明确网络机房设备维护流程、应急响应措施和责任分工,以便在发生设备故障时能够迅速、有效地进行处理,降低故障影响。
二、编制依据1. 《中华人民共和国电信条例》2. 《国家通信保障应急预案》3. 《中华人民共和国计算机信息系统安全保护条例》4. 《计算机病毒防治管理办法》5. 企业内部相关规定三、适用范围本预案适用于公司网络机房设备维护过程中发生的各类故障,包括但不限于硬件故障、软件故障、网络故障等。
四、组织机构及职责1. 应急指挥部负责组织、协调、指挥网络机房设备维护应急工作,制定应急响应措施,对应急工作进行监督、检查和总结。
2. 应急小组由网络运维部门、技术支持部门、安全部门等组成,负责具体实施应急响应措施,包括故障排查、设备修复、网络恢复等。
(1)网络运维部门:负责网络设备、服务器等硬件设备的日常维护和故障处理。
(2)技术支持部门:负责软件系统、数据库等软件设备的维护和故障处理。
(3)安全部门:负责网络安全事件的处理,包括病毒防治、入侵检测等。
五、应急响应流程1. 故障发现(1)用户报告:用户发现网络故障后,及时向网络运维部门报告。
(2)网络运维部门确认:网络运维部门根据用户报告,确认故障现象,初步判断故障原因。
2. 故障上报(1)网络运维部门将故障情况上报应急指挥部。
(2)应急指挥部根据故障情况,决定是否启动应急预案。
3. 应急响应(1)应急小组根据故障情况,迅速开展故障排查工作。
(2)应急小组根据排查结果,制定故障处理方案。
4. 故障处理(1)应急小组按照故障处理方案,进行设备修复、软件升级、网络恢复等工作。
(2)故障处理过程中,确保网络安全,防止故障扩大。
5. 故障恢复(1)故障处理后,进行测试,确保网络设备正常运行。
(2)将故障处理情况报告应急指挥部。
6. 应急结束(1)应急指挥部根据故障处理情况,决定是否结束应急响应。
机房应急处置预案一、背景介绍随着信息技术的快速发展,机房逐渐成为企事业单位和政府机构关键的信息中心。
然而,机房在运行过程中难免会遇到各种故障和突发事件,如停电、网络故障、设备故障等,对正常的运行造成了严重威胁。
为了保障机房运行的安全和稳定,建立一套完善的机房应急处置预案势在必行。
二、应急处置流程1. 应急响应一旦发生机房故障或突发事件,应立即启动应急响应流程。
首先,通过监控系统获取故障信息,并及时通知相关人员,包括机房管理员、IT技术人员等。
同时,启动备用设备,确保机房运行不中断。
2. 问题分析与定位在收到故障信息后,相关人员需快速分析和定位问题。
通过检查设备运行状态、网络连接状况等,确定故障的具体原因和范围。
在此过程中,需保持清晰的思路和快速反应能力,以便尽快恢复机房正常运行。
3. 应急措施与故障解决针对不同的故障类型,制定相应的应急措施。
比如,对于设备故障,可尝试重新启动或更换备用设备;对于网络故障,可进行线路检测和调试;对于停电问题,需与供电部门紧急联系,争取尽快恢复供电。
4. 恢复与验证在确定故障已经解决后,需对机房进行全面检查和验证。
确保所有设备和网络连接正常,以免留下潜在的问题。
同时,对故障的原因进行总结和分析,为后续的防范工作提供经验和教训。
三、应急预案的制定与演练为了保障机房应急工作的有效性,机构应制定详细的应急预案,并且定期进行演练和验证。
应急预案应包括以下内容:1. 应急团队及职责:明确应急团队的组成和成员的职责分工,确保各岗位职责明确,配合默契。
2. 应急联系人员:列出应急联系人员的名单和联系方式,包括机房管理员、IT技术人员、供电部门等。
3. 应急设备备份:明确备用设备的存放地点和维护保养方式,保障备用设备的可用性。
4. 应急演练计划:制定详细的应急演练计划,包括演练时间、内容和评估要点,确保演练的科学性和有效性。
5. 应急处置流程:定义详细的应急处置流程,包括故障响应、问题分析定位、应急措施与故障解决、恢复与验证等环节。
一、预案背景随着信息技术的快速发展,机房已成为企业、机构等单位的重要基础设施。
机房突发故障可能导致数据丢失、系统瘫痪、业务中断等问题,给企业或机构带来巨大的损失。
为保障机房安全稳定运行,提高应急处置能力,特制定本预案。
二、预案目标1. 保障机房设备正常运行,确保业务连续性。
2. 快速定位故障原因,采取有效措施进行修复。
3. 最大程度降低故障对业务的影响,减少损失。
4. 提高机房运维人员应对突发故障的能力。
三、组织机构1. 成立机房故障应急处理小组,负责组织、协调、指挥机房故障应急处理工作。
2. 小组成员包括:机房运维负责人、网络工程师、安全工程师、业务部门负责人等。
四、应急响应流程1. 故障发现(1)机房运维人员发现故障时,应立即向应急处理小组报告。
(2)应急处理小组接到报告后,应迅速展开调查,初步判断故障原因。
2. 故障确认(1)应急处理小组根据初步判断,进行故障确认,确定故障范围。
(2)通知相关业务部门,做好业务调整准备。
3. 应急处置(1)根据故障原因,采取相应措施进行修复。
(2)对故障设备进行检测、维护、更换等操作。
(3)确保故障设备恢复正常运行。
4. 业务恢复(1)故障设备恢复正常后,通知相关业务部门,进行业务恢复。
(2)对业务恢复情况进行跟踪,确保业务正常运行。
5. 故障总结(1)应急处理小组对故障原因、处理过程、恢复情况进行总结。
(2)提出改进措施,防止类似故障再次发生。
五、应急保障措施1. 建立机房设备台账,确保设备信息准确、完整。
2. 定期对机房设备进行巡检、维护,确保设备正常运行。
3. 加强机房安全管理,防止人为因素导致故障。
4. 定期对应急处理小组成员进行培训,提高应急处置能力。
5. 配备必要的应急物资,如备用电源、网络设备等。
六、预案实施与修订1. 本预案由机房运维负责人负责组织实施。
2. 本预案自发布之日起实施,如有需要,可进行修订。
通过本预案的实施,提高机房运维人员应对突发故障的能力,确保机房安全稳定运行,为业务连续性提供有力保障。
一、前言为确保运维作业过程中发生突发事件时,能够迅速、有效地进行处置,最大限度地减少事故损失,保障员工生命财产安全,根据国家有关法律法规和公司相关规定,特制定本运维作业应急预案。
二、适用范围本预案适用于公司所有运维作业现场,包括但不限于数据中心、机房、网络设备、服务器、存储设备等。
三、组织架构1. 应急指挥部:负责统一指挥、协调、决策和指挥应急响应行动。
2. 应急救援组:负责现场救援、人员疏散、医疗救护等工作。
3. 技术保障组:负责现场设备、系统故障的排查、修复和恢复。
4. 信息保障组:负责应急信息收集、发布、报送和舆论引导。
5. 后勤保障组:负责应急物资、车辆、通信设备等后勤保障。
四、应急预案内容1. 事故预警(1)加强日常巡检,及时发现异常情况,提前预警。
(2)建立应急值班制度,确保24小时有人值班。
2. 事故响应(1)接到事故报告后,立即启动应急预案。
(2)应急指挥部迅速组织相关人员赶赴现场。
(3)应急救援组立即开展现场救援、人员疏散和医疗救护。
(4)技术保障组立即排查故障原因,进行修复和恢复。
(5)信息保障组及时收集、发布和报送应急信息。
3. 事故处理(1)针对不同类型的事故,采取相应的处置措施。
(2)对事故原因进行调查分析,制定整改措施。
(3)对事故现场进行清理,确保恢复正常运行。
4. 应急结束(1)事故得到有效控制,恢复正常运行。
(2)应急指挥部宣布应急结束。
(3)对应急响应过程进行总结,评估应急效果。
五、应急保障措施1. 物资保障:储备必要的应急物资,如急救药品、食品、饮用水、帐篷等。
2. 人员保障:组织应急队伍,明确各岗位职责。
3. 车辆保障:配备应急车辆,确保应急物资和人员快速到达现场。
4. 通信保障:确保应急通信畅通,确保信息及时传递。
六、培训与演练1. 定期组织应急培训,提高员工应急意识和应急处置能力。
2. 定期开展应急演练,检验应急预案的可行性和有效性。
3. 根据演练情况,不断优化应急预案,提高应急响应能力。
1.1 编制目的为预防和减少机房网络安全事件的发生,确保机房网络安全稳定运行,保障公司业务连续性,提高网络安全应急处理能力,特制定本预案。
1.2 编制依据《中华人民共和国网络安全法》、《信息安全技术信息安全事件分类分级指南》(GB/Z 20986-2007)等相关法律法规。
1.3 适用范围本预案适用于公司所有机房网络安全事件的应对与处置工作。
二、组织机构与职责2.1 应急领导小组成立机房网络安全事件应急领导小组,负责组织、协调、指挥机房网络安全事件应急处置工作。
2.2 应急小组应急领导小组下设应急小组,负责具体实施机房网络安全事件应急处置工作。
2.3 各部门职责(1)技术支持部门:负责网络安全事件的检测、分析、处理和恢复。
(2)运维部门:负责机房设备的监控、维护和故障处理。
(3)安全管理部门:负责制定、修订和宣传网络安全政策,组织开展网络安全培训。
(4)行政管理部门:负责协调各部门开展应急处置工作。
三、监测与预警3.1 监测(1)实时监测机房网络流量、设备状态、系统日志等信息,及时发现异常情况。
(2)定期进行网络安全风险评估,发现潜在安全风险。
(1)对监测到的异常情况,及时进行分析和评估,确定事件级别。
(2)根据事件级别,启动相应的应急预案。
四、应急处置4.1 事件报告(1)发现网络安全事件后,立即向应急领导小组报告。
(2)应急领导小组接到报告后,立即组织应急小组进行处置。
4.2 应急响应(1)根据事件级别,启动相应的应急预案。
(2)应急小组按照预案要求,开展应急处置工作。
4.3 应急结束(1)事件得到有效控制,恢复正常运行后,应急领导小组宣布应急结束。
(2)应急小组对事件进行总结,分析原因,提出改进措施。
五、预防工作5.1 日常管理(1)加强网络安全意识培训,提高员工网络安全防范意识。
(2)定期开展网络安全检查,及时消除安全隐患。
5.2 演练定期组织网络安全应急演练,提高应急处置能力。
5.3 宣传加强网络安全宣传,提高员工网络安全意识。
一、概述为保障机房设备安全,降低机房受损带来的影响,确保业务连续性,特制定本机房受损应急预案。
本预案适用于机房发生各类设备故障、火灾、自然灾害等突发事件时,对机房受损的应急处理。
二、组织机构1.应急指挥部:负责统筹协调机房受损应急工作,制定应急响应措施,组织各部门开展应急行动。
2.应急小组成员:由设备管理、网络安全、运维、行政等部门人员组成,负责具体实施应急响应措施。
三、应急响应流程1.发现机房受损情况(1)运维人员发现机房受损情况后,立即向应急指挥部报告。
(2)应急指挥部确认受损情况,启动应急预案。
2.应急响应措施(1)切断受损设备电源,防止火势蔓延。
(2)立即通知相关部门,如设备供应商、消防部门等。
(3)组织应急小组成员对受损设备进行抢修。
(4)对受损设备进行安全评估,确保抢修过程中人员安全。
3.应急恢复措施(1)根据受损情况,制定恢复方案。
(2)组织应急小组成员进行设备修复、数据恢复等工作。
(3)对受损设备进行安全检查,确保恢复正常运行。
4.应急结束(1)应急指挥部确认机房恢复正常运行,宣布应急结束。
(2)对应急响应过程进行总结,完善应急预案。
四、应急保障措施1.人员保障:应急小组成员应具备一定的技术能力和应急处置能力,确保应急响应工作顺利进行。
2.物资保障:储备必要的应急物资,如灭火器、防毒面具、急救药品等。
3.通信保障:确保应急期间通信畅通,及时传递应急信息。
4.信息保障:对受损设备进行数据备份,确保业务连续性。
五、应急演练1.定期组织应急演练,提高应急小组成员的应急处置能力。
2.根据演练情况,完善应急预案,提高应急响应效率。
六、附则1.本预案由机房管理部门负责解释。
2.本预案自发布之日起实施。
网络运维小组应急预案随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。
为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。
本预案共分为应用系统故障应急流程和机房突发事件应急流程系统故障应急流程一、系统故障应急流程说明1、故障发生系统运维服务小组可从以下途径得知故障的发生:1.1、运维服务中心通过网管告警发现故障1.2、维护站点通过维护巡检发现故障1.3、用户发现故障,报给呼叫中心1.4、驻场工程师发现故障2、报障受理监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。
3、信息研判运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。
4、预案启动如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。
5、资源确认系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源:我公司技术支持人员;相关厂家技术支持人员;我公司聘请的技术专家6、预案执行按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。
7、预案终止预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。
8、结果上报预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。
然后集中上报至系统突发故障应急领导小组。
二、系统故障应急处理流程图机房突发事件应急流程一、机房突发事件分类1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。
2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。
3、人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。
二、应急处理人员组织机构三、应急机构人员岗位职责1、应急总指挥职责1.1、保证在任何时间,及时协调应急行动所有涉及的岗位人员;1.2、提供必须的紧急响应设备;1.3、在紧急情况下全面负责紧急行动;1.4、在必要时向外界求救,例如:119、110、120等。
2、应急副总指挥职责2.1、在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;2.2、根据获得的应急信息下达命令。
3、各相关设备负责人职责3.1、负责尽快收集信息向应急总指挥汇报事故情况;3.2、负责现场临时设备抢救和对事态的控制;3.3、听从上级指挥人员的指挥。
四、突发事件处理原则1.预防为主。
立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑安全保障体系。
2.快速反应。
突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。
3.分级负责。
按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。
根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。
4.以人为本。
把保障人员以及公共利益的安全作为首要任务。
5.常备不懈。
加强技术储备,规应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规化。
五、机房应急开关机具体措施机房各设备关闭顺序如下:六、机房日常维护1、建立健全机房管理制度1.1在正常工作日,信息技术部人员负责对机房进行监控,主要职责是:巡视网络设备及系统的运行情况,发生异常情况及时处理,消除网络故障隐患。
1.2节假日期间技术人员轮流值班,负责处理有关异常情况。
1.3机房采取来人来访登记制度,未经允许,无关人员不得进入公司机房区域。
2、机房严格采取防雷、防火、防尘、防静电等措施以及机房24小时监控等措施。
3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况。
4、对机房的主要网络设备(路由器、主干交换机等)进行工作时间全程监控,发现异常情况应及时进行处理,确保整个网络的正常运行。
七、服务器及存储设备故障处理1、排错流程2、应急处置具体措施2.1 机房漏水应急预案(1)发生机房漏水时,第一目击者应立即通知运维服务小组,并及时报告监控系统突发故障应急领导小组。
(2)若空调系统出现渗漏水,运维服务小组负责人应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进行降温。
(3)若为墙体或机房门渗漏水,运维服务小组负责人应立即采取有效措施确保机房安全,及时清除积水,维修墙体或门窗,消除渗漏水隐患。
2.2 设备发生被盗或人为损害事件应急预案(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告系统突发故障应急领导小组,同时保护好现场。
(2)系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
(3)事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系统突发故障应急领导小组汇报。
(4)系统突发故障应急领导小组安排运维服务小组、事发单位及时恢复系统正常运行,并对事件进行调查。
运维服务小组和事发单位应在调查结束后一日书面报告系统突发故障应急领导小组。
事态或后果严重的,应向相关领导汇报。
2.3 机房长时间停电应急预案(1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案进行处置:(2)当机房发生市电供电突然停电或是电源异常时。
首先应和后勤部门联系确认正常停电以及预计停电时间。
检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电围的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。
(3)当确定停电时间超出机房UPS承载围后,首先确定停电的围以及受影响的设备围。
并及时通知各部门做好停电应急准备。
然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。
在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。
(4)当确定停电原因是在本身供电系统围,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。
对于恢复时间无法预计的,要通知后勤部门做好柴油机发电及移动电源车供电准备(5)恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。
2.4 通信网络故障应急预案(1)发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应及时通知本单位信息系统管理员,经初步判断后及时上报运维服务小组和系统突发故障应急领导小组。
(2)运维服务小组接报告后,应及时查清通信网络故障位置,隔离故障区域,并将事态及时报告系统突发故障应急领导小组,通知相关通信网络运营商查清原因;同时及时组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
(3)事态或后果严重的,应向应急指挥办公室和相关领导汇报。
(4)应急处置结束后,运维服务小组应将故障分析报告,在调查结束后一日书面报告系统突发故障应急领导小组。
2.5 不良信息和网络病毒事件应急预案(1)发现不良信息或网络病毒时,信息系统管理员应立即断开网线,终止不良信息或网络病毒传播,并报告指挥调度中心运维服务小组和系统突发故障应急领导小组。
(2)运维服务小组应根据系统突发故障应急领导小组指令,采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。
(3)事态或后果严重的,应向监控中心办公室和相关领导汇报。
(4)处置结束后 ,运维服务小组应将事发经过、造成影响、处置结果在调查工作结束后一日书面报告系统突发故障应急领导小组。
2.6 服务器软件系统故障应急预案(1)发生服务器软件系统故障后,运维服务小组负责人应立即组织启动备份服务器系统,由备份服务器接管业务应用,并及时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据。
(2)运维服务小组应根据系统突发故障应急领导小组的指令,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理。
(3)事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。
(4)处置结束后,运维服务小组应将事发经过、处置结果等在调查工作结束后一日报告系统突发故障应急领导小组。
2.7 黑客攻击事件应急预案(1)当发现网络被非法入侵、网页容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告系统突发故障应急领导小组。
(2)接报告后,系统突发故障应急领导小组应立即指令运维服务小组核实情况,关闭服务器或系统,修改防火墙和路由器的过滤规则,封锁或删除被攻破的登陆,阻断可疑用户进入网络的通道。
(3)运维服务小组应及时清理系统,恢复数据、程序,恢复系统和网络正常;情况严重的,应向监控中心应急指挥办公室和相关领导汇报,并请求支援。
(4)处置结束后 ,运维服务小组应将事发经过、处置结果等在调查工作结束后一日报告系统突发故障应急领导小组。
2.8 核心设备硬件故障应急预案(1)发生核心设备硬件故障后,运维服务小组应及时报告系统突发故障应急领导小组,并组织查找、确定故障设备及故障原因,进行先期处置。
(2)若故障设备在短时间无法修复运维服务小组应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。
(3)运维服务小组故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联系相关厂商,认真填写设备故障报告单备查。
(4)事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。
2.9 业务数据损坏应急预案(1)发生业务数据损坏时,运维服务小组应及时报告系统突发故障应急领导小组,检查、备份业务系统当前数据。