电子政务运维中心机房应急预案
- 格式:docx
- 大小:43.74 KB
- 文档页数:10
一、背景随着我国信息化建设的不断深入,电子政务已成为推动政府职能转变、提高行政效率、促进社会服务创新的重要手段。
然而,电子政务系统在运行过程中,也面临着诸多安全风险和挑战。
为有效应对各类安全事件,保障电子政务系统的稳定运行,特制定本预案。
二、组织架构1. 领导小组:成立电子政务应急预案领导小组,负责统一领导、指挥和协调电子政务网络安全应急工作。
2. 工作小组:下设应急指挥部、技术支持组、信息保障组、后勤保障组、宣传报道组等,负责具体实施应急预案。
三、应急预案1. 预警信息(1)建立预警信息收集机制,密切关注国内外网络安全动态,及时发现潜在安全风险。
(2)对电子政务系统进行定期安全检查,发现安全隐患及时整改。
2. 应急响应(1)事件发现:一旦发现电子政务系统发生安全事件,立即上报领导小组。
(2)应急响应:领导小组根据事件等级,启动相应级别的应急响应程序。
(3)应急处置:按照应急预案要求,开展事件调查、分析、处置等工作。
3. 应急恢复(1)事件调查:查明事件原因、影响范围及损失情况。
(2)恢复重建:根据事件调查结果,制定恢复重建方案。
(3)恢复实施:按照恢复重建方案,逐步恢复电子政务系统功能。
4. 总结评估(1)应急结束后,对整个事件进行总结评估,分析应急过程中的不足。
(2)根据评估结果,修订和完善应急预案。
四、保障措施1. 加强网络安全意识教育,提高全体工作人员的安全防范意识。
2. 定期开展网络安全培训,提高应急队伍的应急处置能力。
3. 加强网络安全技术防护,确保电子政务系统安全稳定运行。
4. 建立网络安全监测预警机制,及时发现和处置网络安全事件。
5. 建立应急物资储备库,确保应急物资充足。
五、附则1. 本预案自发布之日起实施。
2. 本预案由电子政务应急预案领导小组负责解释。
3. 本预案如有未尽事宜,由领导小组根据实际情况进行修订。
一、前言随着信息化建设的不断推进,机房已成为企事业单位的重要基础设施。
为确保机房在突发事件发生时能够迅速、有效地进行应急处理,最大限度地减少损失,特制定本应急预案。
二、适用范围本预案适用于我单位所有机房,包括数据中心、网络设备室、服务器机房等。
三、组织机构及职责1.成立机房应急指挥部,负责组织、协调、指挥机房应急工作。
2.设立应急小组,负责具体实施机房应急措施。
(1)组长:负责组织、协调、指挥应急工作。
(2)副组长:协助组长工作,负责应急物资的储备和调配。
(3)成员:负责机房设备、环境、安全等方面的监控和应急处理。
四、应急响应1.预警阶段(1)密切关注机房设备运行状况,发现异常情况立即上报。
(2)根据预警信息,启动应急预案,通知相关人员。
2.应急响应阶段(1)应急小组接到通知后,立即到达现场,了解情况。
(2)根据现场情况,采取相应措施,确保机房安全稳定运行。
(3)如遇设备故障,立即进行维修或更换。
(4)如遇环境异常,立即采取相应措施,确保机房环境恢复正常。
(5)如遇安全事故,立即启动应急预案,进行救援和处理。
3.应急恢复阶段(1)恢复正常运行后,对应急过程进行总结,分析原因,提出改进措施。
(2)加强机房设备、环境、安全等方面的监控,防止类似事件再次发生。
五、应急保障1.物资保障(1)储备必要的应急物资,如备用电源、维修工具、应急通讯设备等。
(2)定期检查物资储备情况,确保应急物资完好可用。
2.技术保障(1)加强机房设备维护,确保设备正常运行。
(2)定期进行技术培训,提高应急小组的应急处置能力。
(3)建立应急预案数据库,方便查询和更新。
六、宣传培训1.定期开展应急知识培训,提高员工的安全意识和应急能力。
2.组织应急演练,检验应急预案的有效性。
3.加强与相关部门的沟通与合作,共同应对突发事件。
七、附则1.本预案自发布之日起实施。
2.本预案由机房应急指挥部负责解释。
3.本预案如遇特殊情况,可进行修订和补充。
运维系统及中心机房应急预案一、前言随着信息化建设的快速发展,网络和服务器已经成为很多企业的核心资产和重要业务支持系统。
在企业运营过程中,如何保障网络和服务器的正常运行,及时应对各种运维问题和突发事件,成为了企业运维中心不可避免的任务。
本文主要介绍运维系统及中心机房应急预案,以期为企业运维工作提供一定参考。
二、运维系统应急预案1.应急响应计划在运维系统的应急响应计划中,应包含以下内容:(1)对应急事件的分类,如故障、攻击、病毒等,以及对每种事件的响应措施;(2)明确各责任人员的职责和应急流程,确保应急响应过程中能够快速高效地响应和处理问题;(3)明确联系人和联系方式,建立紧急联系渠道,以便在发生应急事件时能够及时通知相关人员;(4)制定排查故障的步骤和方法,明确故障处理的流程和时间;(5)建立应急响应规范和标准,指导工作人员根据标准进行应急响应。
2.数据备份和恢复在运维系统中,数据备份和恢复是非常重要的。
应按照以下步骤进行:(1)制定数据备份策略,明确备份的内容、时间和方法;(2)确保备份数据可靠,可用,易恢复,避免出现数据丢失或损坏的情况;(3)测试数据恢复的过程和时间,确保数据能够及时恢复,并且不会对生产和业务造成影响。
3.安全控制和监控在运维系统中,安全控制和监控也是非常重要的。
应包含以下内容:(1)制定安全策略,确保网络和服务器的安全,建立安全控制和监控机制;(2)设定安全阈值和监控指标,及时发现安全漏洞和异常情况;(3)定期进行安全风险评估,及时调整安全控制和监控策略。
三、中心机房应急预案中心机房是企业的重要资产,应急预案的制定也相当重要。
以下为应急预案的内容:1.机房环境应急预案(1)确定环境监测指标,如温度、湿度、电压和电流等数据的监测和记录;(2)定期维护和保养空调和UPS设备,确保中心机房稳定运行;(3)制定环境漏水、火灾等灾害的应急预案,及时处理突发事件,避免设备损坏。
2.网络应急预案(1)确保网络设备的正常运行,及时检查网络设备的安全性和稳定性;(2)设定网络访问控制规则,防止非法入侵和黑客攻击;(3)定期测试网络安全漏洞并及时修复。
机房应急预案(通用8篇)第一篇:机房应急预案—总则1.目的与依据为确保机房运营的安全及稳定,迅速应对突发事件,减少故障对业务的影响,制定本应急预案,旨在提供详细的应急管理流程和操作指南。
2.适用范围本预案适用于所有机房工作人员,包括但不限于操作维护人员、管理人员、安全人员等。
3.术语与缩略语3.1 应急预案:为有效应对突发事件而制定的一系列应急管理措施和操作指南。
3.2 机房:指存放计算机设备、网络设备及相关设备的房间。
3.3 突发事件:指可能影响机房运营的紧急情况,包括但不限于火灾、水灾、停电等。
4.责任分工4.1 机房经理:负责指导机房日常运维工作及应急响应。
4.2 安全专员:负责机房安全检查、应急培训等工作。
4.3 运维人员:负责机房设备的日常管理维护。
4.4 其他相关人员:按照职责进行应急任务执行和配合。
5.紧急联系人员5.1 机房经理:姓名、联系方式5.2 安全专员:姓名、联系方式5.3 运维人员:姓名、联系方式6.机房应急设备6.1 灭火器材:火灾报警器、灭火器、灭火器柜等。
6.2 应急照明设备:应急照明灯、应急出口指示灯等。
6.3 紧急通信设备:手机、对讲机、应急广播设备等。
附件:1. 突发事件应急处置流程图2. 机房紧急联系人名单法律名词及注释:1. 突发事件应急处置法:根据突发事件的性质和程度,针对突发事件的发生和处置提供法律保障。
2. 《安全生产法》:中华人民共和国国家立法,旨在保障生产经营单位的人员安全和设施设备安全,维护社会稳定和人民生命财产安全。
机房应急处置预案一、背景介绍随着信息技术的快速发展,机房逐渐成为企事业单位和政府机构关键的信息中心。
然而,机房在运行过程中难免会遇到各种故障和突发事件,如停电、网络故障、设备故障等,对正常的运行造成了严重威胁。
为了保障机房运行的安全和稳定,建立一套完善的机房应急处置预案势在必行。
二、应急处置流程1. 应急响应一旦发生机房故障或突发事件,应立即启动应急响应流程。
首先,通过监控系统获取故障信息,并及时通知相关人员,包括机房管理员、IT技术人员等。
同时,启动备用设备,确保机房运行不中断。
2. 问题分析与定位在收到故障信息后,相关人员需快速分析和定位问题。
通过检查设备运行状态、网络连接状况等,确定故障的具体原因和范围。
在此过程中,需保持清晰的思路和快速反应能力,以便尽快恢复机房正常运行。
3. 应急措施与故障解决针对不同的故障类型,制定相应的应急措施。
比如,对于设备故障,可尝试重新启动或更换备用设备;对于网络故障,可进行线路检测和调试;对于停电问题,需与供电部门紧急联系,争取尽快恢复供电。
4. 恢复与验证在确定故障已经解决后,需对机房进行全面检查和验证。
确保所有设备和网络连接正常,以免留下潜在的问题。
同时,对故障的原因进行总结和分析,为后续的防范工作提供经验和教训。
三、应急预案的制定与演练为了保障机房应急工作的有效性,机构应制定详细的应急预案,并且定期进行演练和验证。
应急预案应包括以下内容:1. 应急团队及职责:明确应急团队的组成和成员的职责分工,确保各岗位职责明确,配合默契。
2. 应急联系人员:列出应急联系人员的名单和联系方式,包括机房管理员、IT技术人员、供电部门等。
3. 应急设备备份:明确备用设备的存放地点和维护保养方式,保障备用设备的可用性。
4. 应急演练计划:制定详细的应急演练计划,包括演练时间、内容和评估要点,确保演练的科学性和有效性。
5. 应急处置流程:定义详细的应急处置流程,包括故障响应、问题分析定位、应急措施与故障解决、恢复与验证等环节。
机房应急预案(新)一、应急响应组织。
1. 应急响应组织由公司领导和相关技术人员组成,负责应对机房突发事件的处理和应急响应工作。
2. 应急响应组织成员应定期进行培训和演练,提高应急响应能力和水平。
3. 应急响应组织成员应熟悉机房设备和系统,了解应急处理流程和操作规程。
二、应急预案。
1. 火灾应急预案,一旦发现机房内有火情,立即启动灭火系统,通知相关人员疏散,并报警求助。
2. 电力故障应急预案,一旦发现机房电力故障,立即切换备用电源,通知相关人员协助检修,并及时报告上级领导。
3. 网络攻击应急预案,一旦发现机房遭受网络攻击,立即启动安全防护系统,通知相关人员进行应急处理,并报告网络安全部门。
4. 设备故障应急预案,一旦发现机房设备故障,立即通知维修人员进行检修,及时报告上级领导。
5. 人员伤亡应急预案,一旦发生人员伤亡事故,立即进行急救和紧急处理,通知相关部门进行协助,并报告上级领导。
三、应急处置流程。
1. 一旦发生突发事件,应急响应组织成员立即启动应急预案,进行紧急处理。
2. 应急响应组织成员按照预案流程进行应急处置,及时通知相关人员协助处理。
3. 应急响应组织成员负责指挥和协调应急处置工作,确保突发事件得到有效控制和处理。
四、应急预案演练。
1. 定期组织应急预案演练,检验应急响应组织成员的应急处理能力和水平。
2. 演练内容包括火灾、电力故障、网络攻击、设备故障、人员伤亡等突发事件的应急处置流程。
3. 演练结果进行总结和评估,及时修订和完善应急预案,提高应急响应能力和效率。
五、应急预案的宣传和培训。
1. 对所有员工进行应急预案的宣传和培训,提高员工的应急意识和应对能力。
2. 定期组织应急知识培训和技能培训,提高员工的应急处理能力和水平。
3. 加强与相关部门的沟通和协作,建立起完善的应急响应机制,确保机房突发事件的及时处理和应对。
六、应急预案的落实和监督。
1. 公司领导对应急预案的落实和执行进行监督和检查,确保应急预案得到有效实施。
机房应急预案
一、应急预案概述。
为了确保机房设备和数据的安全,提高应对突发事件的能力,制定了机房应急预案。
该预案旨在规范机房应急处理流程,保障机房设备和数据的安全,减少因突发事件造成的损失。
二、应急预案内容。
1. 应急响应组织。
设立机房应急响应小组,明确各成员的职责和联系方式。
包括应急领导、技术支持、通信协调、安全保障等方面的人员。
2. 应急预案流程。
一旦发生突发事件,应急响应小组将立即启动应急预案流程,包括事件的报告、评估、应对措施的制定和执行,以及事后的总结和整改。
3. 突发事件应对。
针对可能发生的突发事件,制定相应的处理方案,包括火灾、设备故障、网络攻击等,明确应对措施和应急资源的调配。
4. 数据备份和恢复。
建立完善的数据备份和恢复机制,定期进行数据备份,并确保备份数据的可靠性和及时性,以便在发生数据丢失或损坏时能够快速恢复。
5. 应急演练。
定期组织机房应急演练,提高应急响应小组成员的应急处理能力,检验应急预案的有效性,并及时进行修订和完善。
三、应急预案执行。
当发生突发事件时,应急响应小组成员应立即按照预案流程进行应急响应,确保机房设备和数据的安全,最大限度地减少损失。
四、应急预案总结。
每次应急事件发生后,应急响应小组将进行总结和评估,分析应对过程中存在的问题和不足,及时进行整改和完善,提高机房应急响应能力。
以上为机房应急预案的内容,希望通过该预案的制定和执行,能够有效应对突发事件,保障机房设备和数据的安全。
一、预案背景随着信息技术的快速发展,机房已成为企业、机构等单位的重要基础设施。
机房突发故障可能导致数据丢失、系统瘫痪、业务中断等问题,给企业或机构带来巨大的损失。
为保障机房安全稳定运行,提高应急处置能力,特制定本预案。
二、预案目标1. 保障机房设备正常运行,确保业务连续性。
2. 快速定位故障原因,采取有效措施进行修复。
3. 最大程度降低故障对业务的影响,减少损失。
4. 提高机房运维人员应对突发故障的能力。
三、组织机构1. 成立机房故障应急处理小组,负责组织、协调、指挥机房故障应急处理工作。
2. 小组成员包括:机房运维负责人、网络工程师、安全工程师、业务部门负责人等。
四、应急响应流程1. 故障发现(1)机房运维人员发现故障时,应立即向应急处理小组报告。
(2)应急处理小组接到报告后,应迅速展开调查,初步判断故障原因。
2. 故障确认(1)应急处理小组根据初步判断,进行故障确认,确定故障范围。
(2)通知相关业务部门,做好业务调整准备。
3. 应急处置(1)根据故障原因,采取相应措施进行修复。
(2)对故障设备进行检测、维护、更换等操作。
(3)确保故障设备恢复正常运行。
4. 业务恢复(1)故障设备恢复正常后,通知相关业务部门,进行业务恢复。
(2)对业务恢复情况进行跟踪,确保业务正常运行。
5. 故障总结(1)应急处理小组对故障原因、处理过程、恢复情况进行总结。
(2)提出改进措施,防止类似故障再次发生。
五、应急保障措施1. 建立机房设备台账,确保设备信息准确、完整。
2. 定期对机房设备进行巡检、维护,确保设备正常运行。
3. 加强机房安全管理,防止人为因素导致故障。
4. 定期对应急处理小组成员进行培训,提高应急处置能力。
5. 配备必要的应急物资,如备用电源、网络设备等。
六、预案实施与修订1. 本预案由机房运维负责人负责组织实施。
2. 本预案自发布之日起实施,如有需要,可进行修订。
通过本预案的实施,提高机房运维人员应对突发故障的能力,确保机房安全稳定运行,为业务连续性提供有力保障。
一、编制目的为确保电子政务网络的稳定运行,提高网络故障应急处理能力,保障电子政务业务的连续性和信息安全,特制定本预案。
二、编制依据1. 《中华人民共和国网络安全法》2. 《电子政务信息系统安全等级保护管理办法》3. 《电子政务信息系统安全事件应急预案》4. 国家及地方有关电子政务网络管理的政策法规三、适用范围本预案适用于本单位的电子政务网络系统,包括网络设备、服务器、数据库、应用系统等。
四、工作原则1. 预防为主,防治结合2. 快速响应,协同处置3. 依法依规,规范操作4. 保障业务,减少损失五、组织机构及职责1. 成立电子政务网络维护应急指挥部(1)指挥长:由单位主要领导担任,负责应急工作的全面指挥和决策。
(2)副指挥长:由分管领导担任,协助指挥长工作,负责应急工作的组织实施。
(3)成员:由信息部门、运维部门、技术支持部门等相关部门负责人组成。
2. 各部门职责(1)信息部门:负责收集、分析网络故障信息,及时向应急指挥部报告,提供技术支持。
(2)运维部门:负责现场处置、设备更换、系统恢复等工作。
(3)技术支持部门:负责提供技术支持,协助应急指挥部制定解决方案。
六、应急响应流程1. 网络故障发现(1)用户报告故障,运维部门接到报告后,立即进行初步判断。
(2)信息部门根据故障情况,评估故障等级,并向应急指挥部报告。
2. 应急指挥部启动(1)应急指挥部接到报告后,立即召开会议,分析故障原因,制定应急方案。
(2)应急指挥部根据故障等级,决定启动相应级别的应急响应。
3. 现场处置(1)运维部门根据应急指挥部制定的方案,立即进行现场处置。
(2)技术支持部门提供技术支持,协助运维部门进行故障排查和修复。
4. 系统恢复(1)故障排除后,运维部门进行系统恢复,确保业务正常运行。
(2)信息部门对故障原因进行分析,总结经验教训,提出改进措施。
5. 应急结束(1)应急指挥部根据故障恢复情况,决定结束应急响应。
(2)各部门总结应急工作,形成报告,上报应急指挥部。
1.1 编制目的为有效应对电子政务系统运行过程中可能出现的各类突发事件,确保电子政务系统安全稳定运行,保障政务信息资源安全,提高政府公共服务水平,特制定本预案。
1.2 编制依据依据《中华人民共和国网络安全法》、《电子政务系统安全管理办法》等相关法律法规,结合我单位实际情况,制定本预案。
1.3 适用范围本预案适用于我单位电子政务系统运行过程中出现的各类突发事件,包括但不限于网络安全事件、系统故障、数据泄露等。
二、组织体系与职责2.1 组织机构成立电子政务应急预案领导小组,负责应急预案的制定、修订、实施和监督。
2.2 领导小组职责(1)组织制定、修订电子政务应急预案;(2)负责组织应急预案的培训和演练;(3)协调各部门、各单位在应急预案实施过程中的工作;(4)对应急预案实施情况进行监督和评估。
2.3 工作小组职责(1)负责应急预案的具体实施;(2)负责突发事件信息的收集、分析和上报;(3)负责突发事件处置方案的制定和实施;(4)负责应急处置物资的调配和保障。
三、预警与报告(1)对电子政务系统进行日常监测,及时发现潜在风险;(2)对网络攻击、系统故障、数据泄露等突发事件进行预警。
3.2 报告(1)发现突发事件后,立即向领导小组报告;(2)领导小组接到报告后,组织相关部门进行调查、分析,确定事件性质和影响;(3)根据事件性质和影响,启动应急预案。
四、应急处置4.1 初步响应(1)启动应急预案,明确各相关部门和人员的职责;(2)对突发事件进行初步评估,确定事件等级;(3)采取应急措施,控制事件蔓延。
4.2 次级响应(1)根据事件等级,启动次级应急预案;(2)加大应急力量投入,提高应急处置效率;(3)加强与上级部门、相关部门的沟通协调。
4.3 级别响应(1)启动最高级别应急预案;(2)全力开展应急处置工作,确保电子政务系统安全稳定运行;(3)根据事件发展情况,调整应急预案和应急处置措施。
五、恢复与重建5.1 恢复(1)对突发事件进行彻底调查,查明原因;(2)根据调查结果,采取针对性措施,防止类似事件再次发生;(3)对受影响的系统、数据等进行修复和恢复。
电子政务运维中心机房应急预案***电子政务运维服务中心机房应急预案目录一、目的 .................................................................... 3 二、基本原则 ................................................................ 3 三、适用范围 ................................................................ 3 四、应急事件级别定义 (4)五、组织机构及职责 ...........................................................5 5.1 应急领导小组组织机构.....................................................5 5.2 应急领导小组职责 ........................................................5 5.3应急小组成员职责 .........................................................5 六、应急响应机制.............................................................6 6.1基本处理流程 .............................................................6 七、应急方案 ................................................................7 7.1互联网中断应急预案(暂定为二级事件) .....................................7 7.2 运维中心ITM监控软件应急预案(暂定为二级事件)...........................7 7.2.1运维中心ITM监控软件部署情况 .........................................7 7.2.2数据库操作部分 .......................................................8 7.2.3 ITM操作部分 .........................................................8 7.2.4 ITSM操作部分 ........................................................9 7.3 运维中心托管应用应急预案(暂定为三级事件)..............................11 7.4 TSM异地备份应急预案(暂定为二级事件) ................................... 11 7.5 运维中心市电中断应急预案(暂定为二级事件).............................. 12 7.5.1 运维机房操作流程 .................................................... 12 7.5.2 柴油发电机房操作流程 ................................................ 13 7.6发电机故障应急预案(暂定为二级事件) (15)一、目的为科学应对网络与信息安全突发事件,提高我省电子政务运维服务中心应对突发应急事件的处理能力,确保信息系统安全运行,维护网络和系统正常运行,降低信息安全事件对运维机房所造成的损失和影响,编制本预案。
二、基本原则(1)居安思危,预防为主。
实行突发事件统一管理、统一指挥、各级负责的原则;(2)统一领导,分级负责,全面规划、及时发现、快速反应、措施果断的原则。
依据《***电子政务统一平台故障等级划分》对突发事件进行分级管理,并按照事件级别迅速上报相关领导和责任人。
(3)制度规范,加强管理。
严格按照《***电子政务网运行维护规范》、《***电子政务中心机房维护作业规范》事件处理流程规范操作,使突发应急的工作规范事件化、制度化。
(4)快速反应,协同应对。
当突发事件发生时,各级要立即按应急预案,投入应急工作;加强各个部门配合协作。
形成统一指挥、反应灵敏、功能齐全、协调有序、运转高效的应急管理机制。
(5)主动报告原则:当突发事件发生后,要及时报告应急预案实施情况。
三、适用范围● 运维中心互联网中断应急预案● 运维中心运维监控软件应急预案● 运维中心托管系统应急预案● 运维中心异地备份应急预案● 运维中心市电中断应急预案● 运维中心发电机故障后应急预案四、应急事件级别定义根据网络与信息安全突发公共事件的可控性、严重程度和影响范围,一般分为四级:I级(特别重大)、II级(重大)、III级(较大)、IV级(一般)。
国家有关法律法规有明确规定的,按国家有关规定执行。
(1)I级(特别重大):重要网络与信息安全系统发生全市性大规模瘫痪,事态发展超出相关主管部门的控制能力,对国家安全、社会秩序、经济建设和公共利益造成特别严重损害的突发公共事件。
(2)II级(重大):重要网络与信息安全系统造成全市性瘫痪,对国家安全、社会秩序、经济建设和公共利益造成严重损害,需要跨部门、跨地区协同处置的突发公共事件。
(3)III级(较大):某一区域的重要网络与信息安全系统瘫痪,对国家安全、社会秩序、经济建设和公共利益造成一定损害,但不需要跨部门、跨地区协同处置的突发公共事件。
(4)IV级(一般):重要的网络与信息安全系统受到一定程度的损坏,对公民、法人和其他组织的权益有一定影响,但不危害国家安全、社会秩序、经济建设和公共利益的突发公共事件。
五、组织机构及职责 5.1 应急领导小组组织机构组长:副组长:成员:5.2 应急领导小组职责(1)负责编制、修订所辖范围内突发应急事件的《应急预案》。
(2)负责协调和督促整个应急事件的处理过程。
有针对性地组织专业技术人员对应急突发事件进行增援处理;必要时去现场督促,对于超出界定的突发事件,尽快提出紧急补救措施进行恢复。
(3)应急事件处理结束后,协调解决故障现场的恢复生产工作。
(4)定期或不定期地对应急小组成员进行技能培训和应急演练。
5.3应急小组成员职责(1)值班人员平时应做好应急事件的监控、预警工作,当应急事件发生后,迅速生产事件上报相关领导,并进行先期处置,如有必要通知二、三线工程师。
(2)二线、三线工程师在接到应急信息后,应积极配合值班人员进行先期处置,迅速赶往故障现场提供技术援助。
(3)对于在应急故障处理期间发生的新问题、新情况,应认真登记,及时上报。
对于超出《应急预案》界定的应急事件,应及时汇报应急领导小组,争取尽早提出补救措施进行恢复。
六、应急响应机制 6.1基本处理流程(1)值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪该事件直至其结束。
对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导。
(2)正常情况下,要求值班人员在10分钟内进行事件确认。
如果属于一般事件则按照事件流程进行分派处理,否则应迅速启动《应急预案》,并严格按照《应急预案》所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时处理情况。
(3)在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部门汇报,协调沟通,尽快联系技术工程师或厂家技术支持赶赴现场援助处理。
七、应急方案7.1互联网中断应急预案(暂定为二级事件)(1)密切关注,积极与其他机房值班人员取得联系,准确判断故障位置、数据域。
如故障区域属于运维中心范围之内,应立即启动应急预案上报相关领导,同时通知其他机房值班人员加紧监控力度。
(2)检查网络硬件设备运行状态,如发现指示灯有异常告警,及时与对端进行确认。
必要时联系市广电工程师检查物理链路,如情况属实,尽快督促广电工程师去现场进行抢修,并上报相关领导。
(3)如发现故障属硬件原因所致,尽快启用备份设备或备用端口,争取将损失减少至最低水平,及时汇报领导,协调更换或维修。
(4)登录核心交换机检查配置信息及其运行情况,如果发现配置信息有被篡改的情况,尽快启用备份数据进行恢复。
(5)坚持由简到繁,由大到小的原则逐步缩小故障范围,最后定位故障点。
如果发现网络内部存在严重病毒感染或网络攻击,果断断网,尽快通知相关责任人查杀病毒,并告知技术支持寻求补救措施。
7.2 运维中心ITM监控软件应急预案(暂定为二级事件) 7.2.1运维中心ITM监控软件部署情况7.2.2数据库操作部分应用系统要运行,首先应保证数据库能正常工作。
如有故障,可以利用vnc远程登录,然后在桌面打开一个命令行终端,输入如下命令: cd/opt/oracle/product/OraHome/bin //进入工作目录 ps –ef|grep ora //查看服务进程如果输出结果与下图类似,则说明oracle数据库正在运行。
否则说明数据库有异常,需要手动重启。
kill -9 **** //杀死相关进程 su – oracle //切换用户dbstart $ORACLE_HOME //启动数据库服务进程 7.2.3 ITM操作部分在确保数据库正常运行后,才能依次在每台监控服务器上启动ITM服务进程,具体命令如下:cd /var/ITManager/bin //进入工作目录 ps –ef|grep ITM //查看服务进程如果有ITMserver进程,则说明ITM服务正在运行。
否则,应手动重启。
nohup ./ITMnurse & //启动ITM服务进程注意:在重新启动ITMnurse服务前,一定要将以前的相关进程全部杀死,否则它将去自动调用ITM服务,导致启动失败。
整个启动过程较慢,大约需要8至10分钟,可以在监控区网管机上通过vnc远程进行操作。
目前,各ITM应用的syslo信息也存放于本地物理磁盘,所以当应用启动后,还应检查syslog运行情况,具体命令如下:ps –ef|grep syslog //查看服务syslog进程 cd/var/ITManager/syslogcollector //进入工作目录 nohup ./syslogrun.sh & //启动syslog服务进程 ps –ef|grep syslog //核查服务syslog进程 kill -9 XXXX //杀死相关进程 dbshut //停掉数据库进程 Poweroff //关闭服务器 7.2.4 ITSM操作部分ITSM数据库和应用均部署在*.15.36.24服务器上,可以通过vnc或远程桌面进行登录,进入到服务管理界面,查看ITSMServer、ITSMProxy、itsmdb、ITSMSms及Apache Tomcat cas进程是否正常启动,如异常则应手动进行重启,并作记录。