数据中心应急预案
- 格式:doc
- 大小:341.00 KB
- 文档页数:29
XX数据中心应急方案随着互联网技术的快速发展和信息化的普及,数据中心作为整个互联网服务基础的核心环节,承担着存储、处理和传输海量数据的重要任务。
数据中心的可靠性和稳定性对整个社会运行的稳定起着极为重要的作用。
然而在现实生活中,各种自然灾害、电力故障和网络攻击等不可预测的事件时有发生,对数据中心运营造成了巨大的威胁。
为了确保数据中心能够及时有效地应对各种紧急情况,保证服务的连续性和稳定性,必须制定完善的应急方案。
一、事前预案1.风险评估:对数据中心可能遭受的各种灾害和事故进行风险评估,包括地震、火灾、水灾、电压异常和网络攻击等。
评估结果作为制定应急方案的基础。
2.设备备份:数据中心必须建立完善的备份设备和备份存储系统,包括备用服务器、存储设备和网络设备等,以便在主设备出现故障时能够立即切换到备用设备,保证服务的连续性。
3.应急团队:组建专门的应急团队,包括技术人员、安全人员和管理人员等,负责应对各种紧急情况,并且要进行定期的演练和培训,提高应对突发事件的能力。
二、事中处理1.告警系统:建立完善的告警系统,对各种异常情况进行实时监测和告警,包括温度异常、湿度异常、电力异常和网络异常等,以便及时发现问题并采取措施进行处理。
2.系统监控:利用监控系统对数据中心的各种系统进行实时监控,包括服务器、存储设备和网络设备等,确保这些设备的正常运行。
一旦发现异常,及时采取措施修复或切换到备用设备。
3.应急演练:定期组织应急演练,模拟各种突发事件的发生,包括服务器宕机、网络中断和数据泄露等,让应急团队成员熟悉应急准备工作,提高应对紧急事件的能力。
4.应急预案更新:随时跟踪和研究最新的安全技术和应急处理方法,及时更新应急预案,并对应急方案进行持续改进,以应对不断变化的威胁。
三、事后总结1.事件分析:对每次发生的紧急事件进行详细的分析和总结,明确问题的根本原因,并制定措施防止类似的事件再次发生。
2.耗损估计:对每次紧急事件造成的损失进行估算,包括直接损失和间接损失,以便为以后制定预算和购买保险提供参考。
一、预案背景随着信息技术的飞速发展,数据中心已成为企业、政府机构和社会组织运行的关键基础设施。
然而,数据中心面临着各种潜在的风险和威胁,如自然灾害、电力故障、网络攻击、设备故障等。
为保障数据中心的安全稳定运行,提高应对突发事件的能力,特制定本专项应急预案。
二、预案目的1. 提高数据中心应对突发事件的能力,确保数据中心在突发事件发生时能够迅速、有效地进行处置。
2. 最大程度地减少突发事件对数据中心运行的影响,保障业务连续性。
3. 保护数据中心工作人员的人身安全,减少财产损失。
三、预案适用范围本预案适用于以下突发事件:1. 自然灾害:地震、洪水、台风、暴雨等。
2. 电力故障:电力中断、电压波动、设备故障等。
3. 网络攻击:黑客攻击、病毒感染、恶意代码等。
4. 设备故障:服务器、存储设备、网络设备等故障。
5. 其他突发事件:火灾、爆炸、泄漏等。
四、组织机构及职责1. 应急指挥部应急指挥部负责统一领导和指挥数据中心应对突发事件的各项工作,其主要职责如下:(1)组织制定和修订应急预案;(2)决定启动和终止应急预案;(3)协调各部门、各单位的应急工作;(4)监督应急预案的实施情况。
应急办公室负责日常应急工作的组织和协调,其主要职责如下:(1)负责应急预案的编制、修订和发布;(2)负责应急物资的采购、储备和调配;(3)负责应急培训和演练;(4)负责收集、整理和上报应急信息。
3. 各部门、各单位各部门、各单位应按照应急预案的要求,落实以下职责:(1)制定本部门、本单位的应急工作预案;(2)组织应急培训和演练;(3)落实应急物资的储备和调配;(4)配合应急指挥部开展应急工作。
五、应急响应流程1. 预警(1)密切关注气象、电力、网络等信息,对可能发生的突发事件进行预警;(2)启动应急预案预警程序,通知各部门、各单位做好应急准备。
2. 启动应急预案(1)接到预警信息后,应急指挥部迅速召开会议,决定启动应急预案;(2)通知各部门、各单位按照预案要求开展应急工作。
一、预案概述为确保数据中心在发生突发事件时能够迅速、有序地采取应急措施,最大限度地减少事故损失,保障数据中心的安全稳定运行,特制定本预案。
二、适用范围本预案适用于数据中心发生的以下突发事件:1. 停电、停水、火灾、地震等自然灾害;2. 设备故障、网络攻击、人为破坏等意外事件;3. 其他可能对数据中心安全稳定运行构成威胁的事件。
三、组织机构1. 应急指挥部:负责组织、指挥、协调应急工作,下设办公室、现场指挥部、应急小组等。
2. 应急办公室:负责应急工作的日常管理、信息收集、沟通协调等工作。
3. 现场指挥部:负责现场应急工作的指挥、协调、调度等工作。
4. 应急小组:负责各类突发事件的应急处理工作。
四、应急处置原则1. 安全第一:确保人员安全,最大限度地减少财产损失。
2. 快速响应:接到报警后,迅速启动应急预案,及时采取措施。
3. 协同配合:各部门、各单位要紧密配合,共同应对突发事件。
4. 科学决策:根据现场实际情况,科学决策,确保应急措施的有效性。
五、应急处置流程1. 报警:发现突发事件后,立即向应急指挥部报告,启动应急预案。
2. 初步判断:应急指挥部根据报警信息,初步判断事件性质和影响范围。
3. 现场处置:应急小组根据现场实际情况,采取相应应急措施。
4. 信息发布:应急指挥部及时向相关人员发布事件信息和应急措施。
5. 恢复运行:在确保安全的前提下,逐步恢复正常运行。
6. 总结评估:事件结束后,对应急处置工作进行总结评估,完善应急预案。
六、应急处置措施1. 停电、停水事件:a. 确认停电、停水原因,通知相关部门进行修复;b. 启动备用电源,确保数据中心关键设备正常运行;c. 通知用户,做好解释工作。
2. 火灾事件:a. 立即启动消防系统,进行灭火;b. 组织人员疏散,确保人员安全;c. 报告消防部门,请求支援。
3. 设备故障事件:a. 确认故障设备,通知相关部门进行维修;b. 启动备用设备,确保数据中心正常运行;c. 通知用户,做好解释工作。
一、预案概述为保障数据中心在各类突发事件中的安全稳定运行,最大限度地减少损失,特制定本预案。
本预案适用于数据中心在日常运营过程中可能发生的各类突发事件,包括但不限于停电、火灾、自然灾害、人为破坏等。
二、应急预案组织机构及职责1. 应急指挥部成立数据中心应急指挥部,负责统一指挥、协调和调度应急工作。
应急指挥部由以下成员组成:(1)指挥长:由数据中心负责人担任,负责全面协调应急工作。
(2)副指挥长:由数据中心分管负责人担任,协助指挥长工作。
(3)各职能小组组长:由相关部门负责人担任,负责本小组工作。
2. 应急职能小组(1)通信联络组:负责应急信息的收集、传递和发布。
(2)设备保障组:负责应急设备、设施的维护和保障。
(3)安全保障组:负责现场安全、人员疏散和秩序维护。
(4)技术支持组:负责应急技术支持和设备恢复。
(5)后勤保障组:负责应急物资、生活物资的保障。
三、应急预案启动条件1. 全部市电停电且停电时间超过15分钟仍未恢复。
2. 数据中心发生火灾等安全事故。
3. 数据中心遭受自然灾害、人为破坏等突发事件。
四、应急处理流程1. 确认事件(1)值班人员接到报警后,立即向应急指挥部报告。
(2)应急指挥部确认事件性质和严重程度。
2. 启动应急预案(1)应急指挥部根据事件情况,决定启动本预案。
(2)各职能小组根据预案要求,迅速进入应急状态。
3. 应急处置(1)通信联络组:确保应急信息畅通,及时向上级领导和相关部门报告。
(2)设备保障组:启动备用电源,保障数据中心关键设备正常运行。
(3)安全保障组:组织人员疏散,确保人员安全。
(4)技术支持组:尽快恢复系统正常运行,确保数据安全。
(5)后勤保障组:提供应急物资和生活物资保障。
4. 应急结束(1)应急指挥部根据事件处理情况,决定结束应急状态。
(2)各职能小组恢复正常工作。
五、应急保障措施1. 人员保障(1)组织应急培训,提高员工应急处理能力。
(2)建立应急值班制度,确保应急信息畅通。
一、编制目的为保障数据中心在发生火灾等紧急情况时能够迅速、有效地进行应急处置,最大限度地减少人员伤亡和财产损失,确保数据中心的安全稳定运行,特制定本预案。
二、适用范围本预案适用于数据中心内部所有人员,包括员工、访客等。
三、组织机构及职责1. 消防指挥部负责统一指挥、协调、调度消防应急工作,成员包括:(1)总指挥:由数据中心负责人担任,负责全面指挥和协调消防应急工作。
(2)副总指挥:由安全管理部门负责人担任,协助总指挥工作。
(3)成员:各部门负责人及消防员。
2. 应急救援小组负责现场救援、疏散、灭火等工作,成员包括:(1)灭火组:负责火灾扑救、灭火器材使用等。
(2)疏散组:负责人员疏散、协助受伤人员撤离等。
(3)医疗救护组:负责现场受伤人员救治、医疗物资保障等。
(4)通讯联络组:负责与消防指挥部、相关部门及外界保持通讯联络。
四、应急响应流程1. 发生火灾(1)发现火情的人员应立即报告消防指挥部。
(2)消防指挥部接到报告后,立即启动应急预案,通知应急救援小组。
(3)灭火组迅速到达火灾现场,使用灭火器材进行扑救。
(4)疏散组组织人员疏散,确保人员安全撤离。
(5)医疗救护组对受伤人员进行救治。
2. 火灾扑灭(1)灭火组确认火势已得到控制,报告消防指挥部。
(2)消防指挥部确认火灾已扑灭,宣布应急响应结束。
3. 应急响应结束(1)应急救援小组返回工作岗位。
(2)消防指挥部组织人员进行火灾原因调查。
(3)对火灾现场进行清理,恢复正常工作秩序。
五、应急物资及装备1. 灭火器材:灭火器、消防栓、消防水带等。
2. 疏散器材:应急照明、安全出口指示牌、应急疏散指示图等。
3. 医疗救护器材:急救包、担架、氧气瓶等。
4. 通讯器材:对讲机、电话等。
六、培训与演练1. 定期组织消防知识培训,提高员工消防安全意识。
2. 定期开展消防应急演练,检验预案的有效性和可行性。
3. 对演练中发现的问题进行总结,完善应急预案。
七、附则1. 本预案由数据中心消防指挥部负责解释。
一、编制目的为保障数据中心在突发情况下能够迅速、有序地应对,最大限度地减少损失,确保数据中心安全、稳定运行,特制定本预案。
二、适用范围本预案适用于数据中心在以下突发情况下采取的应急处置措施:1. 市电停电;2. 设备故障;3. 网络攻击;4. 自然灾害;5. 其他突发情况。
三、组织机构及职责1. 应急指挥部应急指挥部是数据中心应急处置的最高领导机构,负责指挥、协调、监督和指导应急处置工作。
应急指挥部由数据中心负责人担任总指挥,下设以下成员:(1)副总指挥:负责协助总指挥工作,负责应急处置工作的日常管理;(2)各职能小组组长:负责本小组应急处置工作的组织、协调和实施;(3)各职能小组成员:负责本小组应急处置工作的具体实施。
2. 各职能小组(1)现场指挥小组:负责现场应急处置工作的组织、协调和指挥;(2)设备保障小组:负责设备故障的排查、维修和恢复;(3)网络安全小组:负责网络攻击的防御、排查和恢复;(4)物资保障小组:负责应急物资的调配和供应;(5)信息宣传小组:负责应急处置信息的收集、整理和发布;(6)后勤保障小组:负责应急处置期间的后勤保障工作。
四、应急处置原则1. 快速反应:接到突发事件报告后,立即启动应急预案,迅速采取应急措施;2. 协同配合:各职能小组要密切配合,共同应对突发事件;3. 安全第一:在应急处置过程中,确保人员安全和设备安全;4. 最大限度地减少损失:采取有效措施,降低突发事件造成的损失。
五、应急处置流程1. 接到突发事件报告(1)值班人员接到突发事件报告后,立即向应急指挥部报告;(2)应急指挥部启动应急预案,通知各职能小组组长和有关人员到位。
2. 现场指挥(1)现场指挥小组到达现场后,立即进行现场勘查,了解情况;(2)根据现场情况,制定应急处置方案,并通知各职能小组执行。
3. 各职能小组应急处置(1)设备保障小组:排查设备故障原因,进行维修和恢复;(2)网络安全小组:防御网络攻击,排查攻击源,恢复网络;(3)物资保障小组:调配应急物资,保障应急处置工作;(4)信息宣传小组:收集、整理应急处置信息,发布应急处置公告;(5)后勤保障小组:保障应急处置期间的后勤保障工作。
一、编制目的为提高数据中心应对突发事件的能力,确保在发生安全事故时能够迅速、有效地采取应急措施,最大限度地减少事故损失,保障人员安全和数据中心正常运行,特制定本预案。
二、适用范围本预案适用于数据中心在运营过程中可能发生的各类安全事故,包括但不限于火灾、地震、洪水、设备故障、网络攻击等。
三、组织机构及职责1. 应急指挥部成立数据中心安全事故应急指挥部,负责指挥、协调、监督和指导整个应急响应工作。
2. 应急指挥部下设以下工作组:(1)现场指挥组:负责现场指挥、调度和协调救援力量。
(2)医疗救护组:负责伤员的救治和转运。
(3)物资保障组:负责应急物资的采购、调配和供应。
(4)通信保障组:负责应急通信保障,确保信息畅通。
(5)新闻宣传组:负责对外发布应急信息,引导舆论。
(6)后勤保障组:负责应急期间的后勤保障工作。
四、应急响应流程1. 预警阶段(1)当接到可能发生安全事故的预警信息时,应急指挥部应立即启动应急预案,各工作组进入待命状态。
(2)现场指挥组对预警信息进行核实,判断事故等级。
2. 应急响应阶段(1)现场指挥组根据事故等级,启动相应的应急响应措施。
(2)医疗救护组对伤员进行救治和转运。
(3)物资保障组根据需要调配应急物资。
(4)通信保障组确保应急通信畅通。
(5)新闻宣传组对外发布应急信息。
3. 处置阶段(1)现场指挥组组织救援力量对事故现场进行处置。
(2)医疗救护组对伤员进行救治。
(3)物资保障组保障应急物资供应。
(4)通信保障组确保应急通信畅通。
(5)新闻宣传组对外发布应急信息。
4. 结束阶段(1)现场指挥组对事故现场进行清理,恢复正常秩序。
(2)医疗救护组对伤员进行后续治疗。
(3)物资保障组清点应急物资,补充库存。
(4)通信保障组恢复正常通信。
(5)新闻宣传组对外发布事故处理结果。
五、应急措施1. 火灾事故(1)立即启动消防系统,进行灭火。
(2)组织人员疏散,确保人员安全。
(3)医疗救护组对受伤人员进行救治。
一、总则1.1 编制目的为确保数据中心在发生各类事故时能够迅速、有序地开展应急响应工作,最大限度地减少事故损失,保障数据中心业务连续性和用户权益,特制定本预案。
1.2 适用范围本预案适用于数据中心在运行过程中发生的各类事故,包括但不限于火灾、电力故障、网络攻击、设备故障、自然灾害等。
1.3 工作原则(1)以人为本,安全第一;(2)统一领导,分级负责;(3)预防为主,应急结合;(4)快速反应,协同处置。
二、组织机构及职责2.1 应急指挥部成立数据中心事故应急指挥部,负责统一领导和协调事故应急工作。
2.2 应急指挥部组成(1)总指挥:数据中心总经理或其授权代表;(2)副总指挥:数据中心副总经理或其授权代表;(3)成员:各部门负责人及相关部门人员。
2.3 各部门职责(1)安全保卫部:负责事故现场的安全保卫和人员疏散;(2)运维部:负责事故现场设备的抢修和恢复;(3)技术支持部:负责事故原因分析、技术支持和应急演练;(4)综合管理部:负责事故信息报送、物资保障和协调各部门工作;(5)人力资源部:负责事故现场人员调配和应急培训。
三、应急响应程序3.1 紧急响应(1)事故发生后,各部门负责人立即向应急指挥部报告;(2)应急指挥部迅速启动应急预案,成立现场指挥部;(3)各部门按照职责分工,立即采取应急措施。
3.2 应急处置(1)现场指挥部根据事故情况,制定具体处置方案;(2)各部门按照处置方案,迅速开展应急处置工作;(3)事故原因分析和技术支持部及时提供技术支持和指导。
3.3 事故恢复(1)事故原因分析和技术支持部对事故原因进行深入分析;(2)运维部根据事故原因,制定恢复方案;(3)各部门按照恢复方案,逐步恢复数据中心业务。
四、应急保障措施4.1 物资保障(1)应急指挥部负责制定物资清单,明确物资需求;(2)综合管理部负责物资采购、调配和储备。
4.2 人员保障(1)应急指挥部负责组织应急培训,提高员工应急处理能力;(2)各部门负责人负责对本部门人员进行应急培训和考核。
一、预案背景为保障数据中心在发生火灾等紧急情况时,能够迅速、有序、有效地进行人员疏散,降低人员伤亡和财产损失,特制定本预案。
二、预案目标1. 保障人员生命安全,减少人员伤亡。
2. 最大程度降低火灾对数据中心设施和数据的损失。
3. 提高员工火灾应急疏散能力,增强安全意识。
三、预案适用范围本预案适用于数据中心在发生火灾等紧急情况时,对人员疏散的应急处置。
四、预案组织架构1. 成立应急指挥部:由数据中心负责人担任总指挥,各部门负责人为成员,负责指挥、协调火灾应急疏散工作。
2. 成立应急小组:包括灭火组、疏散组、医疗救护组、物资保障组、通讯联络组等,负责具体实施火灾应急疏散工作。
五、应急疏散流程1. 火灾发生时,现场人员立即启动火灾报警系统,并向应急指挥部报告火情。
2. 应急指挥部接到报告后,立即启动应急预案,向各部门下达疏散命令。
3. 疏散组根据火情和人员分布情况,制定疏散路线,组织人员有序疏散。
4. 灭火组根据火势和火灾原因,采取灭火措施,控制火势蔓延。
5. 医疗救护组对受伤人员进行救治,确保伤员安全。
6. 物资保障组负责疏散过程中所需物资的供应。
7. 通讯联络组负责与各部门保持通讯畅通,确保信息传递及时。
六、应急疏散措施1. 人员疏散:按照疏散路线,引导人员从最近的安全出口迅速撤离,避免拥挤和踩踏事故。
2. 消防安全:确保消防通道畅通,避免火灾蔓延。
3. 医疗救护:对受伤人员进行救治,必要时联系专业医疗救护人员。
4. 物资保障:为疏散人员提供必要的物资,如饮用水、食品、衣物等。
5. 通讯联络:保持与各部门的通讯畅通,确保信息传递及时。
七、预案演练与培训1. 定期组织应急疏散演练,提高员工火灾应急疏散能力。
2. 对员工进行消防安全培训,增强员工安全意识。
3. 检查应急设备设施,确保其完好可用。
八、预案修订与完善本预案根据实际情况进行修订与完善,确保其有效性和实用性。
九、预案执行与监督1. 应急指挥部负责监督预案的执行情况。
数据中心消防应急预案一、前言为确保数据中心消防安全,提高应对突发火灾的能力,减少火灾造成的损失,根据《中华人民共和国消防法》及相关法律法规,结合数据中心实际情况,特制定本消防应急预案。
二、组织机构及工作职责为确保应急预案的有效实施,成立以下组织机构,明确各组工作职责:1、灭火行动组(1)职责:负责组织初期火灾的扑救工作,控制火势蔓延,最大限度地减少火灾造成的损失。
(2)成员:由具备消防知识和技能的安保人员、运维人员组成。
2、通信联络组(1)职责:负责火灾报警、应急疏散、扑救火灾等过程中的通信联络工作,确保信息畅通、指挥有序。
(2)成员:由通信部门及相关专业人员组成。
3、疏散引导组(1)职责:负责组织、指挥、协调疏散工作,确保人员迅速、安全、有序地撤离火灾现场。
(2)成员:由安保人员、运维人员、楼层管理员等组成。
4、安全抢救组(1)职责:负责组织抢救火灾现场的受伤人员,协助消防部门进行人员搜救和火灾扑救。
(2)成员:由安保人员、医护人员、志愿者等组成。
5、现场警戒组(1)职责:负责火灾现场的警戒工作,维护现场秩序,保障救援通道畅通,防止无关人员进入。
(2)成员:由安保人员、公安部门人员等组成。
三、报警和接警程序1、报警(1)发现火情的人员应立即就近按下手动火灾报警按钮或使用报警电话(如内部电话、手机等)向消防控制室报警。
(2)报警时应保持冷静,清晰、准确地报告以下信息:a. 火灾发生的具体位置;b. 火势大小、燃烧物质及可能存在的危险因素;c. 报警人姓名和联系方式;d. 现场人员情况及疏散情况。
2、接警(1)消防控制室值班人员接到报警后,应立即按照应急预案启动相关应急程序。
(2)询问报警人火情详细信息,并通知相关领导和各组负责人。
(3)启动应急广播系统,发布火灾警报,告知现场人员火灾发生的具体位置和疏散方向。
(4)拨打“119”火警电话,报告火警情况,请求消防部门支援。
(5)记录报警时间、报警人、火情等信息,以便后续调查和分析。
数据中心应急预案V1.02017年11月修改记录:目录一、总则 (5)二、术语 (5)三、适用范围 (5)四、应急通讯录 (5)五、现场应急指挥领导小组 (6)六、应急事件汇报流程 (7)七、操作安全注意事项 (9)八、应急处理预案流程 (9)(一)市电双路供电中断 (9)(二)UPS故障处理 (11)(三)机柜空开掉电 (12)(四)风冷精密空调故障高温处理 (13)(五)水冷空调高温报警处理 (14)(六)局部高温处理 (15)(七)空调供电中断多台 .................................................................................. 错误!未定义书签。
(八)空调高压报警 .......................................................................................... 错误!未定义书签。
(九)空调低压报警及制冷剂泄漏处理 .......................................................... 错误!未定义书签。
(十)机房低温报警处理 (15)(十一)机房湿度过低的处理 (16)(十二)机房湿度过高的处理 (16)(十三)气流故障处理 ...................................................................................... 错误!未定义书签。
(十四)漏水应急处理 (17)(十五)环境监控故障处理 (18)(十六)消防系统应急处理 (18)(十七)公共卫生事件处理............................................................................... 错误!未定义书签。
(十八)防汛应急处理 (21)(十九)治安应急处理 (26)(二十)地震应急处理 (28)九、应急操作指引维护 (29)一、总则为提高运维人员对各种险情及紧急情况的应对能力,以防突发性事件对公司和客户造成重大损失,结合运维实际,制定各种应急事件处理预案。
应急预案遵循以防为主、防救结合的方针,坚持以人为本、避免伤亡原则,做到责任明确、程序简洁、分工合理、反应灵敏,以应对可能出现的各类险情及紧急情况。
为加强对突发性事件(事故)应急反应的组织领导工作,在数据中心成立现场应急指挥领导小组,组织指挥重特大突发性事件(事故)的救援、抢险工作,确保救援、抢险工作反应迅速、组织有序、效果突出。
二、术语防护用品:劳动者在生产过程中为免遭或减轻事故发生和职业病危害的个人随身穿(佩)戴的用品。
防护设施:在生产过程中为免遭或减轻事故发生和职业病危害的公共防护设备。
操作资格:特种作业人员必须经专门的安全技术培训并考核合格,取得《中华人民共和国特种作业操作证》(以下简称操作资格证)后,方可上岗作业。
三、适用范围数据中心。
四、应急通讯录应急通讯录应定时更新,对供应商值班电话应按月度抽查有效性。
各职位A/B角互换,当第一负责人A角联络不上时,B角人员担当行使第一负责人职权。
应急通讯录应打印成册放置在数据中心值班电话旁的明显位置。
五、现场应急指挥小组数据中心成立现场应急指挥小组,小组成员履行规定的应急职责。
现场应急指挥小组架构图中应有明确的小组人员姓名和联系方式,并打印张贴在数据中心明显位置。
六、应急事件汇报流程(一)在应急事件中的汇报遵守如下流程:➢突发事件发现人报告给数据中心值班人员➢数据中心值班人员报告到数据中心应急总指挥;➢应急总指挥根据反馈信息,对整体的事件初步情况报告做出判断,组织人员初步评估事件严重程度和事件等级,决策启动相应应急程序。
➢各相应应急组组长接受到通报后,根据应急流程实施应急指挥。
(二)事件通报机制:七、操作安全注意事项以下的内容列出了基本的安全注意事项,但它不能包含所有的情况,应时刻警惕!1.没有数据中心经理许可,严禁任何人员触及各供电设施开关。
2.油罐区、柴油发电机组及配电间和UPS 间应急电源系统设备所在区域,此区域严禁明火和电焊操作,非工作人员或未经上级部门许可人员,严禁入内。
3.所有操作运行人员必须有操作职格证及公司内部安全培训,否则不能执行操作,安全培训包含在应急电源系统的培训内。
4.操作运行人员必须完全熟悉相关设备的安全信息,并且知道操作步骤。
5.在机组周围要时刻注意机组的状态,安全隐患包括机械运动、电气伤害、高电压、烫伤等。
6.注意警告标牌并且在操作之前要确认无人在机器周围工作。
八、应急处理预案(一)市电双路供电中断➢值班工程师1.值班人员接到故障报警的信息后,查看监控报警平台影响范围,包含UPS后备时间,空调运行状况,向设施工程师及数据中心经理汇报。
2.短信平台发出告警短信通知基础设施工程师及数据中心主管现场处理。
3.巡检人员查找断电原因,查看发电机是否自动或人员手动投入(发电机投入时间应在10分钟内投入)。
4.值班人员在电脑上查看UPS的输出电压和备份时间,上报设施工程师及DC经理,同时观察机房环境温升情况。
5.发电机供给正常后,检查冷机及配电、UPS运行状况,根据温升情况,开启机房备用空调,并全面巡检空调及日常设施(CCTV、门禁等)。
6.根据设施工程师安排进行应急处置。
7.待处理结束将处理过程、处理结果录入Remedy。
➢基础设施工程师1.根据故障信息,现场进行处理。
2.向DC主管进行汇报事件处理进程及影响评估。
3.根据机房温升判断,不可控情况下,在室外气温25度以下,开启消防排烟进行降温。
4.根据电路供给情况,对空调配电进行手动切换。
5.指挥关闭一些不必要设备,节约电力资源。
➢数据中心主管1.第一时间向ADM及客户当值人员汇报当前故障信息及后续发展评估,建议客户评估并关闭非关键IT设备。
2.协助现场处理及资源协调(干冰采购等)。
3.关注发电机油料储备情况,向数据中心经理及ADM及时汇报事件处理进展。
✧注:✓一路供电中断1.一路市电供给故障后,低压配电系统母联自动投入运行,接替失压段的负荷。
✓当现场自动启动无效时, ,需要手动分别启动失压段的所有低压母联开关✓ATS转换失败1.因市电供给故障,柴油机组启动正常,但ATS故障不能完成切换,需要及时通知上级主管。
2.需要手动投入备路开关。
(二)UPS故障处理➢值班工程师1.向基础设施工程师汇报故障信息及影响范围。
2.通知巡检人员现场查看有异常有烟雾时及时通知中控室。
3.通知厂商驻厂工程师到现场维维修。
4.全面巡检机房客户设备有无报警。
5.办理厂商人员进出手续,录入Remedy事件单。
➢基础设施工程师1.信息判断:查看UPS故障信息,一台还是多台故障,一台故障是否影响到整体运行(正常:并机UPS一台故障会退出运行,负载转移至其它UPS。
异常:UPS整体退出,全部负荷自动向另一路进行切换。
2.根据故障情况评估事件发展,向领导汇报。
3.协助厂商进行维修,了解操作步骤是否对数据中心产生风险。
➢数据中心主管1.向ADM及数据中心经理汇报,故障情况,严重程度。
2.向客户建议2N供电系统单电源设备业务进行评估。
3.跟进后续故障原因及解决方案。
(三)机柜空开掉电➢值班工程师1.现场查看空开对应设备信息向基础设施工程师汇报。
2.向电气工程师、数据中心经理及ADM汇报。
3.办理厂商人员进出手续,录入Remedy事件单。
➢基础设施工程师1.查找故障点分析掉电原因。
查看机柜内PDU保护开关是否动作。
有动作拔开此设备电源线进行万用表进行检查是否短路。
没有保护开关拔开所有电源线,逐台设备电源进行检测。
拔开工业联接器进行检查PDU是否短路接地。
检查插座是否短路接地。
2.因某台设备故障引发掉电,向客户汇报故障点基本判定是否可以对此机柜其它正常设备进行送电。
等待厂商进行现场维修。
3.PDU故障,使用数据中心备用PDU给客户及时更换。
4.总结分析故障原因,出具故障报告。
(四)风冷精密空调故障高温处理➢值班工程师1.接到故障报警的信息后,第一时间到达现场,开启备用空调。
2.电话通知基础设施工程师现场处理、数据中心主管。
3.一台空调故障,备机开启后,温度恢复正常。
4.二台空调出现时故障,联系紧急运送干冰至数据中心并加开应急排风机。
5.对机房高热区域设备打开机柜前后门及通风地板,利于设备散热。
6.关闭机房工作中不必要负荷,工作中的加湿设备,机房部分照明。
7.根据设施工程师安排进行其它故障处理操作。
8.待处理结束将处理过程、处理结果录入Remedy。
(五)水冷空调高温报警处理➢值班工程师1.现场查看供水温度(高于16度以上为异常)。
2.开启备用空调。
3.通知值班室了解情况及是否启用其它冷机。
如无备用冷机,紧急联系将干冰运送至数据中心加开应急排风机。
4.向数据中心设施工程师汇报。
➢基础设施工程师1.安排指导资深操作员,进行相关操作。
2.根据故障信息,现场进行处理。
3.向DC主管进行汇报处理情况,机房温度变化。
4.根据机房温升判断,在室外气温25度以下。
加开应急排风机。
5.协助厂商进行故障处理。
➢数据中心主管1.第一时间向项目经理(客服)及客户当值人员汇报当前故障信息及后续发展评估,建议客户评估并关闭非关键IT设备。
2.协助现场处理及资源协调(干冰采购等)。
3.向数据中心总经理及项目经理(客服)及时汇报事件处理进展。
(六)局部高温处理➢值班工程师1.查看报警平台,高温报警范围。
向基础设施工程师汇报。
2.观察高温处温升变化,增大此区域地板通风量。
➢基础设施工程师1.调整大通风地板无效情况下,下调空调温度设定并加开导流风机。
2.评估气流组织及设备负载,建议客户进行负载调整及气流组织优化。
(七)机房低温报警处理➢值班工程师1.查看报警平台,低温报警范围。
向基础设施工程师汇报。
2.整体温度偏低,两台以上精密空调关机一台。
3.实时观察机房温度变化,温温达到报警值,开启一台空调。
4.并适当(0.5-1度)提高其中一台空调温度设定值,并实时观察温度变化在正常范围内。
➢基础设施工程师查看引发故障原因:设备负载过低适时调整空调参数,空调自身原因引发联系厂商进行维护。
(八)机房湿度过低的处理➢值班工程师1.现场检查空调加湿器是否有投入。
2.室外湿度大于室内,开启新风机。
3.室外湿度小于室内,关闭新风机。
➢基础设施工程师查看各空调加湿是否正常投入工作,调整加湿量。
(九)机房湿度过高的处理➢值班工程师1.现场查看机房环境,查看精密空调是否除湿运行。
2.向基础设施工程师汇报。
➢基础设施工程师1.室外湿度过高,关闭新风机。
2.查看机房环境温度是否过低,进行调整。