当前位置:文档之家› 服务器机房停电服务器维护方案

服务器机房停电服务器维护方案

服务器机房停电服务器维护方案
服务器机房停电服务器维护方案

鹤山同方照明科技有限公司

目录

第一章维护情况概述 1

第二章准备工作 1

2.1. 提前巡检 1

2.2. 停机前备份重要数据 1

第三章硬件设备启停操作流程 2 2.1 时间安排 2

2.2 硬件设备启停计划 2

第四章应急计划 2

维护情况概述

1)由于公司电路维修,所有服务器均需要停机维护;

2)为确保停机之后所有硬件设备能够继续正常运行,需要制定详细的停机、启动流程;3)提前对所有硬件进行检查,并事前做好数据库、应用的备份工作;

4)准备好备机及备件,如出现硬件故障可以及时更换

准备工作

提前巡检

提前对所有硬件设备进行检查

包括富士通小型机存储及PC服务器,光纤交换机

巡检时间人员安排

设备

巡检人员

巡检内容

时间

PC服务器

查看系统日志及硬件故障指示灯是否正常

X86服务器

查看系统日志及硬件故障指示灯是否正常

富士通PQ540

查看系统日志及硬件故障指示灯是否正常

富士通存储

查看存储日志及硬盘控制器指示灯是否正常

光纤交换机

查看系统日志及硬件故障指示灯是否正常Sun6130存储

查看存储日志及硬盘控制器指示灯是否正常Sun storege C2

查看硬件故障指示灯是否正常

停机前备份重要数据

备份内容

备份及验证方法

负责方

所需时间

Oracle数据库

Rman备份全库,备份语句如下:

run

{

allocate channel ch001 type disk;

backup incremental level 0 tag 'dbfull_%T' filesperset 10 format

'/*/*_full_%u_%s_%p.bak' database; backup current controlfile

format'/*/*_contrl_%u_%s_%p.bak';

release channel ch001;

}

物理备份所有归档日志及spfile

备份存放目录由客户决定

应用软件

通过tar命令将应用软件安装目录打包

备份目录由客户决定

光纤交换机配置内容

登入到光纤交换机将所有配置内容复制到TXT文档中

20分钟

Hp_UNIX

通过命令make_tape_recovery –Av 将操作系统备份到磁带机上

半小时

硬件设备启停操作流程

时间安排

按照预定时间进行停机维护,如有硬件故障于预定时间之前解决;硬件设备启停计划

关闭硬件设备

关闭顺序

设备名称

负责人

所需时间

备注

1

应用服务器(X86)40分钟

2

数据库服务器(X86)20分钟

3

富士通PQ540

10分钟

4

Sun storege C2

5分钟

Sun6130存储5分钟

6

富士通存储5分钟

7

光纤交换机5分钟

启动硬件设备1

光纤交换机5分钟

2

富士通存储

10分钟

3

Sun6130存储

5分钟

4

Sun storege C2

5分钟

5

富士通PQ540

30分钟

6

数据库服务器(X86)10分钟

7

应用服务器(X86)

30分钟

应急计划

准备PC服务器的配件包括(IBM x3650 、x3850、hp580 、hp380)

准备HP小型机RX8640及存储EVA4100的配件

如PC服务器出现主板,硬盘等硬件故障导致无法启动时,我方将提供更高配置的PC服务器供暂时使用;直到原PC服务器恢复正常为止;

如HP小型机RX8640出现故障而暂时无法修复时,我方将提供IBM 同档次的小型机供暂时使用,直到RX8640恢复正常为止;

如HP存储EVA4100出现故障而暂时无法修复时,我方将提供EMC同档次的存储供暂时使用,直到EVA4100恢复正常为止;

机房维护方案74306

机房维护方案 一、维护目的 保障机房设备正常运行,过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。 二、维护内容 1、机房主机设备维护管理:计算机服务器(包括PC服务器及存储服务器);网络设备(交换路由设备等)。 2、机房监控设备维护管理:供配电监测系统、温度环境检测系统、门禁设备系统、保安监控设备。 3、机房空调与配电设备维护管理:空调设备、新风设备、UPS 电池、主配电箱。 4、机房消防设备维护管理:烟感热感探测器、手动报警按钮和报警控制器、灭火器的控制装置。 5、机房供水水路、电路及照明维护管理:水电路管线及接口的检查维护。 6、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、防火地板、墙面、吊顶、门窗及相关配套的维护管理。 三、具体维护方案 1、机房主要设备维护及安全:

服务器维护及安全: ①关闭无用的端口: 网络连接都是通过开放的应用端口来实现的。尽可能少地开放端口,就会大大减少了攻击者成功的机会。关闭掉不会用到的服务。telnet使用更为安全的ssh来代替。下载端口扫描程序扫描系统,如果发现有未知的开放端口,马上找到正使用它的进程,从而判断是否关闭。 Windows主机可采用定义安全策略的方法关闭隐患端口;也可采用筛选tcp端口添加允许的端口,其余端口就被自动排除。 Linux主机可检查inetd.conf文件。在该文件中注释掉那些永不会用到的服务(如:echo、gopher、rsh、rlogin、rexec、ntalk、finger 等)。 ②删除不用的软件包 将不需要的服务一律去掉,如果服务器运行了很多的服务。但有许多服务是不需要的,很容易引起安全风险;同时可以腾出空间运行必要的服务,既节省资源又能保证服务器安全。 ③不设置缺省路由 在服务器中,应该严格禁止设置缺省路由,建议为每一个子网或网段设置一个路由,否则其它机器就可能通过一定方式访问该服务器而造成安全隐患。 ④口令管理 服务器登陆口令的长度一般不少于8个字符,口令的组成应以无

机房设备维护方案

机房设备维护方案 一、维护目的 保障机房设备正常运行,过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。 二、维护内容 1、机房主机设备维护管理:计算机服务器(包括PC服务器及存储服务器);网络设备(交换设备等)。 2、机房监控设备维护管理:供配电监测系统、温度环境检测系统、门禁设备系统、保安监控设备。 3、机房空调与配电设备维护管理:空调设备、新风设备、UPS电池、主配电箱。 4、机房消防设备维护管理:烟感热感探测器、手动报警按钮和报警控制器、灭火器的控制装置。 5、机房供水水路、电路及照明维护管理:水电路管线及接口的检查维护。 6、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、防火地板、墙面、吊顶、门窗及相关配套的维护管理。 三、具体维护方案 1、机房主要设备维护及安全:

服务器维护及安全: ①关闭无用的端口: 网络连接都是通过开放的应用端口来实现的。尽可能少地开放端口,就会大大减少了攻击者成功的机会。关闭掉不会用到的服务。telnet使用更为安全的ssh来代替。下载端口扫描程序扫描系统,如果发现有未知的开放端口,马上找到正使用它的进程,从而判断是否关闭。 Windows主机可采用定义安全策略的方法关闭隐患端口;也可采用筛选tcp端口添加允许的端口,其余端口就被自动排除。 Linux主机可检查inetd.conf文件。在该文件中注释掉那些永不会用到的服务(如:echo、gopher、rsh、rlogin、rexec、ntalk、finger等)。 ②删除不用的软件包 将不需要的服务一律去掉,如果服务器运行了很多的服务。但有许多服务是不需要的,很容易引起安全风险;同时可以腾出空间运行必要的服务,既节省资源又能保证服务器安全。 ③不设置缺省路由 在服务器中,应该严格禁止设置缺省路由,建议为每一个子网或网段设置一个路由,否则其它机器就可能通过一定方式访问该服务器而造成安全隐患。 ④口令管理

机房断电应急措施

机房断电应急方案 第一条:机房意外停电后,首先确定停电的范围以及受影响的设备范围。 第二条:确认停电的范围为本公司或本机房,应立即联系工机科电话汇报。估算电力可能恢复的时间,并通知直接上级。 第三条:如果确认停电的时间在1个小时内,可以在UPS正常供电的时间内,等到电力恢复。如果不能确认在2个小时内恢复供电,需及时到达现场。做好各设备的电源停电准备。在UPS供电达1.5个小时后,严格按操作手册停掉存储和各应用服务器的电源,最后停核心交换机和路由期。等待电力恢复,电力恢复供电后转第七条执行。如果确认停电的范围仅在于本机房电源故障,立即汇报给机房电源维护负责人。 第四条:机房维护负责人将掉电的电源柜总空开和分空开的状态处于下电状态。并向直接领导汇报,马上联系相关厂家,如有可能请厂家立即到现场支持。 第五条:将掉电的所有的设备电源状态处于下电状态,以防止电源柜加电对设备的冲击。 第六条:等各厂家和相关的人员到齐后,商议设备恢复时因注意的事项,并形成相关文档。 第七条:电力室恢复供电后,先不要急于给电源柜加电,等待10—20 分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。 第八条:供电正常后,确定设备处于下电状态后,打开电力柜的总控开。 第九条:根据设备加电顺序,启动分项空开。

第十条:设备加电顺序,网络交换类设备正常后再给磁盘阵列柜加电,存储状态检查正常后,启动主机(以上各设备务必按操作手册的启动顺序上电)。 第十一条:设备启动正常后,开始启动数据库。 第十二条:数据库启动正常后,开始启动中间件服务器。 第十三条:中间件服务器正常后,启动应用程序。 第十四条:机房设备进行全面点检,确认所有设备运行和服务正常。

机房的维护管理方案

机房管理方案 随着计算机技术的快速发展和员工对计算机使用操作步骤的日益增加,播出机房的地位和作用越来越重要。合理有效地对机房进行管理,将对设备的运行维护、快速处理设备故障、降低成本具有十分重要的意义。 一、机房环境的要求 1、机房空气环境 机房设备维护主要包括电气环境、温湿度、防尘、防鼠等方面。 (1)电气环境要求 电气环境的要求主要是指防静电要求和防电磁干扰等。 防静电要求播出设备内部电路采用大量的半导体、CMOS等器件。由于这类器件对静电的敏感范围为25~1000V,而静电产生的静电电压往往高达数千伏甚至上万伏,足以击穿各种类型的半导体器件,因此机房应铺设抗静电活动地板,地板支架要接地,墙壁也应做防静电处理,机房内不可铺设化纤类地毯。工作人员进入机房内要穿防静电服装和防静电鞋,避免穿着化

纤类服装进入机房。柜门平常应关闭,工作人员在机房内搬动设备和拿取备件时动作要轻,并尽量减少在机房内来回走动的次数,以免物体间运动摩擦产生静电。 对于长期运行但无法经常清洁的设备,专门对设备做一次清洁是很有必要的。在长期的维护工作中,有时会碰到电路板的告警,如果对该电路板重新插拔,清洁掉电路板插针周围的灰尘,电路板就会恢复正常。 电磁干扰对播出设备的硬件和软件都有可能造成损害,播出设备本身产生的电磁辐射也会对临近的电子设备产生影响。因此,设备在安装时,应与临近用电设备保持一定的距离,必要时机房应采取屏蔽措施,以免临近电子设备之间相互产生干扰。播出设备的机外布线最好与火线交叉通过,并尽量避免长距离靠近并行。 (2)温湿度要求 播出设备尤其是交换机和磁盘阵列等设备对机房的温度有着较高的要求。温度偏高,易使机器散热不畅,使晶体管的工作参数产生漂移,影响电路的稳定性和可靠性,严重时还可造成元器件的击穿损坏。播出设备在长期运行工作期间,机器温度控制在18℃~25℃之间较为适宜。湿度对通信设备的影响也很大。空气潮湿,易引起设备的金属部件和插接件管部件产生锈蚀,并引起电路板、插接件和布线的绝缘降低,严重时还可

机房设备维护方案

机房设备维护方案 机房设备维护方案 一、维护目的 保障机房设备正常运行,过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通 过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。 二、维护内容 1机房主机设备维护管理:计算机服务器(包括PC服务器及 存储服务器);网络设备(交换设备等)。 2、机房监控设备维护管理:供配电监测系统、温度环境检测系统、门禁设备系统、保安监控设备。 3、机房空调与配电设备维护管理:空调设备、新风设备、UPS 电池、主配电箱。

4、机房消防设备维护管理:烟感热感探测器、手动报警按钮和报警控制器、灭火器的控制装置。 5、机房供水水路、电路及照明维护管理:水电路管线及接口的检查维护。 6、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、防火地板、墙面、吊顶、门窗及相关配套的维护管理。 三、具体维护方案 1机房主要设备维护及安全: 服务器维护及安全: ①关闭无用的端口: 网络连接都是通过开放的应用端口来实现的。尽可能少地开放端口,就会大大减少了攻击者成功的机会。关闭掉不会用到的服务。telnet使用更为安全的ssh来代替。下载端口扫描程序扫描系统,如果发现有未知的开放端口,马上找到正使用它的进程,从而判断是否关闭。 Windows主机可采用定义安全策略的方法关闭隐患端口;也可采用筛选tcp端口添加允许的端口,其余端口就被自动排除。 Linux主机可检查inetd. conf文件。在该文件中注释掉那些永不会用至U的服务(如: echo gopher、rsh、rlogin、rexec ntalk、finger 等)。 ②删除不用的软件包 将不需要的服务一律去掉,如果服务器运行了很多的服务。但有许多服务是不需要的,很容易引起安全风险;同时可以腾出空间运行必要的服务,既节省资源又能保证服务器安全。

XXX系统维护及机房运维综合管理方案

运 维 服 务 方 案 2016年5月18日

XXX系统维护及机房运维方案 二零一七年六月

目录 1 服务内容 (3) 1.1 服务目标 (3) 1.2 信息资产统计服务 (3) 1.3 网络、安全系统运维服务 (4) 1.4 主机系统运维服务 (6) 1.5 存储系统运维服务 (10) 1.6 数据安全存储及灾备运维服务 (11) 1.6.1 传统的灾备方式 (11) 1.6.2 容灾方案的关键指标 (13) 1.6.3 常见的备份策略 (14) 1.6.4 容灾的核心问题 (15) 1.6.5 容灾的实现方式 (16) 1.6.6 异地容灾技术 (18) 1.6.7 灾难恢复级别 (20) 1.7 容灾建设方式 (21) 1.7.1 企业信息系统保护层次 (21) 1.7.2 容灾技术模型 (23) 1.7.3 业务平台的保护---业务处理能力的冗余 (23) 1.7.4 数据平台的保护---业务状态数据的复制 (24) 1.7.5 接入平台冗余和贴换 (24) 1.7.6 容灾模式 (24) 1.7.6.1 容灾层次 (25) 1.7.6.2 容灾范围 (25) 1.7.6.3 同级容灾或降级容灾 (26) 1.7.6.4 容灾技术概述 (27) 1.7.6.5 基于存储的数据复制技术建设容灾系统 (28) 1.7.6.6 小结 (31) 2 运维服务流程 (32) 3 服务管理制度规范 (34) 3.1 服务时间........................................................................... . (34) 3.2 行为规范............................................................................. .. (34) 3.3 现场服务支持规范................................................................. . (35) 3.4 问题记录规范.......................................................................... ................................................ .35 4 应急服务响应措施................................................................... (37) 4.1 应急基本流程................................................................................................................................ ..37 4.2 预防措施......................................................................................... .............................. . (37) 4.3 突发事件应急策略 (38)

环境设备应急操作流程

十里河供电设备应急处理流程 网络运行部

2013年9 月 十里河供电设备应急处理流程

目录

1. 市电停电处理流程 第一步:确认市电断电,UPS蜂鸣器响,市电灯灭。 第二步:关闭UPS筆鸣器响,查看UP监控状态,此时,市电应无输入,由电池供电(蜂鸣器位于网控中心监控室老市电配电柜上)。 第三步:通报领导与技术支持人员出现故障。 第四步:与总配电室(电话:67499703)询问断电原因及断电时间,并与楼下油机房人员联系(电话:9971),说明市电断电,等待油机启动。 第五步:值班工程师确认油机供电,观察市电柜油机供电指示灯亮,并查看UP监控状态。此时,UP獣态应与市电供电状态模式一样。 第六步:要检查机房所有空调和设备,如果空调停止运行,要立即重启,如果设备有异常现象,立即通报设备负责人。 第七步:开启UPS筆鸣器,与楼下油机房人员联系(9971),说明油机供电正常。 第八步:操作完毕。 第九步:通过短信平台通报:部门经理,当班领导,公司领导已恢复供电 机房包括:网控中心机房,UP軌房,四楼军航机房,KU与ATh实验室

市电停电处理流程 注意:在市电停电过程中,要检查机房所有空调和设备,如果空调停止运行,要立即重启,如果设备有异常现象,立即通报设备负责 人。机房包括:网控中心机房,UPS机房,四楼军航机房, ATM实验室。 2. 市电来电处理流程KU与

第一步:确认市电来电,市电灯亮。 第二步:手动复位网控中心旧市电复位按钮。 第三步:与楼下油机房人员联系(9971),说明市电来电正常。 第四步:油机停机后查看UP监控状态。此时,应在市电供电状态模式。 第五步:要检查机房所有空调和设备,如果空调停止运行,要立即重启,如果设备有异常现象,立即通报设备负责人。 第六步:观察油机供电指示灯是否灭,并与楼下油机房人员联系(9971),说明市电供电正常。 第七步:通报领导与技术支持人员。 第八步:操作完毕。 第九步:通过短信平台通报:部门经理,当班领导,公司领导已恢复供电 机房包括:网控中心机房,UP軌房,四楼军航机房,KU与ATh实验室

信息机房维保方案

信息机房精密空调及UPS系统维保 运维服务方案 1、前言 随着社会经济及科学技术的飞速发展,计算机网络的逐渐普及,现XX供电公司共有信息机房13个,是公司综合数据网核心设备以及业务应用、安全保障和工具类系统的关键支撑,然而所有机房的UPS和精密空调已经过了质保期,在其出现故障时无法得到原厂的技术支持和硬件的更换,极大的影响了信息设备的安全运行。 2、实施目标 针对该信息系统维护项目,XX利泰电力建设有限公司提供运行维护的服务范围包括:共计9个直属信息通信机房,13套UPS系统进行日常运行维护及保养,其中120kVA 2套(公司本部),10kVA 11套(客户服务中心1套、4个县级供电企业各1套、检修公司2套、4个县级控股供电企业各1套),保证设备在运期间状态良好,降低整体管理成本,提高网络信息系统的整体服务水平。 3、实施方案设计原则及依据 3.1 根据《国网XX供电公司信息机房精密空调及UPS系统维保合同》进行编制 4、实施组织

4.1施工管理组织机构图 4.2机房UPS 、精密空调动力环境运维服务 4.2.1接收服务请求和咨询 在7*24小时工作时间内设置专人值守的热线电话,用于解决内部的技术问题以及机房突发情况。 表示领导管理关系 表示任务转换关系 电力开发总公司 运维队 全体人员 项目经理

4.2.2我公司采用定期巡检结合故障现场服务。定期巡检结合故障现场运行维护服务的基本操作流程如下图所示: 现场巡检服务是我公司对客户的设备及系统进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。同时,我公司将有针对性地提出预警及解决建议,是用户能够提早预防,最大限度降低运营风险。 4.3行为规范 (1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。

基站故障处理流程规范方案

基站故障处理流程规范 1.概述 1.1编制背景 为进一步规范移动基站处理流程,及时处理基站发生的故障,保证基站故障设备能够在最短时间得以恢复及对网络指标的影响降到最低,特制定基站故障抢修指导手册,以便基站维护人员发现、处理、分析故障问题提供参考。 1.2编制单位 中国移动通信集团江西有限公司鹰潭分公司网络部 1.3指标要求 按照基站维护服务技术规范书的要求,基站维护人员在接到设备障碍通知后,应及时到现场处理。 1.4处理原则 1.维护人员应按“先室内,后室外,先软件,后硬件”的原则进行故障处理工作, 即在排除电力、光缆中断的因素后,再进入基站处理故障,在排除软件 吊死、数据丢失等软件原因后,再对调、更换硬件。 2.在充分了解故障信息的情况下,尽量缩短故障处理时长,更换需更换且 仅需更换的板件。因此,接到故障通知后,应根据通知内容对故障进行

预判断,以便采取针对性的处理措施,定位真正的故障点,避免错误信息误导,延长故障恢复时间。 3.维护人员在故障处理过程中,需协调其它部门或单位解决问题时,应立 即展开协调并向上级报告相关进展情况。 4. 对载频,主控板,传输板等故障处理应禁止在网络指标考核 (8:00-11:00,18:00-20:00)时段进行处理

2.故障处理流程

3. 基站故障分类及参考处理步骤 3.1基站载频退服 步骤1:先要求机房查看载频信令是否激活,即是否处于WO状态。如果载频信令没办法激活或已激活,整个BCF也已重启,但载频依然退服,则带上对应型号的载频。 步骤2:到站后,若扇区没开跳频,则闭掉一块正常工作的载频,将故障板件和它对调。若扇区开了跳频,则先叫机房闭站。 步骤3:对调后,重新集成,观察载频是否能正常工作,如果故障随着载频走,则用新板更换故障载频;如果故障依然存在原位置,则可能与载频硬件无关,需重新定位故障点。 步骤4:故障恢复后,处理板卡标签和固定资产变动,签好出入登记本以及故障处理记录,离开基站。 3.2基站因停电退服 步骤1:维护人员接到停电通知后,首先需询问当地电力公司,看该基站附近是否在做电力抢修,如果电力公司确定是在做电力抢修,详细了解将停电时长及恢复供电时间。 步骤2:在得到确切的时间后,根据基站固定资源调查表,或平时巡检表的信息,判断电池组的持续供电时间,如果电业局确定能恢复供电的时间很短,远小于电池组的安全供电时间,则不必带油机前往基站发电,但需每隔1小时跟踪

办公大楼机房维护方案

办公大楼机房维护方案 办公大楼机房维护方案 一、机房维护的必要性 机房确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障。 二、维护内容 1、机房监控设备维护管理:供配电监测系统、空调环境检测系统、门禁设备系统、漏水 检测、保安监控设备(包含摄像头、硬盘录像机)、监控主机; 2、机房空调与配电设备维护管理:精密空调机组、新风设备;UPS及电池、主配电柜、UPS 配电柜; 3、机房消防设备维护管理:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装 置; 4、机房供水水路、电路及照明线路的维护管理:水、电路管线及接口的检查维修。 5、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、地板、墙面、 吊顶、门窗及有关配套的维护管理 6、机房主机设备维护管理:计算机服务器(包括PC服务器、存储服务器);网络设备(路 由及交换设备等);KVM系统;

7、机房运维管理体系建设:完善机房运维规范,优化机房运维体系; 三、维护具体需求 1、机房监控设备: 1) 每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行。同时检查监控机房通风、散热、净尘、供电等设施。室外温度应在,20 ?,,60?,相对湿度应在10,,100,;室内温度应控制在,5?,,35?,相对湿度应控制在10,,80,,留给机房监控设备一个良好的运行环境。 2)根据监控系统各部份设备的使用说明,每月检测其各项技术参数及监控系统传输线路质量,处理故障隐患,协助监控主管设定使用级别等各种数据,确保各部份设备各项功能良好,能够正常运行。 3)对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象应及时更换、维修,如视频头、采集模块等。 4)对易吸尘部份每季度定期清理一次,如监视器、漏水检测主机、门禁主机等暴露在空气中,由于屏幕的静电作用,会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定 期擦拭监视器,校对监视器的颜色及亮度。 5) 对长时间工作的监控设备每月定期维护一次,如硬盘录像机长时间工作会产生较多的热量,一旦其电风扇有故障,会影响排热,以免硬盘录像机工作不正常。 6) 对监控系统及设备的运行情况进行监控,分析运行情况,及时发现并排除故障。如:网络设备、服务器系统、监控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统的病毒防御。

数据中心机房运维方案

数据中心运维外包 服 务 方 案 2019年8月

数据中心运维外包服务方案 目录 一、运维的重要性 (1) 二、维护范围 (1) 三、提供的服务 (2) 四、服务内容 (3) (一)UPS供配电系统 (3) (二)机房空调系统 (5) (三)服务器运维 (7) (四)存储系统运维 (9) (五)虚拟化平台运维 (10) (六)数据库系统运维 (11) (七)网络设备运维 (13) (八)其它有关系统或设备运维 (15) 五、运维报价服务 (16)

一、运维的重要性 数据中心的日常运维工作是至关重要的。设备故障时,应提供快速的备件供应、技术支持、故障处理等服务。通过机房设备维护保养可以提高设备的使用寿命,降低设备出现故障的概率,避免重特大事故发生,避免不必要的经济损失。 数据中心的运维工作专业性很强,通过引入专业的维护公司进行日常运维工作。建设及使用单位相关管理人员可从日常需要完成专业性很强的维护保养工作中解放出来,重点做好管理及协调工作,更好的发挥信息或科技部门的其它职能。 通过专业、系统、全面的维护可以提前发现问题,并解决问题。将故障消灭在萌芽状态,提高系统的安全性,做到为客户排忧解难,减少客户人力、物力投入的成本,为机房内各系统及设备的正常运行提供安全保障。可延迟客户设备的淘汰时间,使可用价值最大化。通过专业的维护,将数据中心机房内各类设备的运行数据进行整理,进行数据分析,给客户的机房基础设施建设、管理和投入提供依据。 二、维护范围 数据中心机房于××年×月建成并投入使用,数据中心有关设备及基础系统清单如下:

三、提供的服务 为更好的服务好客户,确实按质按量的对设备进行维护;我公司根据国家相关标准及厂商维护标准,结合自身经验积累和客户需求,制定以下服务内容: 1.我公司在本地储备相应设备的备品备件,确保在系统出现故障时,及时免费更换新的器件,保障设备使用安全。 2.我公司和客户建立24小时联络机制,同时指定一名负责人与使用方保持沟通,确保7*24小时都可靠联系到工程技术人员,所有节日都照此标准执行。 3.快速进行故障抢修:故障服务响应时间不多于30分钟,2小时内至少2人携带相关工具、仪器到达故障现场现行故障排查处理,直到设备恢复正常运行。 4.我公司对维修维护的设施设备的使用性能负责,在维修维护过程中严格执行技术规范,保证设施设备的性能符合相关技术标准要求。在维修维护间,我方应对设施设备可能存在的故障隐患做出评估,并进行恰当的预防性处理,以保证设施设备的安全运行。若故障隐患超出维修维护范围的,及时书面通知客户,并提出消除隐患建议。 5.维护巡检中我公司提供设备系统图或使用说明书:将机房内设备的整个系统等汇编成资料,由维护人员进行统一放置,便于应急查询。 6.巡检次数每年不少于四次,每次巡检后,由维修维护方提供巡检报告,并由使用方签字确认。每月由我公司客户服务人员定期进行回访,听取客户意见反馈,搭建起双方的沟通渠道。 7.提供系统应急方案:设备在12小时内还无法修复的应有备份应急处理方案。如提供适合负载功率的备机、备用空调等。 8.培训:提供专业理论知识培训和操作培训,维修维护培训,简单故障处理培训,培训文档由我公司整理。 9.人员配置:全年(包括所有的节假日期间)提供不少于2名工程师在常住贵阳本地,确保满足响应时间要求;到现场的维护维修工程师至少一名是能完全解决故障并有丰富从业经验的。 10.我公司每次巡检完毕后提供维护报告,同时还提供全年维护报告、每次维修事故报告等资料,根据事故提出相应的整体解决方案等管理规划层面的内容。

机房维保方案

机房维保方案 随着计算机技术的快速发展和员工对计算机使用操作步骤的日益增加,机房的地位和作用越来越重要。合理有效地对机房进行管理,将对设备的运行维护、快速处理设备故障、降低成本具有十分重要的意义。 一、机房设备对环境的要求 1、机房空气环境 机房设备维护主要包括电气环境、温湿度、防尘、防鼠等方面。 (1)电气环境要求 电气环境的要求主要是指防静电要求和防电磁干扰等。 防静电要求播出设备内部电路采用大量的半导体、CMOS等器件。由于这类器件对静电的敏感范围为25~1000V,而静电产生的静电电压往往高达数千伏甚至上万伏,足以击穿各种类型的半导体器件,因此机房应铺设抗静电活动地板,地板支架要接地,墙壁也应做防静电处理,机房内不可铺设化纤类地毯。工作人员进入机房内要穿防静电服装和防静电鞋,避免穿着化

纤类服装进入机房。柜门平常应关闭,工作人员在机房内搬动设备和拿取备件时动作要轻,并尽量减少在机房内来回走动的次数,以免物体间运动摩擦产生静电。 对于长期运行但无法经常清洁的设备,专门对设备做一次清洁是很有必要的。在长期的维护工作中,有时会碰到电路板的告警,如果对该电路板重新插拔,清洁掉电路板插针周围的灰尘,电路板就会恢复正常。 电磁干扰对播出设备的硬件和软件都有可能造成损害,播出设备本身产生的电磁辐射也会对临近的电子设备产生影响。因此,设备在安装时,应与临近用电设备保持一定的距离,必要时机房应采取屏蔽措施,以免临近电子设备之间相互产生干扰。播出设备的机外布线最好与火线交叉通过,并尽量避免长距离靠近并行。 (2)温湿度要求 播出设备尤其是交换机和磁盘阵列等设备对机房的温度有着较高的要求。温度偏高,易使机器散热不畅,使晶体管的工作参数产生漂移,影响电路的稳定性和可靠性,严重时还可造成元器件的击穿损坏。播出设备在长期运行工作期间,机器温度控制在18℃~25℃之间较为适宜。湿度对通信设备的影响也很大。空气潮湿,易引起设备的金属部件和插接件管部件产生锈蚀,并引起电路板、插接件和布线的绝缘降低,严重时还可

机房保养、使用维护方案

机房保养、使用及维护方案 一、机房维护的必要性 机房内的设备对工作环境有着非同一般的要求。 1、机房设备十分爱干净,对灰尘特别“感冒”。如果设备长期处于灰尘漫舞的环境中工作,很容易发生故障,因为灰尘会不知不觉地渗入设备的控制框中,并直接覆盖到它的电子线路中。时间一长,设备内部的工作电路就会散热不良,长此以往自然就容易出现故障。 2、设备都害怕潮湿。设备内部有电子线路,如果电子线路中的各个元器件长期在潮湿环境中工作,其电气性能会逐步下降,而且还有可能产生漏电现象,引发火灾事故。 3、设备对环境温度十分敏感。高于40℃的环境或低于0℃的环境会降低设备的工作效率,使它的潜能得不到充分发挥,从而减少使用寿命。 4、机房的硬件设备品牌过多、产品供应商过多,厂家售后保障措施不到位等等原因,导致设备使用一段时间后,设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象。 对于客户而言,往往因为专注于业务或者受成本所限,缺乏专业的机房维护人员以及充足的备件。如果说小故障尚可解决,那么,一旦机房发生突如其来的大故障,客户便会措手不及,或者无法找到症结所在,或者没有可更换的备件。此时,损失已经造成了。 为了做好机房设备的维护工作,我公司维修中心配备相应的人力、物力(工具、通讯设备等),确保中心机房正常运作,通过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。 确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障。

机房及设备维护方案与计划

机房及设备维护方案与计划 一、预防性检查 1、巡检时间 每个工作日上午9点 2、巡检地点 计算机机房、精密空调、UPS 3、巡检目的 进行机房检查,对机房设备及供电系统、UPS系统、精密空调系统、录像系统等设备进行检查,及时发现设备隐患,排除故障。 4、巡检要求 4.1巡检期间,进行状态检查,若发现问题,如计算机机房物理环境异常、精密空调异常、UPS及配电系统异常等,应按照应急预案及操作流程进行处理。 (1)电源、UPS:检查机房供电状况,UPS工作情况、指示状态。检查UPS蓄电池使用状态,确保蓄电池无松动。并使用温度枪进行检测物理温度。确保配电柜及UPS、蓄电池无温度过高现象。 (2)机房环境:检查机房卫生状况及物理环境。 (3)机房温度:检查温湿度,将温湿度控制在一定范围内。温度:22℃±5℃,湿度≤60%. (4)机房空调:空调运行状态、空调内部有无漏水现象、空调噪音、空调风量等。 (5)机房照明:机房照明系统是否正常,有无异常状况。 (6)机房PDU:PDU市电或UPS是否正常,使用温度枪进行检测外部物理温度。 (7)机房整体:检查机房其余设备运行状态,有无报警及指示灯异常状态。 4.2如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知甲方相关领导,由相关领导协调资源进行故障处理。 4.3故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。

5、计算机机房现场管理要求 5.1除工作人员外,其他工作人员进出机房,需签字后方可进入,同时计算机机房人员要在现场,检查监督其人员工作,避免其他人员未经授权擅自接触机房物理设备。 5.2机房的机柜、线缆、设备等的标签管理; 5.3机房环境清理。 6、每日检查内容列表 二、现场故障维修 每日巡检过程中,如有发现设备及环境系统有故障状态,需进行记录并恢复故障状态。如不能立即恢复故障状态,则需进行应急预案处理。具体如下: 1、环境故障:卫生、温湿度、照明。(四级故障)

最新整理服务器机房维护方案.docx

最新整理服务器机房维护方案 为了保证信息系统的安全、稳定运行和信息系统功能的全面发挥,延长机器寿命,保护公司信息数据的安全、保密,根据企业的有关规定和客观情况,特制定以下机房管理制度: 一、安全管理制度 1、建立机房管理责任制,明确专人管理,全面负责机房的日常安全管理及信息设备的日常维护、保养。 2、建立机房出入管理登记卡,未经主管领导批准,不得随便进入机房,进出机房原则上两人通行,并履行登记手续。 3、为每台服务器配备日常操作日志,对服务器的所有操作及异常反应做详细记录,并妥善保存。 4、制定应急预案措施。 对灾难事故要做好应急预案。防患于未然,对重要服务器要采取双工工作。 5、制定数据备份制度。 对服务器的数据相关日志进行备份,并进行异地备份;要定时检查备份文件的完整性、可用性。 6、制定安全隐患预警机制。 定时分析系统运行日志及系统运行异常现象,及时对系统安全进行预警,并通知主管部门,同时采取积极措施防止危险的发生。 8、制定系统服务器配置登记表。 制定系统服务器配置登记表,并随机配置,具体内容包括:服务器名称及域名、CPU类型及数量、内存类型及容量、硬盘类型及容量、

网卡类型及速率、操作系统类型及版本、服务器逻辑名及IP地址、应用软件的配置、硬件及软件配置的变更情况等。 二、信息系统运行维护 1、机房管理人员要应注意机房的温度和湿度,使温度在20±5℃,相对湿度45%~65%。 2、机房管理人员应每天清理机房卫生,保证机房及信息设备的整洁;严禁在机房内使用或存放易燃、易爆、腐蚀性、挥发性物品;机房门外严禁堆放杂物和易燃、易爆物;严禁在机房内吸烟和乱丢烟头。严禁在机房内吃食物或存放食物及个人用品。 4、所有服务器其必须配备UPS及应急电池,并保证无人看守的电力供应;严禁在机房内私自配接电器;UPS应妥善保养,每3个月放电一次。 5、定期检修信息设备及附属设施。检修的项目涉及服务器、交换机、集线器、中继器、路由器、防火墙、配线架、网线、UPS电源、电池等公用网络实体。在出现异常征兆或故障情况下可进行临时检修。临时检修包括检查、分析、确定故障设备或故障部位,并进行应急维修。 6、技术人员,要随时处理信息故障、解决问题、保持信息系统的正常运转、提高信息系统的稳定性和可靠性水平。 7、要定期更新服务器安全补丁,升级计算机杀毒软件,并进行杀毒,安装服务器应用软件,做好服务器操作系统及应用软件的安全工作。

机房停电事件应急预案

XXXXXX机房停电应急预案 (V 1.0) IT 运维 2008-11-4 目录

机房停电事件应急预案 1.总则 1.1目的 为更好的应对机房停电此类突发事件,提高处理各类停电事件的能力,建立健全可靠的应急机制,最大限度地降低各类停电事件对公司各部门的影响,参照《XXXX数据中心突发事件应急处理程序V2.1》,特制定《XXXX 机房停电事件应急预案》(以下简称预案)。 1.2工作原则 (1)预防为主。立足安全防护,加强预警,重点保护公司重要系统信息,数据安全。 (2)快速反应。发生突发事件时,《XXXX数据中心突发事件应急处理程序V2.1》,及时获取充分而准确的信息,迅速处置,最大程度地减少突发事件影响。 (4)坚持“统一领导、协调配合、明确责任、坚守岗位”的原则。 1.3适用范围 所有机房临时停电,突发停电以及较长时间停电的事件。 2.组织机构及职责 2.1组织机构(联系人名单及联系方式每半年更新一次) 规划运营:主要联系人及联系方式: IT 主要联系人及联系方式 Helpdesk:分机:XXXX。(7 X 24工作) 各主要设备供应商联系人及联系方式:

2.2各组织机构职责 1).规划运营部门应尽可能及时通知所有部门停电信息,且准备好应急措施,若需要柴油发电机工作应提前检查柴油机性能,输出电压是否稳定以及柴油等辅助设备是否充足。 2).IT部门应及时做好停电应急措施,通知各相关部门做好重要数据备份,并通知到机房设备供应商,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,IT所有相关人员在此期间必须保持随时待命状态。 3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;突发临时停电应尽可能做好远程技术支持工作。 3. IT部门应急预案 3.1机房长时间停电应急预案 ⑴接到长时间停电通知后,应询问停电原因及具体停电时间并及时通过System Helpdesk发布或电话通知停电公告,要求各部门尽可能在停电前停止业务、保存数据,关闭所有能关闭的用电设备。 ⑵根据停电时间长短情况,协同规划运营部门部署应急措施,检查应急设备是否正常,若时间条件许可模拟停电测试应急设备性能。 (3) 对机房设备用电做好统计,做好拉闸限电预案。 (4) 各相关技术支持人员部署到位,确保停电期间重要系统和设备运行正常,以及恢复供电后所有系统,设备运行正常。 (5)通知相关部门,停电期间加强对存在安全隐患的设备及区域的巡查(如电梯间,水房等),保障公司人员和财产安全。 (6) 机房管理人员详细记录事件原因及此期间采取的应急措施,备

中心机房维保方案

目录 第一章机房维护方案 (2) 第二章维护组织机构及职责 (3) 第三章日常维护方案及项目、应急保障方案 (5) 第四章机房维保报价 (9) 第五章公司简介及资质 (9) 1 公司概况 (9) 2 企业文化 (9) 3 主要优势 (10) 4 资质证明材料 (12) 4.1营业执照 (12) 4.2安防一级资质、ISO9001认证 (13)

第一章机房维护方案 1.1维护设备内容 本方案维护内容为中心机房内空调设施、UPS供电、发电机组、消防设施、防雷、布线、环境监测系统等。 1.2维护管理的工作内容 1.2.1保证全程全网安全、稳定、高效运行; 1.2.2保证运行质量达到网络技术指标和服务质量指标的要求; 1.2.3作好各项日常维护,保证维护文档和技术资料的完整、正确; 1.2.4做好客户端维护工作,定期组织巡检。 1.3维护分工界面 电力系统维护界面:我公司负责市电配电箱至UPS以下电源系统维护,包括电池组、空调、机房照明、机架电源维护工作。 材料界面:我公司负责网线、水晶头、标签、尾纤、机房设备电源线材料。机房管理部门负责自购服务器硬件材料、机房其它附属材料(门、窗、静电地板等)提供。 1.4故障和投诉处理 凡影响客户正常使用业务的情况,都称为故障。客户业务故障处理应遵循“先抢通、后修复”原则,即利用各种手段快速恢复客户业务、然后尽快找出故障点,恢复故障。

第二章维护组织机构及职责2.1组织机构 2.2人员配置表 2.2.1维护部门人员配置

2.2.2仪器仪表配置

2.3日常巡检、集中检修作业流程 2.4、客户响应工作内容 维护职责 2.4.1本方案对机房内包括空调、UPS、发电机等主要设备提供一年两次的定期 检测、保养、可预防性的对设备进行检测。 2.4.2本方案按故障等级提供不同的故障响应服务,力求在最短的时间内恢复业 务运行,并排除故障。 2.4.3本方案提供现场培训和集中培训。 第三章日常维护方案及项目、应急保障方案 3.1机房及设备日常维护方案 ●机房空调维护 (一)控制系统的维护 对空调系统的维护人员而言,在巡视时第一步就是看空调系统是否在正常运行,因此我们首先要做以下的一些工作。 (1)从空调系统的显示屏上检查空调系统的各项功能及参数是否正常; (2)如有报警的情况要检查报警记录,并分析报警原因; (3)检查温度、湿度传感器的工作状态是否正常; (二)压缩机的巡回检查及维护 (1)听—用听声音的方法,能较正确的判断出压缩机的运转情况。因为压缩机运转时,它的响声应是均匀而有节奏的。如果它的响声失去节奏声,而出现了不均匀噪音时,即表示压缩机的内部机件或气缸工作情况有了不正常的变化。

IDC数据机房维护保养方案计划

| IDC数据机房运维方案 韩东勋 2017.8.25

目录 1 IDC数据机房架构图 (1) 1.1 IDC数据机房系统逻辑架构图 (1) 1.2IDC机房网络拓扑图 (1) 1.3IDC数据机房安全技术架构图 (2) 2 IDC机房运维 (2) 2.1软件维护 (2) 2.2硬件维护 (2) 2.3安全维护 (3) 2.4物理环境维护 (3) 2.5其它维护内容 (4) 3 IDC机房智能化管理............................................................................................ 错误!未定义书签。 4 IDC机房信息资产统计 (9) 5 IDC机房值班方案 (9) 6 IDC机房应急预案 (12)

1 IDC 数据机房架构图 1.1 IDC 数据机房系统逻辑架构图 1.2 IDC 数据机房网络拓扑图 业务层:主机托管、业务备份等 资源层:计算、存储、宽带等 网络层:路由器、交换机、防火墙等 物理层:电力、空调、综合布线等 运营管理层 网络管理 资源管理 业务管理 运营管理

1.3IDC数据机房安全技术架构图 2 IDC机房运维 2.1 软件维护 ?软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件 等)、业务应用软件等 维护:常用应用软件的安装、调试、管理、更新、升级、故障检测及排除。 操作系统的调试、管理、更新,升级,故障检测及排除。 建立常用应用软件及驱动程序库。(视客户情况而定) 2.2 硬件维护 ?硬件设备包括:网络设备、安全设备、主机设备、存储设备等 维护:计算机硬件设备的维护、保养、更新、升级、故障检测及排除。 对于需要更换的设备,提供设备选型建议及市场参考价格,并可代为购买(设 备采购费用另计)。

系统维护和机房运维方案

系统维护和机房运维方 案 Revised at 2 pm on December 25, 2020.

运 维 服 务 方 案 2016年5月18日

目录 1 服务内容 (3) 服务目标 (3) 信息资产统计服务 (3) 网络、安全系统运维服务 (4) 主机系统运维服务 (6) 存储系统运维服务 (10) 数据安全存储及灾备运维服务 (11) 传统的灾备方式 (11) 容灾方案的关键指标 (13) 常见的备份策略 (14) 容灾的核心问题 (15) 容灾的实现方式 (16) 异地容灾技术 (18) 灾难恢复级别 (20) 容灾建设方式 (21) 企业信息系统保护层次 (21) 容灾技术模型 (23) 业务平台的保护---业务处理能力的冗余 (23) 数据平台的保护---业务状态数据的复制 (24) 接入平台冗余和贴换 (24) 容灾模式 (24) 2 运维服务流程 (32) 3 服务管理制度规范 (34) 服务时间........................................................................... . (34) 行为规范............................................................................. .. (34) 现场服务支持规范................................................................. . (35) 问题记录规范.......................................................................... ................................................ .35 4 应急服务响应措施................................................................... (37) 应急基本流程 ................................................................................................................................ ..37 预防措施......................................................................................... .............................. . (37) 突发事件应急策略 (38)

相关主题
相关文档 最新文档