当前位置:文档之家› 机房维护方案

机房维护方案

机房维护方案
机房维护方案

机房维护方案

一、机房维护的必要性

机房内的设备对工作环境有着非同一般的要求。

1、机房设备十分爱干净,对灰尘特别“感冒”。如果设备长期处于灰尘漫舞的环境中工作,很容易发生故障,因为灰尘会不知不觉地渗入设备的控制框中,并直接覆盖到它的电子线路中。时间一长,设备内部的工作电路就会散热不良,长此以往自然就容易出现故障。

2、设备都害怕潮湿。设备内部有电子线路,如果电子线路中的各个元器件长期在潮湿环境中工作,其电气性能会逐步下降,而且还有可能产生漏电现象,引发火灾事故。

3、设备对环境温度十分敏感。高于40℃的环境或低于0℃的环境会降低设备的工作效率,使它的潜能得不到充分发挥,从而减少使用寿命。

4、机房的硬件设备品牌过多、产品供应商过多,厂家售后保障措施不到位等等原因,导致设备使用一段时间后,设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象。

对于客户而言,往往因为专注于业务或者受成本所限,缺乏专业的机房维护人员以及充足的备件。如果说小故障尚可解决,那么,一旦机房发生突如其来的大故障,客户便会措手不及,或者无法找到症结所在,或者没有可更换的备件。此时,损失已经造成了。

为了做好机房设备的维护工作,我公司维修中心配备相应的人力、物力(工具、通讯设备等),确保中心机房正常运作,通过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。

确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障。

二、维护内容

1、机房监控设备维护管理:供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安

监控设备(包含摄像头、硬盘录像机)、监控主机;

2、机房空调与配电设备维护管理:精密空调机组、新风设备;UPS及电池、主配电柜、UPS 配电柜;

3、机房消防设备维护管理:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装置;

4、机房供水水路、电路及照明线路的维护管理:水、电路管线及接口的检查维修。

5、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、地板、墙面、吊顶、门窗及有关配套的维护管理

6、机房主机设备维护管理:计算机服务器(包括PC服务器、存储服务器);网络设备(路由及交换设备等);KVM系统;

7、机房运维管理体系建设:完善机房运维规范,优化机房运维体系;

三、维护具体需求

1、机房监控设备:

1)每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行。同时检查监控机房通风、散热、净尘、供电等设施。室外温度应在-20 ℃~+60℃,相对湿度应在10%~100%;室内温度应控制在+5℃~+35℃,相对湿度应控制在10%~80%,留给机房监控设备一个良好的运行环境。

2)根据监控系统各部份设备的使用说明,每月检测其各项技术参数及监控系统传输线路质量,处理故障隐患,协助监控主管设定使用级别等各种数据,确保各部份设备各项功能良好,能够正常运行。

3)对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象应及时更换、维修,如视频头、采集模块等。

4)对易吸尘部份每季度定期清理一次,如监视器、漏水检测主机、门禁主机等暴露在空气中,由于屏幕的静电作用,会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定期擦拭监视器,校对监视器的颜色及亮度。

5)对长时间工作的监控设备每月定期维护一次,如硬盘录像机长时间工作会产生较多的热量,一旦其电风扇有故障,会影响排热,以免硬盘录像机工作不正常。

6)对监控系统及设备的运行情况进行监控,分析运行情况,及时发现并排除故障。如:网络设备、服务器系统、监控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统的病毒防御。

7)每月定期对监控系统和设备进行优化:合理安排监控中心的监控网络需求,如带宽、IP地址等限制。提供每月一次的监控系统网络性能检测,包括网络的连通性、稳定性及带宽的利用率等;实时检测所有可能影响监控网络设备的外来网络攻击,实时监控各服务器运行状态、流量及入侵监控等。对异常情况,进行核查,并进行相关的处理。根据用户需要进行监控网络的规划、优化;协助处理服务器软硬件故障及进行相关硬件软件的拆装等。

8)提供每月一次的定期信息服务:每月第一个工作日,将上月抢修、维修、维护、保养记录表以电子文档的形式报送监控中心负责人。

2、机房空调与配电设备

2.1机房空调及新风维护

2.1.1控制系统的维护

对空调系统的维护人员而言,在巡视时第一步就是看空调系统是否在正常运行,因此我们首先要做以下的一些工作。

1)从空调系统的显示屏上检查空调系统的各项功能及参数是否正常;

2)如有报警的情况要检查报警记录,并分析报警原因;

3)检查温度、湿度传感器的工作状态是否正常;

4)对压缩机和加湿器的运行参数要做到心中有数,特别是在每天早上的第一次巡检时,要把前一天晚上压缩机的运行参数和以前的同一时段的参数进行对比,看是否有大的变化,根据参数的变化可以判断计算机机房中的计算机设备运行状况是否有较大的变化,以便合理地调配空调系统的运行台次和调整空调的运行参数。当然,对目前而言有些比较老的空调系统还不能够读出这些参数,这就需要晚上值班的工作人员多观察和记录。

2.1.2压缩机的巡回检查及维护

1)听—用听声音的方法,能较正确的判断出压缩机的运转情况。因为压缩机运转时,它的响声应是均匀而有节奏的。如果它的响声失去节奏声,而出现了不均匀噪音时,即表示压缩机的内部机件或气缸工作情况有了不正常的变化。

2)摸—用手摸的方法,可知其发热程度,能够大概判断是否在超过规定压力、规定温度的情况下运行压缩机。

3)看—主要是从视镜观察制冷剂的液面,看是否缺少制冷剂。

4)量—主要是测量在压缩机运行时的电流及吸、排气压力,能够比较准确判断压缩机的运行状况。当然对压缩机我们还需要检查高、低压保护开关、干燥过滤器等其他附件。

2.1.3冷凝器的巡回检查及维护

1)对专业空调冷凝器的维护相当于对空调室外机的维护,因此我们首先需要检查冷凝器的固定情况,看对冷凝器的固定件是否有松动的迹象,以免对冷媒管线及室外机造成损坏。

2)检查冷媒管线有无破损的情况(当然从压缩机的工作状况及其它的一些性能参数也能够判断冷媒管线是否破损),检查冷媒管线的保温状况,特别是在北方地区的冬天,这是一件比较重要的工作,如果环境温度太低而冷媒管线的保温状况又不好的话,对空调系统的正常运转有一定的影响。

3)检查风扇的运行状况:主要检查风扇的轴承、底座、电机等的工作情况,在风扇运行时是否有异常震动机风扇的扇也在转动时是否在同一个平面上。

4)检查冷凝器下面是否有杂物影响风道的畅通,从而影响冷凝器的冷凝效果;检查冷凝器的翅片有无破损的状况。

5)检查冷凝器工作时的电流是否正常,从工作电流也能够进一步判断风扇的工作情况是否正常。

6)检查调速开关是否正常,一般的空调的冷凝器都有两个调速开关,分为温度和压力调速,现在比较新的控制技术采用双压力调速控制,因此我们在检查调速开关时主要是看在规定的压力范围内,调速开关能否正常控制风扇的启动和停止。

2.1.4蒸发器、膨胀阀的巡回检查及维护

蒸发器、膨胀阀的维护主要是检查蒸发器盘管是否清洁,是否有结霜的现象出现,以及蒸发器排水托盘排水是否畅通,如蒸发器盘管上有比较严重的结霜现象或在压缩机运转时盘管上的温度较高的话(通常状况下,蒸发器盘管的温度应该比环境温度低10℃左右),就应当检查压缩机的高、低压,如果压力正常的话,就应考虑膨胀阀的开启量是否合适。当然出现这种现象也有可能是其它环境的原因引起的,比如空调的制冷量不够、风机故障引起风速过慢等原因造成的。

2.1.5加湿系统的巡检及维护

1)由于各个地方的空气环境不同,对加湿器的使用和影响也不一样,但我们在日常的维护工作中同样要做的事情是观察加上罐内是否有沉淀物质,如有就要及时冲洗,因为现在空调的加湿罐一般都是电极式的,如沉淀物过多而又不及时冲洗的话,就容易在电极上结垢从而影响加湿罐的使用寿命。当然现在有些加湿罐的电极是可以更换的。

2)检查上水和排水电磁阀的工作情况是否正常。在加湿系统工作的过程中,有一种情况经常出现,但又不容易判断,即在空调系统正常工作的时候,由于某种原因出现了一段时间的停水,后又恢复供水,在恢复供水后加湿罐不能够正常上水,出现这种现象的原因有多种,并且在大多数空调器的控制系统中直接对加湿系统复位通常是不能够解决问题的;根据我们多年来的维护来看,引起这种现象的主要原因是停水后的空气进到进水电磁阀前端,对进水电磁阀的正常开启造成了一定的影响,解决这种现象有两种比较有用的办法,一是卸开进水口,排掉空气,二是关掉加湿系统的电源,重新给电磁阀上电也基本上能够解决这类问题。

3)检查加湿罐排水管道是否畅通,以便在需要排水和对加湿罐进行维修时顺利进行。

4)检查蒸汽管道是否畅通,保证加湿系统的水蒸汽能够正常为计算机设备加湿。

5)检查漏水探测器是否正常,这对加湿系统来说是比较重要的一环,因为排水管道如果不畅通的话就容易形成出现漏水的情况,如漏水探测器不正常的话,就易出现事故。当然,对一般的空调系统而言,漏水探测器是选件,如空调系统未配有漏水探测器,那么我们更要注意监测排水管道是否畅通,同时也要做好机房防水墙的维护工作。

2.1.6空气循环系统的巡回检查及维护

对空气循环系统我们主要是考虑空调系统的过滤器、风机、隔风栅及到计算机设备的风道等因素。因

此我们在日常维护工作中要做好以下的一些工作:

1)计算机机房的设备经常有设备移动的现象,而设备的移动一般又不是由空调设备的维护人员去完成,因此我们在设备移动后应及时检查机房内的气流状况,看是否有气流短路的现象发生,同时在新设备的位置是否存在送风阻力过大的情况。如有上述现象应及时调整,如果实在调整不过来,应建议设备移到新的合适的位置。

2)检查空调过滤器是否干净,如脏了就应及时更换或清洗。

3)检查风机的运行状况:主要是检查风机各部件的紧固情况及平衡,检查轴承、皮带、共振等情况;对风机的检查应该特别仔细,因为蒸发器的热交换过程主要是由在风机的作用下使快速流动的气流经过低温的蒸发器盘管来完成的,从而使空调达到制冷的效果,所以风机的是否正常运行是空调系统是否正常运行的最后体现;对风机而言当然最重要的就是电机了,因此我们在日常维护中首先就应查看其皮带的状况、主从动轮是否在同一面上等;皮带调整的松紧程度要合适,太松容易打滑,太紧对皮带的磨损太快,皮带的松紧跟外部对静压得需求也有比较大的关系,当然这种调整是在空调系统控制的范围之内进行的;现在部分比较先进的空调系统采用了一体化的风机,就解决了皮带调整的问题。

4)测量电机运转电流,看是否在规定的范围内,根据测得的参数也能够判断电机是否是正常运转。

5)测量温、湿度值,与面板上显示得值进行比较,如有较大的误差,应进行温度、湿度的校正,如误差过大应分析原因。出现这种情况从我们的维和经验来看有两种原因:一是控制板出现故障,二是温度、湿度探头出现故障需要更换。

6)检查隔风栅的关闭情况是针对已经停机的空调而言的,这也是我们在日常维护工作中比较容易遗漏的一个环节,但也是一个比较重要的环节,因为一台空调停止运行,如果隔风栅未关闭其温度、湿度探头检测到的是其它空调的出口的温度和湿度,在空调下一次开启时控制系统就会根据其先前检测到的参数而对空调系统的运行情况做出控制,这时空调控制系统就会对压缩机、加湿、除湿系统地运行情况做出错误的指令。现在大多数空调设计时都没有考虑这种状况对空调系统的影响,因为这种影响的时间较短,在较短的时间内系统会根据新的信息达到正常的运行状况,所以没有设计隔风栅,这种影响虽然较小,但我们认为在要求很高的计算机机房中我们最好不要让系统出现一段时间的错误运行,因此我们可以为空调系统人为地增加隔风栅。

7)检查计算机及其它需要制冷的设备进风侧的风压是否正常,因为随着计算机设备的搬迁和增加,地板下面的线缆的增加有可能就影响空调系统的风压,从而造成计算机及其它设备跟前的静压不够,这就需要我们设备维护和管理人员对空调系统的风道做出相应的调整或增加空调设备。 2.2 UPS及电池维护2.2.1测试及记录主机运行参数,

2.2.2 根据实际情况进行电池核对性容量测试;

2.2.3 用专用仪器对后备用蓄电池组逐个测量,进行充放电维护及调整充电电流,确保电池正常工作;

2.2.4 检查风机及风道情况并清洁,主机外观清洁、内部除尘;

2.2.5检查记录输出波形、谐波含量、零地电压等,

2.2.6清洁系统主设备及电池等,

2.2.7查清各参数是否正确或切合实际,能及时发现事故隐患

2.2.8 UPS各项功能测试,如检查逆变器、整流器等启停、电池管理功能,有条件进行UPS 同市电的切换试验。

2.2.9 检查主机、电池及相关配电引线及端子的接触情况是否可靠,并测量记录压降及温升,有条件地进行相关紧固工作等。

2.2.10观察可能出现的元件老化或损坏现象、电容是否有膨胀或漏液迹象、磁性元件是否过热或分层迹象

2.2.11 并机系统进行单机运行测试,热备份系统负荷切换测试等

2.3 低压配电柜维护

2.3.1低压配电柜带电清洗维护:

2.3.2检查电气盘柜的部分触点、接线柱等有氧化锈蚀;

2.3.3电气设备外壳用手触摸感觉温度异常高;

2.3.4检查有些电气设备的内部有无声音异常;

2.3.5清理绝缘子表面沉积了污秽物质等;

2.3.6接线柱加固,标签更换,

2.3.7测试输入输出频率;电流电压等

3.消防设备的维护

3.1检查火灾报警控制器的自检、消音、复位功能以及主备电源切换功能;

3.2检查报警探测器、手动报警按钮、火灾警报装置外观;

3.3气体灭火控制器工作状态;

3.4储瓶间环境、气体瓶组或储罐、选择阀、驱动装置等组件外观;

3.5应急灯和疏散指示标志工作状态。

3.6火灾报警探测器、手动报警按钮、报警控制器、联动控制设备的试验报警功能。

3.7气体灭火控制设备的试验模拟自动启动

4、供水水路、电路及照明线路的维护

4.1镇流器、灯管更换;灯盘校正,开关更换,

4.2线头氧化处理,标签巡查更换,漏保实验

4.3 检查机房进出水管接头是否有液漏现象

4.4水管阀门检查、加固及更换

5、机房基础维护

5.1吊顶表面清洁;板材松动、翘起修复,变形、损坏更换;龙骨调平等

5.2墙面污迹清理,裂缝修补

5.3玻璃清洗,不锈钢清洗,玻璃胶修整,地弹簧校正,拉手螺丝加固

5.4静电地板清洗清洁,地面除尘;缝隙调整;平整度调整;损坏更换

5.5接地电阻测试;主接地点除锈、土壤降阻、接头紧固;防雷器检测;接地线触点防氧化加固。

5.6线路测试;模块、光纤配线检查;标签检查;整理凌乱线缆;对甲方所发生的故障及时排除;编写更新文档、表格和对应表来显示其物理链路

5.7机柜除尘、清洁;机柜及网络设备整理,包括交换机、配线架和网线的重新整理、排序,并重新标上统一的编号

6、机房主机设备维护

6.1提供计算机专业知识咨询、操作;

6.2网络进行全面维护、升级硬件设备建立计算机信息卡,并以标签的形式粘贴在计算机主机上。信息卡内容包括:机器名、机器编号、使用人、机器配置、IP地址、备注等。

6.3安装杀毒软件、病毒防火墙,定期为计算机查杀毒和病毒库升级服务

7、房运维管理体系建设:完善机房运维规范,优化机房运维体系;

结合中心机房业务工作及信息化建设实际,制定《机房主机设备维护制度》、《机房环境系统维护制度》、《电气设备操作手册》等用于完善机房运维,在已有的流程制度基础上,进一步细化完善,使之成为一整套高效、合理、适用的机房运维管理流程。

结合中心机房业务工作及信息化建设实际,制定《机房主机设备维护制度》、《机房环境系统维护制度》、《电气设备操作手册》等用于完善机房运维,在已有的流程制度基础上,进一步细化完善,使之成为一整套高效、合理、适用的机房运维管理流程

四、维护服务质量

1、提供专用电话技术咨询,如果电话技术支持不能解决问题,服务提供商将派出技术人员到现场协助解决,根据系统故障的程度提供不同的响应时间和故障排除时间:

2、对本项目涉及的设备进行1年4次(即每季度一次)的定期检测、保养、可预防性的对设备进行检测,并且出具检修报告及时向用户方汇报设备运行状态,报告由用户方确认,双方存底备查。任何故障的维修响应时间为全天24小时。

3、设备或材料产生损坏时,服务商负责送设备至原厂进行维修或更换,当维修或更换设备所需要的时间超过3个工作日(计算机服务器、网络设备等须在1个工作日内),则必须提供档次不低于送修设备的备件。在维护期间,提供保修服务(保修服务包括维护、检测、设备免费维修和更换,提供的更换件不低于需要维修或现使用的产品档次),涉及到的相关维修路途、车费、手续等费用均包含在本投标费用中。维修工作要求10个工作日内处理完成,确实难以在短期内解决的,可以与用户方协商先行使用替代设备或材料,延长处理时间。

4、在用户因其它项目建设,提出协助请求时(如长时间停电、系统切换、调整网络结构、线路迁移等),服务提供商必须派专业技术人员到现场监控设备的运行情况,做好相关配合工作。

5、在服务期内,由运维服务商指定具有相关机房维保资质的服务人员实施定期检查设备状况,对机房出现的故障及时进行检查、提供处理方案,并解决,消除隐患。

机房维护方案74306

机房维护方案 一、维护目的 保障机房设备正常运行,过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。 二、维护内容 1、机房主机设备维护管理:计算机服务器(包括PC服务器及存储服务器);网络设备(交换路由设备等)。 2、机房监控设备维护管理:供配电监测系统、温度环境检测系统、门禁设备系统、保安监控设备。 3、机房空调与配电设备维护管理:空调设备、新风设备、UPS 电池、主配电箱。 4、机房消防设备维护管理:烟感热感探测器、手动报警按钮和报警控制器、灭火器的控制装置。 5、机房供水水路、电路及照明维护管理:水电路管线及接口的检查维护。 6、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、防火地板、墙面、吊顶、门窗及相关配套的维护管理。 三、具体维护方案 1、机房主要设备维护及安全:

服务器维护及安全: ①关闭无用的端口: 网络连接都是通过开放的应用端口来实现的。尽可能少地开放端口,就会大大减少了攻击者成功的机会。关闭掉不会用到的服务。telnet使用更为安全的ssh来代替。下载端口扫描程序扫描系统,如果发现有未知的开放端口,马上找到正使用它的进程,从而判断是否关闭。 Windows主机可采用定义安全策略的方法关闭隐患端口;也可采用筛选tcp端口添加允许的端口,其余端口就被自动排除。 Linux主机可检查inetd.conf文件。在该文件中注释掉那些永不会用到的服务(如:echo、gopher、rsh、rlogin、rexec、ntalk、finger 等)。 ②删除不用的软件包 将不需要的服务一律去掉,如果服务器运行了很多的服务。但有许多服务是不需要的,很容易引起安全风险;同时可以腾出空间运行必要的服务,既节省资源又能保证服务器安全。 ③不设置缺省路由 在服务器中,应该严格禁止设置缺省路由,建议为每一个子网或网段设置一个路由,否则其它机器就可能通过一定方式访问该服务器而造成安全隐患。 ④口令管理 服务器登陆口令的长度一般不少于8个字符,口令的组成应以无

机房设备维护方案

机房设备维护方案 一、维护目的 保障机房设备正常运行,过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。 二、维护内容 1、机房主机设备维护管理:计算机服务器(包括PC服务器及存储服务器);网络设备(交换设备等)。 2、机房监控设备维护管理:供配电监测系统、温度环境检测系统、门禁设备系统、保安监控设备。 3、机房空调与配电设备维护管理:空调设备、新风设备、UPS电池、主配电箱。 4、机房消防设备维护管理:烟感热感探测器、手动报警按钮和报警控制器、灭火器的控制装置。 5、机房供水水路、电路及照明维护管理:水电路管线及接口的检查维护。 6、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、防火地板、墙面、吊顶、门窗及相关配套的维护管理。 三、具体维护方案 1、机房主要设备维护及安全:

服务器维护及安全: ①关闭无用的端口: 网络连接都是通过开放的应用端口来实现的。尽可能少地开放端口,就会大大减少了攻击者成功的机会。关闭掉不会用到的服务。telnet使用更为安全的ssh来代替。下载端口扫描程序扫描系统,如果发现有未知的开放端口,马上找到正使用它的进程,从而判断是否关闭。 Windows主机可采用定义安全策略的方法关闭隐患端口;也可采用筛选tcp端口添加允许的端口,其余端口就被自动排除。 Linux主机可检查inetd.conf文件。在该文件中注释掉那些永不会用到的服务(如:echo、gopher、rsh、rlogin、rexec、ntalk、finger等)。 ②删除不用的软件包 将不需要的服务一律去掉,如果服务器运行了很多的服务。但有许多服务是不需要的,很容易引起安全风险;同时可以腾出空间运行必要的服务,既节省资源又能保证服务器安全。 ③不设置缺省路由 在服务器中,应该严格禁止设置缺省路由,建议为每一个子网或网段设置一个路由,否则其它机器就可能通过一定方式访问该服务器而造成安全隐患。 ④口令管理

机房设备维护方案

机房设备维护方案 机房设备维护方案 一、维护目的 保障机房设备正常运行,过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通 过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。 二、维护内容 1机房主机设备维护管理:计算机服务器(包括PC服务器及 存储服务器);网络设备(交换设备等)。 2、机房监控设备维护管理:供配电监测系统、温度环境检测系统、门禁设备系统、保安监控设备。 3、机房空调与配电设备维护管理:空调设备、新风设备、UPS 电池、主配电箱。

4、机房消防设备维护管理:烟感热感探测器、手动报警按钮和报警控制器、灭火器的控制装置。 5、机房供水水路、电路及照明维护管理:水电路管线及接口的检查维护。 6、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、防火地板、墙面、吊顶、门窗及相关配套的维护管理。 三、具体维护方案 1机房主要设备维护及安全: 服务器维护及安全: ①关闭无用的端口: 网络连接都是通过开放的应用端口来实现的。尽可能少地开放端口,就会大大减少了攻击者成功的机会。关闭掉不会用到的服务。telnet使用更为安全的ssh来代替。下载端口扫描程序扫描系统,如果发现有未知的开放端口,马上找到正使用它的进程,从而判断是否关闭。 Windows主机可采用定义安全策略的方法关闭隐患端口;也可采用筛选tcp端口添加允许的端口,其余端口就被自动排除。 Linux主机可检查inetd. conf文件。在该文件中注释掉那些永不会用至U的服务(如: echo gopher、rsh、rlogin、rexec ntalk、finger 等)。 ②删除不用的软件包 将不需要的服务一律去掉,如果服务器运行了很多的服务。但有许多服务是不需要的,很容易引起安全风险;同时可以腾出空间运行必要的服务,既节省资源又能保证服务器安全。

XXX系统维护及机房运维综合管理方案

运 维 服 务 方 案 2016年5月18日

XXX系统维护及机房运维方案 二零一七年六月

目录 1 服务内容 (3) 1.1 服务目标 (3) 1.2 信息资产统计服务 (3) 1.3 网络、安全系统运维服务 (4) 1.4 主机系统运维服务 (6) 1.5 存储系统运维服务 (10) 1.6 数据安全存储及灾备运维服务 (11) 1.6.1 传统的灾备方式 (11) 1.6.2 容灾方案的关键指标 (13) 1.6.3 常见的备份策略 (14) 1.6.4 容灾的核心问题 (15) 1.6.5 容灾的实现方式 (16) 1.6.6 异地容灾技术 (18) 1.6.7 灾难恢复级别 (20) 1.7 容灾建设方式 (21) 1.7.1 企业信息系统保护层次 (21) 1.7.2 容灾技术模型 (23) 1.7.3 业务平台的保护---业务处理能力的冗余 (23) 1.7.4 数据平台的保护---业务状态数据的复制 (24) 1.7.5 接入平台冗余和贴换 (24) 1.7.6 容灾模式 (24) 1.7.6.1 容灾层次 (25) 1.7.6.2 容灾范围 (25) 1.7.6.3 同级容灾或降级容灾 (26) 1.7.6.4 容灾技术概述 (27) 1.7.6.5 基于存储的数据复制技术建设容灾系统 (28) 1.7.6.6 小结 (31) 2 运维服务流程 (32) 3 服务管理制度规范 (34) 3.1 服务时间........................................................................... . (34) 3.2 行为规范............................................................................. .. (34) 3.3 现场服务支持规范................................................................. . (35) 3.4 问题记录规范.......................................................................... ................................................ .35 4 应急服务响应措施................................................................... (37) 4.1 应急基本流程................................................................................................................................ ..37 4.2 预防措施......................................................................................... .............................. . (37) 4.3 突发事件应急策略 (38)

信息机房维保方案

信息机房精密空调及UPS系统维保 运维服务方案 1、前言 随着社会经济及科学技术的飞速发展,计算机网络的逐渐普及,现XX供电公司共有信息机房13个,是公司综合数据网核心设备以及业务应用、安全保障和工具类系统的关键支撑,然而所有机房的UPS和精密空调已经过了质保期,在其出现故障时无法得到原厂的技术支持和硬件的更换,极大的影响了信息设备的安全运行。 2、实施目标 针对该信息系统维护项目,XX利泰电力建设有限公司提供运行维护的服务范围包括:共计9个直属信息通信机房,13套UPS系统进行日常运行维护及保养,其中120kVA 2套(公司本部),10kVA 11套(客户服务中心1套、4个县级供电企业各1套、检修公司2套、4个县级控股供电企业各1套),保证设备在运期间状态良好,降低整体管理成本,提高网络信息系统的整体服务水平。 3、实施方案设计原则及依据 3.1 根据《国网XX供电公司信息机房精密空调及UPS系统维保合同》进行编制 4、实施组织

4.1施工管理组织机构图 4.2机房UPS 、精密空调动力环境运维服务 4.2.1接收服务请求和咨询 在7*24小时工作时间内设置专人值守的热线电话,用于解决内部的技术问题以及机房突发情况。 表示领导管理关系 表示任务转换关系 电力开发总公司 运维队 全体人员 项目经理

4.2.2我公司采用定期巡检结合故障现场服务。定期巡检结合故障现场运行维护服务的基本操作流程如下图所示: 现场巡检服务是我公司对客户的设备及系统进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。同时,我公司将有针对性地提出预警及解决建议,是用户能够提早预防,最大限度降低运营风险。 4.3行为规范 (1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。

办公大楼机房维护方案

办公大楼机房维护方案 办公大楼机房维护方案 一、机房维护的必要性 机房确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障。 二、维护内容 1、机房监控设备维护管理:供配电监测系统、空调环境检测系统、门禁设备系统、漏水 检测、保安监控设备(包含摄像头、硬盘录像机)、监控主机; 2、机房空调与配电设备维护管理:精密空调机组、新风设备;UPS及电池、主配电柜、UPS 配电柜; 3、机房消防设备维护管理:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装 置; 4、机房供水水路、电路及照明线路的维护管理:水、电路管线及接口的检查维修。 5、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、地板、墙面、 吊顶、门窗及有关配套的维护管理 6、机房主机设备维护管理:计算机服务器(包括PC服务器、存储服务器);网络设备(路 由及交换设备等);KVM系统;

7、机房运维管理体系建设:完善机房运维规范,优化机房运维体系; 三、维护具体需求 1、机房监控设备: 1) 每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行。同时检查监控机房通风、散热、净尘、供电等设施。室外温度应在,20 ?,,60?,相对湿度应在10,,100,;室内温度应控制在,5?,,35?,相对湿度应控制在10,,80,,留给机房监控设备一个良好的运行环境。 2)根据监控系统各部份设备的使用说明,每月检测其各项技术参数及监控系统传输线路质量,处理故障隐患,协助监控主管设定使用级别等各种数据,确保各部份设备各项功能良好,能够正常运行。 3)对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象应及时更换、维修,如视频头、采集模块等。 4)对易吸尘部份每季度定期清理一次,如监视器、漏水检测主机、门禁主机等暴露在空气中,由于屏幕的静电作用,会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定 期擦拭监视器,校对监视器的颜色及亮度。 5) 对长时间工作的监控设备每月定期维护一次,如硬盘录像机长时间工作会产生较多的热量,一旦其电风扇有故障,会影响排热,以免硬盘录像机工作不正常。 6) 对监控系统及设备的运行情况进行监控,分析运行情况,及时发现并排除故障。如:网络设备、服务器系统、监控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统的病毒防御。

数据中心机房运维方案

数据中心运维外包 服 务 方 案 2019年8月

数据中心运维外包服务方案 目录 一、运维的重要性 (1) 二、维护范围 (1) 三、提供的服务 (2) 四、服务内容 (3) (一)UPS供配电系统 (3) (二)机房空调系统 (5) (三)服务器运维 (7) (四)存储系统运维 (9) (五)虚拟化平台运维 (10) (六)数据库系统运维 (11) (七)网络设备运维 (13) (八)其它有关系统或设备运维 (15) 五、运维报价服务 (16)

一、运维的重要性 数据中心的日常运维工作是至关重要的。设备故障时,应提供快速的备件供应、技术支持、故障处理等服务。通过机房设备维护保养可以提高设备的使用寿命,降低设备出现故障的概率,避免重特大事故发生,避免不必要的经济损失。 数据中心的运维工作专业性很强,通过引入专业的维护公司进行日常运维工作。建设及使用单位相关管理人员可从日常需要完成专业性很强的维护保养工作中解放出来,重点做好管理及协调工作,更好的发挥信息或科技部门的其它职能。 通过专业、系统、全面的维护可以提前发现问题,并解决问题。将故障消灭在萌芽状态,提高系统的安全性,做到为客户排忧解难,减少客户人力、物力投入的成本,为机房内各系统及设备的正常运行提供安全保障。可延迟客户设备的淘汰时间,使可用价值最大化。通过专业的维护,将数据中心机房内各类设备的运行数据进行整理,进行数据分析,给客户的机房基础设施建设、管理和投入提供依据。 二、维护范围 数据中心机房于××年×月建成并投入使用,数据中心有关设备及基础系统清单如下:

三、提供的服务 为更好的服务好客户,确实按质按量的对设备进行维护;我公司根据国家相关标准及厂商维护标准,结合自身经验积累和客户需求,制定以下服务内容: 1.我公司在本地储备相应设备的备品备件,确保在系统出现故障时,及时免费更换新的器件,保障设备使用安全。 2.我公司和客户建立24小时联络机制,同时指定一名负责人与使用方保持沟通,确保7*24小时都可靠联系到工程技术人员,所有节日都照此标准执行。 3.快速进行故障抢修:故障服务响应时间不多于30分钟,2小时内至少2人携带相关工具、仪器到达故障现场现行故障排查处理,直到设备恢复正常运行。 4.我公司对维修维护的设施设备的使用性能负责,在维修维护过程中严格执行技术规范,保证设施设备的性能符合相关技术标准要求。在维修维护间,我方应对设施设备可能存在的故障隐患做出评估,并进行恰当的预防性处理,以保证设施设备的安全运行。若故障隐患超出维修维护范围的,及时书面通知客户,并提出消除隐患建议。 5.维护巡检中我公司提供设备系统图或使用说明书:将机房内设备的整个系统等汇编成资料,由维护人员进行统一放置,便于应急查询。 6.巡检次数每年不少于四次,每次巡检后,由维修维护方提供巡检报告,并由使用方签字确认。每月由我公司客户服务人员定期进行回访,听取客户意见反馈,搭建起双方的沟通渠道。 7.提供系统应急方案:设备在12小时内还无法修复的应有备份应急处理方案。如提供适合负载功率的备机、备用空调等。 8.培训:提供专业理论知识培训和操作培训,维修维护培训,简单故障处理培训,培训文档由我公司整理。 9.人员配置:全年(包括所有的节假日期间)提供不少于2名工程师在常住贵阳本地,确保满足响应时间要求;到现场的维护维修工程师至少一名是能完全解决故障并有丰富从业经验的。 10.我公司每次巡检完毕后提供维护报告,同时还提供全年维护报告、每次维修事故报告等资料,根据事故提出相应的整体解决方案等管理规划层面的内容。

机房保养、使用维护方案

机房保养、使用及维护方案 一、机房维护的必要性 机房内的设备对工作环境有着非同一般的要求。 1、机房设备十分爱干净,对灰尘特别“感冒”。如果设备长期处于灰尘漫舞的环境中工作,很容易发生故障,因为灰尘会不知不觉地渗入设备的控制框中,并直接覆盖到它的电子线路中。时间一长,设备内部的工作电路就会散热不良,长此以往自然就容易出现故障。 2、设备都害怕潮湿。设备内部有电子线路,如果电子线路中的各个元器件长期在潮湿环境中工作,其电气性能会逐步下降,而且还有可能产生漏电现象,引发火灾事故。 3、设备对环境温度十分敏感。高于40℃的环境或低于0℃的环境会降低设备的工作效率,使它的潜能得不到充分发挥,从而减少使用寿命。 4、机房的硬件设备品牌过多、产品供应商过多,厂家售后保障措施不到位等等原因,导致设备使用一段时间后,设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象。 对于客户而言,往往因为专注于业务或者受成本所限,缺乏专业的机房维护人员以及充足的备件。如果说小故障尚可解决,那么,一旦机房发生突如其来的大故障,客户便会措手不及,或者无法找到症结所在,或者没有可更换的备件。此时,损失已经造成了。 为了做好机房设备的维护工作,我公司维修中心配备相应的人力、物力(工具、通讯设备等),确保中心机房正常运作,通过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。 确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障。

最新整理服务器机房维护方案.docx

最新整理服务器机房维护方案 为了保证信息系统的安全、稳定运行和信息系统功能的全面发挥,延长机器寿命,保护公司信息数据的安全、保密,根据企业的有关规定和客观情况,特制定以下机房管理制度: 一、安全管理制度 1、建立机房管理责任制,明确专人管理,全面负责机房的日常安全管理及信息设备的日常维护、保养。 2、建立机房出入管理登记卡,未经主管领导批准,不得随便进入机房,进出机房原则上两人通行,并履行登记手续。 3、为每台服务器配备日常操作日志,对服务器的所有操作及异常反应做详细记录,并妥善保存。 4、制定应急预案措施。 对灾难事故要做好应急预案。防患于未然,对重要服务器要采取双工工作。 5、制定数据备份制度。 对服务器的数据相关日志进行备份,并进行异地备份;要定时检查备份文件的完整性、可用性。 6、制定安全隐患预警机制。 定时分析系统运行日志及系统运行异常现象,及时对系统安全进行预警,并通知主管部门,同时采取积极措施防止危险的发生。 8、制定系统服务器配置登记表。 制定系统服务器配置登记表,并随机配置,具体内容包括:服务器名称及域名、CPU类型及数量、内存类型及容量、硬盘类型及容量、

网卡类型及速率、操作系统类型及版本、服务器逻辑名及IP地址、应用软件的配置、硬件及软件配置的变更情况等。 二、信息系统运行维护 1、机房管理人员要应注意机房的温度和湿度,使温度在20±5℃,相对湿度45%~65%。 2、机房管理人员应每天清理机房卫生,保证机房及信息设备的整洁;严禁在机房内使用或存放易燃、易爆、腐蚀性、挥发性物品;机房门外严禁堆放杂物和易燃、易爆物;严禁在机房内吸烟和乱丢烟头。严禁在机房内吃食物或存放食物及个人用品。 4、所有服务器其必须配备UPS及应急电池,并保证无人看守的电力供应;严禁在机房内私自配接电器;UPS应妥善保养,每3个月放电一次。 5、定期检修信息设备及附属设施。检修的项目涉及服务器、交换机、集线器、中继器、路由器、防火墙、配线架、网线、UPS电源、电池等公用网络实体。在出现异常征兆或故障情况下可进行临时检修。临时检修包括检查、分析、确定故障设备或故障部位,并进行应急维修。 6、技术人员,要随时处理信息故障、解决问题、保持信息系统的正常运转、提高信息系统的稳定性和可靠性水平。 7、要定期更新服务器安全补丁,升级计算机杀毒软件,并进行杀毒,安装服务器应用软件,做好服务器操作系统及应用软件的安全工作。

IDC数据机房维护保养方案计划

| IDC数据机房运维方案 韩东勋 2017.8.25

目录 1 IDC数据机房架构图 (1) 1.1 IDC数据机房系统逻辑架构图 (1) 1.2IDC机房网络拓扑图 (1) 1.3IDC数据机房安全技术架构图 (2) 2 IDC机房运维 (2) 2.1软件维护 (2) 2.2硬件维护 (2) 2.3安全维护 (3) 2.4物理环境维护 (3) 2.5其它维护内容 (4) 3 IDC机房智能化管理............................................................................................ 错误!未定义书签。 4 IDC机房信息资产统计 (9) 5 IDC机房值班方案 (9) 6 IDC机房应急预案 (12)

1 IDC 数据机房架构图 1.1 IDC 数据机房系统逻辑架构图 1.2 IDC 数据机房网络拓扑图 业务层:主机托管、业务备份等 资源层:计算、存储、宽带等 网络层:路由器、交换机、防火墙等 物理层:电力、空调、综合布线等 运营管理层 网络管理 资源管理 业务管理 运营管理

1.3IDC数据机房安全技术架构图 2 IDC机房运维 2.1 软件维护 ?软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件 等)、业务应用软件等 维护:常用应用软件的安装、调试、管理、更新、升级、故障检测及排除。 操作系统的调试、管理、更新,升级,故障检测及排除。 建立常用应用软件及驱动程序库。(视客户情况而定) 2.2 硬件维护 ?硬件设备包括:网络设备、安全设备、主机设备、存储设备等 维护:计算机硬件设备的维护、保养、更新、升级、故障检测及排除。 对于需要更换的设备,提供设备选型建议及市场参考价格,并可代为购买(设 备采购费用另计)。

系统维护和机房运维方案

系统维护和机房运维方 案 Revised at 2 pm on December 25, 2020.

运 维 服 务 方 案 2016年5月18日

目录 1 服务内容 (3) 服务目标 (3) 信息资产统计服务 (3) 网络、安全系统运维服务 (4) 主机系统运维服务 (6) 存储系统运维服务 (10) 数据安全存储及灾备运维服务 (11) 传统的灾备方式 (11) 容灾方案的关键指标 (13) 常见的备份策略 (14) 容灾的核心问题 (15) 容灾的实现方式 (16) 异地容灾技术 (18) 灾难恢复级别 (20) 容灾建设方式 (21) 企业信息系统保护层次 (21) 容灾技术模型 (23) 业务平台的保护---业务处理能力的冗余 (23) 数据平台的保护---业务状态数据的复制 (24) 接入平台冗余和贴换 (24) 容灾模式 (24) 2 运维服务流程 (32) 3 服务管理制度规范 (34) 服务时间........................................................................... . (34) 行为规范............................................................................. .. (34) 现场服务支持规范................................................................. . (35) 问题记录规范.......................................................................... ................................................ .35 4 应急服务响应措施................................................................... (37) 应急基本流程 ................................................................................................................................ ..37 预防措施......................................................................................... .............................. . (37) 突发事件应急策略 (38)

机房维护(服务器搬迁方案)

机房维护——服务器搬迁方案 服务器搬迁方案 一、统状况分析 机房的搬迁工作是整个搬家工作中关键的部分,所有的设备将在规定的菪机时间内从原有的机房备搬迁到新的地方,只有按照预定的计划,服务器在预计的时间内全部恢复正常的使用,才意味着搬迁工程的结束。首先要检验系统配置:系统配置主要确认硬件设备的配置清单,这份清单的准确性直接影响到备件的备货情况,在搬迁过程中如果出现硬件的问题,我们将有足够的备件来协调处理服务器的维修,能够在正常的菪机时间内判断故障,排除故障,及时地解决问题,所以在系统检测时一定要仔细,认真,保证数据的真实性。实施的时候我们将安排公司资深的工程师来收集这方面的数据,并做好书面得报告,并以电子文档的形式告诉用户,以备后用。(具体收集参数见附件一:《硬件配置信息表》) 应用描述:应用的描述也是一个重要的方面。每台服务器都是在运行不同的应用,我们收集这方面的资料以后,会根据不同的应用来考虑,如果机器在搬迁过程中出现由于系统问题导致应用无法启动,将会准备一系列的方案,来协调其他的服务器来处理这部分的应用或者使用我们的备机来使机器恢复正常的运行。这部分的工作我们将在用户的配合下来实施完成。(具体参数见附件二:《软件信息配置表》)服务时间:服务时间的确定也是搬迁工作中不可缺少的部分,我

们会根据每台服务器的不同性质来安排每台机器的菪机时间,根据每台机器的不同的菪机时间来确定我们整个搬迁过程的安排,从而使搬迁过程能够顺利进行。避免计划外的菪机时间。 三、项目实施过程 (一)搬迁的准备 搬迁的准备工作是整个搬迁工作的极其重要的部分。在搬迁以前,我们要针对现有的服务器设备进行一次全面的检测工作,包括:硬件的配置的检测和软件信息的检测。准备工作要做的充分,这是保证搬迁工作能够顺利进行的首要条件。通过检测我们不仅可以有效地把一部分隐患排除在搬迁之前,确保在搬迁过程中,机器设备的故障率降到最低,从而避免在搬迁工程中的计划外菪机时间。 1.机房设备的检测 1)硬件设备的检测 针对服务器的硬件设备,我们将详细的记录服务器的硬件配置信息,在搬迁以前明确硬件配置,具有针对性地准备一些备件,在服务器菪机的时候能够及时的修复服务器,及时的解决由于硬件故障产生的计划外菪机,避免不必要的菪机时间。 2)服务器软件应用的检测 针对服务器的软件应用,我们同样也要进行一些常规的检测,把一些由于软件问题产生菪机时间减少到最低限度。从而使搬迁工作能够顺利进行。 2.数据的备份

机房运维方案

机房运维方案 Standardization of sany group #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

机房运行维护工作建议书 为加强********单位数据中心机房各系统的运行维护和管理工作,保证系统长期稳定、高效运行。根据**************信息化工作管理规定,编制适合于******机房运维方案。 1.运维现状分析 ******数据中心机房目前由*******部门管理,由指定的外协公司承接基本运维工作,其职能限定于出入安全、配件管理、设备管理、运行物理环境管理。对于设备本身及其运行维护、软件运行维护等工作,仍由各个供应商按项目签订的协议提供免费服务,目前这些免费服务大部分处于过期或者即将到期的状态。 目前机房运维没有涵盖桌面终端、大楼综合布线、楼层配线间与设备间等,未构成一个完整的运维体系。 1.1.故障连带现象 多方运维导致机房出现中断或者服务不良的情况时有发生。 ********公司机房由于始终未能受到规范统一的运维管理,加上机房作为数据核心,由各种外部单位组成的运维团队无论在数据安全性、人员责任感、技术全面性等方面,都难以保持机房的持续性运转。 我们没有精确的数据来说明机房的运行情况,这也是目前运维工作尚未达标的一种表现,同样,这也导致我们对现状无法进行精确描述。但是,通过一些现象仍然可以发现机房运维工作应该大幅度改进。 1.1.1.长时间断网

具体原因不详,但由于机房服务器大部分无法接通,成都地区的二级单位网络依赖的DHCP服务无法使用等现象持续多个小时,发现晚,响应慢。 1.1. 2.上班时间网速慢 具体原因不详,但简单归结为SEP或者人多并不能完全的解释网速慢的问题,由于网络是信息化建设的基础,充分发挥机房内部与外部的资源是运维工作的重要职责。 1.1.3.服务意外退出 当虚拟机系统开始引入后,我们时常发现挂载在虚拟机系统上的一些服务器无故宕机且不知道任何原因,当用户需要使用时,由于无法自动恢复,影响正常工作。 1.1.4.不易寻找责任人 机房是一完整的整体,涉及到环境、网络、服务器、存储、操作系统、数据库、应用软件等,当一个故障发生时,难以判定故障原因,而目前机房是各个外协单位各施其责,最终造成故障排除时间缓慢,相互推诿的情况时有发生。 1.2.半自动化运维现状 目前许多企业的IT运维已经实现从人工运维到计算机管理,但延展咨询在同客户的交流中发现其中很多企业的IT运维管理还只是处在“半自动化”的运维状态。因为这种IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、半

机房服务器硬件设备维护保养服务方案

机房设备维保服务

目录 目录 (2) 一、服务概述 (6) 1. 硬件保修服务 (6) 2. 远程技术支持服务 (7) 3. 现场技术支持服务 (7) 4. 电话回访服务 (7) 5. 现场巡检服务 (8) 二、公司简介 .............................................................................. 错误!未定义书签。 1. 公司简介 ........................................................................... 错误!未定义书签。 三、服务器设备维保服务 (9) 1. 切实有效的服务保障方案概述 (10) 2. 服务方案设计原则 (12) 2.1 业务为中心: (12) 2.2 重在措施: (12) 2.3 追求最佳性价比: (13) 3. 保修服务内容及标准 (13) 3.1 故障排除 (13) 3.2 定期巡检 (13) 3.3 培训 (13) 3.4 增值服务 (14)

3.4.1.1 系统升级、扩充 (14) 3.4.1.2 协调工作 (15) 3.5 服务标准 (15) 3.5.1 服务工作时间 (15) 3.5.2 响应时间 (15) 3.5.3 故障恢复时间 (15) 3.5.4 保密条款 (15) 4. 服务实施细则 (16) 4.1 前期工作 (16) 4.2 故障预防建议 (16) 4.3 故障排除 (17) 4.4 巡检 (18) 4.4.1 巡查内容 (18) 4.4.2 巡查周期 (19) 4.5 备份与恢复策略 (20) 4.6 项目实施计划 (20) 4.7 工作结果与工作报告 (20) 4.7.1 现场服务报告 (20) 4.7.2 巡检报告 (21) 4.7.3 健康报告 (21) 4.7.4 维护工作总结............................................. 错误!未定义书签。

机房维护方案

机房维护方案 一、机房维护的必要性 机房内的设备对工作环境有着非同一般的要求。 的备件。如果说小故障尚可解决,那么,一旦机房发生突如其来的大故障,客户便会措手不及,或者无法找到症结所在,或者没有可更换的备件。此时,损失已经造成了。 为了做好机房设备的维护工作,我公司维修中心配备相应的人力、物力(工具、通讯设备等),确保中心机房正常运作,通过对机房环境支撑系统、监控设备、计算机主机设备定

期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障。 二、维护内容 由及交换设备等);KVM系统; 7、机房运维管理体系建设:完善机房运维规范,优化机房运维体系; 三、维护具体需求

1、机房监控设备: 1)每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行。 5)对长时间工作的监控设备每月定期维护一次,如硬盘录像机长时间工作会产生较多的热量,一旦其电风扇有故障,会影响排热,以免硬盘录像机工作不正常。 6)对监控系统及设备的运行情况进行监控,分析运行情况,及时发现并排除故障。如:网络设备、服务器系统、监控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统

的病毒防御。 7)每月定期对监控系统和设备进行优化:合理安排监控中心的监控网络需求,如带宽、IP 地址等限制。提供每月一次的监控系统网络性能检测,包括网络的连通性、稳定性及带宽的利用率等;实时检测所有可能影响监控网络设备的外来网络攻击,实时监控各服务器运 3)检查温度、湿度传感器的工作状态是否正常; 4)对压缩机和加湿器的运行参数要做到心中有数,特别是在每天早上的第一次巡检时,要把前一天晚上压缩机的运行参数和以前的同一时段的参数进行对比,看是否有大的变化,根据参数的变化可以判断计算机机房中的计算机设备运行状况是否有较大的变化,以便合

机房的维护管理方案

机房的维护管理方案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

机房管理方案随着计算机技术的快速发展和员工对计算机使用操作步骤的日益增加,播出机房的地位和作用越来越重要。合理有效地对机房进行管理,将对设备的运行维护、快速处理设备故障、降低成本具有十分重要的意义。 一、机房环境的要求 1、机房空气环境 机房设备维护主要包括电气环境、温湿度、防尘、防鼠等方面。 (1)电气环境要求 电气环境的要求主要是指防静电要求和防电磁干扰等。 防静电要求播出设备内部电路采用大量的半导体、CMOS等器件。由于这类器件对静电的敏感范围为25~1000V,而静电产生的静电电压往往高达数千伏甚至上万伏,足以击穿各种类型的半导体器件,因此机房应铺设抗静电活动地板,地板支架要接地,墙壁也应做防静电处理,机房内不可铺设化纤类地毯。工作人员进入机房内要穿防静电服装和防静电鞋,避免穿着化纤类服装进入机房。柜门平常应关闭,工作人员在机房内搬动设备和拿取备件时动作要轻,并尽量减少在机房内来回走动的次数,以免物体间运动摩擦产生静电。 对于长期运行但无法经常清洁的设备,专门对设备做一次清洁是很有必要的。在长期的维护工作中,有时会碰到电路板的告警,如果对该电路板重新插拔,清洁掉电路板插针周围的灰尘,电路板就会恢复正常。

电磁干扰对播出设备的硬件和软件都有可能造成损害,播出设备本身产生的电磁辐射也会对临近的电子设备产生影响。因此,设备在安装时,应与临近用电设备保持一定的距离,必要时机房应采取屏蔽措施,以免临近电子设备之间相互产生干扰。播出设备的机外布线最好与火线交叉通过,并尽量避免长距离靠近并行。 (2)温湿度要求 播出设备尤其是交换机和磁盘阵列等设备对机房的温度有着较高的要求。温度偏高,易使机器散热不畅,使晶体管的工作参数产生漂移,影响电路的稳定性和可靠性,严重时还可造成元器件的击穿损坏。播出设备在长期运行工作期间,机器温度控制在18℃~25℃之间较为适宜。湿度对通信设备的影响也很大。空气潮湿,易引起设备的金属部件和插接件管部件产生锈蚀,并引起电路板、插接件和布线的绝缘降低,严重时还可造成电路短路。空气太干燥又容易引起静电效应,威胁播出设备的安全。为了保持播出机房的相对湿度符合标准,可视机房具体情况配置加湿器或抽湿机。加湿器工作时不要离通信设备太近,且喷雾口不要正对着通信设备,以防喷出的雾气对设备有影响。加湿器和抽湿机可根据机房内温度计的显示数据随时调整。一般说来,机房内的相对湿度保持在40%~60%范围内较为适宜。 (3)防尘要求 电子器件、金属接插件等部件如果积有灰尘可引起绝缘性降低和接触不良,严重时还会造成电路短路。空气中存在着大量悬浮物质,在这些悬浮物质中,对通信设备形成危害的污染物不计其数。污染物一旦进入机房,就会吸附在线路板上,形成人们肉眼能够发现和不能够发现的带电灰尘。随着时间的推移,线路板

机房类运维服务方案(可借鉴)

十四、服务方案 一、机房及设备维护方案与计划 1、预防性检查 1.1 巡检时间 每个工作日上午9点 1.2、巡检地点 计算机机房、精密空调、UPS 1.3、巡检目的 进行机房检查,对机房设备及供电系统、UPS系统、精密空调系统、录像系统等设备进行检查,及时发现设备隐患,排除故障。 1.4、巡检要求 1.4. 1.巡检期间,进行状态检查,若发现问题,如计算机机房物理环境异常、精密空调异常、UPS 及配电系统异常等,应按照应急预案及操作流程进行处理。 (1)电源、UPS:检查机房供电状况,UPS工作情况、指示状态。检查UPS蓄电池使用状态,确保蓄电池无松动。并使用温度枪进行检测物理温度。确保配电柜及UPS、蓄电池无温度过高现象。(2)机房环境:检查机房卫生状况及物理环境。 (3)机房温度:检查温湿度,将温湿度控制在一定范围内。温度:22℃±5℃,湿度≤60%. (4)机房空调:空调运行状态、空调内部有无漏水现象、空调噪音、空调风量等。 (5)机房照明:机房照明系统是否正常,有无异常状况。 (6)机房PDU:PDU市电或UPS是否正常,使用温度枪进行检测外部物理温度。 (7)机房整体:检查机房其余设备运行状态,有无报警及指示灯异常状态。 1.4. 2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知甲方相关领导,由相关领导协调资源进行故障处理。 1.4.3.故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。 1.5、计算机机房现场管理要求 1.除工作人员外,其他工作人员进出机房,需签字后方可进入,同时计算机机房人员要在现场,检查监督其人员工作,避免其他人员未经授权擅自接触机房物理设备。 2.机房的机柜、线缆、设备等的标签管理;

服务器维护方案

关于×××有限公司机房服务器技术服务维护方案 该技术服务的目标:保证甲方系统的正常运行,优化服务器操作系统及相关软件,加强甲方服务器安全性能和抗攻击能力,以确保甲方服务器能在较大负荷下良好的运行。依据前期对甲方服务器了解,初步确定以下技术服务的内容: 常规维护方面: 1. 做好服务器巡检工作.定期观察服务器情况,发现异常及时通知主管,指派相关维护人员,维护人员到位后,帮忙输入密码进入系统,同时进行维护时须在场监督,并做好日常故障维护日志登记工作. 2.病毒防范,发现病毒及时通告信息管理处并进行杀毒。 3.管理好服务器管理员各种账号和密码 4.管理服务器共享内容,不要随意共享服务器内容。 5.机房需要进行停电时、网络调整等,配合主管,如:关机、重启服务器等工作。 安全防护方面: 1.物理安全物理安全是指防止意外事件或人为破坏具体的物理设备,机房和机柜的钥匙一定要管理好,不要让无关人员随意进入机房,每天巡检机房并填写巡检记录,记录应包含机房的温度、湿度、设备运行情况等,如遇突发情况立即启动应急预案。 2.系统安全设置 一:系统及时安装系统补丁 无论是Windows还是Linux,任何操作系统都有漏洞,及时的打补丁避免黑客利用漏洞攻击,是服务器安全最重要的保证之一。 二:安装和设置防火墙 无论是硬防还是软防,原理都是一样的,杜绝一些未知的端口进行数据传输,但是安装了防火墙并不等于服务器安全了,合理的配置才能达到防火墙真正的作用。 三:安装杀毒软件 及时杀毒,及时更新病毒库. 四:关闭不必要的服务和端口 将不要的服务,以及端口关闭。 五:定期备份 这里的备份包括:数据备份,程序备份,最好是两台不同的服务器,同时也可以使用相关公司的备份软件,实现方式大致有:最底层的物理硬件备份,上层的应用备份。 六:账号和密码保护 账号和密码一定要复杂,另外做到定期更改密码策略. 七:定期检查系统系统日志 通过对日志进行统计、分析、综合,就能有效地掌握服务器的运行状况.能及时发现系统是否已经被入侵,或者已经受到过某种入侵行为的侵扰。日志文件应做到定期备份.

相关主题
文本预览
相关文档 最新文档