服务器外观巡检指示灯含义HPIBMSUN
- 格式:doc
- 大小:388.00 KB
- 文档页数:10
一、机房巡检注意事项:1、机房巡检准备工作:带笔记本,笔和小手电。
天气炎热情况下最好能带御寒衣物(机房内外温差大)。
2、进入机房操作注意事项:a、切勿随意触碰各种线缆;b、严禁随意搬动运行中的设备;c、机柜门轻开轻关;d、随身物品应放于指定留放处,切勿随意置于设备上;e、禁止携带任何液体类物品进入机房。
3、发现故障设备的处理事项:a、当看到设备前面板告警指示灯点亮,应全面查看该设备各个部件,初步确认是否设备某一部件告警;b、发现有设备告警,记录下该设备的SN号,如初步确认是部件告警,还需记录该部件的PN号(SUN、Dell设备SN号一般位于设备背部;IBM 设备SN号一般位于前面板右下角处;HP设备SN号一般位于前面板左右边缘处;交换机、路由器设备需连机用命令获取)。
二、各厂商设备指示灯含义1、HP设备(包括型号HP DL380、HP DL580)1)服务器前面板如下图所示的指示灯可以指示服务器的工作状况:2)快速诊断板指示灯的含义,见下表:©©注 : HP ( Systems Insight Display )快速诊断板 的指示灯表现出了主板部件的布局 。
当前面板的内部健康灯亮红灯或是黄灯时 , 表示此时服务器可能发现了一个故障 , 可以结合前面板的内部健康灯和快速诊断板指示灯 ( Systems Insight2、IBM设备(包括X346、X4100等----具体设备可能有些出入)1)服务器前面板如下图所示的指示灯可以指示服务器的工作状况:①信息指示灯:当该灯亮时,表明错误或者警告信息已经写入系统事件日志中。
②定位器指示灯:该灯亮表明是由系统管理员远程点亮以便找到服务器。
③系统错误指示灯:该灯亮表明系统出现错误。
通过光通路诊断板来定位故障。
④供电指示灯:a、该灯点亮且不闪烁,表明服务器已经开启。
b、该灯闪烁时,表明服务器已经关闭且仍然连接到交流电源。
c、该灯熄灭时,表明已经切断交流电源或者电源或者指示灯本身出了故障1、光通路诊断面板指示灯注:REMIND按钮:按下REMIND按钮时,表示确认错误,但不准备立即采取措施,将系统错误指示灯置于“提醒”方式。
故障提示:ps 指示灯:当此指示灯发亮时,表明电源2 出现故障。
temp 指示灯:当此指示灯发亮时,表明系统温度超出阈值级别。
fan:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢。
风扇发生故障还会导致over temp 指示灯发亮。
link指示灯:当此指示灯发亮时,网卡出现故障。
vrm 指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm 出现故障。
cpu 指示灯:当此指示灯发亮时,表明某个微处理器出现故障。
pci 指示灯:当此指示灯发亮时,表明某个pci 总线发生错误。
mem 指示灯:当此指示灯发亮时,表明发生内存错误。
dasd 指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障。
nmi 指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi)。
sp 指示灯:当此指示灯发亮时,表明服务处理器遇到错误。
brd 指示灯:当此指示灯发亮时,表明某个连接的i/o 扩展单元出现故障。
log 指示灯:当此指示灯发亮时,表明您应该查看事件日志或remotesupervisor。
cnfg指示灯:当此指示灯发亮时,表明BIOS配置错误。
raid 指示灯:当此指示灯发亮时,表明阵列卡故障。
over spec 指示灯:当此指示灯发亮时,表明对电源的需求超过了指定的电源供应。
remind 按钮:按下此按钮可重新设置操作员信息面板上的系统错误指示灯并将服务器置于提醒方式。
在提醒方式下,故障并没有清除但系统错误指示灯会闪烁(每2 秒闪烁一次)而不是持续发亮;如果出现另一个系统错误,则系统错误指示灯将会持续发亮。
BRD 主板上发生错误。
CNFG 发生硬件配置错误。
DASD 发生硬盘驱动器错误。
FAN 风扇发生故障,或者是运行过慢,或者是 已卸下风扇。
TEMP 指示灯可能也会点 亮。
LINK 保留。
LOG 已将错误消息写入系统事件日志。
查看IMM 系统事件日志和系统错误日志,获取有关错误的信息。
指示灯
描述
OVERSPEC
没有足够的电量为系统供电。
NONRED和LOG指示灯可能也点亮
PS
一个电源故障或者被电源未插
LINK
保留
CPU
CPU出现故障、丢失或者未正确安装
VRM
直流电-直流电稳压器丢失或者故障
LOG
BMC日志或者系统错误日志满(系统错误日志达到75%满)
MEM
内存故障
NMI
系统已收到一个硬件错误报告。
(PCI和MEM指示灯也可能点亮)PCI
PCI适配器出现故障
SP
Remote Supervisor Adapter II SlimLine中出现故障
DASD
硬盘出现故障或者被卸下
RAID
RAID适配器出现故障
NONRED
服务器使用非冗余电源或者其交流电源出现故障,系统将超出规范。
TEMP
系统温度或者组件超出规范。
(风扇FAN可能也被点亮)
FAN
风扇出现故障或者被卸下
PCI
BRD
PCI-X板出现故障
CPU
BRD
CPU托盘出现故障
I/O
BRD
I/O板出现故障。
服务器现场巡检涉及到的基础知识及相关注意事项一、基础知识1、服务器的几种类型目前按照外形结构划分,服务器可分为塔式、机架式、刀片式三种类型。
1、塔式服务器一般的塔式服务器机箱和我们常用的PC机箱差不多,而大型的塔式机箱就要粗大很多,总的来说外形尺寸没有固定标准。
2、机架式服务器机架式服务器是由于满足企业的密集部署,形成的以19英寸机架作为标准宽度的服务器类型,高度则从1U到数U。
将服务器放置到机架上,并不仅仅有利于日常的维护及治理,也可能避免意想不到的故障。
首先,放置服务器不占用过多空间。
机架服务器整洁地排放在机架中,不会浪费空间。
其次,连接线等也能够整洁地收放到机架里。
电源线和LAN线等全都能在机柜中布好线,可以减少堆积在地面上的连接线,从而防止脚踢掉电线等事故的发生。
规定的尺寸是服务器的宽(48.26cm=19英寸)与高(4.445cm的倍数)。
由于宽为19英寸,所以有时也将满足这一规定的机架称为“19英寸机架”。
3、刀片式服务器刀片服务器是一种HAHD(High Availability High Density,高可用高密度)的低成本服务器平台,是专门为非凡应用行业和高密度计算机环境设计的,其中每一块“刀片”实际上就是一块系统母板,类似于一个个独立的服务器。
在这种模式下,每一个母板运行自己的系统,服务于指定的不同用户群,相互之间没有关联。
不过可以使用系统软件将这些母板集合成一个服务器集群。
在集群模式下,所有的母板可以连接起来提供高速的网络环境,可以共享资源,为相同的用户群服务。
2、服务器外观报警灯1、IBM服务器上面有,电源指示灯,硬盘/IDE设备活动指示灯,网卡指示灯,系统过热报警灯.硬盘槽还有硬盘指示灯。
2、HP服务器上面指示灯一般为UID,内部和外部健康灯,其他就是电源网口灯了,DL的机种有的上面有风扇,内存,CPU,指示灯情况,图标都是很直观的3、其它服务器与IBM,HP的差不多,如:DELL,联想,曙光等都有明显的图示说明。
各厂家服务器和存储外部巡检方法本文主要总结了IBM、HP、DELL、EMC、Fujitsu等主要厂家小型机、服务器、存储设备系统通过系统面板和外部指示灯对机器进行基本巡检的方法,通过这些方法可以对机器的运行状态作出基本判断,并对发生故障机器的故障原因作出相当准确的判断,进一步提高维护的效率。
由于在生产系统中主流SUN设备使用很少,本文暂未涉及以下内容按照厂家的顺序展开描述IBM小型机判断方法:以P5 550为例,系统的主要信息显示在前面板的控制模块和各部件的指示灯上,下图是主机前面板图,图片左方为内置磁盘槽位,右部上方为可选的磁带设备,下方为控制模块,该机型有两种布局,分别为液晶控制面板在右部的上侧和下侧,控制模块带开关和LCD液晶屏以及串口,LCD液晶屏一般显示HMC相关状态信息,正常运行状态下屏幕中间将不显示内容,在启动和运行重大异常情况下将显示4-8位字母和数字组合的代码,液晶屏左侧为机器开关,开关下方分别为系统指示灯和告警指示灯,若系统出现一般故障,带!标识的告警灯将显示橙色,若为硬盘或者电源故障,在左侧内置硬盘槽位上对应硬盘运行指示灯将显示橙色,后部电源指示灯将显示橙色或者不亮。
对于一般故障,需登录系统作进一步诊断。
IBM x86服务器判断方法:下图为x346前面板图x86服务器主要在用的有2U的x346系列和4U的x445,x460系列从机器前面板可看到,在其左侧下方为电源开关以及系统和故障指示灯,正常运行情况下系统指示灯应长绿,若指示灯闪烁表示该机器处于关机状态;故障指示灯应灭掉,若显示橙色则表明设备出现故障。
IBM的服务器提供了光通道诊断板对故障进行定位,所有IBM的x86服务器自带光通道诊断板,该面板根据不同的机型,有旋转式、推出式等类型,一般作为一个单独的模块配置在机器前面面板上侧,开关旁边,通过按压蓝色按钮可以弹出该组件,如图所示。
光通道诊断板上提供了多个内部组件的诊断功能,包括系统板、处理器、内存、风扇、电源、稳压模块等,但不包括PCI通道的外接设备。
IBM服务器以及故障灯说明和解决办法IBM服务器是一种高性能、可靠性极高的服务器设备,常用于企业级应用和大规模数据中心。
尽管IBM服务器的质量和稳定性得到了广泛认可,但在长期运行中,仍然可能会遇到一些故障。
为了帮助管理员及时发现和解决故障,IBM服务器通常配备了故障灯,用于指示服务器的当前状态和故障信息。
以下是IBM服务器常见的故障灯及其含义和解决办法:1.电源灯:电源灯通常是服务器背面的指示灯,用于指示服务器的电源状态。
正常情况下,电源灯应该是绿色或蓝色。
如果电源灯是红色或闪烁的黄色,表示服务器的电源出现问题。
解决办法通常包括检查电源连接是否正常,更换故障的电源模块或电源线。
2.机箱灯:机箱灯通常位于服务器的正面或背面,用来指示服务器的整体状态。
绿色表示服务器正常运行,红色表示服务器出现故障。
如果机箱灯是红色,可以尝试重新启动服务器,如果问题仍然存在,可能需要进一步检查服务器的硬件设备和连接。
3.硬盘灯:硬盘灯通常位于服务器硬盘阵列背面,用来指示硬盘的状态。
正常情况下,硬盘灯应该是绿色或蓝色。
如果硬盘灯是红色或黄色,表示硬盘出现了故障或工作异常。
解决办法通常包括重新插拔硬盘连接线,更换故障的硬盘。
4.CPU灯:CPU灯通常位于服务器主板上方,用来指示CPU的状态。
绿色表示CPU正常工作,红色表示CPU出现故障。
如果CPU灯是红色,可以尝试重新插拔CPU插槽,重新安装散热器。
如果问题仍然存在,可能需要更换故障的CPU。
5.内存灯:内存灯通常位于服务器主板上方,用来指示内存的状态。
绿色表示内存正常工作,红色表示内存出现故障。
如果内存灯是红色,可以尝试重新插拔内存插槽,重新安装内存条。
如果问题仍然存在,可能需要更换故障的内存。
6.网络灯:网络灯通常位于服务器背面的网卡插槽上,用来指示服务器与网络的连接状态。
正常情况下,网络灯应该是绿色或黄色。
如果网络灯是红色或不亮,表示服务器无法正常连接到网络。
解决办法通常包括检查网络连接是否正常,重启网络设备和服务器。
各厂商设备指示灯含义1、HP设备(包括型号HP DL380、HP DL580)1)服务器前面板如下图所示的指示灯可以指示服务器的工作状况:2)快速诊断板指示灯的含义,见下表:注:HP (Systems Insight Display)快速诊断板的指示灯表现出了主板部件的布局。
当前面板的内部健康灯亮红灯或是黄灯时,表示此时服务器可能发现了一个故障,可以结合前面板的内部健康灯和快速诊断板指示灯(Systems Insight2、IBM 设备(包括X346、X4100等----具体设备可能有些出入)1)服务器前面板如下图所示的指示灯可以指示服务器的工作状况:1.信息指示灯:当该灯亮时,表明错误或者警告信息已经写入系统事件日志中。
2.定位器指示灯:该灯亮表明是由系统管理员远程点亮以便找到 服务器。
3.系统错误指示灯:该灯亮表明系统出现错误。
通过光通路诊断板来定位故障。
4.供电指示灯:a 、该灯点亮且不闪烁,表明服务器已经开启。
b 、该灯闪烁时,表明服务器已经关闭且仍然连接到交流电源。
c 、该灯熄灭时,表明已经切断交流电源或者电源或者指示灯本身出了故障.2)光通路诊断面板指示灯:注:REMIND按钮:按下REMIND按钮时,表示确认错误,但不准备立即采取措施,将系统错误指示灯置于“提醒”方式。
当服务器处于“提醒”方式时,系统错误指示灯将闪烁。
3、DELL服务器(PowerEdge 2950等)1)电源指示灯代码前面板上的电源按钮控制输入系统电源设备的电源。
打开系统电源时,电源指示灯将呈绿色亮起。
系统的控制面板 LCD 可以提供状态信息,以表示系统何时运行正常,何时需要注意。
LCD 呈蓝色亮起表示系统运行正常,呈琥珀色亮起表示出现错误。
LCD 滚动显示信息,包括状态代码及其后跟的描述性文本。
表列出了可能出现的4、SUN设备(包括SUN V445、X366等--具体设备可能有些出入)1)前面板指示灯:。