ibm_x系列服务器报错代码
- 格式:docx
- 大小:19.23 KB
- 文档页数:11
IBMX3650M4主板故障故障描述:今天突然接到报警,⼀台服务器⽆法连通,⽆法登录、⽆法 ping 通。
打电话到 IDC ,授权⼯程师查看服务器状态,返回结果如下:1、服务器关机状态2、⽆法开机 ( 电源灯亮 ),按开机键没反应。
3、尝试拔掉电源,等待⼏分钟后再次开机,结果还是不⾏。
这是⼀台宿主机,上⾯开了 5 个虚拟机,⼀下⼦全狗带了... 关键数据还在⾥⾯。
好在,受影响的业务不是主要业务,但也处于⽆法提供服务的状态。
解决⽅法:第⼆天去机房把服务器拉回公司 ( 机房在外地 ),通电发现还真是⽆法开机,还发现⼀点就是,服务器诊断⾯板上 BOARD 亮黄灯!基本断定是主板故障了吧?下⾯是搞数据:1、好在公司机房机架上还有⼀台同型号的服务器 IBM X3650 M42、这台服务器跟坏掉的服务器机器型号、RAID卡信息、硬盘数量等都⼀致3、唯⼀的区别就是,公司的这台服务器没有做 RAID,坏掉的这台是 RAID104、机柜服务器关机 ( 最好先备份⼀下数据 ),拔出硬盘 ( 8块硬盘,顺序不能乱 )5、将坏掉的服务器硬盘按顺序拔出,插⼊机柜中这台好的服务器中 ( 顺序不能乱 )6、开机,根据提⽰导⼊ RAID 信息( 输⼊ C、是否导⼊ Y、选择配置⽂件,其实就⼀个,选 all 即可,Start、同意导⼊ import,退出 exit,reboot 重启服务器 )7、很顺利,由于线上服务器密码极度复杂,这⾥重启的时候顺便重置⼀下 root ⽤户密码8、进⼊系统配置IP,然后就可以不⽤在机房待着了,备份数据,传到线上,恢复业务9、关机、拔出硬盘,按顺序插⼊原来的坏机器,给机柜上的机器重新按顺序插⼊原硬盘10、执⾏第六步,重启进⼊系统异地备份很重要。
服务器启动报下图错误:。
(检测到内存/电池问题。
适配器已恢复,但缓存的数据已丢失。
按任意键继续,或“c”来加载configiguration实用程序。
)出现以上问题的原因有:1、可能的原因:电源模块、主板电池、内存、RAID卡、RAID卡内存电池等故障。
2、突然断电;3、人为非常规关机重启;针对问题1:1、检查电源供电情况;2、检查主板电池是否有电;3、检查内存是否损坏、松动等;4、检查RAID卡是否损坏、松动,工作是否正常;5、检查RAID卡电池是否正常;6、检查RAID卡内存是否正常;解决方案:服务器自带的检查工具,在如下图红线标识的地方,把检测卡拉出来就可以看到是不是硬件故障,亮灯是有问题,则找服务器供应商报修;针对问题2:首先要说明的是:“The adapter”是指raid卡。
机器启动时raid卡自检出错了。
raid 卡上有内存和电池,用来保存磁盘阵列信息。
最坏情况是磁盘阵列中的数据完全丢失。
为了防止这种情况,磁盘上会保留有阵列信息,如果换一块同样型号的好的raid卡,启动时它会读入每块磁盘上保存的阵列信息,装入自身的内存中,这样阵列信息就不会丢失。
此时千万不要插拔阵列中的磁盘,否则启动时raid卡会根据剩余的磁盘上的信息来重建阵列,那样数据就全乱套了。
其次是,IMB服务器一般是没有断电保护功能的,在突然断电时,会导致RAID卡的内存数据丢失,再次启动服务器时,读取不到RAID卡的内存数据,就会出现上述问题;解决方案:1、按下回车;2、输入任意字母,例如“D”;3、在按下回车;4、待页面跳转完成,按下“esc”键退出,等待服务器自动引导进入系统(中间可能会重启);5、系统在启动后,在正常情况下关机,关机后断掉电源5分钟左右,在接通电源开机看下是否正常进入系统;针对问题3系统在正常运行的情况下,人为的强制关机\重启,可能会出现上述情况。
解决方案出现上述情况的时候,按照问题2的解决方案进行处理;。
IBM服务器面板报错解读
(2013-05-14 21:39:49)
标签:
it
BRD主板上发生错误。
CNFG发生硬件配置错误。
DASD发生硬盘驱动器错误。
FAN风扇发生故障,或者是运行过慢,或者是
已卸下风扇。
TEMP指示灯可能也会点
亮。
LINK保留。
LOG已将错误消息写入系统事件日志。
查看IMM系统事件日志和系统错误日志,获取有关错误的信息。
MEM 当只有MEM指示灯点亮时,才表示发生
了内存错误。
当MEM指示灯和CNFG指示灯都点亮
时,表示内存配置无效。
O V E R SPEC
由于某个电源通道上出现电源超负荷情
况,所以关闭了服务器。
电源功率超过最
大额定值。
PS电源发生故障。
RAID RAID阵列出错。
SP服务处理器(IMM)发生故障。
TEMP 系统温度已超出阈值级别。
发生故障的风
扇会导致TEMP指示灯点亮。
VRM 模块。
serveraid manger,在Windows下安装,下载最新版本即可,老一点的版本可能需要安装后重启服务器可看到阵列信息。
IBM ThinkPad错误代码列表Symptom / Error (开机错误代码) FRU / Action in Sequence(检查范围及解决方法)10X101: Interrupt failure;(中断故障)102: Timer failure;(计时器故障)103: Timer interrupt failure;(计时器中断故障)104: Protected mode failure;(保护模式故障)105: Last 8042 command not accepted;107: NMI test failure;(NMI 测试失败)108: Timer bus test failure.109: Low meg-chip select test. 1. System board. (主板问题)110: (Planar parity.) (内存奇偶校验出错)1. Go to Memory Checkout2. DIMM card.3. Detach the expansion unit if it is attached to the computer.4. System board.111: (I/O parity.)1. Go to Memory Checkout2. Expansion unit or port replicator.3. System board.11XX1101: Serial_A test failure.(A 串行口测试失败)1. Serial device (串行设备)2. Communication cable (相关通讯电缆)3. System board (主板)12XX1201: Serial_B test failure.(B 串行口测试失败) 1. System board (infrared) (检查主板:红外线口)158: (Hard disk password was not set even though the supervisor password is set.) (超级用户密码已设,但硬盘密码没有设置)1. Set the password for hard disk drive.(设置硬盘密码)159: (Hard disk password is not set the same as the supervisor password.) (硬盘密码与超级用户密码不一样) 1. Set the correct password for hard disk drive.(设置正确的硬盘密码)161: (Dead battery.) (CMOS电池不行)1. Go to Checking the Backup Battery2. Backup battery.(CMOS 备份电池)3. System board. (主板)163: (Time and date were not set.) (系统时间没有设好或混乱)1. Set time and date.(设置正确的系统时间)2. System board. (主板问题)173: (Configuration data was lost.) (CMOS 设备配置信息丢失)1. Select OK in the error screen; then set the time and date.(在开机 ERROR 画面上按OK,然后设置系统时间)2. Backup battery. (CMOS 电池需要更换)3. System board. (主板问题)174: (Configuration error: Perform Checking the Installed Devices List before changing any FRUs.)1. Check device configuration.2. Hard disk drive assembly.3. System board.175: EEPROM CRC #1 error.177: Supervisor password check sum error.178: EEPROM is not functional. 1. System board. (检查主板)17XX1701: Hard disk controller failure. (硬盘控制器故障)1780, 1790: Hard disk 0 error. (主硬盘有问题)1781, 1791: Hard disk 1 error.(从硬盘有问题)1. Hard disk drive (检查硬盘)2. System board (检查主板)183: (Incorrect password entered at the supervisor password prompt.) (超级用户开机密码不对) 1. Have the user examine the password.(请用户检查密码)184: (Power-on password check sum error.) (Power-on 密码有误) 1. Reset the power-on password in Easy-Setup.(重设Power-on 密码)185: (The startup sequence is not valid. Suspect that power was off when the startup sequence was being updated.) (系统启动顺序无效,怀疑是更新启动顺序时电源关掉) 1. Reset the startup sequence in Easy-Setup.(在Easy-Setup 重设启动顺序)186 :1. System board. (检查主板)190: (A depleted battery pack was installed when the power was on.)(开机时,机内笔记本电池已快耗尽了) 1. Go to Checking the Battery Pack.(更换机内笔记本电池)191XX: (PM initialization error.) (PM 初始化错误) 1. System board. (检查主板)192: (Fan error.)(CPU 散热风扇故障)1. Measure the voltage of the backup battery. If the voltage is not correct, replace the backup battery.(检查CMOS 备份电池的电压,电压不行时更换电池)2. Fan (要更换CPU风扇)3. System board (主板问题)195: (The configuration read from the hibernation area does not match the actual configuration.) (从休眠区域读到的系统配置信息与实际配置不同) 1. Check if the configuration was changed. For example, check if the DIMM card is added.(检查配置是否改动,例如内存有无增加等)196: (A read error occurred in the hibernation area of the hard disk drive.) (从硬盘的休眠区域中读写时,发生错误)1. Run the hard disk drive test. (测试硬盘)2. Hard disk drive.(检查硬盘)199XX(Resume error.) 1. System board.1XX 1. System board.2XX(内存问题)201: Memory data error.202: Memory line error 00-15.203: Memory line error 16-23.205: Memory test failure on on-boardmemory.221: ROM to RAM remap error.1. Go to Memory Checkout.2. DIMM card.3. System board.225: (Unsupported memory module.)1. Check if the supported DIMM is installed.2. DIMM card.3. System board.。
101: 中断失败102: 时钟失败103: 时间中断失败104: 保护模式失败105: 最后的 8042命令未接受107: NMI 检测失败108: 时钟总线检测失败109: Low meg芯片选择检测10开头的通常都是主版设置的问题进BIOS调试基本可以搞定110 平面奇偶检测内存内存插槽如果有接到电脑的扩展部件移除系统主板111 I/O奇偶检测内存扩展部件或端口复制器系统主板.11XX1101: A类设备检测失败串口设备通讯接线系统主板12XX1201: B类检测失败系统主板 (红外)158 即设置了SuperVisor密码但没有设置硬盘密码设置硬盘密码159 硬盘密码与SuperVisor密码不相同设置硬盘密码与SuperVisor密码相同161 电池失效检测备用电池备用电池系统主板.163 时间和日期未设置设置时间和日期系统主板.173 设备数据丢失在屏幕上选择OK,然后设置时间和日期备用电池系统主板.174 设置错误:先进行检测安装的设备列表再改变FRU部件检测设备配置硬盘驱动器系统主板.0175 CRC1错, 停止了 POST任务. EEPROM 校验错. 系统主板0177 SuperVisor密码检验错系统主板0178 EEPROM 失效系统主板17XX1701: 硬盘控制器失败1780, 1790: 硬盘0出错1781, 1791: 硬盘1出错硬盘驱动器系统主板183 提示输入SuperVisor密码时输入错误输入正确的SuperVisor密码184 开机密码检验错进入BIOS设置中重置开机密码185 非法的启动顺序进入BIOS设置中重置启动顺序186 1系统主板0187 EAIA 数据读取错误。
读取EEPROM 失败. 系统主板0188 非法的RFID 连续信息区域或CRC2错。
EEPROM校验错. 系统主板0189 非法的RFID 连续信息区域。
EEPROM校验错. 系统主板0190 电池电量极低错误给电池充电电池仓0193 RF天线被移除. 输入supervisor (超级)密码0194 笔记本被携带通过安全检测门输入supervisor (超级)密码0195 安全保安硬件受到干扰输入SuperVisor(超级)密码进入BIOS 设置工具, 选择Config, 选择 IBM Security Chip, 选择ClearIBM Security Chip 可清除这个错误安全芯片系统主板0196 安全保安硬件被移除输入SuperVisor(超级)密码进入BIOS 设置工具, 选择Config, 选择 IBM Security Chip, 选择Clear IBM Security Chip 可清除这个错误安全芯片系统主板0197 非法的远程修改要求远程配置安全保安芯片失败. 确认该操作重试.01C8 多个Modem设备 - 移走其中一个按Esc继续. 移走一个MiniPCI Modem 卡或Modem 子卡, 或者按Esc忽略该错误继续.系统主板01C9 多个网络类设备 - 移走其中一个按Esc继续. 移走一个MiniPCI Ethernet 卡或Ethernet子卡, 或者按Esc忽略该错误继续.系统主板。
ibm_x系列服务器报错代码适用机型:所有服务器以下报错信息,只是对目前大部分使用过程中发生橘黄色感叹号灯常亮,技术服务人员联系。
错误代码/症状062 (使用缺省配置的连续三次引导失败。
2. 电池3. 主板 4?微处理器101、102、106 (计时器时标中断失败) 102 (计时器2测试失败) 106 (软盘控制器错误)129 (内置高速缓存(L1 )错误) 2?微处理器 151 (实时时钟错误) 2.主板161(实时时钟电池错误)序 2. 电池 3. 主板162 (设备配置错误)注:请务必装入缺省设置和任何期望的其它设置; 然后,保存配置程序2. 电池3. 发生故障的设备4. 主板 163(实时时钟错误)程序2. 电池3. 主板 164(内存配置更改。
)序2. DIMM3. 主板 175(EEPROM CRC #1 损坏)184(开机密码损坏)程序2.主板X 系列服务器适用的报错信息。
仅供参考,如果服务器或者服务器停止在自检过程中,建议客户尽快跟IBM FRU /操作) 1.运行 Configuration/Setup Utility 程序*主板*主板 *主板1.可选微处理器1.电池1.运行 Configuration/Setup Utility 程1.运行 Configuration/Setup Utility1.运行 Configuration/Setup Utility1.运行 Configuration/Setup Utility 程*主板185(驱动器启动顺序信息毁坏)2.主板187(VPD序列号未设置)2.主板188(EEPROM CRC #2 损坏)2.主板189(试图以无效密码进入系统)2.主板196(微处理器高速缓存不匹配)2?微处理器198(微处理器速度不匹配)2?微处理器199(微处理器未按建议进行配置)2?微处理器201(内存测试错误)2.主板229(内置高速缓存(L2)错误)2.后添加微处理器289(用户或系统禁用了DIMM)2.DIMM3.主板301(键盘或键盘控制器错误)2.主板303(键盘控制器错误)2.主板602(无效的软盘引导记录)2.软盘驱动器3.驱动器电缆4.主板604(软盘驱动器错误)1.运行Configuration/Setup Utility 程序1.运行Configuration/Setup Utility 程序1.运行Configuration/Setup Utility 程序1.运行Configuration/Setup Utility 程序1.确保微处理器为相同的类型和速度1.确保微处理器为相同的类型和速度1.确保微处理器为相同的类型和速度1. DIMM1.微处理器1.运行Configuration/Setup Utility 程序1.键盘1.将PS/2键盘更换为USB键盘1.软盘1.运行Configuration/Setup Utility序和诊断程序2.软盘驱动器3.驱动器电缆4.主板662(软盘驱动器配置错误) 1.运行Configuration/Setup Utility 程序和诊断程序2.软盘驱动器3.驱动器电缆4.主板962(并口配置错误)2.主板1162(串口配置错误)11XX(系统板串口1或2错误)2.主板1601(需要更新BIOS代码)2.主板1602(未安装可选Remote Supervisor Adapter II 电源线,等待30秒钟,重新连接然后重试1762 (硬盘驱动器配置错误,仅IDE)2.硬盘电缆3.运行Configuration/Setup Utility 程序4.主板178X(硬盘驱动器错误,仅IDE)2.硬盘适配器3.硬盘驱动器1.运行Configuration/Setup Utility 程序*主板1.运行Configuration/Setup Utility 程序1.下载并安装最新级别的BIOS代码电缆)*从服务器断开所有服务器和选件1.硬盘驱动器1.硬盘电缆4.主板错误代码/症状/操作1800(没有多余的硬件中断可用于PCI适配器)序2.卸下适配器1801(没有可用于PCI适配器的ROM空间)2.卸下适配器FRU 1.运行Configuration/Setup Utility 程3.禁用适配器BIOS 并运行Configuration/Setup。
适用机型:所有服务器以下报错信息,只是对目前大部分 使用过程中发生橘黄色感叹号灯常亮, 技术服务人员联系。
错误代码/症状062 (使用缺省配置的连续三次引导失败。
2. 电池3. 主板 4•微处理器101、102、106 (计时器时标中断失败) 102 (计时器2测试失败) 106 (软盘控制器错误)129 (内置高速缓存(L1 )错误) 2•微处理器 151 (实时时钟错误) 2.主板161(实时时钟电池错误) 序 2. 电池 3. 主板162 (设备配置错误)注:请务必装入缺省设置和任何期望的其它设置; 然后,保存配置 程序2. 电池3. 发生故障的设备4. 主板 163(实时时钟错误) 程序2. 电池3. 主板 164(内存配置更改。
) 序2. DIMM3. 主板 175(EEPROM CRC #1 损坏)184(开机密码损坏) 程序2.主板X 系列服务器适用的报错信息。
仅供参考,如果服务器 或者服务器停止在自检过程中, 建议客户尽快跟IBMFRU /操作) 1.运行 Configuration/Setup Utility 程序*主板*主板 *主板1.可选微处理器1.电池1.运行 Configuration/Setup Utility 程1.运行 Configuration/Setup Utility1.运行 Configuration/Setup Utility1.运行 Configuration/Setup Utility 程*主板185(驱动器启动顺序信息毁坏)2.主板187(VPD序列号未设置)2.主板188(EEPROM CRC #2 损坏)2.主板189(试图以无效密码进入系统)2.主板196(微处理器高速缓存不匹配)2•微处理器198(微处理器速度不匹配)2•微处理器199(微处理器未按建议进行配置)2•微处理器201(内存测试错误)2.主板229(内置高速缓存(L2)错误)2.后添加微处理器289(用户或系统禁用了DIMM)2.DIMM3.主板301(键盘或键盘控制器错误)2.主板303(键盘控制器错误)2.主板602(无效的软盘引导记录)2.软盘驱动器3.驱动器电缆4.主板604(软盘驱动器错误)1.运行Configuration/Setup Utility 程序1.运行Configuration/Setup Utility 程序1.运行Configuration/Setup Utility 程序1.运行Configuration/Setup Utility 程序1.确保微处理器为相同的类型和速度1.确保微处理器为相同的类型和速度1.确保微处理器为相同的类型和速度1. DIMM1.微处理器1.运行Configuration/Setup Utility 程序1.键盘1.将PS/2键盘更换为USB键盘1.软盘1.运行Configuration/Setup Utility序和诊断程序2.软盘驱动器3.驱动器电缆4.主板662(软盘驱动器配置错误) 1.运行Configuration/Setup Utility 程序和诊断程序2.软盘驱动器3.驱动器电缆4.主板962(并口配置错误)2.主板1162(串口配置错误)11XX(系统板串口1或2错误)2.主板1601(需要更新BIOS代码)2.主板1602(未安装可选Remote Supervisor Adapter II 电源线,等待30秒钟,重新连接然后重试1762 (硬盘驱动器配置错误,仅IDE)2.硬盘电缆3.运行Configuration/Setup Utility 程序4.主板178X(硬盘驱动器错误,仅IDE)2.硬盘适配器3.硬盘驱动器1.运行Configuration/Setup Utility 程序*主板1.运行Configuration/Setup Utility 程序1.下载并安装最新级别的BIOS代码电缆)*从服务器断开所有服务器和选件1.硬盘驱动器1.硬盘电缆4.主板错误代码/症状/操作1800(没有多余的硬件中断可用于PCI适配器)序2.卸下适配器1801(没有可用于PCI适配器的ROM空间)2.卸下适配器FRU 1.运行Configuration/Setup Utility 程3.禁用适配器BIOS 并运行Configuration/SetupUtility 程序1802(I/O地址对于PCI适配器不可用)并确保所有适配器的I/O地址正确设置2.适配器3.主板1803(内存地址对于PCI适配器不可用)序,并确保所有其它适配器的内存地址正确设置2.适配器3.主板1804(内存地址对于PCI适配器不可用)2.禁用适配器上的适配器BIOS3.适配器4.主板1805(出现PCI ROM错误)个进行重新安装,在每次重新安装时都重新启动服务器直到确定发生故障的适配器;然后更换该适配器2.主板1806(出现PCI到PCI桥错误)重新安装,在每次重新安装时都重新启动服务器直到确定发生故障的适配器;然后更换该适配器2.主板1807(xxxxyyyy PCI设备不响应或被用户禁用,其中xxxx=PCI供应商标识,yyyy=PCI设备标识)程序并确保启用了该设备2.适配器3.主板1808(安装了不受支持的PCI设备)新安装,在每次重新安装时都重新启动服务器直到确定发生故障的适配器;然后更换该适配器2.主板1962(驱动器不包含有效的引导扇区)1.启动Configuration/Setup Utility 程序,1.启动Configuration/Setup Utility 程1.卸下适配器使内存地址空间可用1.卸下所有适配器并逐1.卸下所有适配器并逐个进行1.运行Configuration/Setup Utility1.卸下所有适配器并逐个进行重1.验证安装了可启动的操作系统2.运行诊断程序3.硬盘驱动器4.SCSI背板或者SCSI连线5.电缆6.主板2400(视频控制器测试失败)2.主板2462(视频配置错误)有安装)2.主板5962(IDE CD-ROM 驱动器配置错误)程序2.CD-ROM驱动器3.CD-ROM 电源线4.IDE电缆5.主板6.电池8603(定位设备错误)2.主板00012000(机器检查体系结构错误)2.主板00019502(微处理器1故障)2.主板00019xxx(微处理器x不工作)正确安装2.微处理器x3.VRM,如有安装4.主板00151200(不可恢复错误,微处理器x报告的IERR)2.VRM3.主板00180100(PCI选件ROM没有空间)Utility 程序1.视频适配器(如有安装)1.视频适配器(如1.运行Configuration/Setup Utility1.定位设备,鼠标1.微处理器1.微处理器1.验证微处理器x是否1.微处理器x2. 发生故障的适配器3.主板 00180200(没有可用于 PCI 适配器的I/O 空间)1.运行Configuration/Setup Utility 程序2. 适配器3. 主板 00180300(没有更多的1MB 以上的内存可用于 PCI 适配器) 1.运行Configuration/Setup Utility程序2.验证引导设备放置在扫描顺序中靠前的位置以便 POST可以执行它3. 验证所有适配器在 Con figuratio n/Setup Utility程序中设置正确,在必要的时候更改内存设置4. 卸下一个适配器以便适配器有更多可用内存5. 禁用适配器上的适配器 BIOS (请参阅适配器随附的文档)6. 主板 00181000(一般PCI 错误)2.主板 012980xx(微处理器1错误)有相同的高速缓存大小和类型以及 相同的时钟速度2. 适配器3. 主板 00180400(没有1MB 以下的内存可用于 PCI 适配器) 序2. 适配器3. 主板 00180500(PCI 选件ROM 校验和错误)2.主板 00180600(PCI 设备BIST 失败。
PCI 桥错误)2.适配器 3主板1.运行 Configuration/Setup Utility 程1. PCI 适配器1.运行 Configuration/Setup Utility 程序00180700(PCI 设备不响应)1. PCI 适配器00180xxx (PCI 适配器请求了不可用的的资源)1.对PCI 插槽中的适配器重新排序1.适配器1.验证两个微处理器具2.下载并更新BIOS代码3•微处理器14.主板012981xx(微处理器2错误)相同的高速缓存大小和类型以及相同的时钟速度1.验证两个微处理器具有2.下载并更新BIOS代码3•微处理器24.主板I9990301(硬盘上有无效的引导记录)2.电缆3.硬盘驱动器4.适配器/主板I9990650(交流电源已复原)2.检查电源的中断3.电源线1.分区和格式化硬盘驱动器1.检查电缆。