IBM小型机日常操作维护手册
- 格式:doc
- 大小:147.50 KB
- 文档页数:6
附件六
IBM小型机日常操作维护手册
目录
一、报修 (3)
二、开关机 (3)
1 开机 (3)
A 无分区: (3)
B 有分区: (3)
2 关机 (4)
A 无分区 (4)
B有分区 (4)
三、日常维护 (4)
四、系统备份(仅rootvg备份) (6)
一、报修
如果碰到硬件或者软件故障,请打IBM 800免费报修电话
IBM硬件报修电话8008106677
IBM软件报修电话8008101818-5004
报修前需要准备:
1)机器序列号(如9117-570 06348DA)
2)客户单位
3)客户联系人及电话
4)机器所在城市
5)问题描述
6)相关日志
二、开关机
1 开机
A 无分区:
1)检查电源是否插好
2)液晶面板出现“OK”字样,指示灯2秒钟闪烁一次,表示机器此时处在关机状态。
3)按下前面板上白色按钮后,主机会进入硬件自检和引导阶段;液晶面板会显示开机
过程码,每一代码表示自检或引导的不同阶段,引导结束时,液晶面板代码消失,终端上有显示,进入AIX操作系统初始化,最后会出现登录提示。
4)如果主机长时间停留在某一代码上(大于20分钟),说明主机或操作系统有故障,请
打IBM硬件保修电话8008106677,并提供相关代码。
B 有分区:
5)检查电源是否插好
6)在HMC中看Service Management里面对应服务器的状态,应为Power off状态
7)选中对应的服务器,选中Power On, 选项为Partition to Standby,点击OK
8)主机开始硬件自检,启动结束后,在HMC中看到对应的服务器为Standby状态
9)选中该主机的对应分区,点击“Active”,启动分区
2 关机
A 无分区
1)停应用
2)shutdown -F停操作系统,如果机器全分区,液晶面板会显示停机过程码,最后出
现“OK”字样,指示灯2秒钟闪烁一次。表示停机过程结束。
如果只是需要重新启动,用“shutdown -Fr”命令。
B有分区
1)停相关分区应用
2)shutdown -F停相关分区
3)在HMC中选中对应的服务器,选中Power Off,点击OK
4)对应服务器的状态最终应为Power off状态
三、日常维护
首先对于机器的日常维护来说,要先观察机器的黄色报警灯是否亮起,如果报警灯亮起则登入操作系统使用以下的步骤进行查看:
1)#errpt –dH(查看硬件错误日志,一般关心P、H类型的错误)
ERROR_IDENTIFIER TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION
0E017ED1 0405131090 P H mem2 Memory failure
其中,TIMESTAMP代表日期,以MMDDhhmmYY格式;如0319131008表示2008年3月19日13时10分
T(Type)一栏中,P表示永久性错误,T 表示零时性错误,U 表示不能决定是什么错误
,I 表示信息而非错误。
C(Class)一栏中,H表示硬件错误,S 表示软件错误,O 表示通知操作员。
如果 T(Type)一栏中是P且 C(Class)一栏中是H,请打8008106677进行硬件报修并发送根据工程师提示收集并发送snap文件。
2)#df –k(查看文件系统使用率)
如果文件系统使用率大于90%,需扩大该文件系统。用smitty chfs
3)抓取snap日志(故障报修时需要在主机上抓取,并提供给IBM 800工程师)#snap –r(进行snap日志清空)
#snap –(gfkbLNc)(snap后所带的标志需要根据情况而定,进行snap日志抓取,命令运行结束后,会生成/tmp/ibmsupt/snap.pax.Z文件,用二进制方式ftp 出来,发给IBM 800工程师)
4)抓取系统DUMP(系统意外宕机时搜集)
当发生在系统崩溃时,根据系统的设置,AIX有可能会做sysdump(系统内存的快照)。这个过程可能会比较长,如果急需恢复业务,则以业务为先。
一般dump是由于软件出错引起,机器通常可以重启。重启时可能提示用户插入磁带拷贝dump文件,不要选择退出,这样会丢失重要的故障信息。请打IBM软件报修电话8008101818。
检查当前系统dump的设置(可通过smitty sysdumpdev更改相关设置)#sysdumpdev -l
primary /dev/hd6 (dump的主设备)
secondary /dev/sysdumpnull
copy directory /var/adm/ras (dump拷贝的目录)
forced copy flag TRUE(设置为true,这样在拷贝dump磁盘空间不够时提示插入磁带进行拷贝)
always allow dump TRUE(设置为true, 这样在操作系统死机时可以按reset键来得到dump分析原因)
估算系统dump的大小
# sysdumpdev –e
例如:0453-041 Estimated dump size in bytes: 53477376
/var/adm/ras 是默认的dump拷贝目录,比较估算值,保证/var文件系统有足够的剩余空间拷贝dump文件。否则机器重起时会提示用户插入磁带。
dump文件名为vmcore.#
搜集dump日志
# sysdumpdev –L(检查dump是否做成功)
0453-039
Device name: /dev/hd6
Major device number: 10
Minor device number: 2