AIX系统的日志文件
- 格式:docx
- 大小:22.44 KB
- 文档页数:5
Ldd 可以查看程序调用了哪些库文件。
当进程在异常终止运行时,系统会把该进程对应的地址空间中的数据写到core文件中(这个过程被称为dump),以便程序员对其进行分析,找出进程异常终止的原因。
缺省情况下,异常终止的进程在启动它的当前目录下产生core文件。
在AIX 4.3.3中,所有的core文件的文件名都是core,如果不只一个程序产生dump或者相同的程序dump多次,它们都会产生相同文件名的core文件,那么就会丢失比较早的core 文件。
从AIX 5.1开始,改变了core文件的命名方法,使得每一个core文件拥有惟一的文件名,从而避免了新的core文件覆盖旧的core文件,这个特色更加有助于程序员调试和跟踪运行失败的程序。
默认情况下,一个core文件的文件名是core。
要使用AIX 5L中core文件命名的新方法,就要把CORE_NAMING环境变量的值设置为yes。
在AIX 5L中,把当前用户的CORE_NAMING环境变量的值设置成yes之后,随后启动的进程产生的core文件名才能惟一的。
新的core文件名的格式是core.pid.ddhhmmss。
其中pid是进程号,dd是当前月份中的日子,hh表示小时,mm表示分,ss表示秒。
对于一个占用内存资源很大的进程产生的core文件也非常大,因此如果经常有进程产生core文件,而core文件名都不相同,那么产生的core就会占用非常多的文件系统空间,所以系统管理员要定期为程序员收集这些core文件,并删除这些文件。
在AIX 5.3中,用户可以设置产生压缩的core文件和指定一个目录来保存core文件,用lscore命令查看当前用户或指定用户的core设置,例如:$ lscore compression: off path specification: off corefile location: not set naming specification: off $要查看peter用户的core设置,命令是lscore peter。
AIX系统日志说明1、系统错误日志存放路径:/var/adm/ras/errlog说明:该日志记录了系统所检测到的软硬件故障和错误,尤其对系统的硬件故障有很大的参考价值,是AIX提供的最有价值的日志之一, errlog 文件用more或者其他文本的查看命令来打开我们看到的只是一对乱码,为了能够查看错误日志文件需要使用aix的errpt命令,如:errpt 列信息;errpt –a列详细信息,详细使用方法可以参考man,2、用户的登录日志存放路径:/var/adm/wtmp /var/adm/sulog说明:这些日志记录了用户登录和访问服务器的情况信息,具体的日志文件有wtmp、、sulog 等,它们记录的分别是不同的事件,wtmp记录的是历史的login和lognout信息,可以用last命令访问。
sulog记录的是用户用su命令转变为另一用户的信息。
who、last等这些命令可以查看wtmp和sulog的内容如:Last –f wtmp我们想查看最近10次登录的用户和他们的地址,可以用如下命令:last -103、用户的失败登录日志存放路径:/etc/security/failedlogin说明:这些日志记录了用户登录和访问服务器失败的情况信息,登录失败的情况单独记录在该日志中,可以用who命令来查看。
4、集群管理软件hacmp的日志存放路径:/tmp/hacmp.out说明:HACMP是IBM提供的确保系统运行可靠性的集群套件,HACMP在每次启动和关闭时都要经历一段时间以停止服务和转换文件系统,我们可以通过对HACMP。
OUT日志文件的跟踪实时的了解HACMP在启动和关闭时的信息,如出现启动失败则可以帮助我们定位错误。
可以使用tail进行跟踪,tail –f /tmp/hacmp.out5、系统启动错误日志存放路径:/var/adm/ras/bootlog说明:该日志可以跟踪系统在Boot过程中发生的问题,包括服务器液晶板上的代码信息都有记载。
vi编辑器 i编辑模式 I移动到行首 a光标前一个字母 A行末 h向左移 l 向右移 k向上 j向下 x删除当前光标 dd删除整行 ctrl+f 向下翻页,ctrl+b 向上翻页图形界面安装 xmanager 然后打开软件输入命令 export DISPLAY=IP:端口即可调用修改网卡属性命令 smitty chinet修改时间和时区 smitty-->system environments-->chang / show date and time-->using system defined value-->PRCAIX关机:shutdown -F hAIX系统安装方式光盘磁带(常用) 网络安装系统启动之前先把网线,光纤拔掉,然后系统启动按1进入SMS模式,选择启动顺序,依次安装升级安装后用命令OSlevel查看是否升级成功调用配置助手的命令是# install_assist 或 # configassist查看软件包的命令:lslpp -l |grep 软件名称查看进程的命令 ps –ef |grep 进程名diag 是硬件诊断命令查看日志文件alog -o -t |more管理系统环境smit system管理语言环境smit mlang六章用户管理与安全策略查看用户ID 和组的两个命令 id+user finger+user查看用户属性的命令是 lsuser+user 或者加具体参数文件系统有 NTFS FAT16 FAT32 NFS ext2/3/4(Linux中) raw(没有格式化或格式化中取消)svmon是查看内存的增加文件读写权限:chmod 777 /file_name修改欢迎界面是在/etc/motd目录下边重置loginretrice的数值可以直接vi /etc/secrrity/lastlog 或者直接smitty user--> reset#who 查看谁在登录#ps aux |grep pts|grep –v grep 查看用户登录进程Umast权限在创建文件夹的时候文件夹权限为755 但是创建文件的时候为664(不需要执行权限)lsvg -l +vg名是查看vg信息的lsvg -p是查看PVlsvg -o是查看激活中的vglsvg –m 是查看有没有做mirrorlspv -l +pv名是查看lvlspv -p是查看pp的lslv -m 是看lp个数和pp的分布–lslv –l 是看lv在pv的分布lsps –a paging spase 分布状态lsps –s paging spase 大小quorum 是vgda可用个数为51% lsvg+vg名称如果stale pv/pp不为0的话肯定是没有同步,要去查逻辑卷删除VG的命令#reducevg –d linvg hdisk3 hdisk4导入导出VG:在exportvg之前一定要查看两边pvid号是否一致,如果不一致先更新pvid号命令:抹掉pvid:#chdev –l hdisk1 –a pv=clear重新获取pvid:#chdev –l hdisk1 –a pv=yes批量清除pvid信息#for i in 3 4 5 6 7 8 9;do chdev -l hdisk${i} -a pv=clear;done批量获取pvid信息#for I in 3 4 5 6 7 8 9;do chdev -l hdisk${i} -a pv=yes;done查看VGDA信息命令:#lqueryvg –Atp hdisk1exportvg+vg名称,可以抹掉在odm库的vg信息,在exportvg之前必须要umout 所有文件系统,而且必须varyoffvg,然后importvg -y +vg名 +pv名命令:lspv查看当前vg里边有哪几个pvlsvg -l linvg 查看 linvg有几个lv 如果有的话umount掉varyoffvg linvg 去激活vgexportvg linvg 抹掉odm库的vg信息importvg -y linvg hdisk (exportvg的那个vg里边的某个盘vmstat 1 是一秒刷新一次pageing spase将LP导入同一个VG下的其他PV中首先创建vg #smitty vg 然后add一个original vg(标准)然后把两个pv加到vg中,可以用#lsvg –l linvg 查看此vg中有没有lv 如果没有的话在其中一个pv中创建lv #smitty lv #add一个lv 创建完成后可以用#lsvg –l linvg查看lv属性可以用#lslv –l lv_linvg 查看lv分布到哪几个PV上,是怎样分布的,用#lslv –m lv_lin/vg 查看lp是怎样分布的然后用#migratelp lv_linvg/lp个数/cop个数目标pv例:#migratelp lv_linvg/1/1 hdisk9扩容LV:首先得有一个lv 用#lslv –l lv_linvg 查看 lv分布到哪几个PV上然后用#lslv –m lv_linvg 查看lp是怎样分布的,然后#smitty lvSet characteristic of a logical volume →increase the size of a logical volume→选择lv名→然后进行扩容在线转移lv:把硬盘hdisk1上的lv00转移到hdisk2上# migratepv -l lv00 hdisk1 hdisk2在线扩容lv:#lsvg –l linvg#lsvg linvg#chfs –a size=+512M /fslv_test这样扩容风险较小,#chfs –a size=-512M /fslv_test缩容也可以这样,但是有一定的风险,谨慎操作扩容VG:扩容vg之前确认要加入的pv没有其他vg占用,如果有要varyoff掉,然后exportvg擦除信息,varyoff之前要确定没有人访问,lv是close状态方法一:#smitty vg →add a pv to vg→vgname,pvname方法二:#extentvg –f linvg hdisk8扩容VG报错:#extendvg –f linvg hdisk3 报错0516-1008 rmlv: Logical volume loglv00 must be closed. If the logical volume contains a filesystem, the umount command will close the LV device.0516-884 reducevg: Unable to remove physical volume hdisk8.#chvg –t 15 linvg#lsvg linvg 看一下maxpv数量#extendvg –f linvg hdisk3文件系统满了的话进行碎片整理4k整理成1k 比如文件问3k,4k为单位那就占用了一个单位有1k是浪费了,整理成1k的话那就使用了3个单位修改换页空间属性:#smitty lvm→paging space→change ps→可以根据需求添加或减少LP如果一块硬盘坏掉,怎样解决?①去mirror,然后备份数据#smitty vg → unmirror 然后选择vgname②把lv从pv删除,然后把pv从vg删除#smitty lv →removelv 然后选择lvname 进行删除#smitty vg→set vg属性→remove pv→选择vg→选择pv 进行删除③diag点亮硬盘,确定哪一块硬盘,把硬盘拔出④把硬盘放进去,然后用#cfgmgr -v识别硬盘然后用#chdev –l pvname –a pv=yes获取pvid⑤加vg,#smitty vg→set vg属性→add一个pv⑥做mirror,#smitty vg → mirror a vg→选择vg→选择同步类型→选择pv 然后同步另:如果lv做copy(mirror)的时候首先#lslv –m lv_linvg查看一下是否有做copy 如果没有的话 #smitty lv→set lv属性→add copy lv→lvname→copy数量→选择pv→选择pv分布范围(注:如果lv分布在两个pv上的话那么range pv 一定要选择maximum) →enterMount与umont#df –g查看有哪些文件系统 mount点在哪然后确定umount哪个文件系统用#fuser –uc /inst 查看有哪些用户在用这个文件系统如果没有用户再用,然后确定不对外提供服务了,可以使用umount /inst 来umount掉如果有用户再用可以用#fuser –kuxc /inst 杀掉mount在这个目录下边的进程,然后再umount 做这些操作之前一定要确定文件系统不对外提供服务而且没有用户在使用的情况下如果paging spase在open状态下,可以用#lsps –a查看有哪些ps 然后用#swapoff /dev/paging00Mount的时候如果根目录下有几个文件系统,你只 mount了一个文件系统的话,其他文件系统是隐藏的,所以你只能看到一个,把mount的那个文件系统umount 掉才能看到其他的举例1:比如一个2G的根目录,已经使用了98%了,而我们mount 的那个文件系统才使用20%了,这个时候就需要umount掉这个mount的文件系统查看一下别的隐藏文件举例2:比如安装一个应用,安装到了vg上边,安装完成之后mount一个文件系统然后发现这个应用找不到了(其实是隐藏了)然后又安装一遍,等这个文件系统umout的时候这个应用还是可以启动,但是数据跟mount上的那个文件系统的数据不一致,所以会出现问题Mount 一个文件到一个mount点的命令首先df –g 查看有没有mount和现在mount在哪然后#mount –v jfs2 /dev/fslv00 /beth查看文件系统目录#cat /etc/filesystems创建文件系统已经mount第一种方式:首先确定要创建多大的文件系统,然后查看vg的pp size #lsvg linvg#smitty fs→add一个→选择第一项→选择第一项→然后根据提示做(选择单位大小,然后决定num,然后填写mount点,然后设置重启是不是自动启动)回车确定,然后#lsvg –l linvg查看是否已经建立成功如果建立成功的话,直接#mount /lin_test01 (这一种方式不能确定分布在哪个pv上,也不能确定是否已经做mirro等)第二种方式:首先确定要创建多大的文件系统,然后查看vg的pp size #lsvg linvg然后创建lv #smitty lvm add一个lv就可以了#lsvg –l linvg 查看lv然后#smitty fs→add一个→选择第一项→选择第二项→选择lv和填写mount 点,设置重启是不是自动启动回车确定,然后#lsvg –l linvg 查看是否已经有挂载点→然后给lv扩容,增加两个lp,#smitty lv→set属性→然后Increase size→选择增加几个lp,分布在哪个PV上,回车确定,然后查看分布在哪些pv 上lslv –m fslv_linvg,确定没问题 #mount test002查看内存的命令 #lsattr -El mem0 #prtconf 看系统配置信息cfgmgr –v 扫描所有加电的设备清除pvid信息#chdev –l hdisk1 –a pv=clear获取pvid信息#chdev –l hdisk1 –a pv=yes把硬盘hdisk1上的lv00转移到hdisk2上#migratepv –l lv00 hdisk1 hdisk2Hd4 根系统 hd5引导系统 hd6换页空间(虚拟内存)hd8日志系统网络:一般IP分为四段,一段为8位一次是128 64 32 16 8 4 2 1A类地址是1开头B类地址是10开头C类地址是100开头永久修改主机名:#chdev –l inet0 -a hostname=xxnameTCP端口监听命令#netstat –an |grep tcp |more端口记录位置#cat /etc/services更改网卡IP#smitty chinet更改网卡属性#smitty chgenet查看所有磁盘 lsdev -Cc disk 直接查看磁盘信息lsattr -El hdisk0,lssrc -a 是查看所有系统服务 refresh -g 是重启服务lssrc -t +服务名查看服务状态startsrc -s +服务名启动服务系统服务:#while true; do df –g ;sleep 5 ;echo ““;done#cd inst#vi abc.sh#!/usr/bin/kshWhile true;do df –g ;sleep 5 ;echo ““;done:wq#chmod a+x abc.sh#/abc.sh#bg 是把命令放到后台运行 fg是在前台输出,exit系统进程就会停止把命令放到后台运行且不退出的命令是#nohup ./abc.sh &#cd /inst #ls –l nohup.out可以查看跑过的nohup命令#nohup ./abc.sh 2>&1 >/dev/null & 1是标准输出2是错误输出,此命令是把错误输出到文件中去#cd /inst #vi aa.sh#!/usr/bin/kshPID=`ps -ef |grep abc.sh |grep -v grep |awk '{print $2 }'`a=`ps -ef |grep abc.sh |grep -v grep |awk '{print $2 }'|wc -l `if [ $a -ne 0 ]thenecho " abc.sh shell is active "fikill -9 $PIDa=`ps -ef |grep abc.sh |grep -v grep |awk '{print $2 }'|wc -l `if [ $a -ne 0 ]thenecho " abc.sh shell is active "elseecho "abc.sh has been killed "fi控制用户使用crontab的两个文件:/var/adm/cron/cron.deny 不允许使用cron的用户/var/adm/cron/cron.allow 允许使用cron的用户如果两个文件都存在,那么只有cron.allow文件有效,如果两个文件都不存在,那么只有root才可以用croncrontab格式:分钟小时日月份星期命令0-59 0-23 1-31 1-12 0-6(0为周日)查看crontab #crontab –l删除crontab #crontab –r编辑crontab方法一:#crontab –e方法二:# crontab –l >/tmp/crontmp# vi /tmp/crontmp# crontab /tmp/crontmp备份与恢复备份分为:系统备份,完全备份,增量备份备份软件:IBM的TSM备份软件HP的NBU备份软件备份介质:软盘,CD,磁带,等等备份系统(rootvg)的时候,可以在/etc/exclude.rootvg更改不想备份的文件,然后#smitty mksysb的时候在EXCLUDE files? 选项选成yes实验:创建一个文件系统并且挂载,然后进行备份,查看备份状态#smitty fs→add/change/show/delete file systems→Enhanced journaled file systems→add an enhanced journaled file system选择VG→选择创建单位,挂载点,选择是否重新自动挂载→创建成功#lsvg –l linvg 查看创建的文件系统是否创建成功#mount /backup#lsvg –l linvg#smitty mksysb→选择挂载点→选择是否启动exclude,选择是否 create map files然后备份备份过程共可以克隆一个会话,#cd /tmp用ls –ltr查看最新生成的文件然后#cd mksysb.13893824→#ls –ltr里边.archive.list.13893824为要备份哪些文件_mksysb.13893824里边为已经备份了哪些文件,还可以用#more /image.data查看data信息;用#wc –l backup一个目录是查看这个目录下边有多少个文件注意:#smitty mksysb只备份rootvg 如果需要备份其他vg 使用#smitty savevg #smitty vg→back up a volume guoup→就是savevg备份文件系统可以#smitty fs#dd if=/dev/fslv00 of=/inst/aa.d count=1024把fslv00前1024个字节移动到aa.d文件 aa.d必须是读写的设备管理13、设备按照读写方式一般可分为两种类型:块设备和字符设备ls -l /dev b开头的是块设备 c开头的是字符设备 d开头的是目录设备号是一个数字,由主设备号(major number)和次设备号(minor number)组成:主设备号标志这设备的类型,次设备号有相应的设备驱动程序解释,常常标志着具体的物理设备。
1、系统错误日志存放路径:/var/adm/ras/errlog说明:该日志记录了系统所检测到的软硬件故障和错误,尤其对系统的硬件故障有很大的参考价值,是AIX提供的最有价值的日志之一,errlog 文件用more或者其他文本的查看命令来打开我们看到的只是一对乱码,为了能够查看错误日志文件需要使用aix的errpt命令,如:errpt 列信息;errpt –a列详细信息,详细使用方法可以参考man,2、用户的登录日志存放路径:/var/adm/wtmp /var/adm/sulog说明:这些日志记录了用户登录和访问服务器的情况信息,具体的日志文件有wtmp、、sulog 等,它们记录的分别是不同的事件,wtmp记录的是历史的login和lognout信息,可以用last 命令访问。
sulog记录的是用户用su命令转变为另一用户的信息。
who、last等这些命令可以查看wtmp和sulog的内容如:Last –f wtmp我们想查看最近10次登录的用户和他们的地址,可以用如下命令:last -103、用户的失败登录日志存放路径:/etc/security/failedlogin说明:这些日志记录了用户登录和访问服务器失败的情况信息,登录失败的情况单独记录在该日志中,可以用who命令来查看。
4、集群管理软件hacmp的日志存放路径:/tmp/hacmp.out说明:HACMP是IBM提供的确保系统运行可靠性的集群套件,HACMP在每次启动和关闭时都要经历一段时间以停止服务和转换文件系统,我们可以通过对HACMP。
OUT日志文件的跟踪实时的了解HACMP在启动和关闭时的信息,如出现启动失败则可以帮助我们定位错误。
可以使用tail进行跟踪,tail –f /tmp/hacmp.out5、系统启动错误日志存放路径:/var/adm/ras/bootlog说明:该日志可以跟踪系统在Boot过程中发生的问题,包括服务器液晶板上的代码信息都有记载。
1. 要更改 /test 日志文件系统的文件系统大小,输入:
chfs -a size=24576 /test
此命令将 /test 日志文件系统的大小更改为 24576 个 512 字节块,或 12MB(只要先前的大小没有这么大)。
2.要增加 /test 日志文件系统的大小,输入:
chfs -a size=+8192 /test
此命令会将 /test 日志文件系统的大小增加 8192 个 512 字节块或 4MB。
3.要更改文件系统的安装点,输入:
chfs -m /test2 /test
此命令将文件系统的安装点从 /test 更改为 /test2。
4.要从文件系统删除记帐属性,输入:
chfs -d account /home
此命令将记帐属性从 /home 文件系统中除去。
记帐属性从 /etc/filesystems 文件的 /home: 节中被删除。
5.要分割镜像文件系统的副本并安装它作为只读形式用以联机备份,输入:
chfs -a splitcopy=/backup -a copy=2 /testfs
这样就在 /backup 安装了 /testfs 的只读副本。
6.要更改 /opt文件系统的文件系统大小,输入:
chfs -a size=10G /opt
此命令将 /opt文件系统的大小更改为 10G(只要先前的大小没这么大)。
alog命令详解alog是一个很有用的AIX命令,该命令主要用来维护和管理系统启动及运行过程中记录的日志信息。
通过alog命令查看日志,可以发现系统是否存在问题。
alog命令从标准输入读取信息,然后写到标准输出中,并将输出的内容循环写入到固定大小的文件中。
当系统启动时,会调用/sbin/rc.boot文件,而该文件会将引导信息重定向到/var/adm/ras/bootlog文件中,下面就是rc.boot文件中的一条重定向语句:cat/../tmp/boot_log | alog -q -t boot,类似的语句还有多条。
另外,系统在执行/etc/inittab文件时,也有类似的重定向语句。
如:rc:23456789:wait:/etc/rc 2>&1 | alog -tboot > /dev/console这些都是alog重定向语句。
alog日志文件在alog配置数据库中定义,而alog配置数据库则保存在ODM数据库中,用户可以通过ODM数据库操作命令调整日志文件属性。
这里不做介绍,请参考ODM相关文档。
下面就介绍一下alog命令的常用的命令参数及命令功能:alog命令参数:—L显示定义在alog配置数据库中的日志文件类型,与-t logtype同时使用时,显示指定日志文件类型的属性值。
如:# alog –L显示定义在alog配置数据库中的日志文件类型,执行结果如下:boot 记录系统启动信息日志bosinst 记录系统BOS安装日志nim 记录通过网络安装系统或软件日志cfg 记录系统配置日志console 记录控制台信息日志lvmcfg 记录lvm配置信息日志lvmt 即 LVM tracing,记录大量lvm操作日志dumpsymp 记录系统dump日志mdmplog 记录内存dump日志—C更改指定 LogType 的属性,与-f、-s和-w标志一起使用来更改指定 LogType 的File、Size和Verbosity属性。
实验15项目名称:日常维护及配置(一)1、实验目的了解小型机系统日常维护及配置的基本内容。
掌握系统及用户环境管理的基本方法。
在理解系统日志概念的基础上,掌握错误日志文件的管理方法。
2、实验内容日常维护及配置的基本内容前面我们分别按专题分别介绍了在小型机系统上对用户、进程、内存、文件系统、存储、外围设备以及网络等方面的基本管理。
本实验则是从用户与系统环境的维护及配置角度,讨论系统管理员日常需做各项工作,其中包括系统及用户环境的配置、系统日志的管理与维护、错误和异常的排查和分析、系统安全管理、基本的数据备份和恢复等等。
这些工作本身并不对应于系统中的某个硬件或软件子系统,但却贯穿于系统管理工作的始终,系统管理员往往是通过这些日常工作逐渐积累各种经验,特别是对系统各类问题,如硬件错误、安全异常等方面的经验,最终成为一名优秀的系统管理员。
因此,这些系统管理知识和技能是大家所必须掌握的内容。
本专题分为两部分,本次实验主要介绍系统及用户环境的配置、系统日志的管理与维护等方面的内容。
系统及用户环境管理对于一个系统管理员,在开展工作前,最起码要对当前系统和用户所使用的环境有一个基本的了解。
以下所介绍的命令,主要用在获取基本系统和用户环境的基本信息。
命令:lscfg功能:显示系统的配置信息、诊断信息和重要产品的信息格式:lscfg例子:lscfg命令的使用#lscfgINSTALLED RESOURCE LISTThe following resources are installed on the machine.+/- = Added or deleted from Resource List.* = Diagnostic support not available.Model Architecture: chrpModel Implementation: Multiple Processor, PCI bus+ sys0 System Object+ sysplanar0 System Planar* vio0 Virtual I/O Bus* vsa1 LPAR Virtual Serial Adapter* vty1 Asynchronous Terminal* vsa0 LPAR Virtual Serial Adapter显示单个设备的基本信息#lscfg | grep ProcessorModel Implementation: Multiple Processor, PCI bus+ proc0 Processor+ proc2 Processor问题:请完成如下问题,并将截图结果附于问题之后。
AIX系统的日志文件2008/12/02 12:41系统日志存放目录:/var/adm/ras/(包括启动日志、错误日志、core文件等)查看错误日志路径# /usr/lib/errdemon -lError Log Attributes——————————————–Log File /var/adm/ras/errlogLog Size 1048576 bytesMemory Buffer Size 32768 bytesDuplicate Removal trueDuplicate Interval 10000 millisecondsDuplicate Error Maximum 1000查看错误日志:# errpt(errpt -a显示详细信息)IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTIONF89FB899 0831150006 P O dumpcheck The copy directory is too small.2BFA76F6 0804104006 T S SYSPROC SYSTEM SHUTDOWN BY USER9DBCFDEE 0804104706 T O errdemon ERROR LOGGING TURNED ON192AC071 0804103906 T O errdemon ERROR LOGGING TURNED OFF 70247B03 0804103806 I H hdisk1 Device Not Supported如果RESOURCE_NAME 为硬件,可以用diag工具诊断错误原因错误分类:1、按错误的类型,或者说严重的程度,分为6个:PEND 设备或功能组件可能丢失简写PPERF 性能严重下降PPERM 硬件设备或软件模块损坏,确诊了的PTEMP 临时性错误,经过重试后已经恢复正常TINFO 一般消息,不是错误IUNKN 不能确定错误的严重性U2、种类CLASS c:指出错误源H 硬件或介质故障S 软件故障O 人为错误U 不能确定日志清理:通过errclear命令可以用来清理错误日志,并且默认情况下cron会每天清理错误日志# crontab -l0 11 * * * /usr/bin/errclear -d S,O 300 12 * * * /usr/bin/errclear -d H 900 15 * * * /usr/lib/ras/dumpcheck >;/dev/null 2>;&1显然,找上面的例子,S,O 类的错误会保留30天,而H的错误会保留90天AIX通过修改配置文件/etc/syslog.conf 来跟踪不同模块的运行状况。
信息类别:auth-used by authorization systems (login)cron -used for the cron and at systemsdaemon-system/netword daemonkern-produced by kernel messageslpr -printing systemmail -mail systemmark-internally used for time stampsnews -reserved for the news systemuser-default facility, used for any programuucp -reserved for the uucp system错误等级:debug-normally used for debugginginfo-informational messagesnotice-conditions that may require attentionWarning-any warningserr-any errorscrit -critical conditions like hardware problemsAlert-any condition that demand immediate attentionemerg -any emergency conditionnone -Do not send messages from the indicated facility -to the selected file.配置举例:在文件中添加cron.err /var/cronerr.log #定义记录cron的err信息到/var/cronerr.log文件core 和snapcore由应用产生的dump 文件,可用于诊断错误可删除nohup.outnohup 命令的输出结果可删除.xerrorsX11的输出结果可截短mbox用户邮箱中的邮件可截短smit.log 和smit.script用户使用smit 命令后的日志可适当保留最后1000行,或删除/var/adm/wtmp记录用户的登录信息,是二进制文件,用who 命令来阅读其内容根据需要保留60天中有用的内容,其余删除/etc/security/failedlogin记录用户失败的登录信息,是二进制文件,用who 命令来阅读其内容可根据需要保留60天中有用的内容,其余删除/var/adm/sulog 用户使用su 命令的日志可根据需要保留60天中有用的内容,其余删除/var/adm/cron/logcron的日志可截短/var/tmp/snmpd.logsnmp 监控进程日志可截短/var/tmp/dpid.log/var/tmp/dpid2.log/var/tmp/hostmidb.log/var/tmp/muxatmdsnmp 子系统日志可截短dead.letter未成功的邮件可删除trcfile trace实用程序的输出可删除/var/adm/messages用于记录syslog进程的日志可适当保留最后1000行,或删除/etc/shutdown.log系统关机过程日志,用shutdown -l 命令产生可适当保留最后1000行,或删除AIX系统日志(2008-10-16 23:00:23)转载▼标签:分类:工作中的点点滴滴杂谈1、系统错误日志存放路径:/var/adm/ras/errlog说明:该日志记录了系统所检测到的软硬件故障和错误,尤其对系统的硬件故障有很大的参考价值,是AIX提供的最有价值的日志之一, errlog 文件用more或者其他文本的查看命令来打开我们看到的只是一对乱码,为了能够查看错误日志文件需要使用aix的errpt命令,如:errpt 列信息;errpt –a列详细信息,详细使用方法可以参考man,2、用户的登录日志存放路径:/var/adm/wtmp /var/adm/sulog说明:这些日志记录了用户登录和访问服务器的情况信息,具体的日志文件有wtmp、、sulog等,它们记录的分别是不同的事件,wtmp记录的是历史的login 和lognout信息,可以用last命令访问。
sulog记录的是用户用su命令转变为另一用户的信息。
who、last等这些命令可以查看wtmp和sulog的内容如:Last –f wtmp我们想查看最近10次登录的用户和他们的地址,可以用如下命令:last -103、集群管理软件hacmp的日志存放路径:/tmp/hacmp.out说明:HACMP是IBM提供的确保系统运行可靠性的集群套件,HACMP在每次启动和关闭时都要经历一段时间以停止服务和转换文件系统,我们可以通过对HACMP。
OUT日志文件的跟踪实时的了解HACMP在启动和关闭时的信息,如出现启动失败则可以帮助我们定位错误。
可以使用tail进行跟踪,tail –f /tmp/hacmp.out4、系统启动错误日志存放路径:/var/adm/ras/bootlog说明:该日志可以跟踪系统在Boot过程中发生的问题,包括服务器液晶板上的代码信息都有记载。
可以使用alog命令监视这些问题, 存放在/var/adm/ras/bootlog 中,可以使用alog –o –t boot命令查看该文件。
5、FTP用户操作日志存放路径:自定义(建议/tmp/ftplog.out)说明:很多服务器都会用到FTP功能,大量的用户通过FTP登陆到服务器上给系统的安全性带来了很大的问题,AIX给我们提供了一套很不错的可以记录用户FTP操作情况的日志。
具体设置步骤如下:在/etc/inetd.conf文件中编辑 FTP 一行,在FTPD后加“-d”重启服务: refresh –s inetdtouch /tmp/ftplog.out在/etc/syslog.conf文件中加上两行:daemon:debug /tmp/ftplog.outdaemon:info /tmp/ftplog.out重启服务: refresh –s syslogd以上只是我在工作中主要用到的一些日志,只是AIX给我们提供了很多其他重要的日志文件中的一部分,大家可以在工作中慢慢体会。
AIX errpt 命令使用备查修改当前的日志文件/usr/lib/errdemon -i /var/adm/ras/myerrlog修改当前日志文件大小/usr/lib/errdemon -s 28866修改当前日志缓冲区大小/usr/lib/errdemon -B 20480修改2个重复错误之间的间隔时间/usr/lib/errdemon -t 50ps -ef | grep errdemon/usr/lib/errdemon/usr/lib/errstopps -ef | grep errdemonerrpt | more详细errpt -a | pg以ASCII 方式显示errpt -g -j 74533D1A | more检查过去24小时内发生的错误日志dateerrpt -a -s 0128092102errclear 命令清除日志记录删除所有日志errclear 0删除10天前的软件记录errclear -d -S 10======================errpt -a-a是以详细格式显示错误日资文件中的错误信息在系统中生成一个记录下来的错误报表。