AIX进程监控与管理
- 格式:doc
- 大小:112.50 KB
- 文档页数:21
系统监控软件的资源监测和进程管理技巧指导一、资源监测技巧资源监测是系统监控软件的核心功能之一,它可以帮助管理员实时了解系统的资源使用情况,并及时发现并解决资源瓶颈问题。
下面将介绍几个资源监测的技巧。
1. 定期监测系统资源利用率定期监测系统资源利用率是非常重要的,可以及时发现资源的使用情况,及早采取措施优化资源分配。
监测的关键指标包括CPU利用率、内存利用率、磁盘利用率和网络利用率等。
通过监控软件提供的图表、报表和警报功能,管理员可以清晰地了解资源的分配状态,及时发现资源利用率异常或者超过预期的情况。
2. 建立阈值警报机制为了方便及时发现资源使用异常情况,监控软件通常提供了阈值警报机制。
管理员可以根据系统的实际情况,设置资源利用率的阈值。
一旦资源利用率超过或者低于设定的阈值,监控软件将自动发出警报,管理员可以及时采取措施解决问题。
通过警报机制,管理员可以避免资源利用率过高或者过低导致系统性能下降的情况。
3. 利用历史数据进行分析监控软件通常会保存历史数据,管理员可以利用这些数据进行分析。
通过分析历史数据,可以发现资源利用率的变化趋势,从而预测未来的资源需求。
管理员可以根据历史数据的分析结果,调整资源分配策略,提高系统的性能和可用性。
4. 使用性能分析工具监控软件通常会提供性能分析工具,管理员可以利用这些工具对系统资源进行深入分析。
例如,性能分析工具可以帮助管理员查找系统中的性能瓶颈,进一步优化资源的分配和使用。
管理员可以通过性能分析工具,了解系统资源使用的细节,并针对性地进行优化。
二、进程管理技巧进程管理是系统监控软件的另一个重要功能,它可以帮助管理员监控和管理系统中运行的进程。
下面将介绍几个进程管理的技巧。
1. 监控进程的状态和资源使用情况监控软件可以提供进程的状态和资源使用情况。
管理员可以通过监控软件,实时查看进程的运行状态、CPU利用率、内存使用情况等。
通过对进程状态和资源使用情况的监控,管理员可以及时发现异常进程和资源瓶颈,及时进行干预和优化。
Windows CMD命令中的进程监控和资源管理技巧Windows操作系统是目前使用最广泛的操作系统之一,而CMD命令作为Windows操作系统的命令行工具,具有很多强大的功能。
本文将介绍一些在CMD命令中可以用来监控进程和管理系统资源的技巧。
一、进程监控技巧1. 查看正在运行的进程在CMD命令行中,可以使用tasklist命令来查看当前正在运行的进程。
只需在命令行中输入tasklist并按下回车键,系统将列出所有正在运行的进程的详细信息,包括进程ID、进程名称、内存使用等。
2. 查找特定进程如果想要查找特定的进程,可以使用tasklist命令的参数来进行筛选。
例如,要查找名为"chrome.exe"的进程,可以使用命令"tasklist | findstr chrome.exe",系统将只显示包含"chrome.exe"的进程。
3. 结束进程在CMD命令行中,可以使用taskkill命令来结束指定的进程。
只需输入"taskkill /PID 进程ID",将进程ID替换为要结束的进程的ID,按下回车键,系统将立即结束该进程。
二、资源管理技巧1. 查看系统资源使用情况使用CMD命令行可以很方便地查看系统的资源使用情况。
可以使用命令"systeminfo"来查看系统的详细信息,包括操作系统版本、安装日期、物理内存等。
此外,还可以使用命令"wmic cpu get loadpercentage"来查看当前CPU的使用率。
2. 查看磁盘空间在CMD命令行中,可以使用命令"dir"来查看指定目录下的文件和文件夹的列表。
使用参数"/s"可以查看指定目录及其子目录下的所有文件和文件夹。
此外,还可以使用命令"fsutil volume diskfree C:"来查看指定磁盘的可用空间。
MacOS终端中的进程监控和性能优化命令在MacOS操作系统中,Terminal终端是一款十分强大的工具,用户可以通过它执行各种命令来管理和优化系统性能。
本文将介绍一些常用的进程监控和性能优化命令,帮助读者更好地利用MacOS的终端工具。
一、进程监控命令1. top命令top命令是一个用于实时监控系统进程的工具。
在终端中输入top命令后,会显示当前运行的进程列表,并实时更新CPU、内存和磁盘等资源的使用情况。
通过top命令,用户可以快速了解系统中各个进程的运行情况,以及它们对系统资源的占用情况。
2. ps命令ps命令用于列出当前正在运行的进程。
在终端中输入ps命令后,会显示包括进程ID、进程状态、CPU占用率等信息。
通过ps命令,用户可以查看系统中正在运行的进程的详细信息,例如进程的启动时间、执行路径等。
3. kill命令kill命令用于终止指定进程的执行。
在终端中输入kill命令后,后面跟上进程ID,就可以将该进程强制终止。
通过kill命令,用户可以主动结束某个进程,以释放系统资源或解决进程卡死等问题。
二、性能优化命令1. activity monitor命令activity monitor命令是一个图形界面应用程序,提供了对系统性能的全面监控和优化。
在终端中输入activity monitor命令后,会启动一个监控窗口,用户可以通过该窗口查看CPU、内存、磁盘和网络等资源的使用情况,并对系统进行性能诊断和优化。
2. du命令du命令用于查看指定目录或文件的磁盘使用情况。
在终端中输入du命令后,后面跟上目录或文件的路径,就可以显示该目录或文件占用的磁盘空间大小。
通过du命令,用户可以及时了解到各个目录或文件的磁盘占用情况,以便进行磁盘清理和优化。
3. purge命令purge命令用于清理系统内存。
在终端中输入purge命令后,系统会将当前的内存缓存清空,以释放内存资源。
通过purge命令,用户可以加快系统的响应速度和运行效率,特别是在内存紧张的情况下。
aix 常用命令AIX常用命令AIX(Advanced Interactive eXecutive)是IBM公司的一款UNIX操作系统,广泛应用于企业级服务器系统中。
本文将介绍AIX 常用命令,帮助读者更好地理解和使用该操作系统。
一、系统管理命令1. whoami:查询当前登录用户的用户名;2. hostname:查看主机名;3. uname -a:显示系统的各种信息,如内核版本、硬件平台等;4. uptime:查看系统的运行时间和负载情况;5. date:显示当前日期和时间;6. topas:实时监控系统性能,包括CPU利用率、内存使用情况等;7. lparstat -i:显示LPAR(Logical Partition)信息,包括分区的配置和资源利用情况;8. lsdev:列出设备列表;9. errpt:查看系统错误日志,用于排查故障;10. ps -ef:显示当前系统的进程列表;11. mksysb:创建系统备份;12. bootlist:设置系统启动顺序。
二、文件和目录管理命令1. ls:列出当前目录下的文件和子目录;2. pwd:显示当前工作目录的路径;3. cd:切换工作目录;4. mkdir:创建新的目录;5. rm:删除文件或目录;6. cp:复制文件或目录;7. mv:移动文件或目录;8. find:按照指定条件查找文件;9. du:查看目录或文件的磁盘使用情况;10. df:显示文件系统的使用情况;11. cat:查看文件内容;12. vi:编辑文本文件。
三、用户和权限管理命令1. useradd:创建新用户;2. userdel:删除用户;3. passwd:修改用户密码;4. chuser:修改用户属性;5. chown:修改文件或目录的所有者;6. chmod:修改文件或目录的权限;7. chgrp:修改文件或目录的所属组;8. groups:查看用户所属的组;9. su:切换用户身份;10. visudo:编辑sudoers文件,配置用户的sudo权限。
Linux系统进程监控脚本使用Shell脚本监控系统进程并自动重启Shell脚本作为一种自动化脚本语言,可在Linux系统中编写和执行各种任务。
其中,一项重要的任务是监控系统进程并在必要时自动重启。
本文将介绍如何使用Shell脚本来实现Linux系统进程监控和自动重启的功能。
一、编写监控脚本首先,我们需要编写一个监控脚本来监控系统中的进程。
以下是一个示例的监控脚本:```#!/bin/bashprocess_name="example_process" # 要监控的进程名称while truedoprocess_num=$(pgrep $process_name | wc -l) # 统计进程数量if [ $process_num -eq 0 ]; then # 如果进程数量为0echo "进程 $process_name 未运行,正在尝试重新启动..."# 重新启动进程的命令,例如:# /path/to/example_process &# 注意加上后台运行符号&fisleep 60 # 休眠60秒,避免频繁检测done```在上述脚本中,首先定义了要监控的进程名称为`example_process`,然后使用一个无限循环来检测进程是否在运行。
通过`pgrep`命令和`wc -l`命令可以统计指定进程名称的进程数量。
如果进程数量为0,则输出提示信息,并执行重启进程的操作(根据实际情况自行修改重启命令)。
最后,使用`sleep`命令休眠60秒,以避免频繁检测。
二、保存并设置执行权限将上述脚本保存为一个以`.sh`为后缀的文件,例如`monitor_process.sh`。
然后,通过命令`chmod +x monitor_process.sh`为脚本文件添加执行权限。
三、设定定时任务为了让监控脚本能够定期执行,我们可以使用Linux系统中的定时任务功能。
Linux终端中的进程管理和监控在Linux终端中,进程的管理和监控是系统管理者和开发人员必备的技能之一。
通过合理的进程管理和监控,可以保证系统的稳定性和正常运行。
本文将介绍Linux终端中进程管理和监控的相关知识,并提供一些实用的命令和工具供读者参考。
一、进程管理在Linux系统中,每个正在运行的程序都是一个进程。
进程管理的任务包括启动、停止、监控和调整进程的运行状态等。
下面是一些常用的进程管理命令及其功能:1. ps命令:用于查看当前系统中运行的进程信息。
通过不同的选项,可以显示进程的PID(进程ID)、状态、内存占用等详细信息。
2. kill命令:用于终止指定的进程。
可以通过进程ID(PID)或进程名来指定要终止的进程。
3. top命令:用于实时监控系统中的进程状态。
它可以显示当前运行的进程列表,并实时更新进程的CPU利用率、内存占用等信息。
4. renice命令:用于调整进程的优先级。
可以通过指定进程ID或进程名,设置进程的优先级,以调整系统资源的分配。
二、进程监控除了上述命令外,Linux终端还提供了一些工具用于进程的监控和管理。
下面是一些常用的进程监控工具及其功能:1. System Monitor:一个图形化的工具,用于实时监控系统的状态和进程信息。
它可以以图表的形式显示CPU利用率、内存占用、网络流量等信息,并提供用于杀死进程、调整优先级等功能。
2. htop:一个更加强大的进程监控工具,相比于top命令,htop提供了更多的功能和定制选项。
它可以以交互式的方式显示系统状态和进程信息,并允许用户进行进一步的操作,如终止进程、修改优先级等。
3. systemd:一个集成的系统和服务管理工具。
通过systemd,可以对系统中的进程进行监控和管理,包括启动、停止、重启进程等操作。
它还提供了一些高级功能,如进程的自动重启、进程的依赖管理等。
4. monit:一个轻量级的进程监控工具,可用于监控系统中的进程和服务。
监控工具:AIX操作系统提供了丰富的命令工具来检查系统性能状态。
其中最主要的命令式:topas,提供了一个实时的系统主要硬件资源运行专题的监控界面,判断系统是否有性能问题。
检查CPU状态的命令:sar, vmstat, tprof。
检查内存状态的命令有:vmstat, lsps, ipcs, ps, svmon。
检查存储状态的命令有:iostat ,df, dd检查网络状态的命令有:netstattopas:监控界面左上角观察到服务器名,当前系统时间,和监控数据刷新时间间隔。
CPU性能状态数据Kernel和User部分表示CPU资源用于Kernel和用户应用计算,是CPU繁忙部分。
“Kernel:操作系统内核(进程间的通信(消息传递),存储器管理。
)”Wait:等待存储或者网络资源,如果此部分持续较高表示系统存储或网络资源存在瓶颈。
Idle:数据接近0时表示系统很繁忙。
反应CPU系统资源不足。
(需要进一步分析CPU资源使用情况)。
Runqueue【音标】:[rʌn’kju:]表示等待CPU资源的线程数,持续大于0表示CPU 资源不足。
Waitqueue 表示已经获得CPU资源但缺少I/O资源的线程数。
当持续大于0时表示I/O资源不足,通常是由于存储带宽和网络带宽不足引起的。
通常在一个没有性能问题的系统中,Runqueue和Waitqueue的值通常为0。
偶尔不为0不代表系统存在性能问题。
内存状态数据::PAGING部分的PgspINhePgspOut持续不为0,表示系统不停的再做换页操作。
系统物理内存资源不足的重要标志。
MEMORY部分可以获得系统物理内存总数,物理内存资源紧张时,%Comp 和%Noncomp数值接近100%。
使用100%—%Comp—%Noncomp获得空闲物理内存。
PAGING SPACE部分可以获得系统配置的全部换页空间的容量。
当前已经使用的换页空间的比例,在物流内存充裕的系统上,换页空间的使用比例接近于0。
AIX内核跟踪程序-TraceAIX 内核跟踪程序-Trace (一)供稿者:杜新存Trace是AIX内置的系统跟踪工具,可以用来收集系统事件(system call,user code,kernel extension等)和时间相关的信息。
是用来分析系统和应用程序性能和运行问题的强大工具。
trace通常情况下trace占用较少的系统资源,不会对系统产生加大的负载压力,使用的CPU资源不会超过5%,trace以循环方式运行使时,只使用内存buffer,没有硬盘读写操作,不会产生I/O负载。
1. 理解跟踪程序跟踪程序比传统的访问和给出系统维护的统计信息系统监视服务更灵活。
它并没有预先假定需要什么统计信息,相反,跟踪程序提供了事件流并允许用户决定提取什么信息。
与传统监视服务相比,数据整理(系统事件向统计信息的转换)大大增加了系统检测。
例如,许多系统通过观察任务A 的运行保存其最小、最大以及平均运行时间并允许提取这一信息。
跟踪程序并不会显著地给检测加重数据整理,而是提供了一种跟踪事件记录流(通常缩写为events)。
没有必要事先决定需要什么统计信息;数据整理很大程度上独立于检测。
用户可以从事件流中选择决定任务 A 的最小、最大和平均时间。
但是也有以下可能:当任务 A 被进程 B 调用时提取任务 A 的平均时间当条件 XYZ 同时出现时提取任务 A 的平均时间计算任务 A 运行时的标准差确定其它一些通过事件流识别的任务对其总结更有意义。
这一灵活性对于诊断性能或功能问题没有价值。
除了提供关于系统活动的详细信息之外,跟踪程序允许检测应用程序并将它们的跟踪事件收集到系统事件中。
跟踪文件随即包含了一条具有正确的序列和精确的时间戳的应用程序和系统活动的完整记录。
2. 实现一个跟踪hook 是一个将被监视的特定事件。
一个唯一的数字被指定给那个事件,这个唯一的数字被称作一个 hook ID。
trace 命令监视这些 hook。
aix常用命令AIX常用命令一、介绍AIX(Advanced Interactive eXecutive)是IBM公司开发的一种UNIX操作系统。
它具有稳定性高、可靠性强的特点,被广泛应用于企业级服务器和大型计算机系统中。
本文将介绍AIX常用命令,帮助读者更好地了解和使用AIX系统。
二、文件和目录操作命令1. ls命令:用于列出指定目录下的文件和子目录。
可以使用-l参数以长格式显示文件详细信息,也可以使用-a参数显示所有文件(包括隐藏文件)。
2. cd命令:用于切换当前工作目录。
可以使用绝对路径或相对路径进行切换。
3. pwd命令:用于显示当前工作目录的路径。
4. mkdir命令:用于创建新的目录。
可以使用-p参数创建多级目录。
5. rmdir命令:用于删除空的目录。
6. cp命令:用于复制文件或目录。
可以使用-r参数递归复制整个目录。
7. mv命令:用于移动文件或目录,也可以用于对文件或目录重命名。
8. rm命令:用于删除文件或目录。
可以使用-r参数递归删除整个目录。
三、文件内容查看和编辑命令1. cat命令:用于查看文件的内容。
可以一次显示整个文件,也可以使用-n参数显示行号。
2. more命令:用于分页显示文件的内容。
可以使用空格键向下翻页,使用q键退出查看。
3. less命令:与more命令类似,但可以向上翻页和搜索内容。
4. head命令:用于显示文件的前几行,默认显示前10行。
5. tail命令:用于显示文件的后几行,默认显示最后10行。
6. vi命令:用于编辑文件。
可以进行插入、删除、修改等操作。
四、进程管理命令1. ps命令:用于查看当前系统的进程信息。
可以使用aux参数显示所有进程的详细信息。
2. top命令:实时显示系统的进程状态和资源占用情况。
可以使用q键退出。
3. kill命令:用于终止指定的进程。
可以使用进程ID或进程名称进行终止。
4. bg命令:将一个在后台暂停的进程变为继续执行。
A I X系统磁盘I O监控与评估AIX系统磁盘IO性能评估 (3)一, 对磁盘IO的性能考虑, 裸设备优缺点分析 (3)1.1 对磁盘IO的性能考虑 (3)1.2 裸设备的优点 (3)1.3 裸设备的缺点 (4)二, IOSTAT工具使用 (4)2.1 参数与用法 (4)2.2 iostat报告解析 (8)三, sar –d看 (9)四, 使用lslv –l lvname估逻辑卷的碎片情况 (10)五, 使用vmstat命令评估调页空间 (12)六, 使用filemon命令监控系统IO (13)6.1 filemon标记描述 (13)6.2 filemon报告解析 (14)七, 监视磁盘IO的小结 (15)AIX系统磁盘IO性能评估一, 对磁盘IO的性能考虑, 裸设备优缺点分析1.1 对磁盘IO的性能考虑1, 将频繁访问的文件系统和裸设备尽可能放置在不同的磁盘上.2, 在建立逻辑卷时尽可能使用mklv的命令开关给不同的文件系统和裸设备赋予不同的内策略.3, 使用磁盘设备驱动器的功能属性构建合适的RAID方式, 以获得更高的数据安全性和存取性能. 一般考虑采用RAID5或者RAID10的方式, 对于写要求比较高的系统, 一般建议采用RAID10方式.4, 尽可能利用内存读写带宽远比直接磁盘IO操作性能优越的特点, 使频繁访问的文件或数据置于内存中进行操作处理.1.2 裸设备的优点由于忽略了文件系统缓冲器而直接读写, 从而具有更好的性能. 对磁盘的直接读写就意味着取消了磁盘与文件系统的同步要求. 这一点对于纯OLTP系统非常有用, 因为在这种系统中, 读写的随机性非常大以至于一旦数据被读写之后,它们在以后的较长一段时间内不会得到再次使用. 除了OLTP, raw设备还能够从以下几个方面改善DSS应用程序性能.排序: 由于对临时表空间的写作数据更快, 所以对排序也有一定的好处.序列号访问: 比如对表,索引的完全扫描等序列化操作, 这种速度会更快.直接读写: 不需要经过OS级的缓存, 节约了内存资源, 在一定程度上避免了内存的争用.避免了OS的cache预读功能, 减少了IO.采用裸设备避免了文件系统的开销. 比如维护I-node, 空闲块等.1.3 裸设备的缺点1, 裸设备的空间管理不灵活, 需要预先规划好裸设备上的空间使用, 还应当保留一部分裸设备以应付突发情况. 这是对空间的浪费.2, 很多备份工具对裸设备的支持不足, 导致备份的操作方式比较原始, 麻烦.二, IOSTAT工具使用Iostat主要用来报告中央处理器(CPU)统计信息和整个系统, 适配器, tty设备,磁盘和CD-ROM的输入输出统计信息. Iostat的一个缺点是它不能对某个进程进行深入分析.仅对系统的整体情况进行分析.2.1 参数与用法iostat [ -s ] [ -a ] [ -d | -t ] [ -T ][ -m ][ PhysicalVolume ... ] [ Interval [ Count ] ]1. 其中-s为显示系统信息.# iostat -sSystem configuration: lcpu=4 drives=11 paths=2 vdisks=0tty: tin tout avg-cpu: % user % sys % idle % iowait 0.0 2.7 0.8 0.3 98.7 0.2System: i2dbKbps tps Kb_read Kb_wrtn200.7 4.6 1526558379 1603904240Disks: % tm_act Kbps tps Kb_read Kb_wrtnhdisk0 0.3 3.0 0.6 20332313 27206892hdisk1 0.0 0.0 0.0 3157 0dac0 0.0 197.7 4.0 1506222909 1576697348 dac0utm 0.0 0.0 0.0 0 0hdisk2 0.0 0.0 0.0 0 0hdisk3 0.0 0.0 0.0 0 0hdisk4 0.0 0.0 0.0 0 0hdisk5 0.7 197.7 4.0 1506222909 1576697348 hdisk6 0.0 0.0 0.0 0 0hdisk7 0.0 0.0 0.0 0 0cd0 0.0 0.0 0.0 0 02, -d标志不能和-t标志合用, 且仅仅显示磁盘使用率报告.# iostat -dSystem configuration: lcpu=4 drives=11 paths=2 vdisks=0Disks: % tm_act Kbps tps Kb_read Kb_wrtn hdisk0 0.3 3.0 0.6 20332317 27207032hdisk1 0.0 0.0 0.0 3157 0dac0 0.0 197.7 4.0 1506222913 1576700356 dac0utm 0.0 0.0 0.0 0 0hdisk2 0.0 0.0 0.0 0 0hdisk3 0.0 0.0 0.0 0 0hdisk4 0.0 0.0 0.0 0 0hdisk5 0.7 197.7 4.0 1506222913 1576700356 hdisk6 0.0 0.0 0.0 0 0hdisk7 0.0 0.0 0.0 0 0cd0 0.0 0.0 0.0 0 03, -a 显示适配器吞吐量报告# iostat -aSystem configuration: lcpu=4 drives=11 paths=2 vdisks=0tty: tin tout avg-cpu: % user % sys % idle % iowait0.0 2.7 0.8 0.3 98.7 0.2Adapter: Kbps tps Kb_read Kb_wrtn sisscsia0 3.0 0.6 20335478 27207108Disks: % tm_act Kbps tps Kb_read Kb_wrtn hdisk0 0.3 3.0 0.6 20332321 27207108 hdisk1 0.0 0.0 0.0 3157 0 Adapter: Kbps tps Kb_read Kb_wrtnfcs0 197.7 4.0 1506222913 1576701580 Disks: % tm_act Kbps tps Kb_read Kb_wrtn dac0 0.0 197.7 4.0 1506222913 1576701580 hdisk2 0.0 0.0 0.0 0 0hdisk3 0.0 0.0 0.0 0 0hdisk4 0.0 0.0 0.0 0 0hdisk5 0.7 197.7 4.0 1506222913 1576701580 hdisk6 0.0 0.0 0.0 0 0hdisk7 0.0 0.0 0.0 0 0Adapter: Kbps tps Kb_read Kb_wrtnvsa0 0.0 0.0 0 0Disks: % tm_act Kbps tps Kb_read Kb_wrtndac0utm 0.0 0.0 0.0 0 0Adapter: Kbps tps Kb_read Kb_wrtnide0 0.0 0.0 0 0Disks: % tm_act Kbps tps Kb_read Kb_wrtncd0 0.0 0.0 0.0 0 04, -t标记排除了-d标记且仅显示tty和cpu的用法报告# iostat -tSystem configuration: lcpu=4tty: tin tout avg-cpu: % user % sys % idle % iowait0.0 2.7 0.8 0.3 98.7 0.25, -T 打印iostat输出的每一行边上的时间戳记,# iostat -TSystem configuration: lcpu=4 drives=11 paths=2 vdisks=0tty: tin tout avg-cpu: % user % sys % idle % iowait time0.0 2.7 0.8 0.3 98.7 0.2 11:44:48Disks: % tm_act Kbps tps Kb_read Kb_wrtn timehdisk0 0.3 3.0 0.6 20332325 27207328 11:44:48 hdisk1 0.0 0.0 0.0 3157 0 11:44:48dac0 0.0 197.7 4.0 1506222925 1576705176 11:44:48 dac0utm 0.0 0.0 0.0 0 0 11:44:48hdisk2 0.0 0.0 0.0 0 0 11:44:48hdisk3 0.0 0.0 0.0 0 0 11:44:48hdisk4 0.0 0.0 0.0 0 0 11:44:48hdisk5 0.7 197.7 4.0 1506222925 1576705176 11:44:48 hdisk6 0.0 0.0 0.0 0 0 11:44:48hdisk7 0.0 0.0 0.0 0 0 11:44:48cd0 0.0 0.0 0.0 0 0 11:44:482.2 iostat报告解析Iostat命令生成四种类型的报告, tty和cpu使用率报告, 磁盘使用率报告, 系统吞吐量报告和适配器吞吐量报告.1, tty和cpu使用率报告tty: tin tout avg-cpu: % user % sys % idle % iowait time0.0 2.7 0.8 0.3 98.7 0.2 11:44:48对于多处理器系统, cpu值是所有处理器的总平均. 同时, IO等待状态是系统级定义的, 而不是每个处理器.注释: tty是teletype的缩写.通常使用tty来简称各种类型的终端设备每过一定的时间间隔, 内核就更新这条信息(一般每秒六十次). Tty报告提供了从系统中所有终端收到的每秒字符数, 以及每秒输出到系统所有终端的字符的总数.2, 磁盘使用率报告这个报告提供了在每个物理磁盘上的统计信息.3, 系统吞吐量报告这个报告提供了针对系统的统计信息.4, 适配器吞吐量报告这个报告提供了针对适配器的统计信息.三, sar –d看搜集, 报告, 或者保存系统活动信息# sar -d 1 1AIX i2db 3 5 00CC886E4C00 07/10/09System configuration: lcpu=4 drives=1109:42:23 device %busy avque r+w/s Kbs/s avwait avserv 09:42:24 hdisk0 0 0.0 0 0 0.0 0.0hdisk1 0 0.0 0 0 0.0 0.0dac0 0 0.0 0 0 0.0 0.0dac0utm 0 0.0 0 0 0.0 0.0hdisk2 0 0.0 0 0 0.0 0.0hdisk3 0 0.0 0 0 0.0 0.0hdisk4 0 0.0 0 0 0.0 0.0hdisk5 0 0.0 0 0 0.0 0.0hdisk6 0 0.0 0 0 0.0 0.0hdisk7 0 0.0 0 0 0.0 0.0四, 使用lslv –l lvname估逻辑卷的碎片情况1,显示卷组列表:# lsvgrootvgrootvg1datavg2, 查看卷组的逻辑卷组成# lsvg -l datavgdatavg:LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT loglv00 jfs2log 1 1 1 open/syncd N/Afslv03 jfs2 720 720 1 open/syncd /oradata3, 显示某个逻辑卷的信息# lslv fslv03LOGICAL VOLUME: fslv03 VOLUME GROUP: datavgLV IDENTIFIER: 00cc886e00004c00000001153b9e95c7.2 PERMISSION: read/writeVG STATE: active/complete LV STATE: opened/syncdTYPE: jfs2 WRITE VERIFY: offMAX LPs: 720 PP SIZE: 128 megabyte(s)COPIES: 1 SCHED POLICY: parallelLPs: 720 PPs: 720STALE PPs: 0 BB POLICY: relocatableINTER-POLICY: minimum RELOCATABLE: yesINTRA-POLICY: middle UPPER BOUND: 32MOUNT POINT: /oradata LABEL: /oradataMIRROR WRITE CONSISTENCY: on/ACTIVEEACH LP COPY ON A SEPARATE PV ?: yesSerialize IO ?: NO4, 显示每个逻辑卷由哪些物理分区组成# lslv -m fslv03|headfslv03:/oradataLP PP1 PV1 PP2 PV2 PP3 PV30001 0162 hdisk50002 0163 hdisk50003 0164 hdisk50004 0165 hdisk50005 0166 hdisk50006 0167 hdisk50007 0168 hdisk50008 0169 hdisk55, 评估逻辑卷的碎片情况# lslv -l fslv03fslv03:/oradataPV COPIES IN BAND DISTRIBUTION对于该例中的结果说明:Copies显示逻辑卷fslv03只复制了一份.In Band显示了内策略是如何遵循的. 这个百分比越高, 分配效率就越好.Distribution显示, 逻辑卷fslv03总共有720个逻辑分区, 外部边缘(160), 外部中间(159), 中间(159), 内部中心(160),内部边缘(182). In band = 159/720 = 22%.6, 查看卷组的物理卷组成# lsvg -p datavgdatavg:PV_NAME PV STATE TOTAL PPs FREE PPs FREE DISTRIBUTIONhdisk5 active 799 78 00..00..00..00..78五, 使用vmstat命令评估调页空间# vmstat -s293967066 total address trans. Faults: 地址翻译错误, 每次发生地址转换页面故障时增加.383887108 page ins: 入页: 随虚拟内存管理器读入的每页增加. 计数随调页空间和文件空间的入页增加. 它和出页统计信息一起表示实际IO总量. 398373792 page outs4197657 paging space page ins: 调页空间入页, 只随VMM启动的来自调页空间的入页而增加.4351404 paging space page outs0 total reclaims237662205 zero filled pages faults222070 executable filled pages faults1399248325 pages examined by clock1487 revolutions of the clock hand518506491 pages freed by the clock4249427 backtracks420362 free frame waits0 extend XPT waits16247685 pending I/O waits782289679 start I/Os69941471 iodones3375131147 cpu context switches381625154 device interrupts814614929 software interrupts2805794153 decrementer interrupts410037 mpc-sent interrupts410037 mpc-receive interrupts1677224 phantom interrupts0 traps24457805147 syscalls六, 使用filemon命令监控系统IO监视文件系统的性能, 并且报告代表逻辑文件, 虚拟内存段, 逻辑卷和物理卷的IO活动.filemon [ -d ] [ -i Trace_File -n Gennames_File] [ -o File] [ -O Levels] [ -P ] [ -T n] [ -u ] [ -v ]6.1 filemon标记描述-I-o file 写IO活动报告到指定的File, 而不是到stdout文件.-d 启动filemon命令, 但是一直推迟跟踪直到用户执行trcon命令. 默认立刻启动. -T n 设置内核的跟踪缓冲区大小为n字节. 缺省值32000字节.-O levels 只监控指定的文件系统级别. 有效的级别标识是Lf 逻辑文件级别Vm 虚拟内存级别Lv 逻辑卷级别Pv 物理卷级别All lf,vm,lv,pv的简单表示6.2 filemon报告解析1,最活动的文件报告2,最活动的段报告3,最活动的逻辑卷报告3,最活动的物理卷报告七, 监视磁盘IO的小结一般来说, 高的%iowait表明系统存在一个应用程序问题, 缺少内存问题或低效的IO子系统配置. 例如, 应用程序的问题可能是由于过多的IO请求而不是处理许多数据. 理解IO瓶颈并且要清楚解决瓶颈问题的关键在于提高IO子系统的效率. 一些典型的解决方案可能包括.1, 限制在特定的物理盘上活动逻辑卷和文件系统的数目. 该方法是为了在所有的物理磁盘驱动器中平衡文件IO.2, 在多个物理磁盘间展开逻辑卷. 该方法在当有一些不同的文件被存取时特别有用.3, 为一个卷组创建多个 Journaled 文件系统(JFS)日志并且把它们分配到特定的文件系统中(最好在快速写高速缓存驱动器中)。
AIX进程监控与管理 (2)一, PS命令 (2)1.1 显示10个消耗cpu最多的进程 (2)1.2 显示10个消耗存储空间最多的进程 (3)1.3 按顺序显示系统中受罚的进程: 31.4 按照优先级顺序显示系统中的进程 (5)1.5 按处理时间为顺序显示系统中的前十个进程 (5)1.6 按实际内存使用的多少顺序显示系统中的前十个进程 (6)1.7 按换入页面的多少顺序显示系统中的前十个进程 (6)二, topas命令监控进程 (7)2.1 topas参数 (8)2.4 PAGING部分 (9)2.6 PAING SPACE部分 (10)三, pTools—进程监控的一组工具 (11)3.1 procwdx. 113.2 procfiles. 123.3 procflags. 133.4 proccred. 133.5 procmap. 133.6 procldd. 133.7 procsig. 133.8 procstack. 133.9 procstop. 133.10 procrun. 133.11 procwait 133.12 proctree. 14AIX进程监控与管理性能优化以及确定系统中的性能瓶颈是系统管理员的主要任务之一. 在一个计算机系统中, CPU, 内存, 硬盘和网络是影响性能的主要因素, 因此系统性能调整也主要在于如何在这些资源中获得某种平衡, 以满足客户对系统性能的期望.一, PS命令Ps命令主要显示系统中关于进程的统计和状态信息, 如进程ID, IO行为以及CPU利用率等. 利用ps命令提供的信息, 可判断一个进程运行了多长时间, 进程使用了多少cpu时间, 以及进程是否受系统的惩罚等. 还可以使用ps命令确定进程使用了多少内存, 完成多少IO, 进程的优先级以及是谁创建了进程.1.1 显示10个消耗cpu最多的进程# ps aux|head -1; ps aux|sort -nr +2 |head -10USER PID %CPU %MEM SZ RSS TTY STA T STIME TIME COMMANDroot 73764 6.1 0.0 384 384 - A Jan 10 130144:34 waitroot 57372 6.1 0.0 384 384 - A Jan 10 132116:52 waitroot 65568 6.0 0.0 384 384 - A Jan 10 129411:36 waitroot 61470 5.9 0.0 384 384 - A Jan 10 126049:17 waitroot 8196 5.9 0.0 384 384 - A Jan 10 127401:32 waitroot 77862 5.7 0.0 384 384 - A Jan 10 123137:04 waitroot 69666 5.7 0.0 384 384 - A Jan 10 122250:12 waitroot 53274 5.6 0.0 384 384 - A Jan 10 119990:30 waitoracle 692388 1.4 1.0 58764 83088 - A13:49:31 1:08 oracleSISDB2 (LO oracle 798844 1.1 1.0 68976 93300 - A11:47:13 12:07 oracleSISDB2 (LO选项说明选项描述“a”显示所有有终端的进程的信息“x”显示没有终端的进程, 除了有一个控制终端的进程“u”显示面向用户的输出: 这包括USER, PID, %CPU , %MEM, SZ , RSS, TTY, STA T, STIME , TIME , COMMAND报告结果列说明栏描述USER(u标志)进程所有者的登录名PID(所有标志)进程的进程标识%CPU(u和v标识)进程启动后, 该进程使用cpu的时间百分比. 该值通过将进程使用cpu的时间除以进程所用时间计算. 在多处理器环境中, 因为同一进程中的几个线程可以同时在不同的cpu上运行, 该值要进一步除以可用cpu数.(由于计算该数据基于的时间不同, 所有%cpu字段的总和可能超过100%)%MEM(u和v标志)进程使用的实际内存的百分比. %MEM往往会夸大与其他进程共享程序文本的进程的成本. 但运行一个程序的多个副本和所有实例共享该程序文本的一个副本时不会计算时间.(-l和l标志)该进程核心映像的大小单位是1KBRSS(v标志) 进程的实际内存(驻留集)大小(单位1KB)TTY(所有标志)进程的控制工作站;- 进程与工作站不相关?未知Number tty数目. 例如2表示tty2STA T(s, u和v标志)包含进程状态0 不存在A活动I 中间的Z 已取消T 已停止K 可用的内核进程STIME(-f和u标志)进程的启动时间. LANG环境变量控制该字段的外观TIME(所有标志) 进程的执行时间总和COMMAND(s, u和v)包含命令名. 使用-f标志显示完整命令名和它的参数.1.2 显示10个消耗存储空间最多的进程# ps aux |head -1; ps aux |sort -nr +3 | head -10USER PID %CPU %MEM SZ RSS TTY STA T STIME TIME COMMANDoracle 974978 2.2 1.0 57992 82316 - A14:05:06 2:41 oracleSISDB2 (LOoracle 966862 0.1 1.0 55144 79468 - A Jul 08 80:49 oracleSISDB2 (LOoracle 942332 0.0 1.0 59112 83436 - A Feb 16 2:24 ora_arc0_SISDB2oracle 909346 1.4 1.0 58364 82688 - A13:49:28 3:22 oracleSISDB2 (LOoracle 901200 0.0 1.0 57592 81916 - A Feb 16 18:46 ora_dbw0_SISDB2oracle 868444 0.0 1.0 59108 83432 - A Feb 16 1:06 ora_arc1_SISDB2oracle 860392 0.0 1.0 56760 81084 - A Feb 16 26:20 ora_ckpt_SISDB2oracle 798844 1.1 1.0 59076 83400 - A11:47:13 13:55 oracleSISDB2 (LOoracle 790532 0.0 1.0 55712 80036 - A Feb 16 16:02 ora_lgwr_SISDB2oracle 725148 1.1 1.0 58008 82332 - A11:20:04 15:41 oracleSISDB2 (LO1.3 按顺序显示系统中受罚的进程:# ps -eakl |head -1; ps -eakl | sort -nr +5 |head -10F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD303 A0 12294 0 120 17 -- 30008110 448 - 0:04 sched303 A0 0 0 120 16 -- 4110 384 - 59:14 swapper240001 A 812 725148 1 2 60 20 46a71e510 58172 * - 16:18 oracle240001 A 812 974978 1 1 60 20 50ab46510 59168 * - 3:08 oracle240001 A0 598188 905366 1 60 20 29aaa2400 716 pts/0 0:00 ksh10340103 A0 602234 286872 0 39 -- 3d84f2400 20920 - 12:42 hagsd10240103 A0 610454 286872 0 31 -- 3484d6400 9052 * - 33:52 hatsd10240103 A0 585876 610454 0 38 -- 3140c1400 2084 * - 44:40 hats_nim10240103 A0 528544 610454 0 38 -- 3244cd400 2084 * - 42:51 hats_nim10240103 A0 499724 610454 0 38 -- 3f04f8400 2044 * - 55:34 hats_diskhb_nim选项说明选项描述“-e”将除内核进程以外所有进程的信息写出到标准输出“-a”将关于所有进程的信息写到标准输出“-k”列出内核进程“-l”生成一长列表报告结果列说明栏描述F(-l和l标志)与进程和线程相关的部分更重要S(-l和l标志)进程或内核线程的状态对于进程0 不存在; A活动; W 已交换; I 空闲; Z 已取消; T 已停止对于内核线程0 不存在; R 正在运行;S 正在休眠; W 已交换; Z 已取消; T 已停止UID(-f, -l 和l标志)进程所有者的用户标识.PID(所有标志) 进程标识PPID(-f, -l和l标志) 父进程标识C(-f, l和-l标志)每次系统时钟周期和发现线程或进程需要运行时增加进程或线程的CPU利用率. 调度程序通过每秒除以2将该值衰减.PRI(-l和l标志)进程或内核线程的优先级; 数字越大优先级越低NI(-l和l标志)ADDR(-l和l标志)包含进程栈的段号; 如果为内核进程, 则为预处理数据区的地址SZ(-l和l标志)该进程核心映像的大小单位是1KBWCHAN(-l标志) 进程或内核线程为之等待或休眠的事件. 对于内核线程, 如果内核线程正在运行, 该字段为空. 对于进程, 如果只有一个内核线程正在休眠, 等待通道定义为该休眠内核线程的等待通道; 否则显示一个星号.TTY(所有标志)进程的控制工作站;- 进程与工作站不相关?未知Number tty数目. 例如2表示tty2TIME(所有标志) 进程的执行时间总和CMD(-f, -l和l标志)包含命令名.1.4 按照优先级顺序显示系统中的进程# ps -eakl | sort -n +6 | head -10F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD303 A0 0 0 120 16 -- 4110 384 - 59:14 swapper303 A0 16392 0 0 16 -- 3800a110 640 f1000700091fa7c0 - 132:15 lrud303 A0 24588 0 0 16 -- 2800e110 640 f1000700091fa7c8 - 0:00 psmd303 A0 28686 0 0 16 -- 50010110 512 - 130:29 xmfreed303 A0 32784 0 0 16 -- 58012110 448 - 0:00 memp_rbd303 A0 36882 0 0 16 -- 40014110 448 - 0:00 memgrdd303 A0 40980 0 0 16 -- 48016110 448 - 0:00 psgc303 A0 90156 0 0 16 -- 118042110 512 2ef6a68 - 0:00 wlmsched303 A0 94254 0 0 16 -- 100044110 448 - 0:00 armtrace_kproc1.5 按处理时间为顺序显示系统中的前十个进程# ps vx |head -1; ps vx |sort -nr +3 | head -10PID TTY STA T TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND57372 - A132139:54 0 384 384 xx 0 0 6.1 0.0 wait73764 - A130166:37 0 384 384 xx 0 0 6.1 0.0 wait 65568 - A129433:23 0 384 384 xx 0 0 6.0 0.0 wait 8196 - A127422:34 0 384 384 xx 0 0 5.9 0.0 wait 61470 - A126071:14 0 384 384 xx 0 0 5.9 0.0 wait 77862 - A123157:53 0 384 384 xx 0 0 5.7 0.0 wait 69666 - A122270:45 0 384 384 xx 0 0 5.7 0.0 wait 53274 - A120010:15 0 384 384 xx 0 0 5.6 0.0 wait 176256 - A213:01 782 508 512 xx 3 4 0.0 0.0 /usr/sbi 655584 - A144:09 115789 2816 2816 xx 0 0 0.0 0.0 nfsd选项说明选项描述“v”显示PGIN, SIZE, RSS, LIM, TSIZ, TRS, %CPU, %MEM字段“x”显示没有终端的进程除了有一个控制终端的进程报告结果列说明PID TTY STA T TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM栏描述PIDTTYSTA TTIMEPGIN(v标志)处理未装入核心的页面引用产生的磁盘io数目SIZE进程数据节的虚拟大小(单位是1KB)RSSLIMTSIZ(v标志) 文本(共享程序)映像的大小TRS%CPU%MEM1.6 按实际内存使用的多少顺序显示系统中的前十个进程# ps vx |head -1; ps vx |sort +6 -nr | head -10PID TTY STA T TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND602234 - A12:43 391 16460 21696 xx 4463 5236 0.0 0.0 hagsd gr610454 - A33:52 133 **** **** xx 819 948 0.0 0.0 /usr/sbi524370 - A0:25 473 6036 6308 xx 223 272 0.0 0.0 haemd HA422110 - A5:56 30587 5580 5880 xx 182 300 0.0 0.0 harmad -336040 - A8:25 16510 4520 5192 xx 827 672 0.0 0.0 /usr/sbi348376 - A30:02 621 2332 4192 xx 1937 1860 0.0 0.0 /usr/es/151636 - A24:36 0 3584 3584 xx 0 0 0.0 0.0 j2pg614552 - A0:00 5 3356 3424 xx 35 68 0.0 0.0 /usr/sbi368832 - A10:24 28243 2532 3184 xx 528 652 0.0 0.0 /usr/sbi655584 - A144:09 115789 2816 2816 xx 0 0 0.0 0.0 nfsd1.7 按换入页面的多少顺序显示系统中的前十个进程# ps vx |head -1; ps vx |sort -nr +4 | head -10PID TTY STA T TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND192610 - A13:15 1923349 448 448 xx 0 0 0.0 0.0 aioserver200804 - A9:59 1667729 448 448 xx 0 0 0.0 0.0 aioserver163936 - A11:48 1629776 448 448 xx 0 0 0.0 0.0 aioserver184414 - A10:38 1595482 448 448 xx 0 0 0.0 0.0 aioserver106640 - A12:25 1454296 448 448 xx 0 0 0.0 0.0 aioserver208998 - A10:59 1413792 448 448 xx 0 0 0.0 0.0 aioserver204906 - A9:54 1321147 448 448 xx 0 0 0.0 0.0 aioserver131150 - A7:23 1277755 448 448 xx 0 0 0.0 0.0 aioserver213096 - A8:29 1238341 448 448 xx 0 0 0.0 0.0 aioserver143506 - A12:48 1207538 448 448 xx 0 0 0.0 0.0 aioserver二, topas命令监控进程Topas命令用于监控各种系统资源, 如cpu的使用情况, cpu事件和队列, 内存和换页空间的使用, 磁盘性能, 网络性能以及NFS统计等. 它还会报告指派给不同WLM类的进程对系统资源的消耗情况. 同时可以报告系统中最热门的进程和工作量管理器(WLM的热门类). Topas命令将热门进程定义为那些使用大量cpu时间的进程. Topas命令没有作日志的选项, 所有信息都是实时的.Topas Monitor for host: i2db EVENTS/QUEUES FILE/TTYWed Jul 15 15:12:18 2009 Interval: 2 Cswitch 87 Readch 1792Syscall 1004 Writech 24770Kernel 0.2 |# | Reads 4 Rawin 0User 0.1 |# | Writes 2 Ttyout 194 Wait 0.0 |# | Forks 0 Igets 0 Idle 99.7 |############################| Execs 0 Namei 3Runqueue 0.0 Dirblk 0Network KBPS I-Pack O-Pack KB-In KB-Out Waitqueue 0.0en0 0.5 4.0 0.5 0.3 0.2lo0 0.1 1.0 1.0 0.0 0.0 PAGING MEMORYFaults 0 Real,MB 3824Disk Busy% KBPS TPS KB-Read KB-Writ Steals 0 % Comp 38.6hdisk1 0.0 0.0 0.0 0.0 0.0 PgspIn 0 % Noncomp 61.9dac0 0.0 24.0 1.5 0.0 24.0 PgspOut 0 % Client 61.9dac0utm 0.0 0.0 0.0 0.0 0.0 PageIn 0hdisk2 0.0 0.0 0.0 0.0 0.0 PageOut 5 PAGING SPACEhdisk0 0.0 0.0 0.0 0.0 0.0 Sios 5 Size,MB 8192hdisk3 0.0 0.0 0.0 0.0 0.0 % Used 13.0NFS (calls/sec) % Free 86.9 Name PID CPU% PgSp Owner ServerV2 0topas 1138930 0.1 2.0 root ClientV2 0 Press:dtgreet 303258 0.1 1.3 root ServerV3 0 "h" for helporacle 491762 0.0 6.4 oracle ClientV3 0 "q" to quitoracle 299146 0.0 8.5 oracleoracle 487432 0.0 3.9 oraclerpc.lock 466952 0.0 0.2 rootaioserve 409822 0.0 0.1 rootoracle 495864 0.0 3.6 oracleSignal 2 received2.1 topas参数Topas命令可以监控系统活动――memory,I/O,paging space,cpu,process。