当前位置:文档之家› 管理员必备的20个Linux系统监控工具

管理员必备的20个Linux系统监控工具

管理员必备的20个Linux系统监控工具
管理员必备的20个Linux系统监控工具

需要监控Linux服务器系统性能吗?尝试下面这些系统内置或附件的工具吧。大多数Linux发行版本都装备了大量的监控工具。这些工具提供了能用作取得相关信息和系统活动的量度指标。你能使用这些工具发现造成性能问题可能原因。此次讨论到的工具只是分析和调试服务器下面问题时最基本工具中的一部分。

51CTO编辑推荐:Linux监控工具大全

1.找出瓶颈

2.硬盘(存储)瓶颈

3.CPU及内存瓶颈

4.网络瓶颈

#1: top - 进程活动

top提供一个当前运行系统实时动态的视图,也就是正在运行进程。在默认情况下,显示系统中CPU使用率最高的任务,并每5秒钟刷新一次。

图01.Linux top命令

常用热键

热键用途

t 显示摘要信息开关.

m 显示内存信息开关.

A 分类显示系统不同资源的使用大户。有助于快速识别系统中资源消耗多的任务。

f 添加删除所要显示栏位.

o 调整所要显示栏位的顺序.

r 调整一个正在运行的进程Nice值.

k 结束一个正在运行的进程.

z 彩色/黑白显示开关

#2:vmstat -系统活动、硬件及系统信息

使用vmstat命令可以得到关于进程、内存、内存分页、堵塞IO、traps及CPU活动的信息。

# vmstat 3

输出样例:

procs -----------memory---------- ---swap-- -----io---- --system--

-----cpu------

r b swpd free buff cache si so bi bo in cs us sy id wa st

0 0 0 2540988 522188 5130400 0 0 2 32 4 2 4 1 96 0 0

1 0 0 2540988 522188 5130400 0 0 0 720 1199 665 1 0 99 0 0

0 0 0 2540956 522188 5130400 0 0 0 0 1151 1569 4 1 95 0 0

0 0 0 2540956 522188 5130500 0 0 0 6 1117 439 1 0 99 0 0

0 0 0 2540940 522188 5130512 0 0 0 536 1189 932 1 0 98 0 0

0 0 0 2538444 522188 5130588 0 0 0 0 1187 1417 4 1 96 0 0

0 0 0 2490060 522188 5130640 0 0 0 18 1253 1123 5 1 94 0 0

显示内存使用详细信息

# vmstat -m

显示内存活动/不活动的信息

# vmstat -a

#3: w - 显示谁已登录,他们正在做什么?

w命令显示系统当前用户及其运行进程的信息。

# w username

# w vivek

输出样例:

17:58:47 up 5 days, 20:28, 2 users, load average: 0.36, 0.26, 0.24 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT

root pts/0 10.1.3.145 14:55 5.00s 0.04s 0.02s vim

/etc/resolv.conf

root pts/1 10.1.3.145 17:43 0.00s 0.03s 0.00s w

#4:uptime - 告诉系统已经运行了多久?

uptime命令过去只显示系统运行多久。现在,可以显示系统运行多久、当前有多少的用户登录、在过去的1,5,15分钟里平均负载时多少。

# uptime

输入样例:

18:02:41 up 41 days, 23:42, 1 user, load average: 0.00, 0.00, 0.00

1可以被认为是最优的负载值。负载是会随着系统不同改变得。单CPU系统1-3和SMP 系统6-10都是可能接受的。

#5:ps - 显示进程

ps命令显示当前运行进程的快照。使用-A或-e显示所有进程。

# ps -A

输出样例:

PID TTY TIME CMD

1 ? 00:00:0

2 init

2 ? 00:00:02 migration/0

3 ? 00:00:01 ksoftirqd/0

4 ? 00:00:00 watchdog/0

5 ? 00:00:00 migration/1

6 ? 00:00:15 ksoftirqd/1

....

.....

4881 ? 00:53:28 java

4885 tty1 00:00:00 mingetty

4886 tty2 00:00:00 mingetty

4887 tty3 00:00:00 mingetty

4888 tty4 00:00:00 mingetty

4891 tty5 00:00:00 mingetty

4892 tty6 00:00:00 mingetty

4893 ttyS1 00:00:00 agetty

12853 ? 00:00:00 cifsoplockd

12854 ? 00:00:00 cifsdnotifyd

14231 ? 00:10:34 lighttpd

14232 ? 00:00:00 php-cgi

54981 pts/0 00:00:00 vim

55465 ? 00:00:00 php-cgi

55546 ? 00:00:00 bind9-snmp-stat

55704 pts/1 00:00:00 ps

ps与top非常相似,但ps提供更多的信息。

输出长格式

# ps -Al

输出附加全格式(显示进程在执行时传入的参数)# ps -AlF

显示进程结构

# ps -AlFH

在进程后显示线程

# ps -AlLm

打印服务器上所有进程

# ps ax

# ps axu

打印进程树

# ps -ejH

# ps axjf

# pstree

打印安全信息

# ps -eo euser,ruser,suser,fuser,f,comm,label

# ps axZ

# ps -eM

查看使用Vivek用户名运行的进程

# ps -U vivek -u vivek u

设置自定义输出格式

# ps -eo pid,tid,class,rtprio,ni,pri,psr,pcpu,stat,wchan:14,comm # ps axo stat,euid,ruid,tty,tpgid,sess,pgrp,ppid,pid,pcpu,comm # ps -eopid,tt,user,fname,tmout,f,wchan

只显示Lighttpd的进程ID

# ps -C lighttpd -o pid=

或者

# pgrep lighttpd

或者

# pgrep -u vivek php-cgi

显示PID为55977的进程名称

# ps -p 55977 -o comm=

找出消耗内存最多的前10名进程

# ps -auxf | sort -nr -k 4 | head -10

找出使用CPU最多的前10名进程

# ps -auxf | sort -nr -k 3 | head -10

#6:free - 内存使用情况

free命令显示系统中空闲的、已用的物理内存及swap内存,及被内核使用的buffer。

# free

输出样例:

total used free shared buffers cached

Mem: 12302896 9739664 2563232 0 523124 5154740

-/+ buffers/cache: 4061800 8241096

Swap: 1052248 0 1052248

#7:iostat - CPU平均负载,硬盘活动

iostat命令可报告中央处理器(CPU)的统计信息,各种设备、分区及网络文件系统输入/输出的统计信息。

# iostat

输出样例:

Linux 2.6.18-128.1.14.el5 (www03.nixcraft.in) 06/26/2009

avg-cpu: %user %nice %system %iowait %steal %idle

3.50 0.09 0.51 0.03 0.00 95.86

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn

sda 22.04 31.88 512.03 16193351 260102868

sda1 0.00 0.00 0.00 2166 180

sda2 22.04 31.87 512.03 16189010 260102688

sda3 0.00 0.00 0.00 1615 0

#8:sar - 搜集和报告系统活动

sar命令用来搜集、报告和储存系统活动信息。查看网路计数器,输入:

# sar -n DEV | more

显示最近24小时网络计数器

# sar -n DEV -f /var/log/sa/sa24 | more

你亦可以用sar显示实时情况

# sar 4 5

输出样例:

Linux 2.6.18-128.1.14.el5 (www03.nixcraft.in) 06/26/2009

06:45:12 PM CPU %user %nice %system %iowait %steal %idle

06:45:16 PM all 2.00 0.00 0.22 0.00 0.00 97.78

06:45:20 PM all 2.07 0.00 0.38 0.03 0.00 97.52

06:45:24 PM all 0.94 0.00 0.28 0.00 0.00 98.78

06:45:28 PM all 1.56 0.00 0.22 0.00 0.00 98.22

06:45:32 PM all 3.53 0.00 0.25 0.03 0.00 96.19

Average: all 2.02 0.00 0.27 0.01 0.00 97.70

#9:mpstat - 多处理器使用率

mpstat命令可以显示所有可用处理器的使用情况,处理器编号从0开始。mpstat -P ALL 显示每个处理器的平均使用率。

# mpstat -P ALL

输出样例:

Linux 2.6.18-128.1.14.el5 (www03.nixcraft.in) 06/26/2009

06:48:11 PM

CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s

06:48:11 PM

all 3.50 0.09 0.34 0.03 0.01 0.17 0.00 95.86 1218.04

06:48:11

PM 0 3.44 0.08 0.31 0.02 0.00 0.12 0.00 96.04 1000 .31

06:48:11

PM 1 3.10 0.08 0.32 0.09 0.02 0.11 0.00 96.28 34 .93

06:48:11

PM 2 4.16 0.11 0.36 0.02 0.00 0.11 0.00 95.25 0 .00

06:48:11

PM 3 3.77 0.11 0.38 0.03 0.01 0.24 0.00 95.46 44 .80

06:48:11

PM 4 2.96 0.07 0.29 0.04 0.02 0.10 0.00 96.52 25 .91

06:48:11

PM 5 3.26 0.08 0.28 0.03 0.01 0.10 0.00 96.23 14 .98

06:48:11

PM 6 4.00 0.10 0.34 0.01 0.00 0.13 0.00 95.42 3 .75

06:48:11

PM 7 3.30 0.11 0.39 0.03 0.01 0.46 0.00 95.69 76 .89

#10: pmap - 进程的内存使用

pmap命令可以显示进程的内存映射,使用这个命令可以找出造成内存瓶颈的原因。

# pmap -d PID

显示PID为47394进程的内存信息。

# pmap -d 47394

输出样例:

47394: /usr/bin/php-cgi

Address Kbytes Mode Offset Device Mapping

0000000000400000 2584 r-x-- 0000000000000000 008:00002 php-cgi

0000000000886000 140 rw--- 0000000000286000 008:00002 php-cgi

00000000008a9000 52 rw--- 00000000008a9000 000:00000 [ anon ]

0000000000aa8000 76 rw--- 00000000002a8000 008:00002 php-cgi

000000000f678000 1980 rw--- 000000000f678000 000:00000 [ anon ]

000000314a600000 112 r-x-- 0000000000000000 008:00002 ld-2.5.so

000000314a81b000 4 r---- 000000000001b000 008:00002 ld-2.5.so

000000314a81c000 4 rw--- 000000000001c000 008:00002 ld-2.5.so

000000314aa00000 1328 r-x-- 0000000000000000 008:00002 libc-2.5.so

000000314ab4c000 2048 ----- 000000000014c000 008:00002 libc-2.5.so

.....

......

..

00002af8d48fd000 4 rw--- 0000000000006000 008:00002 xsl.so

00002af8d490c000 40 r-x-- 0000000000000000 008:00002 libnss_files-2.5.so

00002af8d4916000 2044 ----- 000000000000a000 008:00002 libnss_files-2.5.so

00002af8d4b15000 4 r---- 0000000000009000 008:00002 libnss_files-2.5.so

00002af8d4b16000 4 rw--- 000000000000a000 008:00002 libnss_files-2.5.so

00002af8d4b17000 768000 rw-s- 0000000000000000 000:00009 zero (deleted)

00007fffc95fe000 84 rw--- 00007ffffffea000 000:00000 [ stack ]

ffffffffff600000 8192 ----- 0000000000000000 000:00000 [ anon ]

mapped: 933712K writeable/private: 4304K shared: 768000K

最后一行非常重要:

* mapped: 933712K 内存映射所占空间大小

* writeable/private: 4304K 私有地址空间大小

* shared: 768000K 共享地址空间大小

#11和#12: netstat和ss - 网络相关信息

netstat可以显示网络链接、路由表信息、接口统计信息、伪装链接和多播成员(multicast memberships),ss命令用来显示网络套接字信息,它允许显示类似netstat一样的信息。关于ss和netstat使用,可参考下列资源。

#13: iptraf - 网络实时信息

iptraf是一个可交互式的IP网络监控工具。它可以生成多种网络统计信息包括:TCP信息、UDP数量、ICMP和OSPF信息、以太网负载信息、节点状态、IP校验错误等。有下面几种信息格式:

1.不同网络TCP链接传输量

2.不同网络接口IP传输量

3.不同协议网络传输量

4.不同TCP/UDP端口和不同包大小网络传输量

5.不同第二层地址网络传输量

图02:一般接口信息:不同网络接口IP传输量

图03:不同网络TCP链接传输量

#14:tcpdump:详细的网络流量分析

tcpdump是一个简单网络流量转储工具,然而要使用好需要对TCP/IP协议非常熟悉。例如要显示关于DNS的网络流量,输入:

# tcpdump -i eth1 'udp port 53'

显示所有进出80端口IPv4 HTTP包,也就是只打印包含数据的包。例如:SYN、FIN 包和ACK-only包输入:

# tcpdump 'tcp port 80 and (((ip[2:2] - ((ip[0]&0xf)<<2)) - ((tcp[12]&0xf0)>>2)) != 0)'

显示所有到的FTP会话,输入:

# tcpdump -i eth1 'dst 202.54.1.5 and (port 21 or 20'

显示所有到192.168.1.5的HTTP会话

# tcpdump -ni eth0 'dst 192.168.1.5 and tcp and port http'

用wireshark浏览转储文件中的详细信息,输入:

# tcpdump -n -i eth1 -s 0 -w output.txt src or dst port 80

#15:strace - 系统调用

追踪系统调用和型号,这对于调试Web服务器和其他服务器非常有用。了解怎样追踪进程和他功能。

#16:/proc文件系统- 各种内核信息

/proc目录下文件提供了很多不同硬件设备和内核的详细信息。更多详情参见Linux kernel /proc。一般/proc例如:

# cat /proc/cpuinfo

# cat /proc/meminfo

# cat /proc/zoneinfo

# cat /proc/mounts

#17:Nagios - 服务器及网络监控

Nagios 是一款非常流行的系统及网络监控软件。你可以轻松监控所有的主机、网络设备及服务。它能在发生故障和重新恢复后发送警讯。FAN是"Fully Automated Nagios"的缩写。FAN的目标就是由Nagios社群提供Nagios的安装。为了使安装Nagios服务器更加容易,FAN提供一个标准ISO格式的光盘镜像。此发行版中还会包含一组增强用户使用体验的工具。

#18:Cacti - 基于Web的监控工具

Cacti是一套完成的网络图形化解决方案,基于RRDTool的资料存储和图形化功能。Cacti 提供一个快速的轮询器、进阶的图形化模板、多种数据采集方法和用户管理功能。这些功能都拥有非常友好易用的界面,确保可以部署在一个包含数百台设备的复杂网络中。它提供关于网络、CPU、内存、已登录用户、Apache、DNS等信息。

#19:KDE System Guard

KSysguard是在KDE桌面下一个网络化的系统监控工具。这个工具可以通过SSH会话运行。它提供很多功能,例如可以监控本机和远程主机的客户端/服务器架构,前端图形界面使用所谓传感器得到信息并展现出来。传感器返回的可以是一个简单的数值或是一组表格的信息。针对不同的信息类型,提供一个或多个显示。这些显示被组织多个工作表中,可以工作表可以独体储存和加载。所以,KSysguard不只是一个简单的任务管理器,还是一个可以控制多台服务器的强大工具。

图05:KDE System Guard

#20:Gnome System Monitor

System Monitor可以显示系统基本信息、监控系统进程、系统资源及文件系统使用率。你也可以使用System Monitor监控和修改系统行为。尽管没有KDE System Guard功能强大,但其提供的基本信息对于入门用户还是非常有用的。

* 显示关于计算机硬件和软件的各种基本信息。

* Linux内核版本

* GNOME版本

* 硬件

* 安装的内存

* 处理器及其速度

* 系统状态

* 当前可用的硬盘空间

* 进程

* 内存及交换空间

* 网络使用率

* 文件系统

* 所有挂载的文件系统及其基本信息

图06:The Gnome System Monitor application

计算机网络管理员中级试题

计算机网络管理员中级试题及答案(一) 一、单项选择 1. 职业道德通过( ),起着增强企业凝聚力的作用。 A、协调员工之间的关系 B、增加职工福利 C、为员工创造发展空间 D、调节企业与社会的关系 2. 对供电质量要求( )的负载中使用的UPS是后备式。 A、较高 B、较低 C、不高 D、最高 3. 计算机机房的构造、装修必须严格遵守有关消防规定,如建筑耐火等级不应低于( )。 A、三级和四级 B、四级和五级 C、五级和六级 D、一级和二级 4. 计算机机房应配备最实用的灭火器是( )。 A、水或泡沫灭火器 B、干粉或二氧化碳灭火器 C、清水或二氧化碳灭火器 D、二氧化碳或泡沫灭火器 5. 对于异步传输,下列说法正确的是( )。 A、又称起止式传输 B、需要合作 C、有时需要合作,有时不需要 D、只有接收都同意才能发送 6. CSMA/CD是( )访问方式之一。 A、广域网 B、城域网 C、局域网 D、以太网 7. Token Ring网络中采用的是( )。 A、竞争方式 B、SMA/CA或者令牌方式 C、CSMA/CE D、令牌方式 8. 非屏蔽双绞线的英文缩写是( )。 A、UTP B、STP C、VTP D、RTP 9. 在一个庞大和复杂的网络系统中,网络管理服务可以集中管理网络,并简化复杂的管理任务,下列( )不是网络管理服务可以提供的服务。 A、流量监测的控制 B、负载平衡 C、硬件诊断和失效报警 D、漏洞扫描和检测 10. 英文缩写ATM的意思是( )。 A、通用异步接收/发送装置 B、异步传输模式 C、专用异步接收/发送装置 D、同步传输模式 11. 英文缩写DNS的意思是( )。 A、域名系统 B、Novell目录服务 C、数据通信设备 D、不连续多基频模式 12. 下列选项的( )专利权期限为二十年。 A、著作权中的署名权 B、发明专利权 C、实用新型专利权 D、外观设计专利权 13. 配电柜内设有( )各一根。 A、地线和电源线 B、地线和中性线 C、电源线和中性线 D、火线和零线 14. 为了防止可能产生或聚集静电荷而对用电设备的接地叫( )。 A、防雷接地 B、防静电接地 C、屏蔽接地 D、隔离接地 15. 人触电死亡的危险电流值与人的体重和( )有关。 A、人的体重 B、通电的时间 C、空气温度 D、空气湿度 16. 当对PC机提供保护,则需要选购一台( )UPS就能满足需要。 A、500W B、300W C、400W D、200W

linux系统性能监测

1.1 CPU消耗 在文件"/proc/stat"里面就包含了CPU的信息。 #cat /proc/stat 可通过mpstat系统性能检测工具对当前cpu使用情况进行查看,如下: 语法:mpstat [ options... ] [ [ ] ] [root@reg ~]# mpstat 1 Linux 2.6.9-89.ELsmp (WebServer) 08/18/09 10:08:25 CPU %user %nice %system %iowait %irq %soft %idle intr/s 10:08:26 all 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1005.00 10:08:27 all 0.00 0.00 0.00 0.12 0.00 0.00 99.88 1031.00 10:08:28 all 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1009.00 10:08:29 all 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1030.00 10:08:30 all 0.00 0.00 0.00 0.00 0.00 0.00 100.00 1006.00 ............................ ............................ ............................ 各项的注释: CPU //处理器编号,all表示所有处理器的平均数值 Processor number. The keyword all indicates that statistics are calculated as averages among all processors. %user //用户态的CPU利用率百分比 Show the percentage of CPU utilization that occurred while executing at the user level

Linux系统管理员试卷样题(中级)

Linux 系统管理员试卷样题(中级) 一、选择题: 1、linux 操作系统内核创始人是( ) A. Bill Gates B. Richard Stallman C. Linus Torvalds D. Dennis M · Ritchie 、Ken Thompson 2、在linux 中有关IDE 设备命名编号正确的有( ) A. sda 第一个 IDE 控制器,主设备 B. sdb 第二个 IDE 控制器,次设备 C. hdb 第二个 IDE 控制器,主设备 D. hda 第一个 IDE 控制器,主设备 3、LINUX 网络安装时(多选)( ) A. PXE 网卡芯片一定要可得 B. 必须要有光盘安装介质 C. 必须是采用FTP 方式 D.安装服务器上一定要有相应的映像文件 4、ls 命令( )(多选) A. -a 可显示当前目录内的所有文件 B.与dir 命令类似 C.-A 与 -a 功能相同,但显示的文件更多 D.-d 当遇到目录时列出目录本身而非目录内的文件 5、使普通用户可执行超级用户文件的命令是( ) A. chmod +v B. usermod +v C. chmod +s D. usermod +s 6、以下对于scp 错误的是( )(多选) A. 只能用于主机之间的数据拷贝 B. 只能在开启ssh 服务的基础上工作 C. 拷贝时必须输入密码 D. 数据传输是通过加密通道来完成 7、利用命令find 查找当前目录下的名称尾为.c 的文件,并将结果输出到标准输出的命令是( ) A. find . -name "?.c" –print B. find . -name "#.c" -print C. find . -name "!*.c" –print D. find . -name "*.c" –print 8、为了将当前目录下的归档文件myftp.tgz 解压缩到/tmp 目录下,我们可以使用( ) A. tar xvzf myftp.tgz -C /tmp B. tar xvzf myftp.tgz -R /tmp C. tar vzf myftp.tgz -X /tmp D. tar xvzf myftp.tgz /tmp 9、以下哪种不是LINUX 的SHELL 类型( ) A. bash B. ksh C. rsh D. csh 10、改变bash 的提示符实际上就是改变变量( ) A. $HOME B. $PWD C.$PS1 D.$PS2 11、以下哪几种是vi 的工作模式( )(多选) 姓名: 准考证号: 单位: …… … …… …… …… …… …… ……… … … …… … 装 … … … … … … … …… …订 … … … … … … … … … … … 线 … … … … … … … … … … … … … … … … … … … … … … … … …

(整理)linux系统监控性能评估.

总控服务器性能: 一、Cpu性能评估 Vmstat命令的参数解释: 对上面每项的输出解释如下: procs r列表示运行和等待cpu时间片的进程数,这个值如果长期大于系统CPU的个数,说明CPU 不足,需要增加CPU。? b列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。 Memory swpd列表示切换到内存交换区的内存数量(以k为单位)。如果swpd的值不为0,或者比较大,只要si、so的值长期为0,这种情况下一般不用担心,不会影响系统性能。 free列表示当前空闲的物理内存数量(以k为单位)? buff列表示buffers cache的内存数量,一般对块设备的读写才需要缓冲。 cache列表示page cached的内存数量,一般作为文件系统cached,频繁访问的文件都会被cached,如果cache值较大,说明cached的文件数较多,如果此时IO中bi比较小,说明文件系统效率比较好。 swap si列表示由磁盘调入内存,也就是内存进入内存交换区的数量。 so列表示由内存调入磁盘,也就是内存交换区进入内存的数量。 一般情况下,si、so的值都为0,如果si、so的值长期不为0,则表示系统内存不足。需要增加系统内存。? IO项显示磁盘读写状况? Bi列表示从块设备读入数据的总量(即读磁盘)(每秒kb)。 Bo列表示写入到块设备的数据总量(即写磁盘)(每秒kb) 这里我们设置的bi+bo参考值为1000,如果超过1000,而且wa值较大,则表示系统磁盘IO有问题,应该考虑提高磁盘的读写性能。 system 显示采集间隔内发生的中断数 in列表示在某一时间间隔中观测到的每秒设备中断数。 cs列表示每秒产生的上下文切换次数。 上面这2个值越大,会看到由内核消耗的CPU时间会越多。 CPU项显示了CPU的使用状态,此列是我们关注的重点。 us列显示了用户进程消耗的CPU 时间百分比。us的值比较高时,说明用户进程消耗的cpu 时间多,但是如果长期大于50%,就需要考虑优化程序或算法。 sy列显示了内核进程消耗的CPU时间百分比。Sy的值较高时,说明内核消耗的CPU资源很多。 根据经验,us+sy的参考值为80%,如果us+sy大于 80%说明可能存在CPU资源不足。 id 列显示了CPU处在空闲状态的时间百分比。 wa列显示了IO等待所占用的CPU时间百分比。 wa值越高,说明IO等待越严重,根据经验,wa的参考值为20%,如果wa超过20%,说明IO等待严重,引起IO等待的原因可能是磁盘大量随机读写造成的,也可能是磁盘或者磁盘控制器的带宽瓶颈造成的(主要是块操作)。综上所述,在对CPU的评估中,需要重点注意

网络管理员在工作中的主要任务

在信息社会中,人们一时一刻也离不开计算机网络的支持。网络管理员的职责,就是保证所维护管理的网络每日24小时、每周7天、一年365天正常运转。网络正常运转的时候人们往往并不注意你的劳动成果和你的重要作用,网络一旦出现故障,你常常成为关注焦点,众矢之的。因此,作为一个合格的网络管理员,你需要有宽阔的技术背景知识,需要熟练掌握各种系统和设备的配置和操作,需要阅读和熟记网络系统中各种系统和设备的使用说明书,以便在系统或网络一旦发生故障时,能够迅速判断出问题所在,给出解决方案,使网络迅速恢复正常服务。 网络管理员的日常工作虽然很繁杂,我认为其工作的主要任务有七项,这就是网络基础设施管理、网络操作系统管理、网络应用系统管理、网络用户管理、网络安全保密管理、信息存储备份管理和网络机房管理。这些管理涉及到多个领域,每个领域的管理又有各自特定的任务。 在网络正常运行状况下,网络管理员对网络基础设施的管理主要包括:确保网络通信传输畅通;掌握局域网主干设备的配置情况及配置参数变更情况,备份各个设备的配置文件;对运行关键业务网络的主干设备配备相应的备份设备,并配置为热后备设备;负责网络布线配线架的管理,确保配线的合理有序;掌握用户端设备接入网络的情况,以便发现问题可迅速定位;采取技术措施,对网络内经常出现用户需要变更位置和部门的情况进行管理;掌握与外部网络的连接配置,监督网络通信状况,发现问题后与有关机构及时联系;实时监控整个局域网的运转和网络通信流量情况;制订、发布网络基础设施使用管理办法并监督执行情况。 网络管理员在维护网络运行环境时的核心任务之一是网络操作系统管理。在网络操作系统配置完成并投入正常运行后,为了确保网络操作系统工作正常,网络管理员首先应该能够熟练的利用系统提供的各种管理工具软件,实时监督系统的运转情况,及时发现故障征兆并进行处理。在网络运行过程中,网络管理员应随时掌握网络系统配置情况及配置参数变更情况,对配置参数进行备份。网络管理员还应该做到随着系统环境变化、业务发展需要和用户需求,动态调整系统配置参数,优化系统性能。最后,网络管理员还应该为关键的网络操作系统服务器建立热备份系统,做好防灾准备。因为网络操作系统是网络应用软件和网络用户的工作平台,一旦发生致命故障,这个网络服务将陷入瘫痪状态。 对于普通用户,计算机网络的价值主要是通过各种网络应用系统的服务体现的。网络管理员日常系统维护的另一个重要职责,就是确保这些服务运行的不间断性和工作性能的良好性。任何系统都不可能永远不出现故障,关键是一旦出现故障时如何将故障造成的损失和影响控制在最小范围内。对于要求不可中断的关键型网络应用系统,网络管理员除了在软件手段上要掌握、备份系统配置参数和定期备份系统业务数据外,必要时在硬件手段上还需要建立和配置系统的热备份。对于用户访问频率高、系统负荷大的网络应用系统服务,必要时网络管理员还应该采取负载分担的技术措施。 除了通过软件维护进行系统管理外,网络管理员还需要直接为网络用户服务。用户服务与管理在网络管理员的日常工作量中占有很大一部分份额,其内容包括:用户的开户与撤消管理,用户组的设置与管理,用户使用系统服务和资源的权限管理和配额管理,用户计费管理,以及包括用户桌面联网计算机的技术支持服务和用户技术培训服务的用户端支持服务。建设计算机网络的目的是为用户提供服务,网络管理员必须坚持以人为本、服务至上的原则。 不设防的网络好比在开门揖盗,网络管理员在提供网络服务的同时必须特别注重网络的安全与保密管理。安全与保密是一个问题的两个方面,安全主要指防止外部对网络的攻击和入侵,保密主要指防止网络内部信息的泄露。根据所维护管理的计算机网络的安全保密要求级别的不同,网络管理员的任务也不同。对于普通级别的网络,网络管理员的任务主要是配置管理好系统防火墙。为了能够及时发现和阻止网络黑客的攻击,可以再配置入侵检测软件系统对关键服务提供安全保护。对于安全保密级别要求高的网络,网络管理员除了应该采取上述措施外,还应该配备网络安全漏洞扫描系统,对关键的网络服务器采取容灾的技术手段。更严格的涉密计算机网络,还要求在物理上与外部公共计算机网络绝对隔离;对安置涉密网络计算机和网络主干设备房间的要采取安全措施,控制管理人员的进出;对涉密网络用户的工作情况要进行全面的监控管理。 在计算机网络中最贵重的是什么?不是设备,不是计算机软件,而是数据和信息。任何设备都有损坏的可能,任何软件都有过时的时候,设备损坏可以重新购置,软件可以更新,信息和数据一旦丢失,损失将无法弥补。因此网络管理员还有一个重要职责,就是采取一切可能的技术手段和管理措施,保护网络中的信息安全。对于实时工作级别要求不高的系统和数据,最低限度网络管理员也应该进行定期手工操作备份;对于关键业务服务系统和实时级别高的数据和信息,网络管理员应该建立存储备份系统,进行集中式的备份管理;最后,将将备份数据随时保存在安全地点更是非常重要。 网络机房是安置网络系统关键设备的要地,是网络管理员日常工作的场地。根据网络规模的不同,网络机房的功能复杂程度也不同。一个正规的网络机房通常分为网络主干设备区、网络服务器设备区、系统调试维护维修区、软件开发区和

性能测试-linux资源监控

目录: Linux硬件基础 CPU:就像人的大脑,主要负责相关事情的判断以及实际处理的机制。 CPU:CPU的性能主要体现在其运行程序的速度上。影响运行速度的性能指标包括CPU的工作频率、Cache容量、指令系统和逻辑结构等参数。 查询指令:cat /proc/cpuinfo 内存:大脑中的记忆区块,将皮肤、眼睛等所收集到的信息记录起来的地方,以供CPU 进行判断。 内存:影响内存的性能主要是内存主频、内容容量。 查询指令:cat /proc/meminfo 硬盘:大脑中的记忆区块,将重要的数据记录起来,以便未来再次使用这些数据。 硬盘:容量、转速、平均访问时间、传输速率、缓存。 查询指令:fdisk -l (需要root权限) Linux监控命令 linux性能监控分析命令 vmstat vmstat使用说明 vmstat可以对操作系统的内存信息、进程状态、CPU活动、磁盘等信息进行监控,不足之处是无法对某个进程进行深入分析。 vmstat [-a] [-n] [-S unit] [delay [ count]] -a:显示活跃和非活跃内存 -m:显示slabinfo -n:只在开始时显示一次各字段名称。 -s:显示内存相关统计信息及多种系统活动数量。 delay:刷新时间间隔。如果不指定,只显示一条结果。 count:刷新次数。如果不指定刷新次数,但指定了刷新时间间隔,这时刷新次数为无穷。-d:显示各个磁盘相关统计信息。 Sar sar是非常强大性能分析命令,通过sar命令可以全面的获取系统的CPU、运行队列、磁盘I/O、交换区、内存、cpu中断、网络等性能数据。 sar 命 令行

linux高级监控工具sinfo

Sinfo Sinfo是一款监视工具,使用广播方案来发布关于你本地网络上每一台计算机的运行状况的信息。它支持显示多方面的内容,比如处理器、内存使用情况、网络负载以及关于每一台计算机上五个主要进程的信息。Sinfo使用ncurses,以一目了然的方式来显示信息。 Sinfo可以显示关于多台计算机的系统信息,以便管理。使用的时候可以通过-s选项查看更多信息。 安装过程 如果你使用基于Debian的系统,比如Debian和Ubuntu等系统,可以使用二进制包,可以在你的repo中找一下。考虑到该软件包括了一个启动守护程序sinfod,我强烈建议使用这个可选的二进制文件,因为这个过程的许多方面实现了自动化(它也是我在这里探讨的版本)。不过,为了确保发行版中立,与往常一样,我还在安装过程中介绍了源版本。 说明文档对代码库的要求如下: ?ncurses:用于终端处理的代码库(5.7版本)。 ?boost:可移植的C++源代码库,使用Boost.Bind和Boost.Signals(1.42版本)。 ?asio (>=1.1.0):asio是一个跨平台的C++代码库,用于网络编程(1.4.1版本)。 如果你通过源代码编译,还需要上面这些代码库的开发包(-dev)。libboost-下的开发包的数量相当多,所以要是你在编译过程中遇到了任何问题,请先检查libboost是不是安装全了。 对于使用源代码来运行的那些人来说,一旦你搞定了代码库要求,就可以获取最新的tarball文件(下载地址)。解压缩,在新的文件夹中打开终端,输入以下命令: $ ./configure $ make 如果你的发行版使用sudo: $ sudo make install

Linux系统管理员都应该熟悉的工具

Linux系统管理员都应该熟悉的工具 2010-10-21 17:42:56 https://www.doczj.com/doc/6318524602.html, 来源:51CTO Linux/unix系统工程师远程管理Linux/unix服务器不是像大家想象中的那样,直接在linux/unix下远程管理其服务器,而是一般都在windows下通过工具来远程管理。我这里推荐的工具是我平时用得最多的,推荐给大家... Linux/unix系统工程师远程管理Linux/unix服务器不是像大家想象中的那样,直接在linux/unix下远程管理其服务器,而是一般都在windows下通过工具来远程管理。我这里推荐的工具是我平时用得最多的,推荐给大家。大家较熟悉的,我轻轻带过;不是太熟练的,我多花些篇幅介绍,让大家先知道它们的优点,然后再试用。 作者简介:文章作者抚琴煮酒(Andrew Yu)是经验丰富的Linux/Unix系统工程师,并曾经担任过一段时间的RHCE讲师的工作。 PieTTY PieTTY 是由林弘德(Hung-Te Lin, piaip)以PuTTY 源代码为基础,在Windows上发展的Telnet/SSH 安全远端连线程式,修正与完整支援亚洲语系字符,可切换多种Unicode 字符显示方式,提供简易scp上传界面,并增加透明视窗、无边框模式等视觉效果。PieTTY 与PuTTY同样采用MIT License,但PieTTY目前并没有释出源代码,如果您有非常高度的安全需求,请自行斟酌是否使用PieTTY;个人的感觉是,PieTTY比putty方便和实用多了,所以推荐采用PieTTY。 PieTTY官方网站:https://www.doczj.com/doc/6318524602.html,/~piaip/pietty/ 价格:免费 WinSCP WinSCP是一个Windows环境下使用SSH的开源图形化SFTP客户端。同时支持SCP 协议。它的主要功能就是在本地与远程计算机间安全的复制文件。此软件还可以结合pietty,以方便用户的远程登录。 特性 图形用户界面 多语言 与Windows完美集成(拖拽, URL, 快捷方式) 支持所有常用文件操作 支持基于SSH-1、SSH-2的SFTP和SCP协议

网络管理员国家职业标准

计算机网络管理员国家职业标准 1、职业概况 1.1 职业名称 计算机网络管理员。 1.2 职业定义 从事计算机网络运行、维护工作的人员。 1.3 职业等级 本职业共设三个等级,分别为:网络管理员(国家职业资格四级)、高级网络管理员(国家职业资格三级)、网络管理师(国家职业资格二级)。 1.4 职业环境 室内,常温。 1.5 职业能力特征 1.6基本文化程度 高中毕业(或同等学历) 1.7培训要求 1.7.1培训期限 全日制职业学校教育,根据其培养目标和教学计计划确定。晋级培训期限:网络管理员不少于200标准学时;高级网络管理员不少于250标准学时;网络管理师不少于300标准学时。 1.7.2培训教师 培训网络管理员的教师应具有本职业高级网络管理员职业资格读书2年以 上;培训高级网络管理员的教师应具有本职业网络管理师职业资格证书2年以上

或相关专业中级以上(含中级)专业技术职务任职资格;培训网络管理师的教师应具有本职业网络管理师职业资格证书3年以上或相关专业高级专业技术职务任职资格。 1.7.3培训场地设备 具有满足教学需要的标准教室和具有必备设备的计算机网络环境的实验室。 1.8鉴定要求 1.8.1适用对象 从事或准备从事本职业的人员。 1.8.2申报条件 ——网络管理员(具备以下条件之一者) (1)经本职业网络管理员正规培训达规定标准学时数,并取得毕(结)业证书。 (2)连续从事本职业工作2年以上。 (3)取得经营劳动保障行政部门审核认定的、以中级技能为培养目标的中等以上职业学校本职业(专业)毕业证书。 ——高级网络管理员(具有以下条件之一者) (1)取得本职业网络管理员证书后,连续在本职业工作2年以上,经本职业高级网络管理员正规培训达规定标准学时数,并取得毕(结)业证书。(2)取得经营劳动保障行政部门审核认定的、以高级技能为培养目标的高等以上职业学校本职业(专业)毕业证书。 (3)取得相关专业大专以上(含大专)毕业证书,并连续从事本职业工作2年以上。 (4)连续从事本职业工作5年以上。 ——网络管理师(具备以下条件之一者) (1)取得本职业高级网络管理员证书后,连续从事本职业工作3年以上,经本职业网络管理师正规培训达规定标准学时数,并取得毕(结)业证书。(2)取得本职业网络管理员证书后,连续从事本职业工作4年以上。 (3)取得相关专业大学以上(含本科)毕业证书,并连续从事本职业工作3年以上。 1.8.3鉴定方式 分为理论知识考试和技能操作考试。理论知识考试采用闭卷笔试方式或上机考试方式;技能操作考核采用实际操作方式。理论知识考试和技能操作考核采用实际操作方式。理论知识考试和技能操作考核均实行百分制,成绩皆达60分以上者为合格。网络管理师还须进行综合评审。 1.8.4考评人员与考生配比

Linux服务器运行状况全面监测下

四、服务器主板工作状况监测: 服务器主板以及CPU工作温度是否正常是服务器稳定的核心。迄今为止还没有一种CPU散热系统能保证永不失效。失去了散热系统保护伞的“芯”,往往会在几秒钟内永远停止“跳动”。值得庆幸的是,聪明的工程师们早已开发出有效的处理器温度监控、保护技术。以特殊而敏锐的“嗅觉”随时监测CPU的温度变化,并提供必要的保护措施,使CPU免受高温下的灭顶之灾。lm_sensors可以有效监控主板和CPU的工作电压、风扇转速、温度等核心数据。软件安装: #mv lm_sensors-2.8.8.tar.gz /usr/lo ca l/src/ #cd /usr/local/src/ #tar zxvf lm_sensors-2.8.8.tar.gz #cd /usr/local/src/lm_sensors-2.8.8 #tar xzf i2c-2.8.8.tar.gz #make clean ;make dep ;make all ;make install #/sbin/depmod -a 修改配置文件:“/etc/ld.so.conf”加入一行:/usr/local/lib #ldconfig #sensors-detect #扫描主板所有芯片,选择缺省选项即可(按会车)# 加载模块,注意主板不一定相同。 #modprobe i2c-isa #modprobe lm78 #modprobe sis5595 开始检测,见图-8:

#sensors 图 8 lm_sensors 工作界面 可以看到主板温度、CPU温度电压以及风扇转速等信息非常清晰。 高级应用:定时检测主板运行情况: 这里可以使用Linux组合命令: #watch --interval=450 “sensors ” 这样每隔450秒运行因此sensors 令,就可以得知主板运行情况。 五、P2P通信监测 P2P(Peer-to-Peer)是一种用于文件交换的新技术,通过Internet允许建立分散的、动态的、匿名的逻辑网络。P2P为对等连接或对等网络,点对点网络技术,可应用于文件共享交换,深度搜索、分布计算等领域。它允许个体的PC通过Internet共享文

《Linux系统管理》期末综合试题答案

Linux 期末复习试题 一、选择题 (每小题2分,共50分) 1.在创建Linux分区时,一定要创建( D )两个分区 A. FAT/NTFS B. FAT/SWAP C. NTFS/SWAP D.SWAP/根分区 2.在Red Hat Linux 9中,系统默认的( A )用户对整个系统拥有完全的控制权。 A. root B. guest C. administrator D.supervistor. 3. 当登录Linux时,一个具有唯一进程ID号的shell将被调用,这个ID是什么( B ) A. NID B. PID C. UID D. CID 4. 下面哪个命令是用来定义shell的全局变量( D ) A. exportfs B. alias C. exports D. export 5. 哪个目录存放用户密码信息( B ) A. /boot B. /etc C. /var D. /dev 6. 默认情况下管理员创建了一个用户,就会在( B )目录下创建一个用户主目录。

A. /usr B. /home C. /root D. /etc 7. . 当使用mount进行设备或者文件系统挂载的时候,需要用到的设备名称位于( D )目录。 A. /home B. /bin C. /etc D. /dev 8. 如果要列出一个目录下的所有文件需要使用命令行( C )。 A. ls –l B. ls C. ls –a D. ls –d 9. 哪个命令可以将普通用户转换成超级用户( D ) A. super B. passwd C. tar D. su 10. 除非特别指定,cp假定要拷贝的文件在下面哪个目录下( D ) A. 用户目录 B. home目录 C. root目录 D. 当前目录 11. 在vi编辑器里,命令"dd"用来删除当前的( A ) A. 行 B. 变量 C. 字 D. 字符 12. 当运行在多用户模式下时,用Ctrl+ALT+F*可以切换多少虚拟用户终端( B )

计算机网络管理员国家职业标准新修订

计算机网络管理员国家职业标准 2008修订 1.职业概况 1.1 职业名称 计算机网络管理员。 1.2 职业定义 利用计算机软硬件技术和通讯技术,从事计算机网络运行、维护与管理的人员。 1.3 职业等级 本职业共设四个等级,分别为:中级工(国家职业资格四级)、高级工(国家职业资格三级)、技师(国家职业资格二级)和高级技师(国家职业资格一级)。 1.4 职业环境条件 室内,常温。 1.5 职业能力特征 具有很强的学习、表达、计算和逻辑思维能力,具备一定的空间感、形体感,色觉正常,手指、手臂灵活,动作协调性强。 1.6 基本文化程度 高中毕业(或同等学历)。 1.7 培训要求 1.7.1 培训期限 全日制职业学校教育,根据其培养目标和教学计划确定。晋级培训期限:中级不少于200标准学时;高级不少于200标准学时;技师不少于250标准学时;高级技师不少于300标准学时。 1.7.2 培训教师 培训中级、高级的教师应具有本职业高级职业资格证书2年以上或相关专业中级以上专业技术职务任职资格;培训技师、高级技师的教师应具有本职业高级技师职业资格证书3年以上或相关专业高级专业技术职务任职资格。 1.7.3 培训场地设备 具有满足教学需要的标准教室和具有计算机网络环境、软件环境等必备软硬件条件的实操机房。 1.8 鉴定要求 1.8.1 适用对象 从事或准备从事本职业的人员。 1.8.2 申报条件 ——中级(具备以下条件之一者) (1)经本职业中级正规培训达规定标准学时数,并取得结业证书; (2)连续从事本职业工作1年以上; (3)取得经劳动保障行政部门审核认定的、以中级技能为培养目标的中等以上职业学校本职业

Linux常用的系统监控shell脚本

https://www.doczj.com/doc/6318524602.html,下面是我常用的几个Linux系统监控的脚本,大家可以根据自己的情况在进行修改,希望能给大家一点帮助。 1、查看主机网卡流量 1.#!/bin/bash 2. 3.#network 4. 5.#Mike.Xu 6. 7.while : ; do 8. 9.time=’date +%m”-”%d” “%k”:”%M’ 10. 11.day=’date +%m”-”%d’ 12. 13.rx_before=’ifconfig eth0|sed -n “8″p|awk ‘{print $2}’|cut -c7-’ 14. 15.tx_before=’ifconfig eth0|sed -n “8″p|awk ‘{print $6}’|cut -c7-’ 16. 17.sleep 2 18. 19.rx_after=’ifconfig eth0|sed -n “8″p|awk ‘{print $2}’|cut -c7-’ 20. 21.tx_after=’ifconfig eth0|sed -n “8″p|awk ‘{print $6}’|cut -c7-’ 22. 23.rx_result=$[(rx_after-rx_before)/256] 24. 25.tx_result=$[(tx_after-tx_before)/256] 26. 27.echo “$time Now_In_Speed: “$rx_result”kbps Now_OUt_Speed: “$tx_result”kbps” 28. 29.sleep 2 30. 31.done 2、系统状况监控 1.#!/bin/sh 2. 3.#systemstat.sh

Linux 系统管理员

Linux 文件命令精通指南 作者:Sheryl Calish 为刚接触 Linux 文件命令的初学者提供的速成教程 虽然 GUI 桌面(如 KDE 和 GNOME)能够帮助用户利用 Linux 特性,而无需关于命令行接口的功能知识,但还是经常会需要更多的功能和灵活性。而且,基本熟悉这些命令对于在 shell 脚本中正确地使某些功能自动化仍然是必需的。 这篇文章是关于 Linux 文件命令的一个“速成教程”,它是为那些刚接触这个操作系统或者只是需要补充这方面知识的用户提供的。它包含了对一些更有用的命令的一个简明的概述以及关于它们的最强大的应用的指导。下面包含的信息—结合一些实验—将使您能够容易地掌握这些基本的命令。(注意:当涉及到一个与 Oracle 集群文件系统 (OCFS) 结合的内核时,这些命令中的某些命令的行为可能会稍微有所不同。在此情况下,Oracle 提供了一个OCFS 工具集, 该工具集可以为文件命令应用提供一个更好的选择。) 注意,这里包含的所有示例都在 SUSE Linux 8.0 Professional 上进行了测试。虽然没有理由相信它们在其它的系统上将不能工作,但如果出现问题,您应当查看您的文档,以了解可能的变化。 背景概念 在深入研究规范之前,让我们回顾一些基础知识。 文件和命令 在 Linux/UNIX 操作系统中,所有事物都被当作文件来处理:硬件设备(包括键盘和终端)、目录、命令本身,当然还有文件。这个奇怪的惯例实际上是 Linux/UNIX 的能力和灵活性的基础。 大多数(几乎是全部)的命令形式如下: command [option] [source file(s)] [target file] 获取帮助 最有用的命令之一是那些提供帮助的命令(特别是对那些学习 Linux 的人而言)。Linux 中的两个重要的信息来源是联机参考手册,或 man 页面和 whatis 工具。您可以用 whatis 命令来访问一个不熟悉的命令的 man 页面。 $ whatis echo 要了解关于这个命令的更多信息,可以使用: $ man echo

Unix,Linux 磁盘 IO 性能监控命令

Unix/Linux 磁盘I/O 性能监控命令 磁盘I/O 性能监控指标和调优方法 在介绍磁盘I/O 监控命令前,我们需要了解磁盘I/O 性能监控的指标,以及每个指标的所揭示的磁盘某方面的性能。磁盘I/O 性能监控的指标主要包括: 指标1:每秒I/O 数(IOPS 或tps) 对于磁盘来说,一次磁盘的连续读或者连续写称为一次磁盘I/O, 磁盘的IOPS 就是每秒磁盘连续读次数和连续写次数之和。当传输小块不连续数据时,该指标有重要参考意义。 指标2:吞吐量(Throughput) 指硬盘传输数据流的速度,传输数据为读出数据和写入数据的和。其单位一般为Kbps, MB/s 等。当传输大块不连续数据的数据,该指标有重要参考作用。 指标3:平均I/O 数据尺寸 平均I/O 数据尺寸为吞吐量除以I/O 数目,该指标对揭示磁盘使用模式有重要意义。一般来说,如果平均I/O 数据尺寸小于32K,可认为磁盘使用模式以随机存取为主;如果平均每次I/O 数据尺寸大于 32K,可认为磁盘使用模式以顺序存取为主。 指标4:磁盘活动时间百分比(Utilization) 磁盘处于活动时间的百分比,即磁盘利用率,磁盘在数据传输和处理命令(如寻道)处于活动状态。磁盘利用率与资源争用程度成正比,与性能成反比。也就是说磁盘利用率越高,资源争用就越严重,性能也就越差,响应时间就越长。一般来说,如果磁盘利用率超过70%,应用进程将花费较长的时间等待I/O 完成,因为绝大多数进程在等待过程中将被阻塞或休眠。 指标5:服务时间(Service Time) 指磁盘读或写操作执行的时间,包括寻道,旋转时延,和数据传输等时间。其大小一般和磁盘性能有关,CPU/ 内存的负荷也会对其有影响,请求过多也会间接导致服务时间的增加。如果该值持续超过20ms,一般可考虑会对上层应用产生影响。 指标6:I/O 等待队列长度(Queue Length) 指待处理的I/O 请求的数目,如果I/O 请求压力持续超出磁盘处理能力,该值将增加。如果单块磁盘的队列长度持续超过2,一般认为该磁盘存在I/O 性能问题。需要注意的是,如果该磁盘为磁盘阵列虚拟的逻辑驱动器,需要再将该值除以组成这个逻辑驱动器的实际物理磁盘数目,以获得平均单块硬盘的I/O 等待队列长度。 指标7:等待时间(Wait Time) 指磁盘读或写操作等待执行的时间,即在队列中排队的时间。如果I/O 请求持续超出磁盘处理能力,意味着来不及处理的I/O 请求不得不在队列中等待较长时间。 通过监控以上指标,并将这些指标数值与历史数据,经验数据以及磁盘标称值对比,必要时结合CPU、内存、交换分区的使用状况,不难发现磁盘I/O 潜在或已经出现的问题。但如果避免和解决这些问题呢?这就需要利用到磁盘I/O 性能优化方面的知识和技术。限于本文主题和篇幅,仅列出一些常用的优化方法供读者参考: 1.调整数据布局,尽量将I/O 请求较合理的分配到所有物理磁盘中。 2.对于RAID 磁盘阵列,尽量使应用程序I/O 等于条带尺寸或者为条带尺寸的倍数。并选取合适 的RAID 方式,如RAID10,RAID5。 3.增大磁盘驱动程序的队列深度,但不要超过磁盘的处理能力,否则,部分I/O 请求会因为丢失 而重新发出,这将降低性能。 4.应用缓存技术减少应用存取磁盘的次数,缓存技术可应用在文件系统级别或者应用程序级别。

这30个Linux系统监控工具,每个系统管理员都应该知道

这30个Linux系统监控工具,每个系统管理员都应该知道 是否需要监控Linux服务器的性能?试试这些内置的命令和附加工具。大多数发行版都附带了大量的Linux监控工具,这些工具提供了可以用来获取系统活动信息的指标。你可以使用这些工具来查找性能问题的可能原因。下面讨论的命令是关于系统分析和调试Linux服务器问题的一些最基本的命令,例如:1、找出系统的瓶颈2、磁盘(存储)瓶颈3、CPU 和内存瓶颈4、网络瓶颈。01top—进程活动监视命令top命令显示Linux进程。它提供了一个运行系统的动态实时视图,即实际的流程活动。默认情况下,它显示在服务器上运行的cpu密集型任务,并每5秒钟更新一次列表。图01:Linux top命令常用热键和top Linux监视工具下面是一些有用的热键:热键使用t显示摘要信息m显示内存信息A对不同系统资源的顶级用户进行排序。能快速识别系统里的性能需求。f进入一个交互式配置屏幕。有助于为特定的任务置顶。o优先进行交互式地选择r发布renice命令。k问题终止命令。z打开或关闭color/mono02vmstat—虚拟内存统计vmstat命令报告有关进程、内存、分页、阻塞IO、陷阱和cpu活动的信息。示例输出:显示内存使用的slab信息获取关于活动/非活动内存页的信息。03w—找出谁在登录,他们在做什么w命令显示当前机器上的用户及其进程的信息。示

例输出:04uptime—Linux系统运行了多长时间可以使用uptime命令查看服务器运行了多长时间。当前时间,系统运行的时间,当前登录的用户数量,以及过去1、5和15分钟的系统负载平均值。输出:1可视为最优荷载值。负载可以从系统切换到系统。对于单个CPU系统,1 - 3和SMP系统6-10的负载值是可以接受的。05ps—显示Linux进程ps命令将报告当前进程的快照。要选择所有进程,请使用A或E 选项:示例输出: ps和top一样,但是提供了更多的信息。显示长格式输出打开额外的全模式(它将显示传递到过程的命令行参数):显示线程(LWP和NLWP)观察进程后的线程在服务器上打印所有进程。想要打印一个进程树?#pstree获取Linux进程的安全信息。打印每一个作为用户Vivek运行的进程。将ps命令以用户定义的格式配置输出。尝试只显示Lighttpd的进程id。或者或者打印PID 55977的名称。10大内存消耗过程。显示10个CPU消耗过程。06free—Linux 服务器内存使用情况free命令显示系统中空闲和使用的物 理和交换内存的总量,以及内核使用的缓冲区。示例输出:07iostat—Montor Linux平均CPU负载和磁盘活动iostat命令报告中央处理单元(CPU)统计数据和设备、分区和网络文件系统(NFS)的输入/输出统计数据。示例输出:08sar –Monitor,收集和报告Linux系统活动sar命令用于收集、报告和保存系统活动信息。要查看网络计数器,请输入:网络计

IT运维之Linux服务器监控方案

IT运维之Linux服务器监控方案 随着Linux应用日益广泛,绝大部分的网络服务器都使用Linux操作系统。为了全面掌握网络服务器的运行状况和趋势,需要对服务器进行全面的监控。 利用Linux发行版搭建一个网络服务器可能对于许多人都是一件很容易的事情,但网络服务器正式上线后,服务器数据流动、连接数、网络流量、系统负荷等各方面都会增加,安全问题也随之而来,再考虑到日志、数据库的重要性,我想无论是哪一位系统管理员,都应该迫不及待地想把服务器上线的前期工作做好吧。 那我们究竟需要做好哪些工作准备呢?之前有看过一篇文章说到系统管理员应该定期完成的九件事情,我分析过后,认为有几件事情是必须得做的。首先是备份,做好定时备份策略,备份所有你认为重要的数据,并且定期检查你的备份是否有效、全面;日志轮换,无论你想用哪种轮换方式,控制日志增长避免驱动器已满是你的目的;做一定的安全措施,如防火墙iptables的访问控制,用denyhosts防止黑客远程暴力破解,mysql远程登录权限等等;最后就是服务器监控,也是我主要想讲述的内容。 对于服务器的硬件资源、性能、带宽、端口、进程、服务等都必须有一个可靠和持续的监测,统计分析每天的各种数据,从而能及时反映出服务器哪里存在性能瓶颈、安全隐患等。另外是要有危机意识,就是了解服务器有可能出现哪些严重的问题,出现这些问题后该如何去迅速处理。比如数据库的数据丢失,日志容量过大,被黑客入侵等等。说到底,预防是关键。 监控,是预防的其中的一项重要工作。这里先说说我需要监控的内容。系统负载、cpu 使用率、内存占用、磁盘空间、网络流量、端口、进程、apache或tomcat的连接数、mysql 的运行状态这些都是我想要监控的东西,但又能做到多少呢,我只能尽力而为了。要了解服务器每时每刻的整体运行状态,单靠几个Linux自带的性能监测命令是很难实现的。所以,利用shell脚本和开源监控工具进行服务器监控成为了我的两个主要的选择。 利用shell脚本监控能够很好把握的监控的内容,时间,警告峰值,以及方便地进行告警通知,自定义监控日志内容等等;而许多开源的监控工具都十分方便和实用,比如有zabbix、cacti、nagios等,而且能够针对不同的监控内容,生成好看的便于观察的曲线图,多数的开源监控工具都比较成熟,至于哪个好用就得用过才知道。由于这些监控工具都有许多热血人士写了安装和使用的文档,我这里就不写进来了。想了解下的朋友也可以到我的博客上走走,在这里我主要是把自己写的一些shell监控脚本分享一下,希望大家能给点意见。 我这里写了四个脚本(performance.sh 性能监控,process.sh 进程监控,network.sh 流量监控,tongji.sh流量分析统计),并使用crontab定时执行脚本进行监控数据的记录,形成每天的监控日志放在如下相应的文件夹,并且超过自己设定的告警值后发邮件通知,如果是腾讯企业邮箱,163邮箱那些有免费短信通知功能的可以尝试一下,收到邮件告警后很快就能收到短信了,十分方便。 性能监控脚本 ############################################################################## #!/bin/bash #监控cpu系统负载 IP=`ifconfig eth0 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "` cpu_num=`grep -c 'model name' /proc/cpuinfo`

相关主题
文本预览
相关文档 最新文档