构建基于nagios的图形化服务器监控报警平台
- 格式:doc
- 大小:31.00 KB
- 文档页数:7
Nagios监控路由器和交换机设备1.功能介绍Nagios可以监控有IP可管理的交换机和路由器的设备状态.对小型无管理功能的交换机和HUB是无法监控.监控的方式是通过外部的ping所反馈的信息或者通过SNMP协议来获取相关的状态信息.能够在网络设备上获取的信息包括:包丢失率,包往返时间平均值SNMP状态信息带宽和传输数率2.概述监控的方式有两种一种是利用ping的方式,获取数据包的响应时间和丢包率另一种是利用网络设备的SNMP数据,通过check_snmp获取端口状态和check_mrtgtraf来了解带宽状况.在使用check_snmp之前必须安装snmp包到系统中.如果没有安装则需要先安装好snmp系统包,然后再重新编译nagios plugins3.配置步骤完成第一次执行需要做的操作创建新的监控设备主机和服务对象重新启动Nagios4.确认一下内容在/usr/local/nagios/etc/objects/commands.cfg里面是否包含了check_snmp和check_local_mrt gtraf的命令定义在/usr/local/nagios/etc/objects/templates.cfg里面是否包含了generic-switch5.配置Nagiosa.编辑/usr/local/nagios/etc/nagios.cfg将#cfg_file=/usr/local/nagios/etc/objects/switch.cfg前面的#去掉b.编辑/usr/local/nagios/etc/object/switch.cfg文件设定监控主机的相关内容define host{use generic-switch ; Inherit default values from a templatehost_name Gateway ; The name we're giving to this switchalias Firewall ; A longer name associated with the switchaddress 192.168.200.1 ; IP address of the switchhostgroups allhosts,switches ; Host groups this switch is associated with}监控包的丢失率和RTA响应时间define service{use generic-service ; Inherit values from a templatehost_name Gateway ; The name of the host the service is associated withservice_description PING; The service descriptioncheck_command check_ping!200.0,20%!600.0,60% ;在超过200ms或丢包率在20%上的启动警告,超过600ms或丢包达到60%的启动报警normal_check_interval 5; 在正常情况下,每五分钟监控一次retry_check_interval 1; 在异常情况下,每分钟监控一次}利用SNMP监控交换和网关设备define service{use generic-service ; Inherit values from a templatehost_name Gatewayservice_description Uptimecheck_command check_snmp!-C public -o sysUpTime.0}利用MRTG来监控网络流量信息define service{use generic-service ; Inherit values from a templatehost_name Gatewayservice_description Port 1 Bandwidth Usagecheck_commandcheck_local_mrtgtraf!/var/lib/mrtg/192.168.200.1_1.log!AVG!1000000,2000000!5000000,5000000!10 }利用command里面设定的check_local_mrtgtraf获取本地保存的mrt g流量日志信息来监控,获取文件是/var/lib/mrt g/192.168.200.1_1.log获取数据值是采取AVG的值,数值在1M~2M之间,则状态改为warning,如果超过5M的话则状态改为critical 完成配置后service nagios restart。
基于Nagios构建企业级信息系统监控方案作者:武冬春来源:《计算机光盘软件与应用》2013年第16期摘要:企业信息系统中的服务器、网络等基础设施的稳定运行是保障业务正常运行的基础。
而要保证这些基础设施稳定、高效的运行,设备故障及时有效的发现、设备运行状态信息及时有效的展示就显得十分重要,信息系统的有效监控已成为信息系统管理的重要问题。
大中型企业内部存在着成百上千台服务器、网络等设备,如何实现对这些设备的有效监控,并且高效的解决各类系统故障,保障系统稳定、高效的运行呢?本文主要对Nagios监控功能进行分析,论述了如何利用它去监控服务器等设备。
关键词:nagios;监控;网络管理中图分类号:TP393.18随着企业信息系统的不断建设,庞大的服务器等基础设施的有效监控已成为信息系统管理的重要问题。
依靠人工巡检的方式对于系统故障、潜在风险及安全隐患的发现效率越来越差,为提高发现故障的及时性、把运维人员从繁重的工作中解放出来,亟需引入新的工具来协助工程师解决当前的问题。
该工具能够实现对各类IT设备的监视和管理,提高基础设施的服务质量和效率,因此自动化工具对于运维人员就十分必要。
Nagios是一种开源网管软件,利用它可以实现对企业中的服务器、网络等设备进行全面的监控。
1 Nagios介绍1.1 Nagios简介Nagios是一款开源的监视系统运行状态的网管监控系统。
它能监视本地或远程设备以及服务,同时提供异常告警通知功能等。
Nagios能运行在Linux/Unix平台,状态监测等可实现利用WEB浏览器展示。
1.2 Nagios的主要功能特点监视服务状态(SMTP,POP3,FTP,HTTP,PING等)监视资源利用率(CPU、内存,磁盘I/O等)利用插件方式轻松扩展监视功能支持各类服务等监视的并发处理功能支持错误通知功能(通过email,短信等方法)可指定自定义的事件处理控制器基于WEB浏览器的界面以方便维护人员查看被监控端状态支持通过手机终端查看监控信息1.3 Nagios工作原理Nagios的功能是监控服务和主机,Nagios的监控、检测功能都是依赖各种插件来完成。
服务器监控报警设置技巧如何设置服务器监控报警提醒在当今信息化时代,服务器已经成为企业运营中不可或缺的重要设备。
为了确保服务器的正常运行,及时发现并解决问题,服务器监控系统就显得尤为重要。
而服务器监控报警设置则是服务器监控系统中至关重要的一环,它可以帮助管理员及时发现服务器异常情况,保障服务器的稳定运行。
本文将介绍一些服务器监控报警设置的技巧,帮助管理员更好地设置服务器监控报警提醒。
一、选择合适的监控工具首先,要选择一款适合自己服务器的监控工具。
市面上有很多种服务器监控工具,如Zabbix、Nagios、Prometheus等,每种工具都有其特点和适用场景。
在选择监控工具时,需要考虑自己的实际需求和服务器环境,选择一款功能全面、易于使用的监控工具。
二、设置监控项在进行服务器监控报警设置之前,首先需要设置监控项。
监控项是指需要监控的服务器指标,如CPU利用率、内存使用率、磁盘空间等。
管理员可以根据服务器的实际情况,设置相应的监控项,以便及时发现服务器异常情况。
三、设置报警规则设置监控项后,接下来就是设置报警规则。
报警规则是指当监控项达到一定阈值时,系统会触发报警。
管理员可以根据实际情况设置不同的报警规则,如CPU利用率超过80%时触发报警,内存使用率超过90%时触发报警等。
合理设置报警规则可以帮助管理员及时发现服务器异常情况,避免服务器宕机或数据丢失等问题。
四、选择报警方式在设置报警规则时,管理员还需要选择报警方式。
常见的报警方式包括邮件、短信、电话等。
管理员可以根据自己的习惯和需求选择合适的报警方式,以便在服务器出现异常情况时能够及时收到报警提醒。
五、定时检查报警设置最后,管理员还需要定时检查报警设置,确保报警规则和报警方式设置正确有效。
服务器环境是不断变化的,可能会出现新的问题或需求,因此定时检查报警设置是非常必要的,可以及时调整和优化报警设置,提高服务器监控的效率和准确性。
总之,服务器监控报警设置是保障服务器稳定运行的重要环节,合理设置监控项、报警规则和报警方式,定时检查和优化报警设置,可以帮助管理员及时发现并解决服务器问题,确保服务器的正常运行。
Nagios监控Linux主机(NRPE安装与应用)一、NRPE简介及工作原理NRPE是nagios的一个扩展,它被用于被监控的服务器上,向nagios监控平台提供该服务器的一些本地的情况。
例如,cpu负载、内存使用、硬盘使用等等。
NRPE可以称为nagios 的for linux 客户端。
NRPE 由两个部分组成:工作在监控机一侧的check_nrpe 插件、工作在被监控机一侧的NRPE 守护进程。
Nagios 服务器执行check_nrpe 插件并告诉他检查哪个服务,check_nrpe 插件通过SSL 连接方式联系远程服务器上的NRPE 守护进程,NRPE 守护进程执行相应的插件完成指定的检查,并返回结果。
工作原理是:插件nrpe在被监控机上开启一个daemon,通过这个daemon来和监控主机建立一条ssl加密通道,通过这条通道来传送被监控机的本地信息,达到监控的目的。
装在被监控机上的daemon就相当于一个nagios的传递员,命令行从nagios监控主机发出,然后daemon接受到信息,就会执行这条命令行,执行的方式,其实是和nagios主机是一样的,所以被监控机上也需要装一套nagios-plugins插件。
例如:nagios主机需要监控被监控机的硬盘信息,就会对被监控机发出一条命令说:“我要看你的硬盘信息。
”被监控机nrpe的daemon接到这个命令之后,就会运行一个插件,来检查被监控机本地硬盘的信息,然后插件把信息反馈到nrpe,nrpe通过ssl通道再把这些信息反馈到nagios主机。
如下图所示二、NRPE安装1、所需安装包nrpe、nagios-plugins,这两个包都可以从上得到,本例为nrpe-2.12.tar.gz2、安装openssl、openssl-devel;yum install -y opensslyum install -y openssl-devel3、安装nrpe和nagios-plugins插件1)安装nagios-plugins,在安装时首先在被监控机上新建nagios用户及组。
服务器监控工具推荐实时监测和报警随着互联网的发展,服务器的稳定性和安全性变得越来越重要。
服务器监控工具作为一种实时监测和报警系统,能够帮助我们及时发现服务器故障,并采取相应的措施进行修复,从而保障系统的正常运行。
本文将为您推荐几款优秀的服务器监控工具,帮助您更好地监控和管理服务器。
一、ZabbixZabbix是一款全面的服务器监控工具,具有强大的功能和易用的界面。
它支持多种操作系统和网络设备,可以实时监测服务器的CPU、内存、磁盘等关键指标,并集中管理所有的监控数据。
此外,Zabbix还支持自定义报警规则,当服务器出现异常时,可以及时发送报警信息给管理员,方便快速响应和处理。
二、NagiosNagios是另一个备受推崇的服务器监控工具,被广泛应用于各类企业级系统。
它具有灵活的配置和强大的扩展性,可以监控服务器的服务状态、网络连接和硬件设备等多个方面。
Nagios支持多种报警方式,可以通过电子邮件、短信或者手机应用程序发送报警信息,让管理员能够及时了解服务器的运行状况。
三、PrometheusPrometheus是一种用于时序数据监控和警报的开源系统。
它可以高效地收集服务器的监控数据,并通过内置的警报规则引擎实现实时报警。
Prometheus还支持灵活的数据查询和可视化工具,使管理员可以更方便地分析服务器的性能指标和趋势,帮助他们及时进行系统优化和故障排查。
四、DatadogDatadog是一款云端服务器监控工具,旨在帮助用户实时监测服务器的性能和可用性。
它支持多种云计算平台和操作系统,可以自动收集服务器的指标数据,并提供丰富的视图和仪表盘来展示这些数据。
Datadog还提供智能报警功能,可以根据用户设置的规则进行实时报警,确保服务器的稳定性和安全性。
五、GrafanaGrafana是一款流行的开源数据可视化工具,常与其他服务器监控工具配合使用。
它提供了丰富多样的可视化选项,能够将服务器监控数据以图表和仪表盘的形式展示出来,帮助管理员更直观地了解服务器的状态和趋势。
服务器监控工具GrafanaZabbix和Nagios的比较与选择服务器监控工具Grafana、Zabbix和Nagios的比较与选择引言:在现代信息技术的快速发展下,服务器监控成为了保证系统稳定性和可靠性的重要手段。
监控工具能够实时收集服务器的各项指标数据,并提供可视化的报告和告警功能。
在众多的服务器监控工具中,Grafana、Zabbix和Nagios是常用且值得关注的三个工具。
本文将对它们进行比较与选择,帮助读者了解它们的特点和适用场景。
一、GrafanaGrafana是一个开源的数据可视化和监控平台,可以通过各种数据源将数据可视化展现。
它提供了强大的图表展示功能,能够将数据以多种方式和方式呈现,包括但不限于折线图、柱状图、饼图等。
Grafana还支持用户自定义报表和图表样式,使监控报告与用户需求更加契合。
Grafana的优势在于其出色的数据可视化和用户友好的界面。
通过直观的图表,用户可以快速了解服务器性能和趋势,发现潜在问题并采取相应的措施。
此外,Grafana支持多个数据源,可以与其他监控工具(如Zabbix)结合使用,实现自定义监控指标和更全面的监控功能。
然而,需要注意的是,Grafana并非一个全功能的服务器监控工具,而更偏向于数据可视化。
如果仅仅需要展示服务器性能和数据,Grafana是一个很好的选择。
二、ZabbixZabbix是一款功能强大而成熟的服务器监控工具。
它具有丰富的监控功能,可以监控服务器性能、网络流量、数据库、应用程序服务等各个方面。
Zabbix可以进行实时监控,并能够生成详细的报告和告警,及时通知管理员。
Zabbix的优点在于其全面性和灵活性。
它支持各种不同类型的监控项,可以根据具体需求进行自定义。
Zabbix还提供了灵活的告警机制,可以通过邮件、短信、微信等多种方式发送告警信息,确保管理员能够及时了解并解决潜在问题。
此外,Zabbix还具备强大的历史数据存储和分析能力,可以为系统的容量规划和性能优化提供有力的支持。
Linux系统监控之 Nagios配置教程详解(赵舜东)实验目的:通过实验熟练掌握Nagios这个开源的监控解决方案的实施。
实验环境:Red Hat Enterprise Linux +nagios.3.2.0实验步骤:第一部分:Linux系统监控之 Nagios详解(一)一、Nagios 简介(一)什么是Nagios,Nagios有哪些特性。
(二)Nagios工作原理二、部署Nagios监控服务器(一)下载所需软件包(二)安装Nagios(三)安装Nagios的插件nagios-plugin(四)配置检测主机是否存活(五)第一部分功能测试第二部分:Linux系统监控之 Nagios详解(二)三、使用Nagios监控Linux 客户端(一)Nagios监控服务器的配置(二)Nagios监控客户端的配置四、使用Nagios 监控Windows 客户端(一)Nagios 监控服务器的配置(二)Nagios 监控客户端的配置第三部分:Linux系统监控之 Nagios详解(三)五、Nagios 配置文件详解实验简介:公司进行了机房改造,新系统也上线了,需要一个强大的监控方案,对服务器和各服务的运行情况进行有效的监控,我第一个想到的就是Nagios这个强大的开源解决方案,本文以监控八台服务器和Nagios服务器本身为例。
根据先实现、后深入的方式,把本文分为三个部分,开始先实现了功能, 在第三个部分,在对配置的内容进行详细的讲解,功能实现:实现Web浏览器监控,Mail报警邮件收发,手机短信收发。
手机短信怎么收发呢?网上有很多很多的方法,我推荐一种就是使用139信箱,139信箱有一项免费的功能就是发邮件通知到您的手机上,可以在手机上看邮件内容,免费的哦。
什么?还没有139信箱,那么别傻呆了,系统运维必备的信箱,快免费申请吧。
本作品为本站原创作品,如需转载请注明来自UnixHot 技术联盟实验答疑:zhaoshundong@一、Nagios 简介官方网站:/ (更多的详细说明请参考官方网站)Nagios® is a system and network monitoring application. It watches hosts and services that you specify, alerting you when things go bad and when they get better.Nagios was originally designed to run under Linux, although it should work under most other unices as well.Some of the many features of Nagios include:1.Monitoring of network services (SMTP, POP3, HTTP, NNTP, PING, etc.) 监控网络资源2.Monitoring of host resources (processor load, disk usage, etc.) 监控主机资源3.Simple plugin design that allows users to easily develop their own service checks4.Parallelized service checks5.Ability to define network host hierarchy using "parent" hosts, allowing detection of and distinction between hosts that are down and those that are unreachable6.Contact notifications when service or host problems occur and get resolved (via email, pager, or user-defined method)7.Ability to define event handlers to be run during service or host events for proactive problem resolution8.Automatic log file rotation 自动日志轮滚9.Support for implementing redundant monitoring hosts 支持冗余10.Optional web interface for viewing current network status, notification and problem history, log file, etc.请参考Nagios 中文在线帮助文档:/docs/nagios/cn/build/html/index.html二、部署Nagios监控服务器(一)下载所需软件包1.nagios.3.2.0.tar.gz Nagios的主程序[root@UnixHot src]# wget /sourceforge/nagios/nagios.3.2.0.tar.gz2.nagios-plugins-1.4.13.tar.gz Nagios 的插件[root@UnixHot src]# wget /sourceforge/nagiosplug/nagios-plugins-1.4.13.tar.gz3.nrpe-2.12.tar.gz代理检测程序[root@UnixHot src]# wget /sourceforge/nagios/nrpe-2.12.tar.gz[root@UnixHot src]# lsnagios-3.2.0.tar.gz nagios-plugins-1.4.13.tar.gz nrpe-2.12.tar.gz(二)安装Nagios官方的安装文档:/docs/3_0/quickstart-fedora.html1.安装前的依赖检查[root@UnixHot ~]# rpm -q httpd php gcc glibc glibc-common gd gd-devel2.创建Nagios账户和组[root@UnixHot src]# useradd -m nagios[root@UnixHot src]#groupadd nagcmd[root@UnixHot src]# usermod -a -G nagcmd nagios[root@UnixHot src]#usermod -a -G nagcmd apache3.编译安装[root@UnixHot src]# tar xvf nagios-3.2.0.tar.gz[root@UnixHot src]# cd nagios-3.2.0(至于每一步的具体意思,我不再详述,因为运行完毕后,提示信息会明确的告诉你,它干了什么,是怎么干的。
服务器监测工具比较NagiosvsZabbixvsPrometheus在当今信息化时代,服务器监测工具的选择对于企业的运维管理至关重要。
本文将对三种常见的服务器监测工具——Nagios、Zabbix 和Prometheus进行比较,以帮助读者更好地了解它们的特点和适用场景。
Nagios:Nagios是一款开源的服务器监控工具,具有成熟稳定的特点。
它可以监控服务器、网络设备等各种资源,并提供实时的监控数据和报警功能。
Nagios的配置相对简单,适合中小型企业使用。
其插件化的设计使得用户可以根据需要自定义监控项,扩展性较强。
此外,Nagios有丰富的社区支持和文档资源,用户可以方便地获取帮助和解决问题。
Zabbix:Zabbix是另一款知名的开源监控工具,功能强大且易于使用。
与Nagios相比,Zabbix提供了更多的监控功能和图形化界面,用户可以直观地查看监控数据和趋势。
Zabbix支持自动发现和自动配置,能够快速部署和管理大规模的监控系统。
此外,Zabbix还提供了灵活的报警机制和报表功能,帮助用户及时发现和解决问题。
Prometheus:Prometheus是一款以时间序列数据库为基础的监控工具,适用于大规模分布式系统的监控。
Prometheus具有高度可扩展性和灵活性,支持多维度的数据模型和强大的查询语言。
其基于Pull模型的架构使得监控目标可以自行推送数据,减轻了监控系统的负担。
Prometheus还提供了丰富的图形化界面和告警管理功能,帮助用户全面了解系统的运行状态。
综合比较:在功能性方面,Nagios主要侧重于基础的服务器监控和报警,适用于对监控需求相对简单的企业;Zabbix在功能上更加全面,提供了更多的监控功能和可视化界面,适合对监控要求较高的企业;而Prometheus则更适合大规模分布式系统的监控,具有较强的扩展性和灵活性。
在部署和管理方面,Nagios相对简单易用,适合初学者和中小型企业使用;Zabbix提供了自动化配置和管理功能,适合大规模部署;Prometheus的可扩展性和灵活性使得其适用于复杂的分布式系统监控。
服务器性能监控工具推荐帮助你实时监测服务器状态在当今数字化时代,服务器作为网络连接的核心设备,扮演着至关重要的角色。
然而,随着服务器负载的增加,监控服务器性能的需求也变得日益迫切。
本文将向您推荐几款优秀的服务器性能监控工具,帮助您实时监测服务器状态,以确保网络的稳定运行。
一、Zabbix作为一款开源的服务器监控工具,Zabbix深受多个行业的青睐。
它提供了全面的性能监控功能,包括CPU使用率、内存利用率、网络流量、磁盘空间等关键指标的监测。
此外,Zabbix还支持实时报警和自动化任务管理,可及时提醒您服务器的异常情况,并采取相应措施。
通过其友好的用户界面,您可以直观地查看服务器性能数据,并生成详细的报告,以便分析服务器性能趋势和瓶颈问题。
二、Nagios作为业界广泛应用的服务器性能监控工具,Nagios以其灵活性和可扩展性而闻名。
它支持多种监控方式,包括Ping、端口、SNMP等,可以根据您的需求进行灵活配置。
通过Nagios的可视化界面,您可以监控服务器负载、服务可用性、网络流量等各种指标。
此外,Nagios 还提供了强大的报警功能,通过邮件、短信或自定义脚本等方式,及时通知您服务器的异常情况,确保问题得到及时解决。
三、SolarWinds作为一家知名的网络管理公司,SolarWinds提供了多个优秀的服务器性能监控工具。
其中最为著名的是SolarWinds Server & Application Monitor(SAM)。
SAM集成了多种监控方式,如SNMP、WMI、API 等,可以广泛适用于不同的服务器类型。
除了常见的服务器性能监测外,SAM还提供了应用程序性能监控功能,可以帮助您深入了解应用程序的健康状况,并提供实时的性能数据。
此外,SolarWinds还提供了多种定制化报表和警报功能,方便您通过电子邮件或短信接收服务器性能报警信息。
四、Prometheus作为一款开源的监控系统,Prometheus主要用于监控分布式系统。
基于Cacti和Nagios的校园网监控系统研究摘要:随着高校信息化的快速发展,学校数据中心不断扩大,服务器和网络设备数量日益增加。
借助于开源软件,建立起一种良好的网络及系统排查机制,构建一个能够实时监控网络设备状态的平台。
该系统目前正运行在山东理工大学校园网上。
关键词:监控系统;catci; nagios;实时报警1 引言随着高校信息化的快速发展,学校数据中心不断扩大,服务器和网络设备数量日益增加。
作为校园网络管理和维护人员,随时了解网络和业务应用系统的运行情况越来越重要。
本系统根据实际工作需求,借助于开源软件,建立起一种良好的网络及系统排查机制,构建一个能够实时监控应用服务器状态的平台,既节省了资金投入,同时又具有良好的实时性和扩展性。
通过该系统,可以实现对校园网上所有应用服务器24小时实时监控,实时报警。
2 基本原理cacti是一个基于rrdtool、snmp、php和mysql的网络流量图形化监测分析工具。
cacti通过基于简单网络管理协议的snmpget命令抓取网络各节点的状态信息,并以rrd(round robin data)的方式存储,当浏览数据的时候,cacti通过rrdtool引擎生成图表进行展示。
cacti的强大得益于它的开放式系统框架pia(plugin archi-tecture),该框架提供了制作监控系统的所有基础部件以及“钩子”(hooks)函数组,使得第三方的监控工具的开发和集成变得简单。
nagios是一个遵循gpl开源许可协议的应用运行状态和网络信息监控的网管系统。
与其他网络应用监控系统相比,其特点在于拥有一个监控插件与框架分离的模式,通过代理(agent)方式提供了对网络和应用的强大监控和报警功能。
nagios采用分布-集中地管理模式,在nagios服务器上安装nagios主程序,在被监控主机上安装nagios代理程序。
通过nagios主程序和代理程序之间的通讯,监视对象的状态。
服务器性能监控工具ZabbixNagios和Prometheus的选择与使用在现代信息技术快速发展的背景下,服务器性能监控工具成为企业和个人管理服务器的重要利器。
其中,Zabbix、Nagios和Prometheus是市场上广受欢迎的三种性能监控工具。
本文将从功能特点、易用性、扩展性和适用场景等方面,对Zabbix、Nagios和Prometheus进行比较分析,帮助读者选择并使用最合适的服务器性能监控工具。
一、ZabbixZabbix是一个成熟而强大的开源性能监控工具,被广泛应用于企业级网络环境。
Zabbix的主要功能特点包括四个方面:监控、警报、可视化和自动化。
首先,Zabbix具备全面的监控功能,可以监控服务器的CPU利用率、内存使用率、网络流量、磁盘IO等重要指标,实时了解服务器的性能状况。
其次,Zabbix支持配置警报策略,当服务器性能异常时,可以通过邮件、短信等方式及时通知管理员,以便及时采取措施解决问题。
再次,Zabbix提供直观的可视化界面,可以以图表、表格等形式展示服务器性能指标的历史数据,便于管理员分析趋势和进行容量规划。
最后,Zabbix支持自动化功能,可以通过脚本、API等方式自动处理异常事件,提高故障响应效率。
Zabbix的易用性方面,它提供了直观友好的Web界面,管理员可以通过Web界面完成配置、监控和数据展示等操作,无需深入了解复杂的命令行参数。
此外,Zabbix提供丰富的文档和社区支持,用户可以轻松获取相关帮助和资源。
Zabbix的扩展性方面表现突出。
它支持各种操作系统的监控,包括Windows、Linux、Unix等。
同时,Zabbix还支持多种数据库,如MySQL、PostgreSQL等。
此外,Zabbix提供了丰富的插件和API,可以方便地与其他系统进行集成,满足不同用户的需求。
适用场景上,Zabbix适用于中大型企业或服务器数量较多的场景,具备完备的监控和管理功能。
构建基于nagios的图形化服务器监控报警平台
摘要:企业系统管理员的一项重要工作是了解企业服务器和网络设备的运行状况。
阐述了开源监控软件nagios与飞信和pnp4pnagios的集成,实现对多种平台上的关键应用和服务器运行指标图形化的监控和报警。
关键词:nagios;服务器监控;飞信机器人;报警;pnp4nagios
0引言
服务器和网络设备的运行状态监控是系统管理员的一项重要任务,比如实时监控系统的cpu利用率、内存使用率、可用磁盘空间、数据库服务器运行情况、Web服务运行情况以及对出现问题时的报警以便快速解决问题等等。
Nagios系统是一款运行于Linux或Unix上的服务器系统监控开源软件, 能监视所指定的本地或远程主机以及服务,提供异常通知功能,同时提供一个可选的基于浏览器的Web 界面以方便系统管理人员查看各种系统运行状态,更重要的是它还可
以通过插件的扩展功能实现对网络上的服务器进行全面监控。
本文以RedHat Linux 5.4操作系统为平台, 在nagios监控系统基础上,集成飞信报警和pnp4nagios。
通过该平台,可以实现对企业所有应用服务器24小时实时监控,出现异常情况时以飞信发送手机短信报警,并将监控结果存储于后台数据库中,经过数据分析,将监控的状态趋势以图表形式展现出来,方便了系统管理员的日常工作。
1nagios 工作原理和特点
nagios是有许多组件组成的,最核心的组件就是nagios 进程,利用其众多的插件搜集信息,分析数据,将结果写入日志文件,当核心进程识别到问题后,发送报警信息给系统管理员。
Web界面和CGI 脚本读取这些搜集到信息显示在浏览器上,实现对本机和远端服务的监控。
Nagios采用集中-分布的管理模式,在nagios服务器端,安装nagios主程序,在被监控端安装代理程序,通过主程序与代理程序之间的通信,监视对象的状态。
Nagios自身并不包括监控服务和主机的代码,所有的监控、检测功能是通过各种插件来完成的,当nagios 主程序启动后,就会根据设定的周期,自动调用插件去检测服务和主机状态,将检测到的状态信息进入队列,并通过Web页面显示出来。
Nagios提供了很多插件,很多开源爱好者不断地添加插件,丰富了监控的功能,利用这些插件可以很方便地监控到服务和主机的状态。
通过插件的检测,返回4种状态信息,0(ok)正常、1(warning)警告、2(critical)严重、3(unknown)未知,nagios根据这4种状态
信息发送警报给系统管理员。
Nagios系统的特点主要有以下几点:监控主机资源和网络服务、允许用户通过设计简单的插件来监控自己特定的服务、当被监控对象出现问题是,会及时通知管理人员、事先定义事件处理程序,当对象出现问题时自动调用对应的处理程序、通过Web页面来监视对
象状态、告警提示和日志文件。
2监控环境的构建
笔者目前管理的网络环境,比较关键的服务器30多台,需监控的应用项目大约300多项,涉及windows平台和linux平台,已经搭建好nagios平台,需要通过飞信和pnp4nagios扩展功能,当监控过程中发生异常情况时,如监控的结果超过预设的阀值时,及时通过飞信发送报警信息通知系统管理员,当恢复正常时及时反馈等。
另外,监控的结果除了了解当前的监控状况外,还需要了解历史监控情况,
通过查看趋势图表掌握各项服务运行情况。
3将飞信集成到nagios监控系统
在被监控服务器如果出现警告或者严重报警信息,如果使用手机短信接收无疑方便快捷得多,目前有一些短信猫可以实现这一功能,但是可能涉及费用,这里使用飞信机器人来免费实现手机短信报警。
3.1定义命令
如同nagios的其他插件一样,首先定义飞信的执行命令:
command_name notify-host-by-fetion
command_line /usr/local/nagios/fetion/fetion --mobile=飞信发送手机号--pwd=飞信密码--to=$CONTACTPAGER$ --exit-on-verifycode --msg-type=1 --msg-utf8="Host: $HOSTNAME$(IP:$HOSTADDRESS$) state: $HOSTSTATE$ on $LONGDATETIME$. State information:
$HOSTOUTPUT$ "
command_name notify-service-by-fetion
command_line /usr/local/nagios/fetion/fetion --mobile=飞信发送手机号--pwd=飞信密码--to=$CONTACTPAGER$ --exit-on-verifycode --msg-type=1 --msg-utf8=" (IP: $HOSTADDRESS$)($SERVICEDESC$) state:
$SERVICESTATE$ . Detail : $SERVICEOUTPUT$"
3.2定义联系人
在联系人配置文件中,增加:
service_notification_commands notify-service-by-fetion
host_notification_commands notify-service-by-fetion
在contact.cfg中增加收件人的手机号:如pager 接收
人手机号,也可以增加多个手机号,用逗号分开。
重新启动nagios服务,这样被监控服务器一旦发生报警就可以通过手机短信接收信息了。
4将nagios监控的历史信息通过图形展示出来
4.1修改nagios 的配置文件
在nagios.cfg中开启performance_data
#打开注释项:
process_performance_data=1
host_perfdata_command=process-host-perfdata
service_perfdata_command=process-service-perfdata
4.2修改commands.cfg
command_name process-service-perfdata
command_line /usr/local/pnp4nagios/libexec/process_perfdata.pl
command_name process-host-perfdata
command_line /usr/local/pnp4nagios/libexec/process_perfdata.pl
-d HOSTPERFDATA
4.3添加小太阳模版,镶嵌在nagios页面上
第一步,修改模板配置文件:
# vi templates.cfg
## 在最后添加
define host {
name host-pnp
action_url
/pnp4nagios/index.php/graph?host=$HOSTNAME$&srv=_HOST_
register 0
}
define service {
name srv-pnp
action_url /pnp4nagios/index.php/graph?host=$HOSTNAME$&srv=$SERVICEDE
SC$
register 0
}
第二步,修改主机配置文件
在主机定义处,增加:
use linux-server,host-pnp
在每一项服务定义处,增加:
use generic-service,srv-pnp
第三步,重启nagios 服务:
#service nagios restart
打开nagios的Web页面,点开小太阳图标,出现图形界面,
可以很方便地了解监控到的历史数据。
5结束语
随着企业信息化的不断推进,应用系统和服务器以及网络设备的监控和管理工作显得更加重要,构建一个系统监控平台,集成简单实用的插件,并给出了趋势图,这些数据是不断进行的,为改善系统运行状况提供了数据依据,对于及时发现系统运行时的问题和隐患,对于节省企业信息化维护费用,保障企业信息化建设的正常运转具有非常重要的意义。
今后,随着应用的增多,可以通过这一平台灵活地添
加各种监控插件,为企业信息化发展提供信息决策。
参考文献:
[1]陈子国,刘金刚.基于nagios的网络监控系统的设计和实现[J].
实验室研究与探索,2009(8).
[2]王帆.基于nagios的服务器监控平台构建与实现[J].实验室研究
与探索,2010(12).
[3]宋磊,王静文.OpenBSD下基于Nagios的网络服务监控报警系
统的研究[J].电脑编程技巧与维护,2009(14).。