使用nagios监控服务
- 格式:docx
- 大小:1.13 MB
- 文档页数:3
Nagios监控mysql工作原理利用特定的用户定期访问指定的mysql数据库。
当不能访问或连不通时则报警。
配置过程如下1、在生产库上安装nagios插件,以nagios-plugins-1.4.15为例来讲述整个配置过程进入nagios-plugins-1.4.15 目录./configure 编译然后是编译完显示一定要有mysql支持,不然没有check_mysql这个插件config.status: creating po/Makefile--with-apt-get-command:--with-ping6-command: /bin/ping6 -n -U -w %d -c %d %s--with-ping-command: /bin/ping -n -U -w %d -c %d %s--with-ipv6: yes--with-mysql: /usr/bin/mysql_config--with-openssl: yes--with-gnutls: no--enable-extra-opts: no--with-perl: /usr/bin/perl--enable-perl-modules: no--with-cgiurl: /nagios/cgi-bin--with-trusted-path: /bin:/sbin:/usr/bin:/usr/sbin--enable-libtap: noMake all&&make install插件安装完毕再安装nrpe 安装过程略同时是编译安装三步曲:./configure make make install2、配置mysqlmysql> create database nagios; //建立nagios专用数据Query OK, 1 row affected (0.00 sec)mysql> grant select on nagios.* to nagios@'%' identified by '######'; //建立nagios专用用户权限只给select就OK,给多了不安全。
一、系统环境与软件版本情况本文档使用被监控机的操作系统为rhel6.3 _64位。
监控主机操作系统为rhel6.0 _64位及windows 2003,nagios主服务版本Nagios® Core™ 3.2.3,linu被监控机与主监控通信插件NRPE版本为nrpe-2.8.1。
window被监控机与主监控服务软件为NSClient++-0.2.7所使用的软件如下nrpe-2.8.1.tar.gzNSClient++-0.2.7.zip二、安装配置过程。
因为系统安装大家都非常熟悉了此次略过操作系统安装过程,首先是linux环境下被监控机的安装配置过程。
在安装之前先写个nagios监控非本地信息的原理图主监控机被监控机NRPE总共由两部分组成:–check_nrpe 插件,位于在监控主机上–NRPE daemon,运行在远程的linux主机上(通常就是被监控机)按照上图,整个的监控过程如下:当nagios需要监控某个远程linux主机的服务或者资源情况时1.nagios会运行check_nrpe这个插件,告诉它要检查什么.2.check_nrpe插件会连接到远程的NRPE daemon,所用的方式是SSL3.NRPE daemon会运行相应的nagios插件来执行检查4.NRPE daemon将检查的结果返回给check_nrpe插件,插件将其递交给nagios做处理.注意:NRPE daemon需要nagios插件安装在远程的linux主机上,否则,daemon不能做任何的监控.因为使用rehl线上的yum源安装需要授权,所以先使用iso搭个本地的yum源。
mount /dev/cdrom /mnt/cdrom/ 挂载光驱mkdir /home/rehliso 创建yum源目录。
cp -Rf /mnt/cdrom/* /home/rehliso/ 拷贝安装文件到源目录cd /etc/yum.repos.d/ 切换至yum配置文件目录cp rhel-source.repo rhel-source.repo.bak 备份配置文件vi rhel-source.repo 编辑配置文件,删除之前内容加入[rhel_6_iso]name=local isobaseurl=file:///home/rehlisogpgcheck=1gpgkey=file:///home/rehliso/RPM-GPG-KEY-redhat-release保存退出Yum clean all清除YUM缓存因为是用二进制安装包进行安装所以要先安装gcc编译器yum -y install gcc 安装gcc编译器安装完成后用sftp上传安装文件nrpe-2.8.1.tar.gz, nagios-plugins-1.4.13.tar.gz至/usr/local/src/目录下创建nagios用户Userad nagiosPasswd nagiosCd /usr/local/src 切换至/usr/local/src/目录解压安装包tar zxvf nagios-plugins-1.4.13.tar.gzcd nagios-plugins-1.4.13编译安装./configuremakemake install这一步完成后会在/usr/local/nagios/下生成两个目录libexec和share修改目录权限把权限所属chown nagios.nagios /usr/local/nagios/chown -R nagios.nagios /usr/local/nagios/libexec/至此被监控机nagios插件已经安装完成,接下来就是安装nrpe服务了切换至软件包目录Cd /usr/local/src解压安装文件tar zxvf nrpe-2.8.1.tar.gzcd nrpe-2.8.1编译安装./configurechecking for SSL... configure: error: Cannot find ssl libraries 出现了该错误主要是因为监控主机插件check_nrpe与被监控nrpe服务的通信是通过ssl方式连接的所以必须安装sslyum -y install openssl-devel 所以这个可以在gcc安装时顺便也安装了ssl安装完成后重新./configure*** Configuration summary for nrpe 2.8.1 05-10-2007 ***:General Options:-------------------------NRPE port: 5666NRPE user: nagiosNRPE group: nagiosNagios user: nagiosNagios group: nagiosReview the options above for accuracy. If they look okay,type 'make all' to compile the NRPE daemon and client.成功后会出现以上安装的基本信息接下来编译安装make allmake install-daemonmake install-daemon-configmake install-plugin 安装check_nrpe这个插件之前说过监控机需要安装check_nrpe这个插件,被监控机并不需要,我们在这里安装它是为了测试的目的安装xinetd脚本make install-xinetd这里还要补充一下因为官网的安装文档是将NRPE deamon作为xinetd下的一个服务运行的.在这样的情况下xinetd就必须要先安装好,所以还得确定系统是否已经安装了xinetd的服务[root@localhost nrpe-2.8.1]# service xinetd restartxinetd: unrecognized service服务并未安装yum -y install xinetd 安装xinetd服务安装完成后修改配置文件vi /etc/xinetd.d/nrpeservice nrpe{flags = REUSEsocket_type = streamport = 5666 端口wait = nouser = nagios 用户group = nagios 用户组server = /usr/local/nagios/bin/nrpeserver_args = -c /usr/local/nagios/etc/nrpe.cfg --inetdlog_on_failure += USERIDdisable = noonly_from = 127.0.0.1,192.168.1.243}only_from = 127.0.0.1,192.168.1.243在后面增加监控主机的地址192.168.1.243以空格间隔编辑/etc/services文件,增加NRPE服务端口添加如下信息nrpe 5666/tcp #nrpe查看防火墙是否启动chkconfig iptables –list如果启动需要添加5666端口的开放规则vi /etc/sysconfig/iptables-A INPUT -m state --state NEW -m tcp -p tcp --dport 5666 -j ACCEPT添加该条目service iptables restart 重启iptables服务重启xinetd服务service xinetd restart检查服务端口状态[root@localhost ~]# netstat -natp |grep 5666tcp 0 0 :::5666 :::* LISTEN 1959/xinetd 服务端口已经启动测试NRPE是否则正常工作之前我们在安装了check_nrpe这个插件用于测试,现在就是用的时候.执行[root@localhost ~]# /usr/local/nagios/libexec/check_nrpe -H localhostNRPE v2.8.1返回了版本信息说明nrpe已经正常的工作了。
软件系统运维技术中常见工具及其使用方法介绍在现代企业中,软件系统的运维是一个至关重要的工作。
为了快速、高效地管理和维护软件系统,运维人员需要掌握一些常见的工具和使用方法。
本文将介绍几种常见的软件系统运维工具及其使用方法。
1. 监控工具监控工具是软件系统运维中必不可少的工具之一。
它们能够帮助我们实时监测系统的状态,及时发现并解决问题。
常见的监控工具有:(1) Nagios:Nagios 是一个开源的监控工具,可以监控服务器、网络、应用程序等。
它可以通过配置检查命令、事件处理器和通知器等来监控系统状态,并及时发送警报通知。
(2) Zabbix:Zabbix 是一个功能强大的监控工具,可以监控各种不同类型的设备和系统。
它支持通过Web 界面进行配置和管理,并提供丰富的监控报告和图表。
(3) Prometheus:Prometheus 是一个开源的监控工具,适用于大规模分布式系统。
它提供了灵活的查询语言和仪表盘,可以帮助运维人员更好地理解系统的性能和健康情况。
使用这些监控工具时,我们需要合理配置监控项、设定阈值,并及时处理警报通知。
通过实时监控软件系统的状态,我们可以提前发现潜在问题,并采取相应措施来避免系统故障。
2. 日志管理工具日志是软件系统运维中重要的信息来源,可以帮助我们了解系统的运行情况和问题原因。
为了更好地管理和分析日志,我们可以使用下面几种常见的日志管理工具:(1) ELK Stack:ELK Stack 是一个开源的日志管理工具,由 Elasticsearch、Logstash 和 Kibana 组成。
它可以帮助我们收集、存储、分析和可视化日志数据。
Elasticsearch 是一个强大的搜索和分析引擎,Logstash 是一个数据处理管道工具,而 Kibana 则提供了用户友好的图形界面。
(2) Graylog:Graylog 是一个集中化的日志管理平台,可以帮助我们收集、存储和分析日志数据。
Nagios监控Linux主机(NRPE安装与应用)一、NRPE简介及工作原理NRPE是nagios的一个扩展,它被用于被监控的服务器上,向nagios监控平台提供该服务器的一些本地的情况。
例如,cpu负载、内存使用、硬盘使用等等。
NRPE可以称为nagios 的for linux 客户端。
NRPE 由两个部分组成:工作在监控机一侧的check_nrpe 插件、工作在被监控机一侧的NRPE 守护进程。
Nagios 服务器执行check_nrpe 插件并告诉他检查哪个服务,check_nrpe 插件通过SSL 连接方式联系远程服务器上的NRPE 守护进程,NRPE 守护进程执行相应的插件完成指定的检查,并返回结果。
工作原理是:插件nrpe在被监控机上开启一个daemon,通过这个daemon来和监控主机建立一条ssl加密通道,通过这条通道来传送被监控机的本地信息,达到监控的目的。
装在被监控机上的daemon就相当于一个nagios的传递员,命令行从nagios监控主机发出,然后daemon接受到信息,就会执行这条命令行,执行的方式,其实是和nagios主机是一样的,所以被监控机上也需要装一套nagios-plugins插件。
例如:nagios主机需要监控被监控机的硬盘信息,就会对被监控机发出一条命令说:“我要看你的硬盘信息。
”被监控机nrpe的daemon接到这个命令之后,就会运行一个插件,来检查被监控机本地硬盘的信息,然后插件把信息反馈到nrpe,nrpe通过ssl通道再把这些信息反馈到nagios主机。
如下图所示二、NRPE安装1、所需安装包nrpe、nagios-plugins,这两个包都可以从上得到,本例为nrpe-2.12.tar.gz2、安装openssl、openssl-devel;yum install -y opensslyum install -y openssl-devel3、安装nrpe和nagios-plugins插件1)安装nagios-plugins,在安装时首先在被监控机上新建nagios用户及组。
服务器监控工具推荐与使用在当今信息化时代,服务器已经成为企业和个人不可或缺的重要设备。
为了确保服务器的正常运行和安全性,服务器监控工具成为必备的利器。
本文将介绍几款常用的服务器监控工具,并指导如何正确地使用这些工具。
一、服务器监控工具推荐1. **Zabbix**Zabbix是一款开源的网络监控软件,具有强大的功能和灵活的配置。
它可以监控各种网络服务、服务器硬件状态、网络流量等。
Zabbix支持自定义报警规则,能够及时通知管理员服务器出现异常情况。
同时,Zabbix提供直观的图表展示,方便管理员查看服务器性能数据。
2. **Nagios**Nagios是一款老牌的服务器监控软件,被广泛应用于各种规模的网络环境中。
Nagios支持插件扩展,可以监控服务器的各种指标,如CPU利用率、内存使用情况、磁盘空间等。
Nagios还提供Web界面,管理员可以通过Web浏览器方便地查看监控数据。
3. **Prometheus**Prometheus是一款开源的监控系统,专注于时序数据的采集和存储。
它支持多维度数据模型和灵活的查询语言,适用于大规模分布式系统的监控。
Prometheus还提供了Grafana等可视化工具,帮助管理员更直观地了解服务器的运行状态。
4. **SolarWinds**SolarWinds是一家知名的网络管理软件提供商,旗下的服务器监控工具功能强大、易于使用。
SolarWinds可以监控服务器的性能、应用程序运行状态、网络流量等,同时支持实时报警和自定义报表生成。
SolarWinds的用户界面友好,适合初学者和有经验的管理员使用。
二、服务器监控工具的使用方法1. **安装和配置**在选择合适的服务器监控工具后,首先需要按照官方文档或教程进行安装和配置。
通常情况下,安装过程比较简单,管理员只需按照提示一步步操作即可。
在配置过程中,需要设置监控对象、监控指标、报警规则等参数,以确保监控系统能够正常工作。
一、Nagios简介Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。
在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
Nagios原名为NetSaint,由Ethan Galstad开发并维护至今。
NAGIOS是一个缩写形式: "Nagios Ain't Gonna Insist On Sainthood" Sainthood 翻译为圣徒,而"Agios"是"saint"的希腊表示方法。
Nagios被开发在Linux下使用,但在Unix下也工作得非常好。
/projects/nagios/files//download/plugins/主要功能∙网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)∙主机资源监控(CPU load、disk usage、system logs),也包括Windows主机(使用NSClient++ plugin)∙可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……)∙可以通过配置Nagios远程执行插件远程执行脚本∙远程监控支持SSH或SSL加通道方式进行监控∙简单的plugin设计允许用户很容易的开发自己需要的检查服务,支持很多开发语言(shell scripts、C++、Perl、ruby、Python、PHP、C#等)∙包含很多图形化数据Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)∙可并行服务检查∙能够定义网络主机的层次,允许逐级检查,就是从父主机开始向下检查∙当服务或主机出现问题时发出通告,可通过email, pager, sms 或任意用户自定义的plugin进行通知∙能够自定义事件处理机制重新激活出问题的服务或主机∙自动日志循环∙支持冗余监控∙包括Web界面可以查看当前网络状态,通知,问题历史,日志文件等二、Nagios工作原理Nagios的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。
使用nagios监控nfs服务
搭建好nagios服务器后开机自启动httpd
检测nagios是否正常运行的命令
[root@zlf ~]# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg Total Warnings: 0
Total Errors: 0
以下为监控信息的配置文件
[root@zlf ~]# cd /usr/local/nagios/etc/objects/
commands.cfg localhost.cfg switch.cfg timeperiods.cfg contacts.cfg printer.cfg templates.cfg windows.cfg
首先我们查看主配置文件
root@zlf ~]# cd /usr/local/nagios/etc/
[root@zlf etc]# ls
cgi.cfg ers nagios.cfg objects resource.cfg
#cgi.cfg------主要指定配置文件的路径和用户信息
#nagios.cfg---------主配置文件
[root@zlf etc]# vim nagios.cfg
查看配置信息主要看以下定义内容
root@zlf etc]# cd objects/
[root@zlf objects]# ls
commands.cfg localhost.cfg switch.cfg timeperiods.cfg contacts.cfg printer.cfg templates.cfg windows.cfg
添加本地服务我们以NFS服务为例
[root@zlf objects]# vim /etc/services #查看服务注册端口号
[root@zlf objects]# vim localhost.cfg
[root@zlf objects]# /etc/init.d/nagios restart
Running configuration check...
Stopping nagios: done.
Starting nagios: done.
进入浏览器查看:
报错因为我们没有启动nfs服务:
[root@zlf objects]# yum -y install nfs* #这种安装有点粗暴
启动nfs并挂载目录
[root@zlf ~]# service nfs start
Starting NFS services: [ OK ]
Starting NFS mountd: [FAILED]
Starting NFS daemon: rpc.nfsd: writing fd to kernel failed: errno 111 (Connection refused) rpc.nfsd: unable to set any sockets for nfsd
[FAILED]
[root@zlf ~]# service rpcbind restart
Stopping rpcbind: [FAILED]
Starting rpcbind: [ OK ]
[root@zlf ~]# service nfs start
Starting NFS services: [ OK ]
Starting NFS mountd: [ OK ]
Starting NFS daemon: [ OK ] Starting RPC idmapd: [ OK ] [root@zlf ~]# showmount -e 192.168.1.90
Export list for 192.168.1.90:
/opt *
查看nagiosweb页面监控信息
nfs第一次启动错误是因为没用启动rpcbind服务。