nagios出现的问题
- 格式:docx
- 大小:15.01 KB
- 文档页数:4
一:Nagios的安装1.安装编译所需的软件包;[root@nagios ~]#yum –y install httpd php-* gd-* mysql-devel[root@nagios ~]#setenforce 0 #关闭selinux[root@nagios ~]#sed 's/=enforcing/=permissive/' /etc/sysconfig/selinux2.创建运行nagios服务的用户;[root@nagios ~]#useradd nagios#创建运行nagios服务的用户[root@nagios ~]#usermod –G nagios apache#使apache用户对nagios目录具有写权限,不然web页面操作失败3.Nagios软件安装;[root@nagios ~]#tar zxf nagios-cn-3.2.3.tar.gz#释放nagios源码包[root@nagios ~]#cd nagios-cn-3.2.3Ps: 若在RHEL6X32位系统中安装nagios-cn-3.2.3.tar.bz2要先执行make clean操作,然后再执行./configure和make all等操作,否则执行make all时会报错![root@nagios nagios-cn-3.2.3]#./configure --enable-embedded-perl#编译nagios[root@nagios nagios-cn-3.2.3]#make all[root@nagios nagios-cn-3.2.3]#make install#安装主程序,CGI和HTML文件[root@nagios nagios-cn-3.2.3]#make install-init#在/etc/rc.d/init.d安装启动脚本[root@nagios nagios-cn-3.2.3]#make install-commandmode#配置目录权限[root@nagios nagios-cn-3.2.3]#make install-config#安装示例配置文件[root@nagios nagios-cn-3.2.3]#make install-webconf#安装nagios的web接口,会在/etc/httpd/conf.d目录中创建nagios.conf文件4.安装Nagios-plugins插件;[root@nagios ~]#tar zxf nagios-plugins-1.4.15.tar.gz[root@nagios ~]#cd nagios-plugins-1.4.15[root@nagios nagios-plugins-1.4.15]#./configure –with-nagios-user=nagios \--with-nagios-group=nagios –enable-extra-opts \--enable-libtap --enable-perl-modules [root@nagios nagios-plugins-1.4.15]#make && make install(Ps:会在”/usr/local/nagios/libexec”目录下多出一些文件,这里存放nagios所有插件)5.修改nagios的主配置文件nagios.cfg;[root@nagios ~]#vim /usr/local/nagios/etc/nagios.cfg新建cfg_file=/usr/local/nagios/etc/objects/hosts.cfg#存放主机与主机组定义cfg_file=/usr/local/nagios/etc/objects/services.cfg#存放服务与服务组定义修改#cfg_file=/usr/local/nagios/etc/objects/localhost.cfg #加”#”注释,在36行6.创建hosts.cfg文件;[root@nagios ~]#vim /usr/local/nagios/etc/objects/hosts.cfgdefine host{use linux-server#定义使用的模版host_name nagios#被监控主机名称alias nagios #别名address 127.0.0.1 #被监控主机的IP地址icon_image web.gifstatusmap_image web.gd22d_coords 100,3003d_coords 100,300,100check_command check-host-alive#监控命令,来自commands.cfg文件max_check_attempts 5#检查失败后重试的次数check_period 24x7#查看的时间段,来自timeperiods.cfg定义contact_groups admins#联系人组,在contactgroups.cfg中定义的notification_interval 10#提醒的间隔,每隔10分钟提醒一次notification_period 24x7#提醒的周期,24x7,来自timeperiods.cfg定义notification_options d,u,r #指定什么情况下提醒}define hostgroup{hostgroup_name linux-serversalias linux servermembers *}7.创建services.cfg文件;[root@nagios ~]#vim /usr/local/nagios/etc/objects/services.cfgdefine service {use local-servicehost_name nagiosservice_groups systemcheckservice_description 主机存活check_command check-host-alive}define service {use local-servicehost_name nagiosservice_groups systemcheckservice_description 登录用户数check_command check_local_users!20!50#监测远程主机当前的登录用户数量,如果大于20用户则报warning,如果大于50则报critical}define service {use local-servicehost_name nagiosservice_groups systemcheckservice_description 根分区使用率check_command check_local_disk!20%!10%!/#如果可用空间低于20%会报Warning,如果可用空间低于10%则报Critical}define service {use local-servicehost_name nagiosservice_groups systemcheckservice_description 进程总数check_command check_local_procs!250!400!RSZDT#监测远程主机当前的进程总数,如果大于250进程则报warning,如果大于400进程则报critical,S(休眠)、R(运行)、Z(僵死)、D (不可中断)、T (停止)}define service {use local-servicehost_name nagiosservice_groups systemcheckservice_description CPU负载check_command check_local_load!5.0,4.0,3.0!10.0,6.0,4.0#当1分钟多于5个进程等待,5分钟多于4个,15分钟多于3个则为warning状态#当1分钟多于10个进程等待,5分钟多于6个,15分钟多于4个则为critical状态}define service {use local-servicehost_name nagiosservice_groups systemcheckservice_description 交换空间利用率check_command check_local_swap!20%!10%#如果交换空间低于20%会报Warning,如果可用空间低于10%则报Critical}define servicegroup {servicegroup_name systemcheckalias systemcheck}[root@nagios ~]#/usr/local/nagios/bin/nagios –v /usr/local/nagios/etc/nagios.cfg#校验nagios配置文件的正确性[root@nagios ~]#htpasswd –c /usr/local/nagios/etc/ers nagiosadmin#添加一个访问nagios页面的授权用户,默认用户是nagiosadmin,创建其他用户修改/usr/local/nagios/etc/cgi.cfg文件:方法一:修改use_authentication=0 值为0 (在78行)方法二:authorized_for_system_information=nagiosadminauthorized_for_configuration_information=nagiosadminauthorized_for_system_commands=nagiosadminauthorized_for_all_services=nagiosadminauthorized_for_all_hosts=nagiosadminauthorized_for_all_service_commands=nagiosadminauthorized_for_all_host_commands=nagiosadmin(用:%s/nagiosadmin/新用户名命令替换所有nagiosadmin字符)8.启动httpd和nagios服务并设置开机自动启动[root@nagios ~]#service iptables stop[root@nagios ~]#service nagios start[root@nagios ~]#service httpd start[root@nagios ~]#chkconfig httpd on[root@nagios ~]#chkconfig nagios on[root@nagios ~]#chkconfig iptables off(Ps:如果开启了selinux需要配置如下两步:chcon -R –t httpd_sys_content_t /usr/local/nagios/sbin/chcon -R –t httpd_sys-content_t /usr/local/nagios/share/ )二:被监控端安装(以mysql为例,监控mysql服务的运行情况)1.安装并启动mysql的服务[root@mysql ~]#yum –y install mysql-server[root@mysql ~]#service mysqld start[root@mysql ~]#service iptables stop[root@mysql ~]#chkconfig mysqld on[root@mysql ~]#chkconfig iptables off2.在mysql服务器上创建监控检测帐户[root@mysql ~]#mysqlmysql> create database nagdb;mysql> grant select on nagdb.* to nagdb@’监控主机IP’;mysql> flush privileges;mysql>exit3.在nagis主机上检测是否可以链接mysql主机上的mysql服务[root@nagios ~]#/usr/local/nagios/libexec/check_mysql –H 被监控端IP–u nagdb –d nagdb 4.在nagios主机上添加对msyql服务监控的定义[root@nagios ~]#vim /usr/local/nagios/etc/objects/hosts.cfgdefine host{use linux-serverhost_name mysqlhostalias mysqlserveraddress 被监控端主机IPicon_image server.gifstatusmap_image server.gd22d_coords 100,3003d_coords 100,300,100check_command check-host-alivemax_check_attempts 5check_period 24x7contact_group adminsnotification_interval 10notification_period 24x7notification_options d,u,r}[root@nagios ~]#vim /usr/local/nagios/etc/objects/services.cfgdefine service {use local-servicehost_name mysqlhostservice_groups mysqlgroupservice_description mysqlservicecheck_command check_mysqlcontact_groups adminsnotification_interval 10notification_period 24x7notification_options w,u,r,c}define servicegroup {servicegroup_name mysqlgroupalias mysqlservices}[root@nagios ~]#vim /usr/local/nagios/etc/objects/commands.cfgdefine command{command_name check_mysqlcommand_line $USER1$/check_mysql -H $HOSTADDRESS$ -u nagdb -d nagdb }[root@nagios ~]#/usr/local/nagios/bin/nagios –v /usr/local/nagios/etc/nagios.cfg#检测无误后重新加载nagios服务[root@nagios ~]#service nagios reload三:Nagios通过NRPE监控远程主机系统状况(以mysql主机为例)1.在被监控端安装nagios-plugins和nrpe[root@mysql ~]#useradd nagios[root@mysql ~]#tar zxf nagios-plugins-1.4.15.tar.gz[root@mysql ~]#cd nagios-plugins-1.4.15[root@mysql nagios-plugins-1.4.15]#./configure --with-nagios-user=nagios \--with-nagios-group=nagios[root@mysql nagios-plugins-1.4.15]#make && make install[root@mysql nagios-plugins-1.4.15]#cd[root@mysql ~]#yum –y install xinetd[root@mysql ~]#tar zxf nrpe-2.12.tar.gz[root@mysql ~]#cd nrpe-2.12[root@mysql nrpe-2.12]#./configure[root@mysql nrpe-2.12]#make all[root@mysql nrpe-2.12]#make install-plugin[root@mysql nrpe-2.12]#make install-daemon#安装守护进程[root@mysql nrpe-2.12]#make install-daemon-config#安装配置文件[root@mysql nrpe-2.12]#make install-xinetd#安装xinetd脚本2.配置nrpe,添加nrpe服务[root@mysql ~]#vim /etc/xinetd.d/nrpe修改only_from = 127.0.0.1 监控主机IP#在后面增加监控主机(即nagios服务器)的地址,以空格间隔[root@mysql ~]#vim /etc/services添加nrpe 5666/tcp #nrpe#nrpe服务监听端口[root@mysql ~]#vim /usr/local/nagios/etc/nrpe.cfg修改command[check_disk]=/usr/local/nagios/libexec/check_disk –w 20% -c 10% -p / #在234行,将#注释去掉并修改,’/’表示根分区检测[root@mysql ~]#service xinetd restart[root@mysql ~]#netstat –at | grep nrpe[root@mysql ~]#netstat –an | grep 5666#重启xinetd服务,并查看NRPE是否已经启动3.监控主机的设置[root@nagios ~]#tar zxf nrpe-2.12.tar.gz[root@nagios ~]#cd nrpe-2.12[root@nagios nrpe-2.12]#./configure \--with-nagios-user=nagios --with-nagios-group=nagios[root@nagios nrpe-2.12]#make all && make install-plugin[root@nagios ~]#/usr/local/nagios/libexec/check_nrpe –H 被监控端IP#如输出NRPE v2.12说明连接正常[root@nagios ~]#vim /usr/local/nagios/etc/objects/command.cfgdefine command{command_name check_nrpe#定义命令名称为check_nrpe,在services.cfg中要使用这个名称command_line $USER1$/check_nrpe –H $HOSTADDRESS$ -c $ARG1$ #用$USER1$代替/usr/local/nagios/libexec,后面带的$ARG1$参数是传给nrpe daemon执行的检测命令}[root@mysql ~]#vim /usr/local/nagios/etc/nrpe.cfg#监控mysql主机的SWAP分区command[check_swap]=/usr/local/nagios/libexec/check_swap –w 20% -c 10% [root@mysql ~]#service xinetd reload[root@nagios ~]#cd /usr/local/nagios/libexec[root@nagios libexec]#./check_nrpe –H 被监控端主机IP -c check_swap[root@nagios ~]#vim /usr/local/nagios/etc/objects/services.cfgdefine service {use local-servicehost_name mysqlhostservice_groups mysqlgroupservice_description SWAP分区check_command check_nrpe!check_swapcontact_groups adminsnotification_interval 10notification_period 24x7notification_options w,u,r,c}define service {use local-servicehost_name mysqlhostservice_groups mysqlgroupservice_description CPU负载check_command check_nrpe!check_loadcontact_groups adminsnotification_interval 10notification_period 24x7notification_options w,u,r,c}define service {use local-servicehost_name mysqlhostservice_groups mysqlgroupservice_description 登录用户数check_command check_nrpe!check_userscontact_groups adminsnotification_interval 10notification_period 24x7notification_options w,u,r,c}define service {use local-servicehost_name mysqlhostservice_groups mysqlgroupservice_description 磁盘剩余空间check_command check_nrpe!check_diskcontact_groups adminsnotification_interval 10notification_period 24x7notification_options w,u,r,c}define service {use local-servicehost_name mysqlhostservice_groups mysqlgroupservice_description 总进程check_command check_nrpe!check_total_procscontact_groups adminsnotification_interval 10notification_period 24x7notification_options w,u,r,c}define service {use local-servicehost_name mysqlhostservice_groups mysqlgroupservice_description 僵尸进程check_command check_nrpe!check_zombie_procscontact_groups adminsnotification_interval 10notification_period 24x7notification_options w,u,r,c}define service{use generic-servicehost_name mysqlhostservice_description SWAPcheck_command check_nrpe!check_swap}[root@nagios ~]#/usr/local/nagios/bin/nagios –v /usr/local/nagios/etc/nagios.cfg [root@nagios ~]#service nagios reload四:通过邮件报警!1.配置nagios邮箱报警功能[root@nagios ~]#vim /usr/local/nagios/etc/object/contacts.cfgdefine contact{contact_name nagiosadminalias Nagios Adminservice_notification_period 24x7host_notification_period 24x7service_notification_options w,u,c,rhost_notification_options d,u,rservice_notification_commands notify-service-by-emailhost_notification_commands notify-host-by-emailemail 1009864@#多个管理员邮箱地址使用空格或者逗号隔开}2.配置邮件服务器(这里以postfix介绍)[root@nagios ~]#yum –y install postfix* httpd* dovecot* [root@nagios ~]#hostname [root@nagios ~]#vim /etc/postfix/main.cf修改myhostname = #在75行mydomain = #在83行myorigin = $myhostname #在98行myorigin = $mydomain #在99行inet_interfaces = all #在113行mydestination = $myhostname, $mydomain #在164行[root@nagios ~]#service sendmail stop[root@nagios ~]#service postfix start[root@nagios ~]#netstat –an | grep 25[root@nagios ~]#service dovecot restart[root@nagios ~]#postmap /etc/postfix/virtual。
一、Nagios简介Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix 的主机状态,交换机路由器等网络设置,打印机等。
在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
Nagios原名为NetSaint,由Ethan Galstad开发并维护至今。
NAGIOS是一个缩写形式: "Nagios Ain't Gonna Insist On Sainthood" Sainthood 翻译为圣徒,而"Agios"是"saint"的希腊表示方法。
Nagios被开发在Linux下使用,但在Unix下也工作得非常好。
主要功能•网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)•主机资源监控(CPU load、disk usage、system logs),也包括Windows主机(使用NSClient++ plugin)•可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……)•可以通过配置Nagios远程执行插件远程执行脚本•远程监控支持SSH或SSL加通道方式进行监控•简单的plugin设计允许用户很容易的开发自己需要的检查服务,支持很多开发语言(shell scripts、C++、Perl、ruby、Python、PHP、C#等)•包含很多图形化数据Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)•可并行服务检查•能够定义网络主机的层次,允许逐级检查,就是从父主机开始向下检查•当服务或主机出现问题时发出通告,可通过email, pager, sms 或任意用户自定义的plugin进行通知•能够自定义事件处理机制重新激活出问题的服务或主机•自动日志循环•支持冗余监控•包括Web界面可以查看当前网络状态,通知,问题历史,日志文件等二、Nagios工作原理Nagios的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。
监控系统Nagios系列(八) 抖动(falpping)检测和处理所谓抖动,是指状态在一定时间内变化过于频繁。
如果某个对象处于抖动状态,那么这时候的状态变化也是无意义的。
Nagios提供了抖动状态的检查以及针对抖动状态的处理。
1.判定抖动状态抖动是由于状态变化过于频繁导致,但是该如何定义“频繁”?每次检查得到的状态都与上次不一样?还是一定时间内状态变化达到某个阈值?这个确实很难有统一的标准。
Nagios通过统计状态变化的频度,与用户配置的阈值比对,来判定是进入还是退出抖动状态。
Nagios在其对象配置定义中,提供了Host和Service进入、退出抖动的阈值。
Nagios的全局配置项low_host_flap_threshold,high_host_flap_threshold,low_service_flap_threshold,high_service_flap_threshold 分别定义Host和Service的退出和进入抖动状态的阈值。
具体的Host和Service的配置项是low_flap_threshold,high_flap_threshold。
Nagios统计状态变化频度的方法大概描述为:存储Host或Service的21检查结果分析21次检查结果种状态变化次数统计状态变化的频率比对变化频率与抖动阈值,确定是进入还是退出Nagios计算抖动频率的方法就是:(状态变化次数/状态可能的变化次数)*100 。
但是Nagios对状态变化次数有一个权重,21次检查结果中,近期的状态变化权重比远期的高。
(关于权重这点实际上意义不大,如果需要更接近当前状态,可以把21次缩短,然后增加retry,类似soft和hard状态变化,这样更准确)。
2.判定抖动的例子下面图中有21次检查,OK状态的是绿色,WARNING状态的是黄色,CRITICAL状态的是红色。
image图中总共有20次可能状态发生变化,也就是最大只有20次状态变化,实际上有7次状态变化,那么理论上状态变化的频度为:(7/20)*100 = 35%。
单项选择题1.下面哪个程序负责HDFS数据存储。
a)NameNodeb)Jobtrackerc)Datanoded)secondaryNameNodee)tasktracker2.HDfS 中的block 默认保存几份?a)3 份b)2 份c)1 份d) 不确定3.下列哪个程序通常与NameNode在一个节点启动?a)SecondaryNameNodeb)DataNodec)TaskTrackerd)Jobtracker4.Hadoop 作者a)Martin Fowlerb)Kent Beckc)Doug cutting5.HDFS默认Block Sizea)32MBb)64MBc)128MB6.下列哪项通常是集群的最主要瓶颈a)CPUb)网络c)磁盘d)内存7.关于SecondaryNameNode哪项是正确的?a)它是NameNode的热备b)它对内存没有要求c)它的目的是帮助NameNode合并编辑日志,减少NameNode启动时d)SecondaryNameNode应与NameNode部署到一个节点多选题8.下列哪项可以作为集群的管理工具a)Puppetb)Pdshc)Cloudera Managerd)d)Zookeeper9.配置机架感知的下面哪项正确a)如果一个机架出问题,不会影响数据读写b)写入数据的时候会写到不同机架的DataNode 中c)MapReduce 会根据机架获取离自己比较近的网络数据10.Client 端上传文件的时候下列哪项正确a)数据经过NameNode传递给DataNodeb)Client 端将文件切分为Block ,依次上传c)Client 只上传数据到一台DataNode,然后由NameNode 负责Block 复制工作11. 下列哪个是Hadoop 运行的模式a)单机版b) 伪分布式c)分布式12.Cloudera提供哪几种安装CDH的方法a)Cloudera managerb)Tar ballc)Yum d)Rpm判断题13.Ganglia 不仅可以进行监控,也可以进行告警。
2024年7月运维中心员工月度工作总结尊敬的领导、同事们:大家好!在过去的7月份,我作为运维中心的一名员工,认真履行职责,努力工作,经过团队的共同努力,取得了一定的成绩。
现将本月工作进行总结如下:一、主要工作内容:1. 服务器维护与优化:本月我们对运维中心的所有服务器进行了全面的检查和维护,包括硬件故障的修复、系统的升级以及性能的优化。
同时,我们也对一些老旧的服务器进行了替换,以提升整体的运行效率和稳定性。
2. 网络安全检测与防护:针对网络安全问题,我们使用了专业的安全软件对运维中心的网络进行了全面检测,并及时修复了发现的安全漏洞。
此外,我们也加强了网络的防护措施,设置了更加严格的访问控制策略,保障了数据的安全。
3. 故障处理与应急响应:在工作中,我们及时处理了一些突发故障,如服务器宕机、网络断开等,并迅速安排人员进行应急响应。
在处理过程中,我们快速定位问题并采取了有效的措施,使系统快速恢复正常运行。
4. 运维文档的编写和更新:为了方便团队成员更好地了解和掌握运维工作,我还主动编写和更新了一系列的运维文档,包括服务器配置手册、网络拓扑图、故障处理流程等。
这些文档不仅提高了团队的工作效率,也有助于新员工的培训。
5. 合作项目的推进:本月我们与其他部门合作开展了一系列的项目,我积极参与了项目的实施过程。
通过与其他部门的沟通与协作,我们成功推进了一些关键项目的进展,提供了及时的技术支持,得到了领导和合作单位的高度认可和赞赏。
二、存在的问题及改进措施:1. 沟通协作不足:在工作中,我意识到团队之间的沟通与协作仍有待提高。
有时候信息传递不及时,导致工作出现偏差;有时候合作项目中缺乏有效的沟通和协调,影响了项目的推进。
因此,下个月我打算主动加强与团队成员之间的交流,并定期召开会议,及时解决问题。
2. 学习进步不够:随着科技的发展,新的技术不断涌现,作为一名运维人员,我要时刻保持学习的态度,跟上技术的发展。
下个月我打算加强学习,参加相关的技术培训与考试,提高自己的专业能力,为团队的发展做出更大的贡献。
nagios端口机制-回复问题:什么是Nagios端口机制?Nagios是一款非常流行的开源网络监控工具,它能够帮助系统管理员监控各种网络设备和服务的状态。
在Nagios中,端口机制是一项关键功能,用于检测和监控网络上各个设备和服务的运行状态。
本文将逐步解释Nagios的端口机制是如何工作的,并介绍其使用和设置。
第一步:理解端口和监控在开始讨论Nagios的端口机制之前,我们需要了解一些关于端口和监控的基础知识。
在计算机网络中,端口是用于在不同的进程之间进行通信的特定数字标识。
通常情况下,每个网络服务都使用特定的端口来接收和发送数据。
监控是指对网络设备和服务进行持续的跟踪和评估,以确保它们正常运行。
监控结果可用于识别和解决潜在的故障和问题。
第二步:Nagios的基本工作原理Nagios通过周期性地向设备发送指定的请求,并检查响应来监控网络设备和服务。
这些请求通常是基于不同协议的数据包,而Nagios则负责收集和分析这些响应。
对于端口监控,Nagios使用的是TCP和UDP协议。
TCP(Transmission Control Protocol)是一种面向连接的协议,为数据传输提供可靠性和有序性。
UDP(User Datagram Protocol)则是一种无连接的协议,适用于时间敏感的应用。
第三步:Nagios端口机制的使用Nagios的端口机制允许管理员指定要监控的设备和服务的端口号,并设置监控的方法和频率。
以下是一些常见的使用方法:1. 端口存活性检查:管理员可以设置Nagios定期检查设备上特定端口的存活性。
如果端口处于打开状态,Nagios会发出警报。
这是一种常用的监控方法,可以帮助管理员及时发现网络设备和服务的故障。
2. 端口数据收集:Nagios还可以通过检查特定端口的响应来收集数据。
例如,管理员可以设置Nagios检查Web服务器的80端口,以确保服务器正常运行,并记录每次检查的响应时间和内容。
Nagios,安装远远没完
如果按照我之前的文档,肯定可以安装成功吗?我不能保证.这不我就碰到了这样的问题.
一个新的项目要安装nagios监控几台服务器,我按照正常步骤进行着.
首先在监控服务器上安装nagios主程序,然后是安装插件,可是在make的时候
说库文件的,有说openssl不兼容的,可就是没给出解决的办法.我逛到秋香的那篇文章里面,发现文章后面的留言有个人也是类似的错误,很可惜,秋香没有给出答案.
没办法了,按照别人的建议装rpm版的,要知道插件本身就是一些可以独立执行的程序,我装上去以后把他们copy到/usr/loca/nagios/libexec下不就行了,来个狸猫换太子.按照提示安装了很多的依赖性软件包,终于把插件都装好了.把初始的监控主机存活的服务加上去了,运行正常.
(注:我以为把这些依赖包装上去了,我的插件也可以make了,但是很不幸,仍然是那个错误,但无论如何,用rpm来安装插件是没问题了)
在被监控机上,很显然的安装插件的时候也是在这个地方报错了.(因为这些机器的初始配置都一样).而NRPE我不报希望了,因为搜索的过程中也有人在安装NRPE的时候碰到这个错误.
rpm??只有rpm吗?光是要装那些依赖性包我就会头晕了.继续google.
曙光,是的曙光!
/questions/showthread.php?t=555818
/questions/showthread.php?t=558277
看过之后如此解决:
在安装插件的时候如果make报这个错误,则使用
make LDFLAGS+=-ldl
在安装nrpe的时候如果make报这个错误,则使用
export CFLAGS=-ldl
./configure
make all。
Nagios快速安装中文版需要工具:VMware Workstation、SSH Secure Shell Client、CentOS5.3首先安装好CentOS5.3,建议使用命令行界面安装。
安装完后用SSH Secure Shell Client连接服务器可直接复制粘帖安装配置Nagios安装需要root权限,先确保已经安装以下软件包ApacheGCC compilerGD development libraries如果没有安装,可以用yum来自动安装这些软件包,需要连接网络或者配置好yum的安装源比如CDROMyum install httpdyum install gccyum installglibcglibc-commonyum installgdgd-devel1) 创建nagios帐号信息并且设置好密码su -l/usr/sbin/useradd -m nagiospasswdnagios会要求输入密码创建nagcmd 组,并把nagios和apache加入到该组中/usr/sbin/groupaddnagcmd/usr/sbin/usermod -a -G nagcmdnagios/usr/sbin/usermod -a -G nagcmd apache2) 下载nagios和nagios的插件(根据最新版本,安装包名会有所变动)mkdir ~/downloadscd ~/downloadswget /download/nagios-3.0.6.tar.gzwget /download/nagios-plugins-1.4.13.tar.gz3) 编译和安装nagioscd ~/downloadstar xzf nagios-3.0.6.tar.gzcd nagios-3.0.6运行nagios的配置脚本,开始配置nagios./configure --with-command-group=nagcmd编译nagios源码包,make命令需要调用当前目录下的Makefile的文件,执行make时不能离开现在这个目录make all安装二进制文件,初始化脚本,sample的配置文件,并且设置目录权限make installmake install-initmake install-configmake install-commandmode4) 个性化的配置(可不设置)在/usr/local/nagis/etc/目录下已经安装了一些配置文件的样本,可以根据需要修改里面的配置。
服务器性能监控工具ZabbixNagios和Prometheus的选择与使用在现代信息技术快速发展的背景下,服务器性能监控工具成为企业和个人管理服务器的重要利器。
其中,Zabbix、Nagios和Prometheus是市场上广受欢迎的三种性能监控工具。
本文将从功能特点、易用性、扩展性和适用场景等方面,对Zabbix、Nagios和Prometheus进行比较分析,帮助读者选择并使用最合适的服务器性能监控工具。
一、ZabbixZabbix是一个成熟而强大的开源性能监控工具,被广泛应用于企业级网络环境。
Zabbix的主要功能特点包括四个方面:监控、警报、可视化和自动化。
首先,Zabbix具备全面的监控功能,可以监控服务器的CPU利用率、内存使用率、网络流量、磁盘IO等重要指标,实时了解服务器的性能状况。
其次,Zabbix支持配置警报策略,当服务器性能异常时,可以通过邮件、短信等方式及时通知管理员,以便及时采取措施解决问题。
再次,Zabbix提供直观的可视化界面,可以以图表、表格等形式展示服务器性能指标的历史数据,便于管理员分析趋势和进行容量规划。
最后,Zabbix支持自动化功能,可以通过脚本、API等方式自动处理异常事件,提高故障响应效率。
Zabbix的易用性方面,它提供了直观友好的Web界面,管理员可以通过Web界面完成配置、监控和数据展示等操作,无需深入了解复杂的命令行参数。
此外,Zabbix提供丰富的文档和社区支持,用户可以轻松获取相关帮助和资源。
Zabbix的扩展性方面表现突出。
它支持各种操作系统的监控,包括Windows、Linux、Unix等。
同时,Zabbix还支持多种数据库,如MySQL、PostgreSQL等。
此外,Zabbix提供了丰富的插件和API,可以方便地与其他系统进行集成,满足不同用户的需求。
适用场景上,Zabbix适用于中大型企业或服务器数量较多的场景,具备完备的监控和管理功能。
安装nrpe时提示错误:configure: error: cannot find ssl headers怎么办?
安装nrpe,编译的时候提示以下信息checking for SSL headers... configure: error: Cannot find ssl headers
原因是缺少openssl-devel包,yum -y install openssl-devel 问题解决!
nagios 执行check_disk时报错“NRPE: Command
nagios 执行check_disk时报错“NRPE: Command 'check_disk' not defined”
在网上找了半天的解决方法。
例如:/youth402/blog/item/cc5e72184f24a00035fa41f6.html 最后才发现和链接的问题类似我在nrpe.cfg没有定义check_disk
我的nrpe.cfg内容:
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/hda1
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200
正确的nrpe.cfg内容:
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_sda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200
command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20 -c 10
关于nagios执行主机命令时提示"可能是CGI的认证功能没有开启"问题的解决
关于在中文版nagios执行主机命令时提示"可能是CGI的认证功能没有开启"的解决方案,在站长的指导下,终于得到解决,非常感谢站长;我把解决方案分享一下给大家: 提示内容:
认值没有开启。
可能是CGI的认证功能没有开启
在没有认证的情况下,Nagios将不能保证使用的结果是正确的。
如果你确实想在无认证的情况下使用这个功能,可能要降低Nagios对权限认证的要求。
:-(
在线的HTML帮助里有关于CGI认证权限相关的设置信息以及为何你需要设置认证的内容。
解决方案:
vi /usr/local/nagios/etc/cgi.cfg
use_authentication=0 改成1即可。