当前位置:文档之家› Zabbix运维监控平台解决方案课件.doc

Zabbix运维监控平台解决方案课件.doc

Zabbix运维监控平台解决方案课件.doc
Zabbix运维监控平台解决方案课件.doc

Zabbix运维监控解决方案

目录

一、背景 (3)

二、目标 (3)

监控的基本内容 (4)

三、采用的软件 (4)

四、软件的特点 (5)

五、软件的优势 (5)

系统架构 (7)

监控实现方式: (8)

监控指标 (8)

规则引擎 (9)

一、背景

网站平台部署运行后会出现各种各样的故障,比如服务器CPU 负载高,磁盘容量使用

超过80% ,内存使用超过阈值,系统进程多,tomcat 服务宕机等问题都会给公司平台稳定

和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24 小时监控您的网站,

一旦网站发生异常,会有报警提醒您,如邮件,微信,电话,短信,及时避免流量损失。

Zabbix 是一个企业级的开源分布式监控解决方案,它是一个基于WEB 界面的提供分

布式系统监视以及网络监视功能的企业级的开源解决方案。

zabbix 具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP 等通用协议监控、多种告警方式、详细的报表图表绘制)支持自动发

现网络设备和服务器;支持分布式,能集中展示、管理分布式的监控点;扩展性强,server 提供通用接口,可以自己开发完善各类监控。

zabbix server 可以通过SNMP ,zabbix agent ,ping ,端口监视等方法提供对远程

服务器/ 网络状态的监视,数据收集等功能,它可以运行在Linux ,Solaris ,HP-UX ,AIX ,Free BSD ,Open BSD ,OS X 等平台上。

二、目标

物理范围:

组件:硬件,OS,存储,中间件,数据库,机房,网络等

维度:可用性,性能。

指标:见下。

监控的基本内容

性能数据基本CPU ,磁盘,网络,内存等关系系统正常运行的基本指标。

端口状态一般交换机或网络设备,端口启动状态,流量大小,网络状态

日志内容日志内容监控,系统日志,应用程序日志,错误信息。

系统状态DB ,OS,中间件等的系统状态

硬件状态硬盘状态,风扇,电池,内存,主板等系统状态

机房状态UPS,机柜电功率,机房电功率,机房温度,湿度,空气质量,漏水,消防,人员出入,机房门状态,机柜门状态,红外线,图像,防盗等

应用状态程序启动时间,网站访问速度等。

三、采用的软件

软件名称:ZABBIX 4.0 LTS

四、软件的特点

zabbix 是一个基于WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解

决方案。zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供柔软的报警机

制以让系统管理员快速定位/ 解决存在的各种问题,其真正的可扩展性,高可用性,易用性,灵活性,极大地降低了企业的总成本,是目前最受欢迎的解决方案

五、软件的优势

1.企业级开源监控方案

2. 各组件分离

Zabbix 由3 部分构成,zabbix server ,Web front ,zabbix DB ,Zabbix Proxy 与可选组件zabbix agent 。

3 监控方式

zabbix server 可以通过SNMP ,zabbix agent ,ping ,端口监视等方法提供对远程

服务器/ 网络状态的监视,数据收集等功能,它可以运行在Linux, Solaris, HP-UX, AIX, Free

BSD, Open BSD, OS X,W 等agent 配置文件中,根据要求编写脚本,将定期执行该脚本获取指定的信息。

格式:

UserParameter=custom.updatescript,/etc/z 平台上。

4 支持自定义监控

Zabbix agent 支持脚本监控,只需要在

abbix/zabbix_agentd/custom_updatescript

5 支持远程执行命令

允许指定的server ,调用agent 本机系统命令,获取相关信息。

6 硬件配置信息采集

zabbix agent 需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU 等信息的收集。

7 丰富的可视化功能,包括仪表盘,自定义图表和网络拓扑功能

8 代理支持的系统版本

zabbix agent 可以运行在Linux ,Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X, Tru64/OSF1, Windows NT4.0, Windows 2000/2003/XP/Vista) 等系统之上。

9 支持无代理监控方式

Zabbix server 可以支持fping ,对网络通畅,丢包率,错误率,重传等的监控

10 支持Web 网站的自动登录测试

可以支持对web 网站的自动登录测试,并对登录结果进行匹配和测试。

11 核心功能

zabbix server 可以单独监视远程服务器的服务状态;同时也可以与zabbix agent 配合,可以轮询zabbix agent 主动接收监视数据(trapping 方式),同时还可被动接收zabbix agent 发送的数据(trapping 方式)。

另外zabbix server 还支持SNMP (v1,v2) ,可以与SNMP 软件(例如:net-snmp) 等

配合使用。

12 支持分布式监控

Zabbix proxy 为分布式服务器的一种实现方式。

Zabbix proxy 和zabbix server 同步config 。Zabbix proxy 主动轮训zabbix agent ,将数据采集到zabbix proxy 的数据库中,将数据,zabbix proxy 使用一个进程将数据同

步到zabbix sever 上。

如果发生proxy 联系不到server ,将对在本地数据库保持 2 天的数据,网络联通或server 可以通信后,proxy 将对把数据重新传送到server 。

准备采用的软件:zabbix 4.0 LTS

系统架构

监控实现方式:

OS 安装Agent ,zabbix server 设置监控配置项,采集结果。

网络设备通过SNMP ,zabbix Server 开启snmppoller 进程轮询SNMP ,根据SNMP 查询结果

存储设备一般通过API 方式,没有API 的,采用登陆设备上,返回命令采集结果,对采

集结果进行格式化。

数据库一般为通过插件,第二种为通过集中库,对数据库进行读取。

硬件通过IPMI 方式,获取相关硬件信息,如风扇,温度,电池,硬盘,内存插槽等硬

件环境信息。

机房监控通过API 方式,直接调用机房环境监控系统的数据。

中间件通过JMX 监控,MQ 或其他的memo cache 通过编写脚本并格式化输出。

应用:通过嵌入Jar 包,程序轮询,将相关信息收集到本地,然后推送到监控服务器上

业务:通过将数据库中的数据采集,查询发送给监控服务器。

监控指标

Number Type Case 备注

1 Load Average

CPU

2 CPU Utilization

3 Memory Utilization

4 Swap /pagfile Utilization

Memory

5 Network Transfer

6 Network Error /Drop

Packet

7 File System Utilization

Disk

8 Disk I/O

9 Process Monitoring

10 Windows Service

11 TCP Port Connectivity

Service

12 TCP Port Response Time

13 DNS Monitoring

14 NTP Monitoring

15 Text Log

Log

16 EventLog

17 File File Monitoring

18 Performance

Other

counter(windows)

规则引擎

1、警报触发机制:

规则引擎,查询zabbix 监控数据DB 中的事件,根据系统架构编写,根据指标或触发器,生成事件,规则引擎对事件和系统的的负责人,显示警报内容。

2、警报的校验:

对任何警报,通过 3 种的间接方式验证,如果在 3 个网段发生的事件进行校验,如果

发生两个重复的警报内容,则触发警报。

3、警报的发送方式:

事件平台,邮件,微信,电话和短信

现阶段,事件为统一平台事件平台

4、警报推送方式:

PUSH 方式,即根据CMDB 中的系统的负责组的信息进行定位目标人群,群组人员信息由负责人负责。

CMDB

获取系统负责人

获取所有事件规则引擎,警报发送调度

警报规则

发送邮件报警

Zabbix DB

邮件服务器

展现事件及警报

Web 警报事件展示台

相关主题
文本预览
相关文档 最新文档