Zabbix 介绍

本贴最后更新于 2451 天前,其中的信息可能已经时移世异

关于 Zabbix

Zabbix 是一个分布式开源监控系统,支持多种数据采集方式,有专用的数据采集 Agent,支持 SNMP, IPMI, JMX, Telnet, SSH 等多种协议,支持将采集到的数据存放到数据库中,对数据进行分析整理,触发告警,灵活的扩展性和丰富的功能是其他监控系统不能比的。

支持的监控方式

Agent, SNMP, IPMI, JMX

支持的数据库

MySQL, PostgreSQL

告警方式

E-Mail, Script(通过脚本来调用相关 API 发送告警,如短信,微信),其他内置的告警方式大陆无法使用。

支持告警升级,比如出现故障时首先发给管理员 A,如果一段时间后故障仍未解决,那就继续将告警通知给管理员 B。

支持远程命令,比如出现一个服务宕掉了,服务端发送一条命令给 Agent 尝试重新启动该服务,如果到第二个采集周期任然有故障才发送告警通知

Zabbix 组件

  • Zabbix Server
    负责接受 agent 发送的报告信息的核心组件,所有配置、统计数据及操作数据均由 zabbix server 组织进行;

  • Database Storage
    专用于存储所有配置信息,以及由 zabbix 收集的数据;

  • Web Interface
    zabbix 的 GUI 接口,通常与 Server 运行在同一台主机上;

  • Proxy
    可选组件,主要用于分布式监控环境中,代理 Server 收集部分被监控端的监控数据并统一发送给 Server 端;

  • Agent
    部署在被监控主机上,负责手机本地数据并发往 Server 端或 Proxy 端;

Zabbix 常用术语

  • host(主机)
    要监控的设备,可有 IP 或 DNS 名称指定;

  • host group(主机组)
    主机的逻辑容器,可以包含主机和模板,但同一个组内的主机和模板不能互相链接。主机组通常在给用户或者用户组指派监控权限时使用;

  • item(监控项)
    一个特定监控指标的相关数据,这些数据来自被监控对象。item 是 zabbix 进行数据收集的合兴,没有 item,将没有数据。相对某监控对象,每个 item 都由 “key” 进行表示;

  • trigger(触发器)
    一个表达式,用于评估某监控对象的某特定 item 内所今收到的数据是否在合理范围内,即阈值,接收到的数据量不在阈值范围内是,触发器状态从 “OK” 转为 “Problem”,当数据量回归到合理范围时,状态从 “Problem” 转为 “OK”;

  • event(事件)
    发生的一个值得关注的事件,例如触发器的状态转变,新的 agent 或重新上线的 agent 的自动注册等;

  • action(动作)
    指对于特定事件事先定义的处理方法,通过包含操作(如发送通知)和条件(何时执行操作);

  • escalation(告警升级)
    发送告警或执行远程命令的自定义方案,如每个五分钟发送一次告警,共发送五次等;

  • media(媒介)
    发送通知的方式或通道,如 EMail 等;

  • notification(通知)
    通过选定的媒介向管理人员发送的有关某事件的信息;

  • remote command(远程命令)
    预定义的命令,可在被监控主机处于某特定条件下时自动执行;

  • template(模板)
    用于快速定义被监控主机的预设条目集合,通常包含了 item, trigger, graph, screen, application 以及 low-level discovery rule;模板可以直接链接至单个主机;

  • application(应用)
    一组 item 的集合;

  • web scennario(web 场景)
    用于检测 web 站点可用性的一个或多个 HTTP 请求;

  • frontend(前端)
    Zabbix 的 WEB 接口;

Zabbix 的逻辑架构

4c042784309d4747929d1f90be5334d2-zabbixlogicarchimg.png

END!

相关帖子

回帖

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...