Zabbix运维监控平台解决方案

合集下载

运维监控平台解决方案

运维监控平台解决方案

运维监控平台解决方案
《运维监控平台解决方案》
随着企业科技的发展,IT基础设施的复杂性和规模不断增加,运维监控变得至关重要。

然而,传统的手动监控方法已经远远不能满足当前的需求。

因此,许多企业正在寻找更高效和智能的解决方案来优化他们的运维监控。

在当前的云计算和大数据环境下,运维监控平台解决方案变得尤为重要。

这样的解决方案可以帮助企业实时监控其IT基础
设施的状态,发现并解决潜在的问题,从而提高系统的可靠性和稳定性。

在这个过程中,运维监控平台解决方案需要具备以下特点:
1. 自动化监控:运维监控平台需要能够自动监控和收集各种系统指标和日志,提供可视化的报表和图表,帮助管理员快速发现和诊断问题。

2. 实时警报:平台需要能够及时发出警报并给出解决方案,以便运维人员可以迅速采取行动,减少系统故障对业务的影响。

3. 大数据分析:平台需要具备大数据分析的能力,可以分析历史数据,识别系统的异常和趋势,并提供智能化的预测和建议。

4. 故障排查:平台需要提供全面的排查工具,帮助运维人员快速定位并解决故障,缩短故障修复的时间。

5. 安全性和可扩展性:平台需要具备强大的安全机制,确保数据的保密性和完整性。

同时需要具备良好的可扩展性,以应对不断增长的数据量和系统规模。

综上所述,运维监控平台解决方案是企业IT运维管理的重要工具,可以帮助企业提高系统的可靠性和稳定性,降低运维成本,提高服务质量。

因此,企业应该根据自身的需求和实际情况,选择适合自己的运维监控平台解决方案,并不断优化和升级,以应对未来的挑战。

zabbix简介

zabbix简介

zabbix简介1、什么是zabbixZabbix 是由Alexei Vladishev创建,⽬前由Zabbix SIA在持续开发和⽀持。

Zabbix 是⼀个企业级的分布式开源监控⽅案。

Zabbix是⼀款能够监控各种⽹络参数以及服务器健康性和完整性的软件。

Zabbix使⽤灵活的通知机制,允许⽤户为⼏乎任何事件配置基于邮件的告警。

这样可以快速反馈服务器的问题。

基于已存储的数据,Zabbix提供了出⾊的报告和数据可视化功能。

这些功能使得Zabbix成为容量规划的理想⽅案。

Zabbix⽀持主动轮询和被动捕获。

Zabbix所有的报告、统计信息和配置参数都可以通过基于Web的前端页⾯进⾏访问。

基于Web的前端页⾯可以确保从任何⽅⾯评估⽹络状态和服务器的健康性。

适当的配置后,Zabbix可以在IT基础架构监控⽅⾯扮演重要的⾓⾊。

对于只有少量服务器的⼩型组织和拥有⼤量服务器的⼤型公司也同样如此。

Zabbix是免费的。

Zabbix是根据GPL通⽤公共许可证第2版编写和发⾏的。

这意味着它的源代码都是免费发⾏的,可供公众任意使⽤。

2、zabbix功能和特性Zabbix是⼀个⾼度集成的⽹络监控解决⽅案,⼀个简单的安装包中提供多样性的功能。

数据收集可⽤性和性能检查⽀持SNMP(包括主动轮训和被动获取),IPMI,JMX,VMware监控⾃定义检查按照⾃定义的间隔收集需要的数据通过server/proxy+agents来执⾏灵活的阀值定义可以⾮常灵活的定义问题阈值,称之为触发器,触发器从后端数据库获取参考值⾼度可配置化的告警可根据递增机制,接收⽅和媒介类型⾃定义发送告警通知使⽤宏变量可以使告警通知更加⾼效有⽤⾃动相应动作可包含远程命令实时图表绘制使⽤内置图表绘制功能可以将监控项的内容实时绘制成图表Web监控功能Zabbix可以追踪模拟⿏标在Web⽹站上的点击操作,来检查Web的功能和响应时间丰富的可视化选项⽀持创建⾃定义的图表,⼀个试图集中展现多个监控项⽹络拓扑图以仪表盘的样式⾃定义⼤屏展现和幻灯⽚轮询播放报表监控内容的⾼级(业务)视图历史数据存储数据库数据可配置历史数据内置数据管理机制(housekeeping)配置简单将被监控对象添加为主机在数据库中获取主机进⾏监视应⽤模板来监控设备使⽤模板在模板中分组检查模板可以关联其他模板⽹络发现⾃动发现⽹络设备监控代理⾃动注册发现⽂件系统,⽹络接⼝和SNMP OID值快捷的Web界⾯PHP Web前端可从任何地⽅访问可以定制⾃⼰的操作⽅式审核⽇志Zabbix APIZabbix API为Zabbix 提供了对外的可编程接⼝,⽤于批量操作,第三⽅软件集成和其他⽬的权限管理系统安全⽤户认证特定⽤户可以限制访问特定的视图功能强⼤,易于扩展的agent部署在被监控对象上⽀持Linux和Windows⼆进制代码为了性能和更少内存的占⽤,⽤C语⾔编写便于移植为复杂环境准备使⽤Zabbix proxy代理服务器,使得远程监控更简单3、zabbix概述结构Zabbix由⼏个主要的软件组件构成,这些组件的功能如下。

如何使用Zabbix进行服务器监控

如何使用Zabbix进行服务器监控

如何使用Zabbix进行服务器监控服务器是现代网络应用的核心组件,它需要提供稳定、高效、安全的服务。

但是,服务器在运行过程中可能会出现各种问题。

例如,服务器可能会暂停服务,可能会出现磁盘空间不足的情况,可能会出现 CPU 使用率过高的情况等等。

这时,我们需要一种工具来监控服务器的运行情况,以便及时发现并解决问题。

Zabbix就是这样一种工具。

本文将介绍如何使用Zabbix 进行服务器监控。

一、安装 Zabbix安装 Zabbix 的过程有点复杂,这里不再详细说明,读者可以参考 Zabbix 的官方文档进行安装。

在安装完成之后,需要进行以下配置:1. 启动 Zabbix Server 和 Zabbix Agent。

在启动之前,需要检查Zabbix 的配置文件是否正确。

例如,检查 Zabbix Server 是否配置了正确的数据库信息,检查 Zabbix Agent 是否配置了正确的Server。

2. 配置监控主机。

在 Zabbix 中,需要通过监控主机来监控服务器。

每个监控主机都有一个唯一的Hostname。

在配置监控主机时,需要注意:a. 首先,需要在监控主机上安装 Zabbix Agent,并配置Agent 的 Server 变量。

b. 其次,需要在Zabbix Server 上配置监控主机的Hostname。

3. 配置监控项。

监控项是用来监控服务器指标的,例如 CPU使用率、磁盘空间等等。

每个监控项都有一个唯一的名称和一个采集间隔。

在配置监控项时,需要注意:a. 需要选择正确的监控项类型。

例如,CPU 使用率的监控项类型是 "Zabbix Agent (Active)",而磁盘空间的监控项类型是"Zabbix Agent (Passive)"。

b. 需要配置正确的监控项参数。

例如,CPU 使用率的监控项需要设置 CPU 核数,而磁盘空间的监控项需要设置磁盘挂载点。

服务器性能监控工具比较ZabbixvsNagiosvsPrometheus

服务器性能监控工具比较ZabbixvsNagiosvsPrometheus

服务器性能监控工具比较ZabbixvsNagiosvsPrometheus 服务器性能监控工具比较:Zabbix vs Nagios vs Prometheus服务器性能监控工具在现代IT运维中扮演着关键的角色,帮助管理员追踪服务器的性能、发现问题并做出相应的调整。

在众多的性能监控工具中,Zabbix、Nagios和Prometheus是备受关注且应用广泛的几个。

本文将对它们进行比较,帮助读者了解它们各自的特点和适用场景。

一、概述1. Zabbix:作为一个综合性的监控解决方案,Zabbix提供了广泛的功能,包括基于代理和无代理两种工作模式、分布式监控、通用状况数据收集等等。

它使用自主开发的Zabbix服务器采集和处理数据,并提供友好的用户界面进行展示和配置。

2. Nagios:作为一种最初的开源监控工具,Nagios以其可定制性和灵活性而受到青睐。

它通过插件机制支持各种各样的监控需求,并提供了一套丰富的报警选项。

Nagios通过运行插件来收集性能数据,并采用核心监控引擎进行处理和分析。

3. Prometheus:作为新一代的监控系统,Prometheus具有高效的数据存储和查询能力,以及强大的告警和通知功能。

它通过HTTP协议采集时间序列数据,并将其存储在本地数据库中。

Prometheus同时提供了灵活的查询语言以及可视化和报表功能,使得用户可以轻松地分析和展示监控数据。

二、层次与架构1. Zabbix:Zabbix采用客户端-服务器的架构,通常需要在每台被监控的主机上安装Zabbix代理程序。

代理程序负责定期收集性能数据,并将其发送到Zabbix服务器进行存储和分析。

这种架构能够支持大规模部署,但需要较多的配置和管理工作。

2. Nagios:Nagios同样采用客户端-服务器的架构,但不依赖代理程序。

相反,Nagios通过SSH、SNMP等协议直接与被监控主机通信,并使用插件进行性能数据的收集。

zabbix架构原理

zabbix架构原理

zabbix架构原理Zabbix是一种用于监控和管理网络设备、服务器以及应用程序的开源解决方案。

它的架构原理如下:1. 服务器端(Zabbix Server):Zabbix的核心组件,负责接收来自各个监控代理和其他组件的数据,并处理这些数据。

它还负责存储监控数据、配置告警规则和触发动作。

2. 监控代理(Zabbix Agent):安装在需要监控的目标主机上,负责收集主机的性能数据并将其发送给Zabbix Server。

监控代理可以通过主动模式或被动模式与服务器通信。

3. 数据库(Database):Zabbix使用关系型数据库(如MySQL、PostgreSQL等)存储监控数据、配置信息和历史记录。

数据库存储了整个Zabbix系统的状态和配置信息。

4. 前端界面(Frontend):Zabbix提供了一个用户友好的Web界面,用于配置监控项、显示监控数据、设置报警规则等。

前端界面与服务器通过HTTP或HTTPS 协议进行通信。

5. 触发器(Triggers):Zabbix使用触发器定义在特定条件下触发报警动作的规则。

例如,当CPU利用率超过某个阈值时,触发器会触发相应的报警。

6. 动作(Actions):Zabbix的动作定义了在触发器满足条件时执行的操作,例如发送电子邮件、短信通知或运行脚本。

7. 监控项(Items):监控项定义了需要收集和监控的数据类型,可以是CPU利用率、内存使用量、网络流量等。

Zabbix支持多种监控方式,如简单检查、SNMP、JMX、IPMI等。

8. 图形和报表(Graphs and Reports):Zabbix可以生成各种图形和报表,以直观地展示监控数据的变化趋势和性能指标。

总体来说,Zabbix的架构包括服务器端、监控代理、数据库、前端界面以及触发器、动作、监控项、图形和报表等组件。

通过这些组件的协同工作,Zabbix实现了对网络设备、服务器和应用程序的全面监控和管理。

【Zabbix实战之部署篇】docker部署Zabbix+grafana监控平台

【Zabbix实战之部署篇】docker部署Zabbix+grafana监控平台

【Zabbix实战之部署篇】docker部署Zabbix+grafana监控平台随着互联网技术的发展,企业内部的IT基础设施和业务系统越来越复杂和庞大,为了保障服务的稳定性和可靠性,必须对IT基础设施和业务系统进行全方位的监控。

而Zabbix+grafana监控平台,是一种非常优秀的监控方案。

在这篇文章中,我们将介绍如何使用docker部署Zabbix+grafana监控平台。

根据我们的实践经验,docker部署有以下几个优点:1.快捷方便:使用docker可以省去繁琐的安装和配置过程,只需要几个简单的命令就可以完成整个部署过程。

2.可移植性:使用docker部署的Zabbix+grafana监控平台,可以方便地从一台主机迁移到另一台主机,而不需要再进行重新安装和配置。

3.隔离性:使用docker可以将Zabbix和grafana分别部署在独立的容器中,从而实现更好的隔离性和安全性。

接下来,我们将按照以下步骤,一步一步地介绍如何使用docker部署Zabbix+grafana监控平台:步骤1.安装docker如果您已经安装了docker,可以跳过这一步。

在这里,我们以CentOS系统为例,介绍如何安装docker。

1) 安装必要的一些系统工具sudo yum install -y yum-utils device-mapper-persistent-data lvm22) 添加Docker软件包源sudo yum-config-manager --add-repo3) 安装Docker CEsudo yum install docker-ce4) 启动Dockersudo systemctl start docker步骤2.部署Zabbix1) 下载Zabbix镜像docker pull zabbix/zabbix-server-mysql:latest 2) 启动Zabbix容器docker run --name zabbix-server-mysql -t \-e MYSQL_USER="zabbix" \-e MYSQL_PASSWORD="zabbix" \-e MYSQL_DATABASE="zabbix" \-p 8080:80 -p 10051:10051 \--link zabbix-mysql:mysql \-d zabbix/zabbix-server-mysql:latest说明:--name:指定容器名称为zabbix-server-mysql。

Zabbix运维---zabbixserver的高可用解决方案

Zabbix运维---zabbixserver的高可用解决方案

Zabbix运维---zabbixserver的⾼可⽤解决⽅案实验环境[root@agent ~]# cat /etc/redhat-releaseCentOS release 6.7 (Final)[root@agent ~]# sestatusSELinux status: disabled[root@agent ~]# /etc/init.d/iptables stopssh优化GSSAPIAuthentication noUseDNS no本次实验⼀共准备了,三台机器主机名ip软件环境zabbix-server01192.168.56.29httpd+php+keepalived+sshpasszabbix server+agentzabbix-server02192.168.56.30httpd+php+keepalived+sshpasszabbix server+agentagent192.168.56.99zabbix agent+mysqlVIP规划:192.168.56.66本⽂中⽤到了sshpass免密钥交互,也可以做ssh相互免密钥登录zabbix server的⾼可⽤,我试过在agent配置⽂件中,使⽤VIP,发现不能正常监控,于是才有本⽂。

我的做法agent中的配置⽂件,Server和ServerActive中分别都配置了两个ip,就是为了保证,zabbix-server01宕机了,还可以把监控数据发往zabbix-server02,由于两个zabbix-server共⽤⼀个数据库,肯定不能同时往数据库写数据,于是我想到了使⽤keepalived来控制zabbix server的开关,做到VIP在哪,那台机器的zabbix server就启动,另外⼀台关闭,⽽zabbix的web页⾯使⽤VIP去访问本⽂把zabbix数据库独⽴出来,为了⽅便做mysql⾼可⽤集群⾸先在zabbix-server01rpm -ivh /zabbix/zabbix/3.0/rhel/6/x86_64/zabbix-release-3.0-1.el6.noarch.rpmvim /etc/yum.repos.d/zabbix.repo修改两处bashurlbaseurl=/zabbix/zabbix/3.0/rhel/6/x86_64/baseurl=/zabbix/non-supported/rhel/6/x86_64/因为zabbix3.0需要php5.4以上,这⾥安装⼀个php的yum源rpm -ivh /yum/el6/latest.rpm安装httpd和phpyum install httpd -yyum install php55w php55w-mysql php55w-common php55w-gd php55w-mbstring php55w-mcrypt php55w-devel php55w-xml php55w-bcmath -y安装zabbixyum install -y zabbix-agent.x86_64 zabbix-get.x86_64 zabbix-server-mysql.x86_64 zabbix-web.noarch zabbix-web-mysql.noarch\cp -R /usr/share/zabbix/ /var/www/html/sed -i 's#^post_max_size = 8M#post_max_size = 16M#g' /etc/php.inised -i 's#^max_execution_time = 30#max_execution_time = 300#g' /etc/php.inised -i 's#^max_input_time = 60#max_input_time = 300#g' /etc/php.inised -i '883a date.timezone = Asia/shanghai' /etc/php.inised -i '276a ServerName 127.0.0.1:80' /etc/httpd/conf/httpd.confscp /usr/share/doc/zabbix-server-mysql-3.0.5/create.sql.gz root@192.168.56.99:/opt在agent上yum install -y zabbix-agent.x86_64yum install -y mysql-server mysql-devel mysql/etc/init.d/mysqld startmysql -e "create database zabbix character set utf8 collate utf8_bin;"mysql -e "show databases;"mysql -e "grant all on zabbix.* to zabbix@'192.168.56.%' identified by '123456';"mysql -e "select user,host from er"zcat /opt/create.sql.gz |mysql -uzabbix -p123456 zabbix在zabbix-server01上sed -i '81a DBHost=192.168.56.99' /etc/zabbix/zabbix_server.confsed -i '116a DBPassword=123456' /etc/zabbix/zabbix_server.conf/etc/init.d/httpd start/etc/init.d/zabbix-server start/etc/init.d/zabbix-agent start打开浏览器进⾏安装安装完成后scp /etc/zabbix/web/zabbix.conf.php root@192.168.56.30:/opt在zabbix-server02rpm -ivh /zabbix/zabbix/3.0/rhel/6/x86_64/zabbix-release-3.0-1.el6.noarch.rpm修改两处bashurlvim /etc/yum.repos.d/zabbix.repobaseurl=/zabbix/zabbix/3.0/rhel/6/x86_64/baseurl=/zabbix/non-supported/rhel/6/x86_64/安装httpd和phprpm -ivh /yum/el6/latest.rpmyum install httpd -yyum install php55w php55w-mysql php55w-common php55w-gd php55w-mbstring php55w-mcrypt php55w-devel php55w-xml php55w-bcmath -y 安装zabbixyum install -y zabbix-agent.x86_64 zabbix-get.x86_64 zabbix-server-mysql.x86_64 zabbix-web.noarch zabbix-web-mysql.noarch\cp -R /usr/share/zabbix/ /var/www/html/sed -i 's#^post_max_size = 8M#post_max_size = 16M#g' /etc/php.inised -i 's#^max_execution_time = 30#max_execution_time = 300#g' /etc/php.inised -i 's#^max_input_time = 60#max_input_time = 300#g' /etc/php.inised -i '883a date.timezone = Asia/shanghai' /etc/php.inised -i '276a ServerName 127.0.0.1:80' /etc/httpd/conf/httpd.confsed -i '81a DBHost=192.168.56.99' /etc/zabbix/zabbix_server.confsed -i '116a DBPassword=123456' /etc/zabbix/zabbix_server.conf\mv /opt/zabbix.conf.php /etc/zabbix/web//etc/init.d/httpd start注意:⼀个主机上有两个IP,限制我从那个IP地址出去取值修改如下三处:vi /etc/zabbix/zabbix_agentd.confServer=192.168.56.30,192.168.56.29ServerActive=192.168.56.30,192.168.56.29Hostname=192.168.56.99修改完成如下/etc/init.d/zabbix-agent start在zabbix-server01和zabbix-server02上分别安装keepalived的zabbix-server01配置⽂件如下cat /etc/keepalived/keepalived.conf! Configuration File for keepalivedglobal_defs {router_id LVS_DEVEL 29}vrrp_instance VI_1 {state BACKUPinterface eth0virtual_router_id 51priority 150advert_int 1authentication {auth_type PASSauth_pass 1111}virtual_ipaddress {192.168.56.66}notify_master /opt/to_master.sh}cat /opt/to_master.sh#!/bin/bashsshpass -p 123456 ssh -o StrictHostKeyChecking=no root@192.168.56.30"/etc/init.d/zabbix-server stop" /etc/init.d/zabbix-server startzabbix-server02配置⽂件如下cat /etc/keepalived/keepalived.conf! Configuration File for keepalivedglobal_defs {router_id LVS_DEVEL 30}vrrp_instance VI_1 {state BACKUPinterface eth0virtual_router_id 51priority 100advert_int 1authentication {auth_type PASSauth_pass 1111}virtual_ipaddress {192.168.56.66}notify_master /opt/to_master.sh}[root@zabbix3 zabbix]# cat /opt/to_master.sh#!/bin/bashsshpass -p 123456 ssh -o StrictHostKeyChecking=no root@192.168.56.29"/etc/init.d/zabbix-server stop" /etc/init.d/zabbix-server start下⾯是测试两台zabbix server都启动keepalived的zabbix-server01 启动zabbix serverzabbix-server02不启动zabbix serverzabbix-server01状态如下zabbix-server02状态如下模拟zabbix-server01宕机,keepalived不⼯作了再测试飘回来查看数据历史间隔,发现会丢失个别监控项的⼀次监控数据由于两台zabbix-server只会同时开启⼀台,所有agent的⽇志如下。

监控运维方案

监控运维方案

监控运维方案第1篇监控运维方案一、概述本监控运维方案旨在确保信息系统稳定、安全、高效运行,降低系统故障风险,提升运维团队工作效率。

通过对关键业务系统、网络设备、安全设备进行实时监控,实现对系统性能、安全状况的全面掌握,为我国企事业单位提供专业、高效的监控运维服务。

二、监控范围1. 业务系统监控:包括但不限于数据库、中间件、Web服务器、应用服务器等关键业务系统。

2. 网络设备监控:包括路由器、交换机、防火墙等网络设备。

3. 安全设备监控:包括入侵检测系统、安全审计系统、漏洞扫描系统等安全设备。

4. 系统性能监控:包括CPU、内存、磁盘I/O、网络流量等系统性能指标。

5. 数据中心基础设施监控:包括电源、空调、UPS等基础设施。

三、监控工具与平台1. 采用开源监控工具Nagios、Zabbix等,结合商业监控平台进行部署。

2. 监控工具应具备以下功能:a. 自动发现和监控网络设备、服务器、应用服务等。

b. 支持多种报警方式,如短信、邮件、电话等。

c. 提供性能数据统计、分析和报表功能。

d. 支持分布式部署,易于扩展。

3. 监控平台应具备以下特点:a. 高可用性:确保监控平台自身稳定运行。

b. 安全性:对监控数据进行加密存储和传输。

c. 易用性:提供友好的用户界面,便于运维人员操作。

四、监控策略与流程1. 制定监控策略:a. 根据业务系统、网络设备、安全设备的特点,制定相应的监控策略。

b. 确定监控指标、阈值、报警级别等。

c. 定期对监控策略进行评估和优化。

2. 监控流程:a. 自动化监控:通过监控工具自动发现和监控设备、系统。

b. 报警处理:当监控指标超过阈值时,触发报警,通知运维人员。

c. 故障排查:运维人员接收到报警后,立即进行故障排查。

d. 故障处理:根据故障原因,采取相应的措施予以解决。

e. 故障总结:对故障原因、处理过程进行总结,提高运维水平。

五、人员与职责1. 运维团队:a. 运维经理:负责监控运维方案的制定、优化和监督执行。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Zabbix运维监控解决方案
目录
一、背景......................................................... 错误!未定义书签。

二、目标......................................................... 错误!未定义书签。

监控的基本内容............................................错误!未定义书签。

三、采用的软件................................................... 错误!未定义书签。

四、软件的特点................................................... 错误!未定义书签。

五、软件的优势................................................... 错误!未定义书签。

系统架构..................................................错误!未定义书签。

监控实现方式:............................................错误!未定义书签。

监控指标..................................................错误!未定义书签。

规则引擎..................................................错误!未定义书签。

一、背景
网站平台部署运行后会出现各种各样的故障,比如服务器CPU负载高,磁盘容量使用超过80%,内存使用超过阈值,系统进程多,tomcat服务宕机等问题都会给公司平台稳定和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24小时监控您的网站,一旦网站发生异常,会有报警提醒您,如邮件,微信,电话,短信,及时避免流量损失。

Zabbix是一个企业级的开源分布式监控解决方案,它是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。

zabbix具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图表绘制)支持自动发现网络设备和服务器;支持分布式,能集中展示、管理分布式的监控点;扩展性强,server 提供通用接口,可以自己开发完善各类监控。

zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD,OS X等平台上。

二、目标
物理范围:
组件:硬件,OS,存储,中间件,数据库,机房,网络等
维度:可用性,性能。

指标:见下。

监控的基本内容
性能数据基本CPU,磁盘,网络,内存等关系系统正常运行的基本指标。

端口状态一般交换机或网络设备,端口启动状态,流量大小,网络状态
日志内容日志内容监控,系统日志,应用程序日志,错误信息。

系统状态 DB ,OS,中间件等的系统状态
硬件状态硬盘状态,风扇,电池,内存,主板等系统状态
机房状态 UPS,机柜电功率,机房电功率,机房温度,湿度,空气质量,漏水,消防,人员出入,机房门状态,机柜门状态,红外线,图像,防盗等
应用状态程序启动时间,网站访问速度等。

三、采用的软件
软件名称: ZABBIX LTS
四、软件的特点
zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。

zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供柔软的报警机制以让系统管理员快速定位/解决存在的各种问题,其真正的可扩展性,高可用性,易用性,灵活性,极大地降低了企业的总成本,是目前最受欢迎的解决方案
五、软件的优势
1.企业级开源监控方案
2. 各组件分离
Zabbix由3部分构成,zabbix server,Web front,zabbix DB,Zabbix Proxy与可选组件zabbix agent。

3 监控方式
zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X,W等agent 配置文件中,根据要求编写脚本,将定期执行该脚本获取指定的信息。

格式:
UserParameter=,/etc/z平台上。

4支持自定义监控
Zabbix agent支持脚本监控,只需要在
abbix/zabbix_agentd/custom_updatescript
5支持远程执行命令
允许指定的server,调用agent本机系统命令,获取相关信息。

6硬件配置信息采集
zabbix agent需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU等信息的收集。

7丰富的可视化功能,包括仪表盘,自定义图表和网络拓扑功能
8代理支持的系统版本
zabbix agent可以运行在Linux ,Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X, Tru64/OSF1, Windows , Windows 2000/2003/XP/Vista)等系统之上。

9支持无代理监控方式
Zabbix server 可以支持fping ,对网络通畅,丢包率,错误率,重传等的监控
10支持Web网站的自动登录测试
可以支持对web网站的自动登录测试,并对登录结果进行匹配和测试。

11 核心功能
zabbix server可以单独监视远程服务器的服务状态;同时也可以与zabbix agent配合,可以轮询zabbix agent主动接收监视数据(trapping方式),同时还可被动接收zabbix agent发送的数据(trapping方式)。

另外zabbix server还支持SNMP (v1,v2),可以与SNMP软件(例如:net-snmp)等配合使用。

12 支持分布式监控
Zabbix proxy 为分布式服务器的一种实现方式。

Zabbix proxy 和zabbix server 同步config。

Zabbix proxy 主动轮训zabbix agent,将数据采集到zabbix proxy的数据库中,将数据,zabbix proxy 使用一个进程将数据同步到zabbix sever上。

如果发生proxy联系不到server ,将对在本地数据库保持2天的数据,网络联通或server可以通信后,proxy将对把数据重新传送到server。

准备采用的软件:zabbix LTS
系统架构
监控实现方式:
OS 安装Agent,zabbix server 设置监控配置项,采集结果。

网络设备通过SNMP,zabbix Server开启snmppoller进程轮询SNMP,根据SNMP查询结果
存储设备一般通过API方式,没有API的,采用登陆设备上,返回命令采集结果,对采集结果进行格式化。

数据库一般为通过插件,第二种为通过集中库,对数据库进行读取。

硬件通过IPMI方式,获取相关硬件信息,如风扇,温度,电池,硬盘,内存插槽等硬件环境信息。

机房监控通过API方式,直接调用机房环境监控系统的数据。

中间件通过JMX 监控,MQ 或其他的memo cache 通过编写脚本并格式化输出。

应用:通过嵌入Jar包,程序轮询,将相关信息收集到本地,然后推送到监控服务器上业务:通过将数据库中的数据采集,查询发送给监控服务器。

监控指标
Number Type Case备注
1
CPU
Load Average
2CPU Utilization
3
Memory
Memory Utilization
规则引擎
1、警报触发机制:
规则引擎,查询zabbix 监控数据DB中的事件,根据系统架构编写,根据指标或触发器,生成事件,规则引擎对事件和系统的的负责人,显示警报内容。

2、警报的校验:
对任何警报,通过3种的间接方式验证,如果在3个网段发生的事件进行校验,如果发生两个重复的警报内容,则触发警报。

3、警报的发送方式:
事件平台,邮件,微信,电话和短信
现阶段,事件为统一平台事件平台
4、警报推送方式:
PUSH方式,即根据CMDB中的系统的负责组的信息进行定位目标人群,群组人员信息由负责人负责。

规则引擎,警报发送调度
警报规则。

相关文档
最新文档