Zabbix通过SNMP监控HP服务器硬件信息

Zabbix通过SNMP监控HP服务器硬件信息
Zabbix通过SNMP监控HP服务器硬件信息

Zabbix通过SNMP监控HP服务器硬件信息关于Zabbix监控服务器硬的件信息,Zabbix官方网站没有提到这方面的监控思路和方法。之前我写的博文中写过关于HP服务器硬件监控的文章,大致的思路是借助HP管理工具通过脚本的方式取出硬件的信息,然后以trapper的方式通过进行监控,得到好多博友的支持,在此特别感谢。

通过脚本的方式监控服务器硬件信息,有以下三个缺点:

1) 通过agent的方式监控会超时,取不到值。

2)通过trapper的方式需要每台机器添加crontab,部署起来麻烦。

3)脚本通用性差,只适合Windows机器。

4)G8的服务器执行管理命令非常慢。

由于通过脚本监控硬件有以上几个缺点,因此后来研究了HP代理。通过HP代理和SNMP 监控HP服务器的硬件,需要安装snmp服务和HP代理工具。

1.#需要安装的软件包

2.yum install -y net-snmp net-snmp-util

3.hpacucli-9.40-12.0.x86_6

4.rpm

4.hp-snmp-agents-9.40-2506.37.rhel6.x86_64.rpm

5.hp-health-9.40-1602.44.rhel

6.x86_64.rpm

6.#SNMP安装完成后需要修改snmpd.conf的配置文件。

7.dlmod cmaX /usr/lib/libcmaX.so

8.rwcommunity sfzhang 127.0.0.1 #可读可写

9.rocommunity public 127.0.0.1 #只读

10.syscontact Root

11.syslocation Shanghai China

12.view all included .1 80

13.access notConfigGroup "" any noauth exact all none no

ne

14.#启动相关的服务

15./etc/init.d/hp-snmp-agents start

16./etc/init.d/hp-health start

17./etc/init.d/snmpd start

然后通过snmpwalk命令测试是否可以获取数据,下面获取的是HP服务器各部件的实际温度值。

创建监控模板,通过Zabbix Low-level discovery 可以自动创建监控项,触发器和图像。Zabbix官方文档中LLD支持以下三种监控自动发现:

1)文件系统自动发现

2)服务器网卡的自动发现

3)SNMP OID的自动发现

下面通过第三种方法来监控HP服务器硬件信息,以SNMP监控HP服务器阵列卡为例子来说明一下实现原理。

1)首先创建监控模板和Applications。

2)点击模板的discovery->Create discovery rule。

3)创建监控项目Create item prototype。HP代理中的MIB信息没有被解析成具体的设备名称,因此Name中的#SNMPVALUE就是为了区分多个设备名称,如

HardDisk_0_status,HardDisk_1_status表示第一个硬盘和第二个硬盘的状态。

4)创建触发器Create trigger prototype。HP服务器硬盘,阵列卡,逻辑磁盘等的状态正常返回值都是2,如果不是2,说明有问题,触发报警。

5)用同样的方法可以监控HP硬盘的状态,逻辑磁盘的状态,风扇的状态,HP各部件的温度等。

6)下面通过DDL自动发现服务器的物理硬盘的监控项和触发器,有多少个硬盘就会有多少个监控项和触发器。

7)Link模板到监控主机上面,当主机整列卡有问题的时候会报警。

总结:

1)SNMP协议是通用的,该模板不仅可以监控HP Linux机器,还可以监控HP Windows 机器。

2)HP代理常用的OID,其它的还很多,大家去慢慢研究。

HP阵列卡状态:1.3.6.1.4.1.232.3.2.2.1.1.6

物理磁盘状态:1.3.6.1.4.1.232.3.2.5.1.1.6

逻辑磁盘状态:1.3.6.1.4.1.232.3.2.3.1.1.4

HP部件温度:1.3.6.1.4.1.232.6.2.6.8.1.4

3)Zabbix不仅对各种操作系统,应用程序监控很好,而且对服务器硬件的监控也非常棒。

Zabbix运维监控平台解决方案

Zabbix运维监控解决方案

目录 一、背景 (3) 二、目标 (3) 监控的基本内容 (4) 三、采用的软件 (4) 四、软件的特点 (5) 五、软件的优势 (5) 系统架构 (7) 监控实现方式: (8) 监控指标 (8) 规则引擎 (9)

一、背景 网站平台部署运行后会出现各种各样的故障,比如服务器CPU负载高,磁盘容量使用超过80%,内存使用超过阈值,系统进程多,tomcat服务宕机等问题都会给公司平台稳定和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24小时监控您的网站,一旦网站发生异常,会有报警提醒您,如邮件,微信,电话,短信,及时避免流量损失。 Zabbix是一个企业级的开源分布式监控解决方案,它是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 zabbix具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图表绘制)支持自动发现网络设备和服务器;支持分布式,能集中展示、管理分布式的监控点;扩展性强,server 提供通用接口,可以自己开发完善各类监控。 zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD,OS X等平台上。 二、目标 物理范围: 组件:硬件,OS,存储,中间件,数据库,机房,网络等 维度:可用性,性能。 指标:见下。 监控的基本内容 性能数据基本CPU,磁盘,网络,内存等关系系统正常运行的基本指标。 端口状态一般交换机或网络设备,端口启动状态,流量大小,网络状态

如何使用SNMP监视VMware ESX的服务器参数

使用简单网络管理协议(SNMP)监视服务器性能并发送通知(叫做traps)是所有VMware 管理员最终必须掌握的一项技能。在本文中,TechTarget中国的特约虚拟化专家David Davis将解释VMware ESX与ESXi可用的不同类型的SNMP代理,并给出使用SNMP 进行监控的例子。最后,你将学习如何配置ESX SNMP代理和ESXi代理以发送SNMP traps到网络管理站(NMS)。 为什么需要为VMware ESX Server配置SNMP? SNMP用于收集如PC、服务器、网络设备等的信息。SNMP也能用于发送traps到SNMP管理站(如Dell OpenManage)。我会简短地提及如何配置traps,本文将着重介绍如何配置ESX以便收集信息。 为什么想要使用SNMP?例如,如果你下载一个新的ESX Server监控工具SolarWinds VM Monitor,首先必须启用ESX上的SNMP,这是由于SolarWinds的VM Monitor使用SNMP收集数据。由于越来越多的应用用于监控VMware ESX Server,并且许多应用都使用SNMP。我们也开始听说现有的监控应用能监视VMware ESX——如果你启用SNMP。 VMware ESX Server(而不是ESXi)带有两个SNMP代理。一个代理基于net-snmp (这是一个在互联网上很出名的Linux SNMP)。另一个代理非常简单,并且只支持traps。这与ESXi所提供的代理是相同的。在本文中,我将配置更加高级的SNMP代理,即 net-snmp。(关于如何配置小型ESX代理与ESXi代理请参见VMware的文章―在ESXi 上使用SNMP‖)。不过要注意,你不能使用我下面所提到的应用监控服务器。你只能配置ESX和ESXi以发送traps到NMS。 但是不能使用图形界面(如VMware Infrastracture Client)启用SNMP。这就是说很难使用命令行。下面我们看看如何通过使用SSH命令行和SNMP命令启用SNMP。 如何通过SSH在ESX Server里启用SNMP? 通过SSH配置SNMP是唯一的方法,而不是通过服务器的控制台。 一旦使用SSH连接SNMP到ESX Server,就能使用标准的Linux命令配置SNMP。配置(使用加密等技术的版本3)SNMP很复杂,我只介绍标准的SNMP配置。 SNMP进程在默认下不会运行,SNMP监控应用不能与ESX Server对话。 首先使用nano或vi编辑/etc/snmp/snmpd.conf文件。例如: nano /etc/snmp/snmpd/conf

服务器监控系统方案及运作模式

服务器监控系统方案及运作模式

目录 一、概述 (3) 二、监控系统架构 (4) 三、功能描述 (5) 3.1、服务器运行状态监控 (6) 3.1.1CPU使用率监控 (6) 3.1.2内存监控 (7) 3.1.3磁盘空间监控 (7) 3.1.4 TCP/IP连接数监控 (8) 3.1.5流量监控 (8) 3.1.6 丢包率监控 (9) 3.2、应用程序监控 (9) 3.2.1 Apache监控 (9) 3.2.2 TOMCAT监控 (10) 3.2.3 Weblogic (10) 3.2.4 WEBSPHERE (11) 3.3、数据库监控 (11) 3.3.1 Oracle监控 (11) 3.3.2 MSSQL监控 (11) 3.3.3 MYSQL监控 (12) 四、该项目的运作模式 (12) 4.1、购买软件 (12) 4.2、租用服务 (12) 4.3、代理系统监控 (13)

一、概述 随着网络技术的发展与进步,作为企业内部网络的核心节点,服务器担负着越来越重要的企业关键服务应用,服务器在企业内部网络中所扮演的角色无可替代。服务器一旦出现故障,将给企业带来的无可估量的巨额损失。 根据美国标准技术研究所(NIST)所公布的数据: 金融行业每停机一分钟,平均损失900,000美元; 其他行业每停机一小时,平均损失800,000美元。 美国Strategic Research Corp.针对美国企业每年因服务器停机或宕机所花费的机会成本研究发现: 必须承担的成本,一年约为2,200,000美元; 每年因服务器定期维护的停机以及不可预期的宕机,给企业带来的业务损失无法估算。 难道企业真的没有办法避免如此巨额的损失或者把损失降至最低呢?现代IT技术认为,在一个完善的IT管理系统体系中,对服务器的预警与监控的重要性甚至超过服务器发生故障后及时修复。通过对大量的实际案例进行分析后,我们可以清楚的认识到:在一套完善的系统中,对企业的关键应用不间断运行有着极高的要求。以前那种“出了问题再来解决”的管理方式早已渐趋势微。随着服务器预警与监控的理念逐渐为企业所熟知与接受,“全面监控,提早预知”的管理方式逐渐成为主流,这对于一个成熟,安全的系统来说已经成为其重要的一个组成部分。 “全面监控,提早预知”的管理方式分为两个重要的部分: 全面监控是对企业服务器进行全方位的信息收集,做到“及时发现,及时反馈,及时通知,及时处理,及时修复”。 提早预知,根据权威数据统计,企业的服务器故障76.4%以上是由于服务器的负载不均衡所引起的,过高的负载不仅会造成服务器的软硬件的不稳定工作,更甚者会造成服务器软硬件的损坏。同时,服务器负载过轻也是对企业资源的一种极大的浪费。提早预知,对可根据服务器一段时间以来的运行数据,通过科学的分析,比较,判断,来找出服务器可能发生故障的故障点,并及时进行相应的调整,把故障排除在即将发生状态,把发生故障的可能性减至最低,从而有力的保障了企业关键应用的不间断运行。 “全面监控,提早预知”的管理方式在实施过程通常会遇到四个比较重要的困难点: 1.无法及时全面的收集服务器运行信息

Zabbix监控平台高可用架构

Zabbix 监控平台高可用架构 zabbix 总体设计原则路 1.读写分离 2.冷热双备 3.DB 存储两个副本 zabbix 平台软件版本 系统 Centos 7.2 Mysql 5.6 Haproxy 1.5.19 Oneproxy v5.8.5 Web 服务器 Nginx Apache Mysql 存储 主主复制 ZabbixDB ZabbixDB 主主 分表技术 Data Data Data Data Data Data Data Data Data Data Data Data 读写分离 主从复制 Master Slave Oneproxy Zabbix-高可用集群 Zabbix Zabbix haproxy+keepalived haproxy+keepalived Vrrp 二级节点 Zabbix Proxy Zabbix Proxy Zabbix Proxy

搭建zabbix的过程可以参照《zabbix单间手册》这里只介绍haproxy做主备,和oneproxy做读写分离。 Mysql master-slave(主从) 1、修改主服务器master: #vi /etc/https://www.360docs.net/doc/eb16111335.html,f [mysqld] log-bin=mysql-bin server-id=1 2、修改从服务器slave: #vi /etc/https://www.360docs.net/doc/eb16111335.html,f [mysqld] log-bin=mysql-bin server-id=2 3、在主服务器上建立帐户并授权slave: mysql>GRANT REPLICATION SLAVE ON *.* to 'slave'@'%' identified by 'slave’; 4、登录主服务器的mysql,查询master的状态 mysql>show master status; +------------------+----------+--------------+------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | +------------------+----------+--------------+------------------+ | mysql-bin.000002 | 308 | | | +------------------+----------+--------------+------------------+ 1 row in set (0.00 sec) 5、配置从服务器Slave: mysql>changemastertomaster_host='ip',master_user='slave',master_password='slave ',master_log_file='mysql-bin.000002',master_log_pos=308; Mysql>start slave; 6.查看主从状态 查看两个线程是否是yes

02-Zabbix自动监控交换机

ZABBIX 自动监控华为交换机流量 1、配置交换机的snmp snmp-agent community read zabbix@123 #配置读取snmp的密码 在linux上安装net-snmp net-snmp-utils包,测试snmp访问 #snmpwalk -v 2c -c zabbix@123 14.1.8.1 1.3.6.1.2.1.2.2.1.10.2 #查看端口2的计数 iso.3.6.1.2.1.2.2.1.10.2 = Counter32: 3497833695 2、配置zabbix community变量在[管理]à[一般]à[巨集]里,配置snmp的密码变量,这样就可以调用zabbix自带的snmp模板了。 3、创建主机使用snmp监控 4、连结默认的snmp模板

OK,配置完成,zabbix就可以完成自动监控。 5、网卡监控图过一段时间后,监控项有了数据,可以查看图形啦。 5、常用snmp OID说明下面这些值可以手动连接进行获取数据: snmpwalk -v 2c -c test IP1.3.6.1.2.1.2.2.1.2 #获取端口列表及描述 snmpwalk -v 2c -c test IP1.3.6.1.2.1.2.2.1.8 #获取端口UP/DOWN 情况 snmpwalk -v 2c -c test IP1.3.6.1.2.1.2.2.1.10 #获取端口入流量(byte) snmpwalk -v 2c -c test IP1.3.6.1.2.1.2.2.1.16 #获取端口出流量(byte) snmpwalk -v 2c -c test IP1.3.6.1.4.1.9.2.1.56.0 #获取过去5 秒内的cpu load(百分比) snmpwalk -v 2c -c test IP1.3.6.1.4.1.9.2.1.57.0 #获取过去10 秒内的cpu load(百分比) snmpwalk -v 2c -c test IP 1.3.6.1.4.1.9.2.1.58.0 #获取过去15 秒内的cpu load(百分比) snmpwalk -v 2c -c test IP1.3.6.1.4.1.9.9.48.1.1.1.5 #获取内存使用情况 snmpwalk -v 2c -c test IP1.3.6.1.4.1.9.9.48.1.1.1.6 #获取内存空闲情况 这个是正确的配置方法,已开始我看了这篇添加了没有任何反应,但是过了10来分钟就有效果了

Zabbix部署与安装

Zabbix3.2监控工具 Zabbix是一个基于WEB界面的提供的分布式系统监控以及网络监视功能的企业级的开源工具。 Zabbix能监视各种网络参数,保证服务器系统的安全运营,并提供灵活的通知机制让管理员迅速定位/解决存在的各种问题。 Zabbix由Zabbix_Server服务端和Zabbix_Agent客户端还有Zabbix_proxy代理三个部分组成。Zabbix_Server:可以通过SNMP,Zabbix_Agent,Ping,SNMP等方法提供对远程服务器/网络状态的监视。 Zabbix_Agent:是用来采集客户端服务器数据来交给Zabbix_Server处理。 Zabbix_Proxy:缓存同步Agent监控数据。 Zabbix的主要功能:CPU负荷,内存使用,磁盘使用,网络状况,端口监视,日志监视。Zabbix的监控架构: Zabbix部署步骤: 环境需求:必须LNMP/LAMP环境的支持,需要PHP5.4以上版本支持才可以。 # systemctl stop firewalld #关闭firewalld防火墙 # systemctl disable firewalld.service #禁止firewalld服务自启 # sed -i -e 's|SELINUX=enforcing|SELINUX=disabled|' /etc/selinux/config #关闭SELINUX # sed -i -e 's|SELINUXTYPE=targeted|#SELINUXTYPE=targeted|' /etc/selinux/config # setenforce 0 源码编译方式: ?安装相关依赖组件 # yum -y install php php-gd php-mysql php-bcmath php-mbstring php-xml curl curl-devel gcc gcc-c++ net-snmp net-snmp-devel perl-DBI httpd mariadb* #YUM部署LAMP环境

服务器状态监控之snmp

服务器状态监控之snmp&ipmi 一、ipmi 1、简介 IPMI(Intelligent Platform Management Interface)即智能平台管理接口是使硬件管理具备“智能化”的新一代通用接口标准 开源的免费标准、跨不同操作系统 监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源供应及机箱入侵等 核心部件:BMC(Baseboard Management Controller),一种嵌入式微控制器,整个平台管理的大脑, ipmi所有功能都是通过BMC发送命令来完成,BMC接受并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据,支持远程访问 BMC具有以下功能: 1.通过系统的串行端口进行访问 2. 故障日志记录和SNMP 警报发送 3.访问系统事件日志(System Event Log ,SEL) 和传感器状况 4.控制包括开机和关机 5.独立于系统电源或工作状态的支持 6.用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向 基于BMC,最大优势:独立于CPU BIOS和OS,无论是开机还是关机状态下,接通电源就可以实现对服务器的监控 2、使用ipmi的先决条件

(1)服务器硬件本身提供对ipmi的支持 目前惠普、戴尔和NEC 等大多数厂商的服务器都支持IPMI 2.0,但并不是所有服务器都支持,所以应该先通过产品手册或在BIOS 中确定服务器是否支持ipmi,也就是说服务器在主板上要具有BMC 等嵌入式的管理微控制器。 (2)操作系统提供相应的ipmi驱动 通过操作系统监控服务器自身的ipmi 信息时需要系统内核提供相应的支持,linux 系统通过内核对OpenIPMI(ipmi 驱动)的支持来提供对ipmi 的系统接口。在使用驱动之前,请先启动该驱动: service ipmi start 或者启动模块: modprobe ipmi_msghandler modprobe ipmi_devintf modprobe ipmi_si modprobe ipmi_poweroff modprobe ipmi_watchdog (3)ipmi管理工具 选择的是Linux 下的命令行方式的ipmi 平台管理工具ipmitool,开源的还有很多,如:ipmiutil ipmitool通过OpenIPMI接口来访问BMC,实现对服务器的两种管理方式:(1)通过OS 监控本地服务器;(2)通过网络监控远程服务器 本地服务管理:系统结构 监控本地命令格式:ipmitool -I open command,其中-I Open command有以下项:

Zabbix监控平台(三)生产环境案例

一,Zabbix生产环境监测案例概述 1.1 项目规划 ?主机分组 o交换机 o Nginx o Tomcat o MySQL o Apache o PHP-fpm o redis(也有状态页,自己研究) o memcache(也有状态页,自己研究) ?监控对象识别: o使用SNMP监控交换(监控交换机或路由器) o使用IPMI监控服务器硬件 o使用Agent监控服务器(监控操作系统和软件服务) o使用JMX监控JAVA(监控tomcat等java服务) o监控MySQL o监控Web状态

o监控Nginx状态 o监控Apache状态 o监控Tomcat状态 1.2 SNMP监控流程(监控交换机或路由器) 1.交换机上开启snmp 2.在zabbix上添加监控(设置SNMP interfaces) 3.关联监控模版 1.3 IPMI(监控服务器硬件) 建议使用自定义item监控服务器硬件,在本地执行ipmitool命令来获取数据(虚拟机上没有远程控制卡,所以无法测试) 可以在本地执行ipmitool命令获取数据(命令需要安装) 1.4 JMX(使用Zabbix Java Gateway代理) 用来获取java数据,本次的实战内容 1.5 实战监控Nginx,Apache,MySQL,PHP-fpm 今天的实战内容,注意总结过程 1.6 Zabbix的Web监测 今天的实战内容,注意总结过程

所有zabbix模板包和源码包 链接:https://https://www.360docs.net/doc/eb16111335.html,/s/1aezlSsXlfn5A-_CJnTUUhw 提取码:ndhs ---模板包 链接:https://https://www.360docs.net/doc/eb16111335.html,/s/1YwwtmnWATM9DxAQmZCDG4Q 提取码:0nmk ---源码包 二,Zabbix监控MySQL数据库操作实战 我们需要部署一个MySQL服务和一个zabbix-agentd客户端 2.1 编写监控mysql脚本 在nginx服务器(192.168.200.69)上安装一个MySQL 下面是监控mysql状态的一个shell脚本,内容如下: mkdir -p /server/scripts cd /server/scripts vim check_mysql.sh cat check_mysql.sh 1.#!/bin/bash 2.# author:Mr.sun 3. 4.MySQL_USER="root" 5.MySQL_PWD="linyaonie" 6.MySQL_HOST="12 7.0.0.1" 7.MySQL_PORT="3306" 8. 9.MySQL_CONN="/usr/local/mysql/bin/mysqladmin -u${MySQL_USER} -h${MySQL_HOST} -P${MySQL_PORT} -p${MySQL_PWD}" 10.if [ $# -ne "1" ];then

企业信息系统运行状态监控与管理

企业信息系统运行状态监控与管理的信息化 在企业内部运行着许多信息系统,信息系统管理员的主要工作之一就是负责这些系统的运行状态监控与管理,这也是信息系统管理员的日常工作。然而在实际工作中,系统管理员往往疏于日常监控与管理,只是在出现故障时才疲于应急维修。因此加强日常运维管理,用信息化手段提高效率和管理水平是必需的,也是IT专业人员专业性的体现。 本文在以下部分讨论WINDOWS环境下信息系统运行状态监控与管理的信息化实现,文中代码以SERVER2003标准版为例,在.NET2008下调试通过。 一、信息系统维护工作现状 信息系统运维最重要的是服务器软硬件及网络环境的监控与维护管理,包括同下几方面内容: ●服务器操作系统运行状态监控(CPU负载率、内存占用率等) ●服务器日志监控(主要包括操作系统日志、应用程序日志、安全日志) ●相关服务运行状态监控(数据库服务、IIS服务、杀毒软件服务等) ●进程监控 ●漏洞修复管理 ●网络状态监控 ●硬件状态监控 ●信息系统软硬件运行故障处理记录 ●数据库运行状态 对上述工作,常规的方式是人工检查后再填写纸质记录表。这种工作模式存在以下问题: ●不便于追溯分析与相关性分析 信息系统出现问题,可能的原因很多。总体上是软硬件环境,但具体原因有网络、硬件故障、操作系统故障、服务配置与运行、病毒、异常进程、负载等。根据维护经验,许多故障是重新启动一下服务器就好,系统管理员往往对具体什么原因不追查或不便追查。在实际工作中,日志中经常有各种严重错误信息,但也不影响信息系统正常运行。有些原因是积累性或累加性的,如不必要的服务对信息系统安全运行的影响等,这些都要进行相关性分析。在故障处理时,相关性分析尤其重要,可以迅速定位故障、减少判定时间。 ●工作效率低、发现潜在问题难。 系统管理员日常巡检一般是登录到服务器,在系统资源管理窗口看资源使用情况、在性能窗口看系统负载、在事件窗口查看日志、在服务窗口查看相关服务运行情况、在任务管理窗口查看异常进程、PING网关查看网络情况、查看杀毒软件服务日志、查看硬件指示灯。如有异常或故障,则处理故障后,再填写故障处理记录。 由于企业内部信息系统管理员并不是专职的系统管理员,同时用于信息系统维护的工作时间不是很多,特别是在信息系统运行正常时,往往巡查流于形式。在一个个界面切换,在短时间内从满屏信息中排查出异常迹象,效率很低,发现潜在问题的可能性极小。 ●对于全局性问题不易统一处理、根本解决问题 对于一些特定类型的故障,如病毒、漏洞引发的故障,往往是全局性的,在全厂范围内所有服务器都可能存在同样的问题。处理这类故障隐患,需要统一排查统一处理。而人工或纸质记录表方式不能支持这方式。 在信息系统正式上线运行后,才发现设计缺陷或硬件选型、软件不兼容问题也是时有发生。在上线初期,用户数据量很少,运行一段时间后随着数据量和访问量的急剧增加累积,

zabbix监控系统的搭建

最近在实验室搭建了一套zabbix系统,来对实验室的硬件资源,以及软件资源进行监控,zabbix由两部分组成:zabbix server与可选组件zabbix agent,zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监控,数据收集等功能。可以对包括:CPU负荷、内存使用、磁盘使用、网络状况、端口监视、日志监视等功能进行监控,同时也可以对vmware,java,数据库,weblogic 等系统进行监控。 zabbix支持多种网络方式下的监控,可通过分布式的方式部署和安装监控代理,整个结构如下图所示: Zabbix搭建: 1.准备环境 搭建环境:centos6.5_x86_64 zabbix2.2.2 安装centos6.5系统 (1)关闭防火墙: #service iptables stop #chkconfig iptables off (2)关闭selinux vi /etc/selinux/config 修改SELINUX的值为disabled //重启后才能生效 执行setenforce 0 立即关闭selinux (3)配置yum源 (4)修改主机名 vi /etc/sysconfig/network 修改HOSTNAME=zabbix 2.安装server端 (1)安装开发包以及软件依赖包 yum -y groupinstall "Development Tools" yum -y install httpd mysql mysql-server php php-mysql php-common php-mbstring php-gd php-odbc php-pear curl curl-devel net-snmp net-snmp-devel perl-DBI php-xml ntpdate php-bcmath (2)创建服务所需的用户和用户组 groupadd -g 201 zabbix useradd -g zabbix -u 201 -m zabbix (3)启动mysql,并创建zabbix服务器,为zabbix用户开启用户权限 service mysqld start

Linux服务器运行状况全面监测下

四、服务器主板工作状况监测: 服务器主板以及CPU工作温度是否正常是服务器稳定的核心。迄今为止还没有一种CPU散热系统能保证永不失效。失去了散热系统保护伞的“芯”,往往会在几秒钟内永远停止“跳动”。值得庆幸的是,聪明的工程师们早已开发出有效的处理器温度监控、保护技术。以特殊而敏锐的“嗅觉”随时监测CPU的温度变化,并提供必要的保护措施,使CPU免受高温下的灭顶之灾。lm_sensors可以有效监控主板和CPU的工作电压、风扇转速、温度等核心数据。软件安装: #mv lm_sensors-2.8.8.tar.gz /usr/lo ca l/src/ #cd /usr/local/src/ #tar zxvf lm_sensors-2.8.8.tar.gz #cd /usr/local/src/lm_sensors-2.8.8 #tar xzf i2c-2.8.8.tar.gz #make clean ;make dep ;make all ;make install #/sbin/depmod -a 修改配置文件:“/etc/ld.so.conf”加入一行:/usr/local/lib #ldconfig #sensors-detect #扫描主板所有芯片,选择缺省选项即可(按会车)# 加载模块,注意主板不一定相同。 #modprobe i2c-isa #modprobe lm78 #modprobe sis5595 开始检测,见图-8:

#sensors 图 8 lm_sensors 工作界面 可以看到主板温度、CPU温度电压以及风扇转速等信息非常清晰。 高级应用:定时检测主板运行情况: 这里可以使用Linux组合命令: #watch --interval=450 “sensors ” 这样每隔450秒运行因此sensors 令,就可以得知主板运行情况。 五、P2P通信监测 P2P(Peer-to-Peer)是一种用于文件交换的新技术,通过Internet允许建立分散的、动态的、匿名的逻辑网络。P2P为对等连接或对等网络,点对点网络技术,可应用于文件共享交换,深度搜索、分布计算等领域。它允许个体的PC通过Internet共享文

服务器运行状态监控系统

系统目标 本系统的主要功能是对各种服务器进行实时监控,基于Windows 系统(包括Windows XP/2003/2008),采用C/S模式,使用VC6.0开发。其中,Client客户端安装在受监控的服务器上,Server服务器端安装在网管人员的PC机上。网管人员可以随时通过Server端获知任意一台受监控服务器的运行状态,并在服务器出现异常的情况下(如:服务器意外down机、存储空间不足、CPU利用率过高等),及时的收到Server端的短信报警信息。 2.1、Client端主要功能 (1) 采集服务器的各种性能指标数据,并发送到Server端,使网络管理员能实时查看服务器的状态。主要包括:CPU使用率、内存使用率、进程数量监控、进程运行状况监控等。 (2) 采集服务器的相关信息,并保存在服务器的日志文件中,供网络管理员进行定期的数据分析。主要包括:重点分区文件的变动信息、容量大小信息、服务器重新启动信息等。 (3) 服务器进程信息的监测。主要包括进程列表的实时扫描、黑名单监测和白名单监测。其中,黑名单监测是指对非正常进程的监测(如病毒进程),当发现监测服务器上运行着这类非正常进程时,便会向Server端发送告警信息,并自动关闭进程。白名单是指对服务器上守护进程的监控,当发现服务器守护进程没有正常运行时,便会

向Server端发送告警信息,并自动重新启动进程。 (4) 日志文件监控。此项功能实现对服务器日志文件所占存储空间的监控。当监控的日志文件大小超过其预设阀值时,Client端便会向Server端发送告警信息,通知网络管理人员进行及时处理。 (5) Web服务器监控。对WEB服务器的实时监控,当发现受监控的Web服务器不能正常提供服务时,自动重新启动该服务,使其能够正常运行,并将WEB服务器发生问题的时间和处理信息写入日志文件,以供网络管理人员进行分析。主要提供对Tomcat、IIS(6.0)等Web 服务器的监控。 (6) 数据库服务器监控。对服务器上运行的数据库服务器的实时监控,当发现受监控的数据库服务不能正常提供服务时,自动重新启动该服务,以使其能够运行正常,并将问题发生时间和处理信息写入日志文件,以供网络管理人员进行分析。主要提供对SQL Server、Oracle等数据库的监控。 (7) 盘符容量监控。选定某一监控盘符后,设置其容量大小,当容量不足时,向Server端发送报警信息。 2.2、Server端主要功能 Server端的主要功能是接收Client端发送的数据,并根据设置阈值在这些海量数据中筛选出异常数据向网络管理员进行告警。 (1) 参数设置:对一些基本参数进行设置,保存设置后,Server 端按照参数的设定范围对接收的数据进行分析。主要包括:

Zabbix运维监控平台解决方案

Z a b b i x运维监控平台 解决方案 集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

Zabbix运维监控解决方案 目录 一、背景 网站平台部署运行后会出现各种各样的故障,比如服务器CPU负载高,磁盘容量使用超过80%,内存使用超过阈值,系统进程多,tomcat 服务宕机等问题都会给公司平台稳定和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24小时监控您的网站,一旦网站发生异常,会有报警提醒您,如邮件,微信,电话,短信,及时避免流量损失。 Zabbix是一个企业级的开源分布式监控解决方案,它是一个基于WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。

zabbix具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图表绘制)支持自动发现网络设备和服务器;支持分布式,能集中展示、管理分布式的监控点;扩展性强,server提供通用接口,可以自己开发完善各类监控。 zabbixserver可以通过SNMP,zabbixagent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP-UX,AIX,FreeBSD,OpenBSD,OSX等平台上。 二、目标 物理范围: 组件:硬件,OS,存储,中间件,数据库,机房,网络等 维度:可用性,性能。 指标:见下。 监控的基本内容 性能数据基本CPU,磁盘,网络,内存等关系系统正常运行的基本指标。端口状态一般交换机或网络设备,端口启动状态,流量大小,网络状态日志内容日志内容监控,系统日志,应用程序日志,错误信息。 系统状态DB,OS,中间件等的系统状态 硬件状态硬盘状态,风扇,电池,内存,主板等系统状态

服务器管理监控系统

服务器管理、监控系统 摘要:现今互联网行业发展迅速,底层支撑互联网服务的服务器等各种硬件设备规模越来庞大。如何管理有效地管理这些设备、实时发现其潜在的隐患、获取其运行的状态,而显得至关重要。根据这些信息才能合理地决定设备上所运行系统、应用等服务的关闭与保留与挂起。本文介绍了利用开源监控解决方案,以及对该方案的二次开发而实现对服务器机房的专家系统。 关键字:机房运维服务器监控

目录

1. 引言 随着现今互联网行业的迅速发展,某些物联网服务的用户已经达到了亿级,如淘宝网注册用户已达到3.7亿,仅在2015年“双十一”当天活跃用户过亿[1]。支撑如此庞大用户使用的硬件基础是规模庞大的服务器群。如何获取每一台服务器的运行状态,及时获悉潜在隐患,出现问题及时锁定排除显得至关重要。机房运维人员以及高层决策人员只有在实时掌握这些信息后才可有效地对进行决策,如在访问流量过大或其他恶意攻击后是及时关闭服务还是启动备用服务,服务区瘫痪后是需要工作人员至机房处理硬件问题还是只需远程重启服务器等类似或简单或复杂的决策,都需要底层专家系统信息的支持。 现今比较成熟的开源服务器底层数据的采集解决方案主要有和。 是一个监视系统运行状态和网络信息的监视系统,能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等[2]。可运行在平台之上,同时提供一个可选的基于浏览器的界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。 可以监控的功能有: 1、监控网络服务(、3、、、等); 2、监控主机资源(处理器负荷、磁盘利用率等); 3、简单地插件设计使得用户可以方便地扩展自己服务的检测方法; 4、并行服务检查机制; 5、具备定义网络分层结构的能力,用""主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态; 6、当服务或主机问题产生与解决时将告警发送给联系人(通过、短信、用户定义方式); 7、可以定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用; 8、自动的日志滚动功能; 9、可以支持并实现对主机的冗余监控; 10、可选的界面用于查看当前的网络状态、通知和故障历史、日志文件等[2]; 11、可以通过手机查看系统监控信息;

用SNMP协议实现系统监控

用SNMP协议实现系统监控 作者王基立系统监测的基本概念及分类: a.系统监测的概述: 如何对现有IT架构的整体以及细节运行情况进行科学、系统和高效地监测是目前各企业运维和管理部门一项非常重要的工作内容。随着当前企业IT环境中服务器、应用数量和类型的不断地增加,运维部门需要通过科学和高效的手段尽可能详细、实时和准确地获取整个架构中具体到每个服务器、每个系统甚至每个应用程序工作的细节,并且会对所获取到的原始数据进行分析、绘图和统计,以便为后续的性能调优、建构调整以及各类型排错建立参考依据。 常见的监测对象基本上涵盖了IT运行环境的方方面面,包括机房环境、硬件、网络等,而每一个方面所涉及的监测项目则种类繁多。例如对硬件环境的监测中,所涵盖内容就会包括服务器的工作温度、风扇转速等指标;针对系统环境的监测,将包括基本的操作系统运行环境,如CPU、内存、I/O、存储空间使用状况、网络吞吐量、进程数量和状态等情况;针对具体的应用情况,涉及监测的内容可能会更多,而且也会有很多专门针对应用的指标。 除了监测的内容需要尽量全面之外,同时我们还希望所使用的监测解决方案能够灵活和具备更多扩展功能。例如有效地支持IT架构的变化和扩展,在监测量增加的情况下能够尽可能少地占用资源,拥有强大的事件通知机制等等。 今天本文所涉及的内容,主要是针对操作系统以及软件环境的监测,而且尤其是针对Linux操作系统的运行情况监测。尽管目前有很多的商用软件以及解决方案来实现相关的功能,但是实际上我们也有很多开源的解决方案可以起到相同的作用,而且效果也非常不错。下面的内容中,我们将会对这些解决方案的实现方法进行详细描述。 b.基于Linux上系统监测的基本原理以及种类: 在Linux系统上的系统监测所采用的方式基本上有两种: 第一种,通过SNMP协议结合数据采集软件来实现: 这种方法所涉及的架构一般包括两部分,其中一部分是被监测服务器,另外一部分则是网管工作站。至于实现方法具体来说就是在Linux服务器上启动 SNMP简

服务器监控系统实现方案

2019.03 随着信息化建设的不断深入,各单位部署的服务器数量越来越多,导致系统管理和运维的难度也越来越大。对服务器的状态进行实时监控,及时发现和处理问题,是解决此难题的一个行之有效的方法。然而,目前市面上真正好用、能满足实际运维需要的监控软件却极少,不少单位在试用了一些监控软件之后,不得不选择自行开发。 1服务器监控的必要性 服务器是网络中能对其他机器提供某些服务的计算 机系统,它存储、处理网络上80%的数据和信息,被称为网络的灵魂[1]。由于服务器需要长时间不间断地工作,因此对稳定性和可靠性有很高要求。计算机的可靠性可用MTTF (Mean Time To Failure ,平均无故障时间)来度量,平均无故障时间越长系统的可靠性就越高。对用户而言,高可靠性也就意味着高可用性,意味着可以随时随地从系统获得高质量的服务。 尽管服务器采用了大量的软、硬件技术,但其稳定性和可靠性离人们的期望还是有不小的距离,服务器响应变慢、服务中断的现象仍时有发生。尽管提高软、硬件的可靠性是软、硬件厂商需要考虑的事情,但是对最终用户来说,对服务器的软、硬件进行实时监控,及时发现和处理问题,无疑能大大提高系统的可用性。 2服务器监控软件的现状 对服务器进行监控,显然用软件方式要比人工方式 更加高效和快捷。与网络管理类似,服务器管理也分为带内(in -band )管理和带外(ou t-of-band )管理[2],带 内管理的控制信息与数据信息使用同一物理通道进行传送,而带外管理则是使用不同的物理通道。带外管理可 以在操作系统失去响应的情况下采集服务器硬件数据(CPU 和主板的温度、电压、风扇转速以及电源、功耗等),甚至在电源关闭的情况下进行开机、重启等维护操作,但并不能监控带内的应用情况。带内管理可以实现对带内应用情况的监控,也可以通过I PMI (I ntelli - gent Platform Management Interface ,智能平台管理接口)获取带外硬件信息,但是在网络中断时业务和管理都无法正常进行。 有些品牌的服务器厂商提供基于带外管理的服务器管理软件(属增值服务,需另外购买),但不同厂商之间存在一定的兼容性问题。目前大多数的服务器监控软件还是基于带内管理的。 除了I PMI 以外,常用的监控技术手段还有:JMX (Java Management Extensions ,Java 管理扩展)、S SH (Secure Shell)、S NMP (S imple Network Management Pro -tocol ,简单网络管理协议)、WMI (Win dows Manage -ment Instrumentation ,Win dows 管理规范)和WBEM (Web -Based Enterprise Management ,基于Web 的企业管理)。其中JMX 适用于监控Java 应用;S SH 适用于 Lin ux 系统,用于Win dows 时需结合WMI 使用;S NMP 有明显的安全隐患[3],对网络性能有不小影响;WMI 只能用于Win dows 系统,也存在明显的安全问题[4]; WBEM 则限于Web 应用。 作者简介:徐波(1971-),男,高级工程师,硕士,研究方向:医疗信息化、算法理论、机房运维;王建英(1985-),女,工程师,硕士,研究方向:医疗信息化、 I T 项目管理。 收稿日期:2018-12-11 服务器监控系统实现方案 徐波,王建英 ( 广州市中西医结合医院信息科,广州510800)摘 要:服务器监控是机房运维管理的一项重要内容,同时也是一种行之有效的管理方法,但目前市 面上很难找到符合实际需要的服务器监控软件。解决办法之一是找软件公司按需定制,但定制开发的成本很高,很多单位选择了自主开发。这里给出一个服务器监控系统的自主开发实现方案,主要包括监控对象的选择、软件架构设计和技术方案的选择3个方面。关键词:服务器; 监控;方案;运维 43 DOI:10.16184/https://www.360docs.net/doc/eb16111335.html,prg.2019.03.011

01-Zabbix手动监控交换机

ZABBIX手动监控华为交换机 1. 要获取交换机的OID,必须确保该交换机是可以被网管的,即该交换机的161(SNMP)端口是被开启的。如161端口没有被开启,需在交换机上加上以下配置: snmp---配置 snmp-agent sys-info version all snmp-agent community read cipher zabbix@123 snmp-agent mib-view included view_ALL iso snmp-agent trap enable snmp-agent target-host trap address udp-domain 192.168.1.77 params securityname zabbix@123 v2c private-netmanager save quit 2.打开Getif,软件填入ip及snmp团体名称,点击start,如下图所示: 当显示“SysInfo variables OK"的时候,表明可以正确获取交换机的OID。 交换机每个接口都会有进和出的流量,所以要去查询对应得OID 3.in 代表进来的流量 out 代表出去的流量

查询in 的OID值 https://www.360docs.net/doc/eb16111335.html,.dod.internet.mgmt.mib-2.interfaces.ifTable.ifEntry.ifInOctets 查询out的OID值 https://www.360docs.net/doc/eb16111335.html,.dod.internet.mgmt.mib-2.interfaces.ifTable.ifEntry.ifOutOctets

现在in out 值都查询出来了,那么怎么使用,怎么把in out 值相对应, .1.3.6.1.2.1.2.2.1.10 in .1.3.6.1.2.1.2.2.1.16 out 就是把这个值个接口相对于,比如我要监控的是 GigabitEthernet0/0/1-IN GigabitEthernet0/0/1-OUT 4.我们来看下那个对于表的接口关系: 所以在ZABBIX上面的写法是:以此类推:GigabitEthernet0/0/2 就是 7 .1.3.6.1.2.1.2.2.1.10.6 IN .1.3.6.1.2.1.2.2.1.16.6 OUT

相关文档
最新文档