nagios监控系统
Nagios监控路由器和交换机设备

Nagios监控路由器和交换机设备1.功能介绍Nagios可以监控有IP可管理的交换机和路由器的设备状态.对小型无管理功能的交换机和HUB是无法监控.监控的方式是通过外部的ping所反馈的信息或者通过SNMP协议来获取相关的状态信息.能够在网络设备上获取的信息包括:包丢失率,包往返时间平均值SNMP状态信息带宽和传输数率2.概述监控的方式有两种一种是利用ping的方式,获取数据包的响应时间和丢包率另一种是利用网络设备的SNMP数据,通过check_snmp获取端口状态和check_mrtgtraf来了解带宽状况.在使用check_snmp之前必须安装snmp包到系统中.如果没有安装则需要先安装好snmp系统包,然后再重新编译nagios plugins3.配置步骤完成第一次执行需要做的操作创建新的监控设备主机和服务对象重新启动Nagios4.确认一下内容在/usr/local/nagios/etc/objects/commands.cfg里面是否包含了check_snmp和check_local_mrt gtraf的命令定义在/usr/local/nagios/etc/objects/templates.cfg里面是否包含了generic-switch5.配置Nagiosa.编辑/usr/local/nagios/etc/nagios.cfg将#cfg_file=/usr/local/nagios/etc/objects/switch.cfg前面的#去掉b.编辑/usr/local/nagios/etc/object/switch.cfg文件设定监控主机的相关内容define host{use generic-switch ; Inherit default values from a templatehost_name Gateway ; The name we're giving to this switchalias Firewall ; A longer name associated with the switchaddress 192.168.200.1 ; IP address of the switchhostgroups allhosts,switches ; Host groups this switch is associated with}监控包的丢失率和RTA响应时间define service{use generic-service ; Inherit values from a templatehost_name Gateway ; The name of the host the service is associated withservice_description PING; The service descriptioncheck_command check_ping!200.0,20%!600.0,60% ;在超过200ms或丢包率在20%上的启动警告,超过600ms或丢包达到60%的启动报警normal_check_interval 5; 在正常情况下,每五分钟监控一次retry_check_interval 1; 在异常情况下,每分钟监控一次}利用SNMP监控交换和网关设备define service{use generic-service ; Inherit values from a templatehost_name Gatewayservice_description Uptimecheck_command check_snmp!-C public -o sysUpTime.0}利用MRTG来监控网络流量信息define service{use generic-service ; Inherit values from a templatehost_name Gatewayservice_description Port 1 Bandwidth Usagecheck_commandcheck_local_mrtgtraf!/var/lib/mrtg/192.168.200.1_1.log!AVG!1000000,2000000!5000000,5000000!10 }利用command里面设定的check_local_mrtgtraf获取本地保存的mrt g流量日志信息来监控,获取文件是/var/lib/mrt g/192.168.200.1_1.log获取数据值是采取AVG的值,数值在1M~2M之间,则状态改为warning,如果超过5M的话则状态改为critical 完成配置后service nagios restart。
Linux上的系统监控工具比较NagiosvsZabbix

Linux上的系统监控工具比较NagiosvsZabbix在Linux系统中,系统监控工具起着至关重要的作用,帮助管理员实时监测系统状态和性能指标。
Nagios和Zabbix是两款流行的系统监控工具,它们在功能和使用上有所差异。
本文将对Nagios和Zabbix进行比较,以帮助读者选择适合自己需求的系统监控工具。
一、NagiosNagios是一款开源的系统监控工具,通过监测主机、服务和网络设备等方面来保证系统的可用性。
它具有以下特点:1. 灵活性:Nagios可以监控各种类型的主机、服务和设备,例如服务器、路由器、数据库等。
用户可以根据自己的需求,通过自定义插件来监测不同的指标。
2. 强大的告警功能:Nagios可以设置各种告警规则和通知方式,当系统出现故障或达到预定的阈值时,及时发送告警信息给管理员。
3. 可扩展性:Nagios拥有丰富的第三方插件和扩展,可以方便地与其他系统集成,满足复杂的监控需求。
4. 灵活的配置:Nagios使用文本配置文件进行管理,管理员可以根据需要编辑配置文件,实现对监控对象和监控指标的灵活配置。
二、ZabbixZabbix也是一款开源的系统监控工具,具有以下特点:1. 自动发现功能:Zabbix可以自动发现并监控网络设备、服务器和服务。
这个功能可以大大减轻管理员配置监控对象的工作量。
2. 实时监控和图形化展示:Zabbix提供实时数据监控和图形化展示功能,可以直观地查看系统的各项性能指标和状态。
3. 强大的报表功能:Zabbix可以生成各种类型的报表,帮助管理员分析历史数据、趋势和性能统计等。
4. 可视化配置:Zabbix提供直观的Web界面进行配置和管理,管理员可以通过图形化界面完成监控对象和监控指标的配置。
三、Nagios vs ZabbixNagios和Zabbix在功能和使用上都有各自的优势,下面对它们进行比较:1. 配置和管理:Nagios使用文本配置文件进行管理,需要具备一定的技术能力和配置经验。
基于Nagios的交换机监控系统设计与实现

( 中 国民航 大学计算机 学院 ,天津 3 0 0 0 0 0)
摘 要 :针 对 企 业 中交换机 数 量繁 多 ,汇聚层 交换 机 、接入 层 交换 机部 署 物理 位 置分散 难 以统一 管理
的现 状 ,文章 在 L i n u x系统上 设计 并 实现 了一 个 交换机 监控 系统 。该 系统 以 Na g i O S 为核 心 ,集成 简单 实用
a na l yz i ng t he h i s t o r y mo n i t o r i n g d a t a c o ul d he l p o p t i mi z e t he n e w o t r k s t r uc t ur e , a nd c o n ir f m t h e a b no r ma l c o n di t i on , a nd in f a l l y t hi s s ys t e m wi l l i n c r e as e n e w o t r k u t i l i z a t i o n r a t i o ,i mpr o v e t h e s wi t c h’ S l o a d b a l a nc e ,a n d p r e v e n t t h e
运维中常用的系统监控工具

运维中常用的系统监控工具在现代互联网技术的快速发展下,运维工作愈发重要。
现代的软件系统越来越大且复杂,监控系统的作用显得尤为重要。
一个好的监控系统可以使我们在第一时间内发现系统中的问题,可以极大的提高故障处理的效率,保证系统的高可用性和稳定性。
本文将对运维中常用的系统监控工具进行介绍和分析,包括Nagios、Zabbix、Cacti、Icinga、Prometheus、ELK 等。
虽然这些工具各有特点,但是从监控的目的和实现方式来看,可以分为两类,一类是基于SNMP 协议的工具,另一类是基于Agent 的工具。
一、基于 SNMP 协议的工具SNMP 是 Simple Network Management Protocol 的缩写,它是一种管理网络设备的协议,它提供了对各种网络设备的监控和控制。
1. NagiosNagios 是运维工作中最常用的监控工具之一,它是一款基于SNMP 的开源工具。
Nagios 主要通过通过通过插件的方式,监控系统的各项指标,例如 CPU 负载、硬盘使用率、网络延迟等等。
另外,Nagios 也支持邮件和短信告警,以及第三方插件的扩展。
Nagios 的强大之处在于它对插件的支持,可以通过插件实现对除了其它工具不支持的服务的监控,比如 Tomcat、MySQL 等等。
2. ZabbixZabbix 是一款基于SNMP 的开源监控工具,它类似于Nagios,但比 Nagios 更加强大和灵活。
它提供了多种监控方式,包括SNMP、JMX、IPMI 等等,可以支持不同操作系统的监控。
另外,Zabbix 的告警机制很灵活,可以设置多种告警方式,包括邮件、短信、微信等。
3. CactiCacti 是一款基于 SNMP 的开源图形化监控工具,它提供了一些预设指标,可以通过配置 SNMP 协议来监控不同的系统。
Cacti的主要优点在于它提供了图形化的监控界面,用户可以通过界面进行图形化展示查看系统的运行情况,对问题快速定位。
nagios监控端安装配置手册

一、系统环境与软件版本情况本文档使用被监控机的操作系统为rhel6.3 _64位。
监控主机操作系统为rhel6.0 _64位及windows 2003,nagios主服务版本Nagios® Core™ 3.2.3,linu被监控机与主监控通信插件NRPE版本为nrpe-2.8.1。
window被监控机与主监控服务软件为NSClient++-0.2.7所使用的软件如下nrpe-2.8.1.tar.gzNSClient++-0.2.7.zip二、安装配置过程。
因为系统安装大家都非常熟悉了此次略过操作系统安装过程,首先是linux环境下被监控机的安装配置过程。
在安装之前先写个nagios监控非本地信息的原理图主监控机被监控机NRPE总共由两部分组成:–check_nrpe 插件,位于在监控主机上–NRPE daemon,运行在远程的linux主机上(通常就是被监控机)按照上图,整个的监控过程如下:当nagios需要监控某个远程linux主机的服务或者资源情况时1.nagios会运行check_nrpe这个插件,告诉它要检查什么.2.check_nrpe插件会连接到远程的NRPE daemon,所用的方式是SSL3.NRPE daemon会运行相应的nagios插件来执行检查4.NRPE daemon将检查的结果返回给check_nrpe插件,插件将其递交给nagios做处理.注意:NRPE daemon需要nagios插件安装在远程的linux主机上,否则,daemon不能做任何的监控.因为使用rehl线上的yum源安装需要授权,所以先使用iso搭个本地的yum源。
mount /dev/cdrom /mnt/cdrom/ 挂载光驱mkdir /home/rehliso 创建yum源目录。
cp -Rf /mnt/cdrom/* /home/rehliso/ 拷贝安装文件到源目录cd /etc/yum.repos.d/ 切换至yum配置文件目录cp rhel-source.repo rhel-source.repo.bak 备份配置文件vi rhel-source.repo 编辑配置文件,删除之前内容加入[rhel_6_iso]name=local isobaseurl=file:///home/rehlisogpgcheck=1gpgkey=file:///home/rehliso/RPM-GPG-KEY-redhat-release保存退出Yum clean all清除YUM缓存因为是用二进制安装包进行安装所以要先安装gcc编译器yum -y install gcc 安装gcc编译器安装完成后用sftp上传安装文件nrpe-2.8.1.tar.gz, nagios-plugins-1.4.13.tar.gz至/usr/local/src/目录下创建nagios用户Userad nagiosPasswd nagiosCd /usr/local/src 切换至/usr/local/src/目录解压安装包tar zxvf nagios-plugins-1.4.13.tar.gzcd nagios-plugins-1.4.13编译安装./configuremakemake install这一步完成后会在/usr/local/nagios/下生成两个目录libexec和share修改目录权限把权限所属chown nagios.nagios /usr/local/nagios/chown -R nagios.nagios /usr/local/nagios/libexec/至此被监控机nagios插件已经安装完成,接下来就是安装nrpe服务了切换至软件包目录Cd /usr/local/src解压安装文件tar zxvf nrpe-2.8.1.tar.gzcd nrpe-2.8.1编译安装./configurechecking for SSL... configure: error: Cannot find ssl libraries 出现了该错误主要是因为监控主机插件check_nrpe与被监控nrpe服务的通信是通过ssl方式连接的所以必须安装sslyum -y install openssl-devel 所以这个可以在gcc安装时顺便也安装了ssl安装完成后重新./configure*** Configuration summary for nrpe 2.8.1 05-10-2007 ***:General Options:-------------------------NRPE port: 5666NRPE user: nagiosNRPE group: nagiosNagios user: nagiosNagios group: nagiosReview the options above for accuracy. If they look okay,type 'make all' to compile the NRPE daemon and client.成功后会出现以上安装的基本信息接下来编译安装make allmake install-daemonmake install-daemon-configmake install-plugin 安装check_nrpe这个插件之前说过监控机需要安装check_nrpe这个插件,被监控机并不需要,我们在这里安装它是为了测试的目的安装xinetd脚本make install-xinetd这里还要补充一下因为官网的安装文档是将NRPE deamon作为xinetd下的一个服务运行的.在这样的情况下xinetd就必须要先安装好,所以还得确定系统是否已经安装了xinetd的服务[root@localhost nrpe-2.8.1]# service xinetd restartxinetd: unrecognized service服务并未安装yum -y install xinetd 安装xinetd服务安装完成后修改配置文件vi /etc/xinetd.d/nrpeservice nrpe{flags = REUSEsocket_type = streamport = 5666 端口wait = nouser = nagios 用户group = nagios 用户组server = /usr/local/nagios/bin/nrpeserver_args = -c /usr/local/nagios/etc/nrpe.cfg --inetdlog_on_failure += USERIDdisable = noonly_from = 127.0.0.1,192.168.1.243}only_from = 127.0.0.1,192.168.1.243在后面增加监控主机的地址192.168.1.243以空格间隔编辑/etc/services文件,增加NRPE服务端口添加如下信息nrpe 5666/tcp #nrpe查看防火墙是否启动chkconfig iptables –list如果启动需要添加5666端口的开放规则vi /etc/sysconfig/iptables-A INPUT -m state --state NEW -m tcp -p tcp --dport 5666 -j ACCEPT添加该条目service iptables restart 重启iptables服务重启xinetd服务service xinetd restart检查服务端口状态[root@localhost ~]# netstat -natp |grep 5666tcp 0 0 :::5666 :::* LISTEN 1959/xinetd 服务端口已经启动测试NRPE是否则正常工作之前我们在安装了check_nrpe这个插件用于测试,现在就是用的时候.执行[root@localhost ~]# /usr/local/nagios/libexec/check_nrpe -H localhostNRPE v2.8.1返回了版本信息说明nrpe已经正常的工作了。
八大优秀IT基础设施监控工具

八大优秀IT基础设施监控工具IT基础设施监控工具(Infrastructure Monitoring Tool)是指能够实时收集、分析、报告并预测计算机系统、网络、应用程序和基础设施运行状况的软件工具。
它们是IT部门识别和处理问题,保持应用程序和服务高度可用性的重要工具。
下面介绍八大优秀IT基础设施监控工具。
1. NagiosNagios是一款使用广泛的开源网络监控系统,它可以检测网络、服务器和应用程序等问题。
它支持扩展性、灵活性和可维护性,可以从各种来源接收数据,并将结果以图形的方式进行显示。
Nagios还提供了日志记录、报告和警报功能,以提醒管理员解决问题。
2. ZabbixZabbix是一款开源的基于网络的监控解决方案,用于监控服务器、网络设备、应用程序等基础设施。
它支持多种数据类型的收集和分析,并可监控不同协议和服务的性能。
Zabbix还提供了定制报告、告警和峰值分析等强大的功能。
3. GraylogGraylog是一款开源的日志管理及分析软件,它能进行宏观异常诊断分析,以及日志、事件和服务器指标的集中化监控。
Graylog可以收集来自各种系统中的日志数据,并支持多种查询和分析方式。
Graylog还提供了警报、仪表板和报告等强大功能。
4. PrometheusPrometheus是一款开源的系统监控和告警工具,它可用于监控容器、云和裸机环境等。
它使用可配置的规则引擎来检测潜在的问题,并支持自动化响应机制。
Prometheus还提供了仪表板、可视化、告警和报告等功能。
5. IcingaIcinga是一款开源的网络监控软件,它继承了Nagios的开放性和扩展性,支持自定义插件和命令,可以对不同类型的系统和应用程序进行分层检测。
Icinga还提供了实时分析、峰值分析、告警和自定义报告等功能。
6. DynatraceDynatrace是一款高级应用程序性能监控工具,它可以实时监测业务流程,并识别潜在的瓶颈。
Nagios监控Linux主机(NRPE安装与应用)

Nagios监控Linux主机(NRPE安装与应用)一、NRPE简介及工作原理NRPE是nagios的一个扩展,它被用于被监控的服务器上,向nagios监控平台提供该服务器的一些本地的情况。
例如,cpu负载、内存使用、硬盘使用等等。
NRPE可以称为nagios 的for linux 客户端。
NRPE 由两个部分组成:工作在监控机一侧的check_nrpe 插件、工作在被监控机一侧的NRPE 守护进程。
Nagios 服务器执行check_nrpe 插件并告诉他检查哪个服务,check_nrpe 插件通过SSL 连接方式联系远程服务器上的NRPE 守护进程,NRPE 守护进程执行相应的插件完成指定的检查,并返回结果。
工作原理是:插件nrpe在被监控机上开启一个daemon,通过这个daemon来和监控主机建立一条ssl加密通道,通过这条通道来传送被监控机的本地信息,达到监控的目的。
装在被监控机上的daemon就相当于一个nagios的传递员,命令行从nagios监控主机发出,然后daemon接受到信息,就会执行这条命令行,执行的方式,其实是和nagios主机是一样的,所以被监控机上也需要装一套nagios-plugins插件。
例如:nagios主机需要监控被监控机的硬盘信息,就会对被监控机发出一条命令说:“我要看你的硬盘信息。
”被监控机nrpe的daemon接到这个命令之后,就会运行一个插件,来检查被监控机本地硬盘的信息,然后插件把信息反馈到nrpe,nrpe通过ssl通道再把这些信息反馈到nagios主机。
如下图所示二、NRPE安装1、所需安装包nrpe、nagios-plugins,这两个包都可以从上得到,本例为nrpe-2.12.tar.gz2、安装openssl、openssl-devel;yum install -y opensslyum install -y openssl-devel3、安装nrpe和nagios-plugins插件1)安装nagios-plugins,在安装时首先在被监控机上新建nagios用户及组。
基于Nagios的网络管理监控系统的应用研究

安装 完 成 后 可 以查 看 安 装 目录 : sls l ah- #l uto l a /c / go/bxe 可 以 看 到 以 下 文 件 ceksnos isiee 。 l hc_esr。
c e k sma , h c s p, h c s o c e k sh, h c i p c e k mt c e k p p,h c s
架 、 能特点 、 行环 境 、 装 配置 。为 高校 的 网络 管理 监控提 供 了有效 的解 决方案 。 功 运 安
【 关键词】 ai ;i x 网络监控 :N g s n ; oL u
随着计 算机 网络技术 在 高 校教 学 、实 验 中的不 断 各 种 N go 的插 件 . 户也 可 以开 发 自己的插 件 来监 ais 用 应用 。 服务器管 理的复 杂度也 在 不断增 强 服务 的质 控 自己的服务 。 ais 对 N g 在它众 多插 件的支持 下 . 以集 o 可
源 ; 户可 以开发简 单 的插 件 来监 控 己特定 的服 务 ; 用 当
ቤተ መጻሕፍቲ ባይዱ
#/s/ i/sr o a- ac dmI0 ur bnuem d— G ng m g s s i
#lslbn ue mo — G a e p c e urs il sr d a— n g md a a h
# ma eisal c ni k n tl- f o g
( ) ai hg 的安 装 : 4 N go sP i m
:t -d lo— I i - . 1 .r z I a 暑 lg 8lu r 1 . t . }r Ii p s 丑 e 4 4 ag
#. n gr / f ue— t— g∞— r Igo o ci l . i 硼 =I i I朋 a 8—唧 h
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、【提纲】
Nagios核心 内核模式 配置管理和服务管理 目录结构 服务对象的定义 Plugin工作模式和编写 插件信息输出 搭建我们想要的nagios RRD支持和介绍 SNMP支持 Png插件 添加监控项 增加web支持 一些扩展 Windows客户端支持 NRPE和NSCA扩展 添加监控项和rrd导数据脚本 web权限管理
NAGIOS监控系统一点经验和总结 隋剑峰
一、介绍
什么是Nagios?
Nagios是一款用于系统和网络监控的应用程序。它可以在你设 定的条件下对主机和服务进行监控,在状态变差和变好的时候给出 告警信息。
Nagios能干什么? .监控网络服务(SMTP、POP3、HTTP、NNTP、PING等) .监控主机资源(处理器负荷、磁盘利用率、网络流量等) .简单地插件设计使得用户可以方便地扩展自己服务的检测方法 . 当服务或主机问题产生与解决时将告警发送给联系人(通过
三、Nagios核心
内核模式 配置管理和服务管理 目录结构 服务对象的定义 Plugin工作模式和编写 插件信息输出
内核模式:
配置和服务管理:
安装 配置检测和启动 启动管理
目录结构:
etc Bin Libexec Sbin Share var
服务对象的定义:
什么是对象? 对象在哪里定义? 对象如何定义? 对象间的关系?
对象如何定义?
对象可以在一个用柔性化模板样式来定义, 模板可使得对Nagios的配置管理更为容易 。 下面简单介绍几种对象的定义。
对象间的关系?
服务组和主机组之间是多对多的关系。联 系人组可以他们两者也是多对多的关系。
Plugin工作模式和编写:
插件信息输出:
performance data格式:
什么是对象?
对象是指所有在监控和通知逻辑中涉及到的元素。对象 的类型包括 : 服务 服务组 主机 主机组 联系人 联系人组 命令 时间周期 通知扩展 通知和执行依赖关系
对象在哪里定义?
对象可以在一个配置文件cfg_file或是多个由主配 置文件对象保存目录cfg_dir里配置文件来定义。
RRD支持和介绍 SNMP支持 Png插件 添加监控项 增加web支持
五、一些扩展
Windows客户端支持 NRPE和NSCA扩展 添加监控项和rrd导数据脚本 web权限管理
NRPE和NSCA模式:
六、运行中遇到的问题
报警问题 展示速度慢的问题
七、总结
谢谢大家!
TEXT OUTPUT | OPTIONAL PERFDATA LONG TEXT LINE 1 LONG TEXT LINE 2 ... LONG TEXT LINE N | PERFDATA LINE 2 PERFDATA LINE 3 ... PERFDATA LINE N
四、搭建我们想要的nagios