构建基于nagios的图形化服务器监控报警平台

合集下载

Nagios监控路由器和交换机设备

Nagios监控路由器和交换机设备

Nagios监控路由器和交换机设备1.功能介绍Nagios可以监控有IP可管理的交换机和路由器的设备状态.对小型无管理功能的交换机和HUB是无法监控.监控的方式是通过外部的ping所反馈的信息或者通过SNMP协议来获取相关的状态信息.能够在网络设备上获取的信息包括:包丢失率,包往返时间平均值SNMP状态信息带宽和传输数率2.概述监控的方式有两种一种是利用ping的方式,获取数据包的响应时间和丢包率另一种是利用网络设备的SNMP数据,通过check_snmp获取端口状态和check_mrtgtraf来了解带宽状况.在使用check_snmp之前必须安装snmp包到系统中.如果没有安装则需要先安装好snmp系统包,然后再重新编译nagios plugins3.配置步骤完成第一次执行需要做的操作创建新的监控设备主机和服务对象重新启动Nagios4.确认一下内容在/usr/local/nagios/etc/objects/commands.cfg里面是否包含了check_snmp和check_local_mrt gtraf的命令定义在/usr/local/nagios/etc/objects/templates.cfg里面是否包含了generic-switch5.配置Nagiosa.编辑/usr/local/nagios/etc/nagios.cfg将#cfg_file=/usr/local/nagios/etc/objects/switch.cfg前面的#去掉b.编辑/usr/local/nagios/etc/object/switch.cfg文件设定监控主机的相关内容define host{use generic-switch ; Inherit default values from a templatehost_name Gateway ; The name we're giving to this switchalias Firewall ; A longer name associated with the switchaddress 192.168.200.1 ; IP address of the switchhostgroups allhosts,switches ; Host groups this switch is associated with}监控包的丢失率和RTA响应时间define service{use generic-service ; Inherit values from a templatehost_name Gateway ; The name of the host the service is associated withservice_description PING; The service descriptioncheck_command check_ping!200.0,20%!600.0,60% ;在超过200ms或丢包率在20%上的启动警告,超过600ms或丢包达到60%的启动报警normal_check_interval 5; 在正常情况下,每五分钟监控一次retry_check_interval 1; 在异常情况下,每分钟监控一次}利用SNMP监控交换和网关设备define service{use generic-service ; Inherit values from a templatehost_name Gatewayservice_description Uptimecheck_command check_snmp!-C public -o sysUpTime.0}利用MRTG来监控网络流量信息define service{use generic-service ; Inherit values from a templatehost_name Gatewayservice_description Port 1 Bandwidth Usagecheck_commandcheck_local_mrtgtraf!/var/lib/mrtg/192.168.200.1_1.log!AVG!1000000,2000000!5000000,5000000!10 }利用command里面设定的check_local_mrtgtraf获取本地保存的mrt g流量日志信息来监控,获取文件是/var/lib/mrt g/192.168.200.1_1.log获取数据值是采取AVG的值,数值在1M~2M之间,则状态改为warning,如果超过5M的话则状态改为critical 完成配置后service nagios restart。

基于Nagios构建企业级信息系统监控方案

基于Nagios构建企业级信息系统监控方案

基于Nagios构建企业级信息系统监控方案作者:武冬春来源:《计算机光盘软件与应用》2013年第16期摘要:企业信息系统中的服务器、网络等基础设施的稳定运行是保障业务正常运行的基础。

而要保证这些基础设施稳定、高效的运行,设备故障及时有效的发现、设备运行状态信息及时有效的展示就显得十分重要,信息系统的有效监控已成为信息系统管理的重要问题。

大中型企业内部存在着成百上千台服务器、网络等设备,如何实现对这些设备的有效监控,并且高效的解决各类系统故障,保障系统稳定、高效的运行呢?本文主要对Nagios监控功能进行分析,论述了如何利用它去监控服务器等设备。

关键词:nagios;监控;网络管理中图分类号:TP393.18随着企业信息系统的不断建设,庞大的服务器等基础设施的有效监控已成为信息系统管理的重要问题。

依靠人工巡检的方式对于系统故障、潜在风险及安全隐患的发现效率越来越差,为提高发现故障的及时性、把运维人员从繁重的工作中解放出来,亟需引入新的工具来协助工程师解决当前的问题。

该工具能够实现对各类IT设备的监视和管理,提高基础设施的服务质量和效率,因此自动化工具对于运维人员就十分必要。

Nagios是一种开源网管软件,利用它可以实现对企业中的服务器、网络等设备进行全面的监控。

1 Nagios介绍1.1 Nagios简介Nagios是一款开源的监视系统运行状态的网管监控系统。

它能监视本地或远程设备以及服务,同时提供异常告警通知功能等。

Nagios能运行在Linux/Unix平台,状态监测等可实现利用WEB浏览器展示。

1.2 Nagios的主要功能特点监视服务状态(SMTP,POP3,FTP,HTTP,PING等)监视资源利用率(CPU、内存,磁盘I/O等)利用插件方式轻松扩展监视功能支持各类服务等监视的并发处理功能支持错误通知功能(通过email,短信等方法)可指定自定义的事件处理控制器基于WEB浏览器的界面以方便维护人员查看被监控端状态支持通过手机终端查看监控信息1.3 Nagios工作原理Nagios的功能是监控服务和主机,Nagios的监控、检测功能都是依赖各种插件来完成。

服务器监控报警设置技巧如何设置服务器监控报警提醒

服务器监控报警设置技巧如何设置服务器监控报警提醒

服务器监控报警设置技巧如何设置服务器监控报警提醒在当今信息化时代,服务器已经成为企业运营中不可或缺的重要设备。

为了确保服务器的正常运行,及时发现并解决问题,服务器监控系统就显得尤为重要。

而服务器监控报警设置则是服务器监控系统中至关重要的一环,它可以帮助管理员及时发现服务器异常情况,保障服务器的稳定运行。

本文将介绍一些服务器监控报警设置的技巧,帮助管理员更好地设置服务器监控报警提醒。

一、选择合适的监控工具首先,要选择一款适合自己服务器的监控工具。

市面上有很多种服务器监控工具,如Zabbix、Nagios、Prometheus等,每种工具都有其特点和适用场景。

在选择监控工具时,需要考虑自己的实际需求和服务器环境,选择一款功能全面、易于使用的监控工具。

二、设置监控项在进行服务器监控报警设置之前,首先需要设置监控项。

监控项是指需要监控的服务器指标,如CPU利用率、内存使用率、磁盘空间等。

管理员可以根据服务器的实际情况,设置相应的监控项,以便及时发现服务器异常情况。

三、设置报警规则设置监控项后,接下来就是设置报警规则。

报警规则是指当监控项达到一定阈值时,系统会触发报警。

管理员可以根据实际情况设置不同的报警规则,如CPU利用率超过80%时触发报警,内存使用率超过90%时触发报警等。

合理设置报警规则可以帮助管理员及时发现服务器异常情况,避免服务器宕机或数据丢失等问题。

四、选择报警方式在设置报警规则时,管理员还需要选择报警方式。

常见的报警方式包括邮件、短信、电话等。

管理员可以根据自己的习惯和需求选择合适的报警方式,以便在服务器出现异常情况时能够及时收到报警提醒。

五、定时检查报警设置最后,管理员还需要定时检查报警设置,确保报警规则和报警方式设置正确有效。

服务器环境是不断变化的,可能会出现新的问题或需求,因此定时检查报警设置是非常必要的,可以及时调整和优化报警设置,提高服务器监控的效率和准确性。

总之,服务器监控报警设置是保障服务器稳定运行的重要环节,合理设置监控项、报警规则和报警方式,定时检查和优化报警设置,可以帮助管理员及时发现并解决服务器问题,确保服务器的正常运行。

Nagios监控Linux主机(NRPE安装与应用)

Nagios监控Linux主机(NRPE安装与应用)

Nagios监控Linux主机(NRPE安装与应用)一、NRPE简介及工作原理NRPE是nagios的一个扩展,它被用于被监控的服务器上,向nagios监控平台提供该服务器的一些本地的情况。

例如,cpu负载、内存使用、硬盘使用等等。

NRPE可以称为nagios 的for linux 客户端。

NRPE 由两个部分组成:工作在监控机一侧的check_nrpe 插件、工作在被监控机一侧的NRPE 守护进程。

Nagios 服务器执行check_nrpe 插件并告诉他检查哪个服务,check_nrpe 插件通过SSL 连接方式联系远程服务器上的NRPE 守护进程,NRPE 守护进程执行相应的插件完成指定的检查,并返回结果。

工作原理是:插件nrpe在被监控机上开启一个daemon,通过这个daemon来和监控主机建立一条ssl加密通道,通过这条通道来传送被监控机的本地信息,达到监控的目的。

装在被监控机上的daemon就相当于一个nagios的传递员,命令行从nagios监控主机发出,然后daemon接受到信息,就会执行这条命令行,执行的方式,其实是和nagios主机是一样的,所以被监控机上也需要装一套nagios-plugins插件。

例如:nagios主机需要监控被监控机的硬盘信息,就会对被监控机发出一条命令说:“我要看你的硬盘信息。

”被监控机nrpe的daemon接到这个命令之后,就会运行一个插件,来检查被监控机本地硬盘的信息,然后插件把信息反馈到nrpe,nrpe通过ssl通道再把这些信息反馈到nagios主机。

如下图所示二、NRPE安装1、所需安装包nrpe、nagios-plugins,这两个包都可以从上得到,本例为nrpe-2.12.tar.gz2、安装openssl、openssl-devel;yum install -y opensslyum install -y openssl-devel3、安装nrpe和nagios-plugins插件1)安装nagios-plugins,在安装时首先在被监控机上新建nagios用户及组。

服务器监控工具推荐实时监测和报警

服务器监控工具推荐实时监测和报警

服务器监控工具推荐实时监测和报警随着互联网的发展,服务器的稳定性和安全性变得越来越重要。

服务器监控工具作为一种实时监测和报警系统,能够帮助我们及时发现服务器故障,并采取相应的措施进行修复,从而保障系统的正常运行。

本文将为您推荐几款优秀的服务器监控工具,帮助您更好地监控和管理服务器。

一、ZabbixZabbix是一款全面的服务器监控工具,具有强大的功能和易用的界面。

它支持多种操作系统和网络设备,可以实时监测服务器的CPU、内存、磁盘等关键指标,并集中管理所有的监控数据。

此外,Zabbix还支持自定义报警规则,当服务器出现异常时,可以及时发送报警信息给管理员,方便快速响应和处理。

二、NagiosNagios是另一个备受推崇的服务器监控工具,被广泛应用于各类企业级系统。

它具有灵活的配置和强大的扩展性,可以监控服务器的服务状态、网络连接和硬件设备等多个方面。

Nagios支持多种报警方式,可以通过电子邮件、短信或者手机应用程序发送报警信息,让管理员能够及时了解服务器的运行状况。

三、PrometheusPrometheus是一种用于时序数据监控和警报的开源系统。

它可以高效地收集服务器的监控数据,并通过内置的警报规则引擎实现实时报警。

Prometheus还支持灵活的数据查询和可视化工具,使管理员可以更方便地分析服务器的性能指标和趋势,帮助他们及时进行系统优化和故障排查。

四、DatadogDatadog是一款云端服务器监控工具,旨在帮助用户实时监测服务器的性能和可用性。

它支持多种云计算平台和操作系统,可以自动收集服务器的指标数据,并提供丰富的视图和仪表盘来展示这些数据。

Datadog还提供智能报警功能,可以根据用户设置的规则进行实时报警,确保服务器的稳定性和安全性。

五、GrafanaGrafana是一款流行的开源数据可视化工具,常与其他服务器监控工具配合使用。

它提供了丰富多样的可视化选项,能够将服务器监控数据以图表和仪表盘的形式展示出来,帮助管理员更直观地了解服务器的状态和趋势。

基于Linux的Nagios服务器监控系统的研究与实现

基于Linux的Nagios服务器监控系统的研究与实现
a d d tcin f rr moe s r es n ee t o e t e v r . o Ke r s Na is e v r l g i y wo d : go ;s r e ;p u - n;NRP E;L n x iu
0 引 言
随着我 国各行各业 信息化 的迅速普 及 , 机房 作为

N g s 一款遵 循 G L 2的开 源 网络监 控软件 , ai 是 o Pv 可用来 监控指定 的 多种 系 统 的 变化 时 通 知 管 理 员… 。N go ai s通
常 由一个 主程序 ( ai ) 一 个插 件程 序 ( ai —l— N go 、 s N go pu s
gn ) 4个 可 选 的 A D N( R E、 S A、 S l n is 和 D O N P N C N Ci t e
+ +和 N O ts组 成。N go D Ui ) l ais的监 控 工 作 都是 通 过
插件 实 现 的。 因 此 , ai N g s和 N g spu i o ai —lg s是 服 务 o n
果单 靠 人工去 监测这 么 多服 务器 显然 既 不科 学 也 不
现实 。
因此 , 一个能够 实时监测 服务器 系统 的软件 对 于
远程 LnxU i iu/ nx主机 主 动将 监 控 信息 发 送 给 N g s ai o
服务 器 ; S l n + 是 用来监 控 Widw 主机时安 装 N Ci t + e no s
c n mo i rs r e n n t o k e t ey h sp p r td e h t o t k s f go l g n v i b et c iv n tr g a n t e v ro ew r n i l .T i a e u ist a w ma e u e o isp u i sa al l oa h e e mo i i o r s h o Na a on

基于Nagios的网络管理监控系统的应用研究

基于Nagios的网络管理监控系统的应用研究
撑 m丑 eal k l 撑 Ia eisal n k n tl
安装 完 成 后 可 以查 看 安 装 目录 : sls l ah- #l uto l a /c / go/bxe 可 以 看 到 以 下 文 件 ceksnos isiee 。 l hc_esr。
c e k sma , h c s p, h c s o c e k sh, h c i p c e k mt c e k p p,h c s
架 、 能特点 、 行环 境 、 装 配置 。为 高校 的 网络 管理 监控提 供 了有效 的解 决方案 。 功 运 安
【 关键词】 ai ;i x 网络监控 :N g s n ; oL u
随着计 算机 网络技术 在 高 校教 学 、实 验 中的不 断 各 种 N go 的插 件 . 户也 可 以开 发 自己的插 件 来监 ais 用 应用 。 服务器管 理的复 杂度也 在 不断增 强 服务 的质 控 自己的服务 。 ais 对 N g 在它众 多插 件的支持 下 . 以集 o 可
源 ; 户可 以开发简 单 的插 件 来监 控 己特定 的服 务 ; 用 当
ቤተ መጻሕፍቲ ባይዱ
#/s/ i/sr o a- ac dmI0 ur bnuem d— G ng m g s s i
#lslbn ue mo — G a e p c e urs il sr d a— n g md a a h
# ma eisal c ni k n tl- f o g
( ) ai hg 的安 装 : 4 N go sP i m
:t -d lo— I i - . 1 .r z I a 暑 lg 8lu r 1 . t . }r Ii p s 丑 e 4 4 ag
#. n gr / f ue— t— g∞— r Igo o ci l . i 硼 =I i I朋 a 8—唧 h

服务器监控工具GrafanaZabbix和Nagios的比较与选择

服务器监控工具GrafanaZabbix和Nagios的比较与选择

服务器监控工具GrafanaZabbix和Nagios的比较与选择服务器监控工具Grafana、Zabbix和Nagios的比较与选择引言:在现代信息技术的快速发展下,服务器监控成为了保证系统稳定性和可靠性的重要手段。

监控工具能够实时收集服务器的各项指标数据,并提供可视化的报告和告警功能。

在众多的服务器监控工具中,Grafana、Zabbix和Nagios是常用且值得关注的三个工具。

本文将对它们进行比较与选择,帮助读者了解它们的特点和适用场景。

一、GrafanaGrafana是一个开源的数据可视化和监控平台,可以通过各种数据源将数据可视化展现。

它提供了强大的图表展示功能,能够将数据以多种方式和方式呈现,包括但不限于折线图、柱状图、饼图等。

Grafana还支持用户自定义报表和图表样式,使监控报告与用户需求更加契合。

Grafana的优势在于其出色的数据可视化和用户友好的界面。

通过直观的图表,用户可以快速了解服务器性能和趋势,发现潜在问题并采取相应的措施。

此外,Grafana支持多个数据源,可以与其他监控工具(如Zabbix)结合使用,实现自定义监控指标和更全面的监控功能。

然而,需要注意的是,Grafana并非一个全功能的服务器监控工具,而更偏向于数据可视化。

如果仅仅需要展示服务器性能和数据,Grafana是一个很好的选择。

二、ZabbixZabbix是一款功能强大而成熟的服务器监控工具。

它具有丰富的监控功能,可以监控服务器性能、网络流量、数据库、应用程序服务等各个方面。

Zabbix可以进行实时监控,并能够生成详细的报告和告警,及时通知管理员。

Zabbix的优点在于其全面性和灵活性。

它支持各种不同类型的监控项,可以根据具体需求进行自定义。

Zabbix还提供了灵活的告警机制,可以通过邮件、短信、微信等多种方式发送告警信息,确保管理员能够及时了解并解决潜在问题。

此外,Zabbix还具备强大的历史数据存储和分析能力,可以为系统的容量规划和性能优化提供有力的支持。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

构建基于nagios的图形化服务器监控报警平台
摘要:企业系统管理员的一项重要工作是了解企业服务器和网络设备的运行状况。

阐述了开源监控软件nagios与飞信和pnp4pnagios的集成,实现对多种平台上的关键应用和服务器运行指标图形化的监控和报警。

关键词:nagios;服务器监控;飞信机器人;报警;pnp4nagios
0引言
服务器和网络设备的运行状态监控是系统管理员的一项重要任务,比如实时监控系统的cpu利用率、内存使用率、可用磁盘空间、数据库服务器运行情况、Web服务运行情况以及对出现问题时的报警以便快速解决问题等等。

Nagios系统是一款运行于Linux或Unix上的服务器系统监控开源软件, 能监视所指定的本地或远程主机以及服务,提供异常通知功能,同时提供一个可选的基于浏览器的Web 界面以方便系统管理人员查看各种系统运行状态,更重要的是它还可
以通过插件的扩展功能实现对网络上的服务器进行全面监控。

本文以RedHat Linux 5.4操作系统为平台, 在nagios监控系统基础上,集成飞信报警和pnp4nagios。

通过该平台,可以实现对企业所有应用服务器24小时实时监控,出现异常情况时以飞信发送手机短信报警,并将监控结果存储于后台数据库中,经过数据分析,将监控的状态趋势以图表形式展现出来,方便了系统管理员的日常工作。

1nagios 工作原理和特点
nagios是有许多组件组成的,最核心的组件就是nagios 进程,利用其众多的插件搜集信息,分析数据,将结果写入日志文件,当核心进程识别到问题后,发送报警信息给系统管理员。

Web界面和CGI 脚本读取这些搜集到信息显示在浏览器上,实现对本机和远端服务的监控。

Nagios采用集中-分布的管理模式,在nagios服务器端,安装nagios主程序,在被监控端安装代理程序,通过主程序与代理程序之间的通信,监视对象的状态。

Nagios自身并不包括监控服务和主机的代码,所有的监控、检测功能是通过各种插件来完成的,当nagios 主程序启动后,就会根据设定的周期,自动调用插件去检测服务和主机状态,将检测到的状态信息进入队列,并通过Web页面显示出来。

Nagios提供了很多插件,很多开源爱好者不断地添加插件,丰富了监控的功能,利用这些插件可以很方便地监控到服务和主机的状态。

通过插件的检测,返回4种状态信息,0(ok)正常、1(warning)警告、2(critical)严重、3(unknown)未知,nagios根据这4种状态
信息发送警报给系统管理员。

Nagios系统的特点主要有以下几点:监控主机资源和网络服务、允许用户通过设计简单的插件来监控自己特定的服务、当被监控对象出现问题是,会及时通知管理人员、事先定义事件处理程序,当对象出现问题时自动调用对应的处理程序、通过Web页面来监视对
象状态、告警提示和日志文件。

2监控环境的构建
笔者目前管理的网络环境,比较关键的服务器30多台,需监控的应用项目大约300多项,涉及windows平台和linux平台,已经搭建好nagios平台,需要通过飞信和pnp4nagios扩展功能,当监控过程中发生异常情况时,如监控的结果超过预设的阀值时,及时通过飞信发送报警信息通知系统管理员,当恢复正常时及时反馈等。

另外,监控的结果除了了解当前的监控状况外,还需要了解历史监控情况,
通过查看趋势图表掌握各项服务运行情况。

3将飞信集成到nagios监控系统
在被监控服务器如果出现警告或者严重报警信息,如果使用手机短信接收无疑方便快捷得多,目前有一些短信猫可以实现这一功能,但是可能涉及费用,这里使用飞信机器人来免费实现手机短信报警。

3.1定义命令
如同nagios的其他插件一样,首先定义飞信的执行命令:
command_name notify-host-by-fetion
command_line /usr/local/nagios/fetion/fetion --mobile=飞信发送手机号--pwd=飞信密码--to=$CONTACTPAGER$ --exit-on-verifycode --msg-type=1 --msg-utf8="Host: $HOSTNAME$(IP:$HOSTADDRESS$) state: $HOSTSTATE$ on $LONGDATETIME$. State information:
$HOSTOUTPUT$ "
command_name notify-service-by-fetion
command_line /usr/local/nagios/fetion/fetion --mobile=飞信发送手机号--pwd=飞信密码--to=$CONTACTPAGER$ --exit-on-verifycode --msg-type=1 --msg-utf8=" (IP: $HOSTADDRESS$)($SERVICEDESC$) state:
$SERVICESTATE$ . Detail : $SERVICEOUTPUT$"
3.2定义联系人
在联系人配置文件中,增加:
service_notification_commands notify-service-by-fetion
host_notification_commands notify-service-by-fetion
在contact.cfg中增加收件人的手机号:如pager 接收
人手机号,也可以增加多个手机号,用逗号分开。

重新启动nagios服务,这样被监控服务器一旦发生报警就可以通过手机短信接收信息了。

4将nagios监控的历史信息通过图形展示出来
4.1修改nagios 的配置文件
在nagios.cfg中开启performance_data
#打开注释项:
process_performance_data=1
host_perfdata_command=process-host-perfdata
service_perfdata_command=process-service-perfdata
4.2修改commands.cfg
command_name process-service-perfdata
command_line /usr/local/pnp4nagios/libexec/process_perfdata.pl
command_name process-host-perfdata
command_line /usr/local/pnp4nagios/libexec/process_perfdata.pl
-d HOSTPERFDATA
4.3添加小太阳模版,镶嵌在nagios页面上
第一步,修改模板配置文件:
# vi templates.cfg
## 在最后添加
define host {
name host-pnp
action_url
/pnp4nagios/index.php/graph?host=$HOSTNAME$&srv=_HOST_
register 0
}
define service {
name srv-pnp
action_url /pnp4nagios/index.php/graph?host=$HOSTNAME$&srv=$SERVICEDE
SC$
register 0
}
第二步,修改主机配置文件
在主机定义处,增加:
use linux-server,host-pnp
在每一项服务定义处,增加:
use generic-service,srv-pnp
第三步,重启nagios 服务:
#service nagios restart
打开nagios的Web页面,点开小太阳图标,出现图形界面,
可以很方便地了解监控到的历史数据。

5结束语
随着企业信息化的不断推进,应用系统和服务器以及网络设备的监控和管理工作显得更加重要,构建一个系统监控平台,集成简单实用的插件,并给出了趋势图,这些数据是不断进行的,为改善系统运行状况提供了数据依据,对于及时发现系统运行时的问题和隐患,对于节省企业信息化维护费用,保障企业信息化建设的正常运转具有非常重要的意义。

今后,随着应用的增多,可以通过这一平台灵活地添
加各种监控插件,为企业信息化发展提供信息决策。

参考文献:
[1]陈子国,刘金刚.基于nagios的网络监控系统的设计和实现[J].
实验室研究与探索,2009(8).
[2]王帆.基于nagios的服务器监控平台构建与实现[J].实验室研究
与探索,2010(12).
[3]宋磊,王静文.OpenBSD下基于Nagios的网络服务监控报警系
统的研究[J].电脑编程技巧与维护,2009(14).。

相关文档
最新文档