基于Nagios构建企业级信息系统监控方案

合集下载

信息系统监控方案

信息系统监控方案

信息系统监控方案一、引言随着信息科技的迅猛发展,信息系统已成为企业运行的重要组成部分。

然而,随之而来的安全隐患也日益增加。

为了保障信息系统的安全运行,有效的监控方案势在必行。

本文将介绍一个完整的信息系统监控方案。

二、监控目标1.提高信息系统的安全性:通过对信息系统的监控,可以及时发现潜在的安全漏洞并及时修补,避免信息泄露和系统被攻击的风险。

2.提高信息系统的可用性:通过对信息系统的监控,可以及时发现系统故障并及时处理,保证信息系统的稳定运行,避免对业务操作的影响。

3.提高信息系统的性能:通过对信息系统的监控,可以及时发现系统瓶颈并进行优化,提高系统的运行效率,保证用户的使用体验。

4.提高信息系统的合规性:通过对信息系统的监控,可以及时发现违反法律法规和企业策略的操作行为,保证信息系统的合规运行。

三、监控内容1.网络流量监控:通过对网络流量的监控,可以发现网络攻击和异常流量,及时采取相应的措施进行防护。

2.安全日志监控:通过对系统日志的监控,可以及时发现异常登录、异常操作等安全事件,提供追踪和事后分析的能力。

3.硬件监控:通过对服务器、交换机等硬件设备的监控,可以及时发现硬件故障,减少系统宕机时间。

4.应用程序监控:通过对应用程序的监控,可以发现系统资源利用率、性能瓶颈等问题,并进行相应的优化。

5.数据库监控:通过对数据库的监控,可以及时发现数据库性能问题、数据库连接异常等,保证数据库的稳定运行。

四、监控工具1. 网络流量监控工具:例如Wireshark、Snort等工具,可以对网络流量进行实时监控和分析,发现异常流量和网络攻击。

2. 安全日志监控工具:例如Splunk、ELK等工具,可以收集和分析系统产生的安全日志,发现异常登录和操作等安全事件。

3. 硬件监控工具:例如Zabbix、Nagios等工具,可以对服务器、交换机等硬件设备进行实时监控,发现硬件故障。

4. 应用程序监控工具:例如New Relic、AppDynamics等工具,可以对应用程序的性能进行实时监控,发现性能瓶颈和资源利用率问题。

Nagios监控路由器和交换机设备

Nagios监控路由器和交换机设备

Nagios监控路由器和交换机设备1.功能介绍Nagios可以监控有IP可管理的交换机和路由器的设备状态.对小型无管理功能的交换机和HUB是无法监控.监控的方式是通过外部的ping所反馈的信息或者通过SNMP协议来获取相关的状态信息.能够在网络设备上获取的信息包括:包丢失率,包往返时间平均值SNMP状态信息带宽和传输数率2.概述监控的方式有两种一种是利用ping的方式,获取数据包的响应时间和丢包率另一种是利用网络设备的SNMP数据,通过check_snmp获取端口状态和check_mrtgtraf来了解带宽状况.在使用check_snmp之前必须安装snmp包到系统中.如果没有安装则需要先安装好snmp系统包,然后再重新编译nagios plugins3.配置步骤完成第一次执行需要做的操作创建新的监控设备主机和服务对象重新启动Nagios4.确认一下内容在/usr/local/nagios/etc/objects/commands.cfg里面是否包含了check_snmp和check_local_mrt gtraf的命令定义在/usr/local/nagios/etc/objects/templates.cfg里面是否包含了generic-switch5.配置Nagiosa.编辑/usr/local/nagios/etc/nagios.cfg将#cfg_file=/usr/local/nagios/etc/objects/switch.cfg前面的#去掉b.编辑/usr/local/nagios/etc/object/switch.cfg文件设定监控主机的相关内容define host{use generic-switch ; Inherit default values from a templatehost_name Gateway ; The name we're giving to this switchalias Firewall ; A longer name associated with the switchaddress 192.168.200.1 ; IP address of the switchhostgroups allhosts,switches ; Host groups this switch is associated with}监控包的丢失率和RTA响应时间define service{use generic-service ; Inherit values from a templatehost_name Gateway ; The name of the host the service is associated withservice_description PING; The service descriptioncheck_command check_ping!200.0,20%!600.0,60% ;在超过200ms或丢包率在20%上的启动警告,超过600ms或丢包达到60%的启动报警normal_check_interval 5; 在正常情况下,每五分钟监控一次retry_check_interval 1; 在异常情况下,每分钟监控一次}利用SNMP监控交换和网关设备define service{use generic-service ; Inherit values from a templatehost_name Gatewayservice_description Uptimecheck_command check_snmp!-C public -o sysUpTime.0}利用MRTG来监控网络流量信息define service{use generic-service ; Inherit values from a templatehost_name Gatewayservice_description Port 1 Bandwidth Usagecheck_commandcheck_local_mrtgtraf!/var/lib/mrtg/192.168.200.1_1.log!AVG!1000000,2000000!5000000,5000000!10 }利用command里面设定的check_local_mrtgtraf获取本地保存的mrt g流量日志信息来监控,获取文件是/var/lib/mrt g/192.168.200.1_1.log获取数据值是采取AVG的值,数值在1M~2M之间,则状态改为warning,如果超过5M的话则状态改为critical 完成配置后service nagios restart。

基于Nagios构建企业级信息系统监控方案

基于Nagios构建企业级信息系统监控方案

基于Nagios构建企业级信息系统监控方案作者:武冬春来源:《计算机光盘软件与应用》2013年第16期摘要:企业信息系统中的服务器、网络等基础设施的稳定运行是保障业务正常运行的基础。

而要保证这些基础设施稳定、高效的运行,设备故障及时有效的发现、设备运行状态信息及时有效的展示就显得十分重要,信息系统的有效监控已成为信息系统管理的重要问题。

大中型企业内部存在着成百上千台服务器、网络等设备,如何实现对这些设备的有效监控,并且高效的解决各类系统故障,保障系统稳定、高效的运行呢?本文主要对Nagios监控功能进行分析,论述了如何利用它去监控服务器等设备。

关键词:nagios;监控;网络管理中图分类号:TP393.18随着企业信息系统的不断建设,庞大的服务器等基础设施的有效监控已成为信息系统管理的重要问题。

依靠人工巡检的方式对于系统故障、潜在风险及安全隐患的发现效率越来越差,为提高发现故障的及时性、把运维人员从繁重的工作中解放出来,亟需引入新的工具来协助工程师解决当前的问题。

该工具能够实现对各类IT设备的监视和管理,提高基础设施的服务质量和效率,因此自动化工具对于运维人员就十分必要。

Nagios是一种开源网管软件,利用它可以实现对企业中的服务器、网络等设备进行全面的监控。

1 Nagios介绍1.1 Nagios简介Nagios是一款开源的监视系统运行状态的网管监控系统。

它能监视本地或远程设备以及服务,同时提供异常告警通知功能等。

Nagios能运行在Linux/Unix平台,状态监测等可实现利用WEB浏览器展示。

1.2 Nagios的主要功能特点监视服务状态(SMTP,POP3,FTP,HTTP,PING等)监视资源利用率(CPU、内存,磁盘I/O等)利用插件方式轻松扩展监视功能支持各类服务等监视的并发处理功能支持错误通知功能(通过email,短信等方法)可指定自定义的事件处理控制器基于WEB浏览器的界面以方便维护人员查看被监控端状态支持通过手机终端查看监控信息1.3 Nagios工作原理Nagios的功能是监控服务和主机,Nagios的监控、检测功能都是依赖各种插件来完成。

nagios监控端安装配置手册

nagios监控端安装配置手册

一、系统环境与软件版本情况本文档使用被监控机的操作系统为rhel6.3 _64位。

监控主机操作系统为rhel6.0 _64位及windows 2003,nagios主服务版本Nagios® Core™ 3.2.3,linu被监控机与主监控通信插件NRPE版本为nrpe-2.8.1。

window被监控机与主监控服务软件为NSClient++-0.2.7所使用的软件如下nrpe-2.8.1.tar.gzNSClient++-0.2.7.zip二、安装配置过程。

因为系统安装大家都非常熟悉了此次略过操作系统安装过程,首先是linux环境下被监控机的安装配置过程。

在安装之前先写个nagios监控非本地信息的原理图主监控机被监控机NRPE总共由两部分组成:–check_nrpe 插件,位于在监控主机上–NRPE daemon,运行在远程的linux主机上(通常就是被监控机)按照上图,整个的监控过程如下:当nagios需要监控某个远程linux主机的服务或者资源情况时1.nagios会运行check_nrpe这个插件,告诉它要检查什么.2.check_nrpe插件会连接到远程的NRPE daemon,所用的方式是SSL3.NRPE daemon会运行相应的nagios插件来执行检查4.NRPE daemon将检查的结果返回给check_nrpe插件,插件将其递交给nagios做处理.注意:NRPE daemon需要nagios插件安装在远程的linux主机上,否则,daemon不能做任何的监控.因为使用rehl线上的yum源安装需要授权,所以先使用iso搭个本地的yum源。

mount /dev/cdrom /mnt/cdrom/ 挂载光驱mkdir /home/rehliso 创建yum源目录。

cp -Rf /mnt/cdrom/* /home/rehliso/ 拷贝安装文件到源目录cd /etc/yum.repos.d/ 切换至yum配置文件目录cp rhel-source.repo rhel-source.repo.bak 备份配置文件vi rhel-source.repo 编辑配置文件,删除之前内容加入[rhel_6_iso]name=local isobaseurl=file:///home/rehlisogpgcheck=1gpgkey=file:///home/rehliso/RPM-GPG-KEY-redhat-release保存退出Yum clean all清除YUM缓存因为是用二进制安装包进行安装所以要先安装gcc编译器yum -y install gcc 安装gcc编译器安装完成后用sftp上传安装文件nrpe-2.8.1.tar.gz, nagios-plugins-1.4.13.tar.gz至/usr/local/src/目录下创建nagios用户Userad nagiosPasswd nagiosCd /usr/local/src 切换至/usr/local/src/目录解压安装包tar zxvf nagios-plugins-1.4.13.tar.gzcd nagios-plugins-1.4.13编译安装./configuremakemake install这一步完成后会在/usr/local/nagios/下生成两个目录libexec和share修改目录权限把权限所属chown nagios.nagios /usr/local/nagios/chown -R nagios.nagios /usr/local/nagios/libexec/至此被监控机nagios插件已经安装完成,接下来就是安装nrpe服务了切换至软件包目录Cd /usr/local/src解压安装文件tar zxvf nrpe-2.8.1.tar.gzcd nrpe-2.8.1编译安装./configurechecking for SSL... configure: error: Cannot find ssl libraries 出现了该错误主要是因为监控主机插件check_nrpe与被监控nrpe服务的通信是通过ssl方式连接的所以必须安装sslyum -y install openssl-devel 所以这个可以在gcc安装时顺便也安装了ssl安装完成后重新./configure*** Configuration summary for nrpe 2.8.1 05-10-2007 ***:General Options:-------------------------NRPE port: 5666NRPE user: nagiosNRPE group: nagiosNagios user: nagiosNagios group: nagiosReview the options above for accuracy. If they look okay,type 'make all' to compile the NRPE daemon and client.成功后会出现以上安装的基本信息接下来编译安装make allmake install-daemonmake install-daemon-configmake install-plugin 安装check_nrpe这个插件之前说过监控机需要安装check_nrpe这个插件,被监控机并不需要,我们在这里安装它是为了测试的目的安装xinetd脚本make install-xinetd这里还要补充一下因为官网的安装文档是将NRPE deamon作为xinetd下的一个服务运行的.在这样的情况下xinetd就必须要先安装好,所以还得确定系统是否已经安装了xinetd的服务[root@localhost nrpe-2.8.1]# service xinetd restartxinetd: unrecognized service服务并未安装yum -y install xinetd 安装xinetd服务安装完成后修改配置文件vi /etc/xinetd.d/nrpeservice nrpe{flags = REUSEsocket_type = streamport = 5666 端口wait = nouser = nagios 用户group = nagios 用户组server = /usr/local/nagios/bin/nrpeserver_args = -c /usr/local/nagios/etc/nrpe.cfg --inetdlog_on_failure += USERIDdisable = noonly_from = 127.0.0.1,192.168.1.243}only_from = 127.0.0.1,192.168.1.243在后面增加监控主机的地址192.168.1.243以空格间隔编辑/etc/services文件,增加NRPE服务端口添加如下信息nrpe 5666/tcp #nrpe查看防火墙是否启动chkconfig iptables –list如果启动需要添加5666端口的开放规则vi /etc/sysconfig/iptables-A INPUT -m state --state NEW -m tcp -p tcp --dport 5666 -j ACCEPT添加该条目service iptables restart 重启iptables服务重启xinetd服务service xinetd restart检查服务端口状态[root@localhost ~]# netstat -natp |grep 5666tcp 0 0 :::5666 :::* LISTEN 1959/xinetd 服务端口已经启动测试NRPE是否则正常工作之前我们在安装了check_nrpe这个插件用于测试,现在就是用的时候.执行[root@localhost ~]# /usr/local/nagios/libexec/check_nrpe -H localhostNRPE v2.8.1返回了版本信息说明nrpe已经正常的工作了。

基于Nagios的网络管理监控系统的应用研究

基于Nagios的网络管理监控系统的应用研究
撑 m丑 eal k l 撑 Ia eisal n k n tl
安装 完 成 后 可 以查 看 安 装 目录 : sls l ah- #l uto l a /c / go/bxe 可 以 看 到 以 下 文 件 ceksnos isiee 。 l hc_esr。
c e k sma , h c s p, h c s o c e k sh, h c i p c e k mt c e k p p,h c s
架 、 能特点 、 行环 境 、 装 配置 。为 高校 的 网络 管理 监控提 供 了有效 的解 决方案 。 功 运 安
【 关键词】 ai ;i x 网络监控 :N g s n ; oL u
随着计 算机 网络技术 在 高 校教 学 、实 验 中的不 断 各 种 N go 的插 件 . 户也 可 以开 发 自己的插 件 来监 ais 用 应用 。 服务器管 理的复 杂度也 在 不断增 强 服务 的质 控 自己的服务 。 ais 对 N g 在它众 多插 件的支持 下 . 以集 o 可
源 ; 户可 以开发简 单 的插 件 来监 控 己特定 的服 务 ; 用 当
ቤተ መጻሕፍቲ ባይዱ
#/s/ i/sr o a- ac dmI0 ur bnuem d— G ng m g s s i
#lslbn ue mo — G a e p c e urs il sr d a— n g md a a h
# ma eisal c ni k n tl- f o g
( ) ai hg 的安 装 : 4 N go sP i m
:t -d lo— I i - . 1 .r z I a 暑 lg 8lu r 1 . t . }r Ii p s 丑 e 4 4 ag
#. n gr / f ue— t— g∞— r Igo o ci l . i 硼 =I i I朋 a 8—唧 h

监控系统配置使用(Nagios)

监控系统配置使用(Nagios)
税友
监控系统配置使用—Nagios
讲师:吴云鹏
税友软件集团股份有限公司
课程目标
nagios体系结构认识 • 帮助运维人员对nagios体系结构有更清晰的认识
如何配置监控项 • 帮助运维人员更有效的使用和配置nagios的监控项
理解监控项含义 • 帮助运维人员更好理解现有监控项的含义
2
课程大纲
3
系统介绍 原理、结构 部署、配置 监控项简介
问题交流
Nagios介绍
Nagios介绍: Nagios是一款用于系统和网络监控的应用程序,可在设定的条件下对主机和服务
进行监控,在状态变差和变好的时候给出告警信息。 Nagios 的特征包括: 1) 监控网络服务(SMTP、POP3、HTTP、NNTP、PING 等); 2) 监控主机资源(处理器负荷、磁盘利用率等); 3) 简单地插件设计使得用户可以方便地扩展服务的检测方法; 4) 当服务或主机问题产生与解决时将告警发送给联系人(Email)、页面声音报警 Centreon介绍: centreon作为nagios的分布式监控管理平台,它的底层使用nagios监控软件,通过 centreon页面可以简单方便地管理和配置nagios;
个性类监 控
监控项
Weblogic 类监控
Oracle类 监控
15
监控插件
插件作用
• 什么是插件?插件和命令的关系?
插件存放位置
• 存放在监控机位置?存放在被监控机位置?
现有插件
• 现有哪些插件?获取插件网站
16
回顾
通用监控
主机监控项 Weblogic监控项
Oracle监控项
17
个性监控
Godengate监控项 业务监控项 接口监控项

系统监控与运维方案

系统监控与运维方案

系统监控与运维方案一、引言系统监控与运维方案是现代企业IT部门必备的重要工作之一,它涵盖了系统监控、故障处理、性能优化等多个方面。

本文就系统监控与运维方案进行详细讨论,并给出了一套完整的方案。

二、系统监控系统监控是对企业的软硬件资源进行实时、准确、全面的状态监测,并对异常情况作出及时响应的工作。

系统监控方案应当包括以下内容:1. 监控对象:对公司内部的服务器、网络设备、数据库、应用程序等关键资源进行全面监控,确保其正常运行。

2. 监控方式:通过使用合适的监控工具,如Zabbix、Nagios等,实时采集各项指标数据,并通过报警通知等方式及时地反馈异常情况。

3. 监控指标:针对不同的资源,确定关键的监控指标,如服务器的CPU使用率、网络设备的带宽利用率、数据库的连接数等,以全面了解资源的状态。

4. 报警通知:建立良好的报警通知机制,及时将异常情况通知到相应的人员,以快速响应并解决问题。

三、故障处理故障处理是系统监控方案的关键环节,对于出现的各类故障,需要能够快速定位问题并进行有效的处理。

故障处理方案应当包括以下内容:1. 定位问题:通过系统监控工具提供的数据和日志信息,结合问题反馈,快速定位故障的源头,确定是软件还是硬件问题,以便有效解决。

2. 处理措施:针对不同的故障类型,制定相应的处理措施,如重启服务、切换到备份设备、更新修复程序等,以快速恢复正常运行。

3. 故障分析:在处理完故障后,对故障原因进行详细分析,寻找问题的根源,以便避免类似故障再次发生。

4. 故障记录:及时记录故障发生的时间、原因、处理过程等信息,以备后续分析和改进。

四、性能优化性能优化是系统监控与运维方案中不可或缺的一环,它可以提高系统的运行效率和用户体验。

性能优化方案应当包括以下内容:1. 性能监测:通过系统监控工具,实时监测系统的性能指标,如响应时间、吞吐量等,及时发现性能瓶颈。

2. 优化策略:根据系统的特点和性能瓶颈,制定相应的优化策略,如增加硬件资源、优化数据库查询语句、使用缓存等,以提升系统整体性能。

监控运维方案

监控运维方案

监控运维方案第1篇监控运维方案一、概述本监控运维方案旨在确保信息系统稳定、安全、高效运行,降低系统故障风险,提升运维团队工作效率。

通过对关键业务系统、网络设备、安全设备进行实时监控,实现对系统性能、安全状况的全面掌握,为我国企事业单位提供专业、高效的监控运维服务。

二、监控范围1. 业务系统监控:包括但不限于数据库、中间件、Web服务器、应用服务器等关键业务系统。

2. 网络设备监控:包括路由器、交换机、防火墙等网络设备。

3. 安全设备监控:包括入侵检测系统、安全审计系统、漏洞扫描系统等安全设备。

4. 系统性能监控:包括CPU、内存、磁盘I/O、网络流量等系统性能指标。

5. 数据中心基础设施监控:包括电源、空调、UPS等基础设施。

三、监控工具与平台1. 采用开源监控工具Nagios、Zabbix等,结合商业监控平台进行部署。

2. 监控工具应具备以下功能:a. 自动发现和监控网络设备、服务器、应用服务等。

b. 支持多种报警方式,如短信、邮件、电话等。

c. 提供性能数据统计、分析和报表功能。

d. 支持分布式部署,易于扩展。

3. 监控平台应具备以下特点:a. 高可用性:确保监控平台自身稳定运行。

b. 安全性:对监控数据进行加密存储和传输。

c. 易用性:提供友好的用户界面,便于运维人员操作。

四、监控策略与流程1. 制定监控策略:a. 根据业务系统、网络设备、安全设备的特点,制定相应的监控策略。

b. 确定监控指标、阈值、报警级别等。

c. 定期对监控策略进行评估和优化。

2. 监控流程:a. 自动化监控:通过监控工具自动发现和监控设备、系统。

b. 报警处理:当监控指标超过阈值时,触发报警,通知运维人员。

c. 故障排查:运维人员接收到报警后,立即进行故障排查。

d. 故障处理:根据故障原因,采取相应的措施予以解决。

e. 故障总结:对故障原因、处理过程进行总结,提高运维水平。

五、人员与职责1. 运维团队:a. 运维经理:负责监控运维方案的制定、优化和监督执行。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于Nagios构建企业级信息系统监控方案
摘要:企业信息系统中的服务器、网络等基础设施的稳定运行是保障业务正常运行的基础。

而要保证这些基础设施稳定、高效的运行,设备故障及时有效的发现、设备运行状态信息及时有效的展示就显得十分重要,信息系统的有效监控已成为信息系统管理的重要问题。

大中型企业内部存在着成百上千台服务器、网络等设备,如何实现对这些设备的有效监控,并且高效的解决各类系统故障,保障系统稳定、高效的运行呢?本文主要对nagios监控功能进行分析,论述了如何利用它去监控服务器等设备。

关键词:nagios;监控;网络管理
中图分类号:tp393.18
随着企业信息系统的不断建设,庞大的服务器等基础设施的有效监控已成为信息系统管理的重要问题。

依靠人工巡检的方式对于系统故障、潜在风险及安全隐患的发现效率越来越差,为提高发现故障的及时性、把运维人员从繁重的工作中解放出来,亟需引入新的工具来协助工程师解决当前的问题。

该工具能够实现对各类it设备的监视和管理,提高基础设施的服务质量和效率,因此自动化工具对于运维人员就十分必要。

nagios是一种开源网管软件,利用它可以实现对企业中的服务器、网络等设备进行全面的监控。

1 nagios介绍
1.1 nagios简介
nagios是一款开源的监视系统运行状态的网管监控系统。

它能监
视本地或远程设备以及服务,同时提供异常告警通知功能等。

nagios能运行在linux/unix平台,状态监测等可实现利用web浏览器展示。

1.2 nagios的主要功能特点
监视服务状态(smtp,pop3,ftp,http,ping等)
监视资源利用率(cpu、内存,磁盘i/o等)
利用插件方式轻松扩展监视功能
支持各类服务等监视的并发处理功能
支持错误通知功能(通过email,短信等方法)
可指定自定义的事件处理控制器
基于web浏览器的界面以方便维护人员查看被监控端状态
支持通过手机终端查看监控信息
1.3 nagios工作原理
nagios的功能是监控服务和主机,nagios的监控、检测功能都是依赖各种插件来完成。

nagios启动后,它会定期的调用插件去检测服务器状态,同时将所有插件返回来的状态信息都进入队列,每次都从队首开始读取信息,处理后,把状态结果通过web界面展示出来。

nagios 提供了丰富的插件资源,利用不同功能的插件可以实现各类设备服务状态的监控。

在nagios 主目录下的/libexec目录里放有nagios自带的插件:例如如check_disk是检查磁盘空间的插件,check_load是检查cpu负载等。

每一种插件都可以通过运
行./check_xxx–h命令来查看其使用方法和功能。

nagios可以识别4种状态返回信息,即0(ok)表示状态正常、1(warning)表示出现一定的异常、2(critical)表示出现非常严重的错误、3(unknown)表示被监控的对象已经停止了。

nagios 根据插件返回来的值,来判断监控对象的状态,并通过web显示出来,以供维护人员及时发现故障。

图1nagios系统结构图。

2 nagios安装
2.1 实现目标
通过ping的方式检测服务器是否存活,并通过snmp协议采集网络中各种服务器客户端的性能数据,依据ndoutils插件,将收集到的信息(信息以文本方式存在)导入到后台数据库中,后续通过对这些历史数据进行统计分析可实现对设备运行性能等的评估,从而更早发现性能瓶颈,更好的指导后续设备扩容工作。

2.2 安装环境准备
在安装nagios之前需要创建相关用户组,并检查关联的软件包:# rpm -q wget httpd php gcc glibc glibc-common gd gd-devel make
2.3 安装nagios core
nagios core是主程序,解压缩并安装软件包:
# ./configure --with-command-group=nagcmd
2.4 安装nagios plugins
解压缩并安装nagios plugins安装包:
# ./configure --with-command-group=nagcmd
# make all
# make install
创建用于web访问账号:
# htpasswd –c /usr/local/nagios/etc/ers nagiosadmin
2.5 配置mysql
在mysql上创建nagios数据库和用户,用于存放nagios service 数据。

2.6 安装配置ndoutils
ndoutils是nagios的一个插件,就是可以用来把nagios的获取的数据存入到数据库中,也可以实现与cacti的集成。

如图2。

软件包安装,在ndoutils目录下:
# ./configure --prefix=/usr/local/nagios --enable-mysql --disable-pgsql
为mysql的nagios数据库创建表和其它相关对象:
# ./installdb -unagios -ppasswd -hlocalhost.localdomain -d nagios
将ndo2db、ndomod复制到nagios脚本路径,并修改nagios主配置文件中配置ndoutils调用:
broker_module=/usr/local/nagios/bin/ndomod-3x.o
config_file=/usr/local/nagios/etc/ndomod.cfg
另外还需要修改ndo2db.cfg配置文件中关于mysql数据库的信息,包括nagios使用的数据库名、用户密码等,ndoutils调用这些数据库信息,连接并将数据写入到数据库中存储。

3 nagios监控部署
3.1 实现原理
nagios通过周期性的调用插件去检测服务器状态,通过ping检测主机是否存活,通过check_snmp抓取系统性能数据,包括cpu、内存使用量等。

3.2 配置
nagios安装后下面一共有bin、etc、libexec、sbin、var等几个目录,其中bin目录下存放的是相关命令,etc目录下存放的是配置文件,sbin目录下存放的是通过的cgi脚本,libexec目录下存放的是所有插件,而var则存放的是log和pid文件等。

nagios 监控实现是依靠执行插件来实现的,首先需要在nagios中定义一个service,并且在这个service中指定监控对象、监控命令以及报警机制等。

在主配置文件nagios.cfg中既可以指定单独包含一个cfg,也可以指定一个包含目录,即该目录下所有的cfg文件都会包含进来,本次使用两种方式结合,即nagios.cfg中指定:
cfg_file=/usr/local/nagios/etc/objects/commands.cfg contacts.cfg
timeperiods.cfg
templates.cfg
cfg_dir=/usr/local/nagios/etc/target
target目录中每个主机生成一个cfg文件,每个配置文件定义相应的host、service,定义host的时候,指定主机名、别名、地址等信息,定义service时需要指定相应的主机、执行的命令等,如抓取某台主机的内存使用量:
check_snmp -h $hostaddress$ -c public
-o .1.3.6.1.4.1.2021.4.6.0
配置完host之后,检查nagios的配置无异常后,即可启动nagios 服务:
# service nagios start
# /usr/local/nagios/bin/ndo2db-3x -c
/usr/local/nagios/etc/ndo2db.cfg
3.3 界面展现
nagios提供基于web浏览器的管理界面,方便维护人员人员监控被监测设备,如被监控设备出现异常则图标会显示为红色,如某项性能指标超过设定阀值也将有告警显示。

利用web浏览器可实现对被监控设备运行情况的全面管理。

4 结束语
本文主要是对nagios在企业信息系统基础设施资源基本监控功能的应用论述,如果要利用nagios对企业信息系统进行全面的监控管理,想要实现更加复杂的监控功能,那就需要部署更多的插件,
并且根据实际运行情况进行不断优化,才能保证监控数据的正确无误。

虽然nagios配置十分复杂,但配置完成后,都是基于标准的web应用,操作很容易上手,而且功能非常易于扩展。

nagios是一款非常强大的网管工具,在它部署后,能够帮助你轻松管理企业内部各类基础设施资源。

具有开源及低成本的优势,我们可以从nagios社区中获得帮助,能够共享各种插件和经验。

参考文献:
[1]杨云江.计算机网络管理技术(第二版)[j].网络与通信,2011.
[2]陶利军.掌控——构建linux系统nagios监控服务器[m].清华大学出版社,2013.
作者简介:武冬春,毕业于吉林工学院计算机及应用专业,本科学历,现供职于中国联通集团公司总部电子商务部,长期从事中国联通企业信息系统建设和维护工作。

相关文档
最新文档