4.nagios报警配置

合集下载

浅谈基于Nagios的故障告警系统

浅谈基于Nagios的故障告警系统

即0 0K表 示状 态正 常 1 ( ( ) WAR NG) NI 表示 出现一 安 装说 明 , 在此 不再 赘述 。但 是在正 式安 装n g o 之 a is 定 的 异常 : ( RTC ) 示 出现非 常 严重 的错 误 2 C II AL表 前, 务必让设置Ap c e1 s l a h  ̄ My q的默认字符集为 U F ] T一
4 、Nagi 软件 介绍 os
N go 主要 有以下几大功 能特 点 : a is (1)、监 视 网 络 服 务 ( MT ,P 3 S OP ,HT P T, P NN R PNG 。 T I 等)
( 、监视主机资源 ( 2) 进程, 磁盘等) 。
Na O 是 一款 遵 循 GP 协 议 的开 源 软 件 , gi S L 用于
Na o 通过 命令行 方式 调用 这些 脚本 , 且返 回4 gls 并 种 持 中文 , 议 安装 由 田朝 阳组 织汉 化 的 Na o 软件 建 gi s 状 态 信 息 ,Na i 可 以识 别 这 4 状 态 返 回信 息 , n go —n g OS 种 a sc 。由于 各软 件包 官方 网站 都有 比较详 细 的 i
3 UNK ( NOW N) 示被监控 的对象 已经停止 。 Na i s 8 由于 S n mal 也是 不支持 中文 的 , 以需要 表 go 。 ed i 默认 所 根据 插件返 回 的值来 判 断监控 对 象的状 态 , 并通 过页 修改/ t/ tri 置文件 , ec Mu tc ec Mu tc i  ̄ ]  ̄/ t/ tr中增3I t [ e s 面显 示 出来 , 以供系 统 管理 员及 时发现 故 障。用 户可 c a s t ” T 一 ”l e e d c as t ” t 8 , h re = U F8 ̄l ts n — h re = u f ” 同时 : s -

Nagios安装配置手册

Nagios安装配置手册

12.配置和启动 nagios cd /usr/local/nagios/etc 里面如果有 cfg-sample,就把目录里的.cfg-sample 文件全部拷贝成.cfg 例如: cp nagios.cfg-sample nagios.cfg 没有的话就直接修改:
修改 vi cgi.cfg, use_authentication=1 改成 use_authentication=0, 即不用验证.不然有一些页面不会显示。
情况二: 如果还不行,从这个网站: 下载一下 Mudule 包,tar.gz 格式的! - Crypt::DES - Digest::MD5 - Digest::SHA1 - Digest::HMACcd - Net::SNMP 按以下操作顺序安装这些 Module: tar zxf <module>.tar.gz cd <module> perl Makefile.PL make test make install 完了以后 cd nagios_plugins ./install.sh (路径选默认,y/n 选 Y!)
6.安装 nagios nagios 之前的准备,特别需要安装 gd-devel, 另外安装 nagios 时需要加--with-gd-lib=/usr/lib --with-gd-inc=/usr/include 不然不能生成 statusmap.cgi 也就不能看状态图了!
groupadd nagios useradd -g nagios nagios passwd nagios mkdir /usr/local/nagios chown -R nagios:nagios /usr/local/nagios chmod 755 /usr/local/nagios/ usermod -G nagios apache usermod -G nagios nagios grep ^User /etc/httpd/conf/httpd.conf User apache 查看运行 apache 的用户

Nagios服务器配置说明

Nagios服务器配置说明

Nagios服务器配置文件详细说明文档本文档主要针对性的介绍本次Nagios部署过程中所涉及到的参数内容,更多其它内容这里不做介绍,需要了解的同事可以查看附件中《Nagios在线帮助中文版.CHM》。

目录写在前面 (2)1、Nagios特征包括: (2)一、Nagios配置文件说明 (3)1、环境说明 (3)2、Nagios服务器目录说明: (4)3、Etc目录中配置文件说明: (4)二、Cgi.cfg文件配置: (5)三、nagios.cfg文件配置: (5)四、Linux.cfg文件配置: (6)1、定义主机基本信息 (6)2、定义主机组: (6)3、定义服务组: (6)4、具体服务的定义: (6)五、localhost.cfg文件配置: (7)六、switch.cfg文件配置: (7)七、Windows.cfg文件配置: (8)八、Nagios效果展示 (9)1、总览效果展示 (9)2、拓扑图效果展示 (10)3、主机效果展示 (10)4、服务效果展示 (11)5、主机组效果展示 (11)6、服务组效果展示 (12)7、问题故障效果展示 (13)写在前面nagiso是一个非常灵活的监控系统,可以监控常见的各种服务以及服务器的运行状态,并在监测到服务器发生故障的情况下,使用各种不同的方式通知维护人员发生了何种故障。

目前nagios支持如下几种报警方式:邮件、MSN、QQ、短信、飞信。

(由于公安网的特殊性,本套系统不启用任何报警方式,只是供管理人员通过web界面或者日志浏览被监控服务器的服务状态)nagios只提供了一个监控平台,实际上nagios本身并不提供任何工具来对服务器进行报警,也不提供发送报警信息的代码,所有这些功能都是由插件来实现的。

nagios可以很好地整合所有的插件一起高效的工作。

通过分工合作来实现一个完善的监控机制。

1、Nagios特征包括:1.监控网络服务(SMTP、POP3、HTTP、SSH、mysql、NNTP、PING等);2.监控主机资源(处理器负荷、磁盘利用率等);3.简单地插件设计使得用户可以方便地扩展自己服务的检测方法;4.并行服务检查机制;5.具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态;6.当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式);7.具备定义事件句柄功能,它可以在主机或服务的事件发生时获取更多问题定位;8.自动的日志回滚;9.可以支持并实现对主机的冗余监控;10.可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等;常用的nagios系统一般组成:nagios、nagios-plugs、nrpe、nsclient一个典型的架构如下图所示:上面架构只能监控到服务器的外部服务,如HTTP、SSH、FTP,要实现对本地信息的监控可以通过在被监控服务器上安装NRPE服务,作为监控代理来实现对本地信息的监控,架构如下:NRPE 由两个部分组成:工作在监控机一侧的check_nrpe 插件、工作在被监控机一侧的NRPE 守护进程。

nagios部署+短信和邮件报警

nagios部署+短信和邮件报警

nagios部署+短信和邮件报警操作系统 CentOS6.6服务端:10.0.0.20客户端:10.0.0.50⼀.nagios的服务端安装部署1.nagios安装[root@manager src]# rzrz waiting to receive.Starting zmodem transfer. Press Ctrl+C to cancel.Transferring nagios-cn-3.2.3.tar.bz2...100% 9412 KB 9412 KB/sec 00:00:01 0 Errorstar xf nagios-cn-3.2.3.tar.bz2cd nagios-cn-3.2.3useradd -m -s /bin/bash nagiosgroupadd nagcmdmake install; make install-init;make install-commandmode;make install-config;make install-webconfll /usr/local/nagios/ #出现以下⽂件代表成功drwxrwxr-x 2 nagios nagios 4096 Mar 12 08:08 bindrwxrwxr-x 3 nagios nagios 4096 Mar 12 08:08 etcdrwxrwxr-x 2 nagios nagios 4096 Mar 12 08:08 libexecdrwxrwxr-x 2 nagios nagios 4096 Mar 12 08:08 sbindrwxrwxr-x 9 nagios nagios 4096 Mar 12 08:08 sharedrwxrwxr-x 6 nagios nagios 4096 Mar 12 08:08 varchmod o+rwx /usr/local/nagios/var/rw2.nagios plugin 插件安装[root@manager src]# rzrz waiting to receive.Starting zmodem transfer. Press Ctrl+C to cancel.Transferring nagios-plugins-1.4.13.tar.gz...100% 2226 KB 2226 KB/sec 00:00:010 Errors[root@manager src]# tar xf nagios-plugins-1.4.13.tar.gz[root@manager src]# cd nagios-plugins-1.4.13#安装依赖yum install make apr* autoconf automake curl curl-devel gcc gcc-c++ zlib-devel \openssl openssl-devel pcre-devel gd gd-devel kernel keyutils patch perl perl-devel \kernel keyutils kernel-headers compat* mpfr cpp glibc libgomp libstdc++-devel ppl \cloog-ppl keyutils-libs-devel libcom_err-devel libsepol-devel libselinux-devel \krb5-devel zlib-devel libXpm* freetype libjpeg* libpng* php-common php-gd ncurses* libtool* libxml2 libxml2-devel patch -y./configure --prefix=/usr/local/nagios --with-mysql=/usr/local/mysql/makemake installfile /usr/lib64/libxcb-reply.so.1.0.0 from install of compat-xcb-util-0.4.0-2.2.el6.x86_64 conflicts with file from package xcb-util-0.3.6-5.el6.x86_64有冲突卸载掉这个有冲突的yum remove -y xcb-util-0.3.6-5.el6.x86_643.nrpe安装[root@manager src]# rzrz waiting to receive.Starting zmodem transfer. Press Ctrl+C to cancel.Transferring nrpe-2.12.tar.gz...100% 396 KB 396 KB/sec 00:00:010 Errorstar xf nrpe-2.12.tar.gzcd nrpe-2.12./configuremake./configuremake allmake install-pluginmake install-daemonmake install-daemon-config\cp src/check_nrpe /usr/local/nagios/libexec//usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -decho'/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d' >> /etc/rc.local要重启nrpe进⾏就先杀掉进⾏,然后重启kill `ps aux |grep nrpe |grep -v grep |awk'{print $2}'`/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d本机测试下:/usr/local/nagios/libexec/check_nrpe -H localhost -c check_users加⼊系统服务加⼊系统服务并设为开机⾃动chkconfig --add nagioschkconfig nagios onchown nagios.nagios /usr/local/nagios/var/rw# 测试配置⽂件是否正确/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg添加别名命令,⽅便测试配置⽂件vi ~/.bashrc在⾥⾯⽤alias 来⾃定义⼀个命令来代替,这⾥我⽤checkalias check='/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg'source ~/.bashrc此时可以⽤check命令来检测配置⽂件了安装 nginx 的FCGI模块cd /usr/local/src/rztar xf FCGI-0.74.tar.gzcd FCGI-0.74perl Makefile.PLmake && make install安装IO 和IO-ALL模块[root@manager src]# tar xf IO-1.25.tar.gz[root@manager src]# cd IO-1.25[root@manager IO-1.25]# perl Makefile.PL[root@manager IO-1.25]# make && make install[root@manager src]# tar xf IO-All-0.81.tar.gz[root@manager src]# cd IO-All-0.81[root@manager IO-All-0.81]# perl Makefile.PL[root@manager IO-All-0.81]# make && make install上传fastcgi 的启动脚本。

nagios 邮件报警配置

nagios 邮件报警配置

nagios 邮件报警配置张映发表于 2012-04-20分类目录:服务器相关nagios最主要优点就是在于它的报警功能,下面讲解一下用nagios来发邮件警告。

一,配置contacts.cfg查看复制打印?1.vim /etc/nagios/objects/contacts.cfg2.3.define contact{ //30行4. contact_name nagiosadmin5. use generic-contact6. alias Nagios Admin7. email xxxx@ //这里改成自己的邮箱8. }二,配置nagios.cfg和localhost.cfg查看复制打印?1.vim /etc/nagios/nagios.cfg2.3.enable_notifications=1 //807行,开启报警4.5.上面的总的开启也就是nagios装的所有插件,出现问题都会报警6.7.vim /etc/nagios/objects/localhost.cfg8.9.define service{ //以processes为例10. use local-service ;Name of service template to use11. host_name localhost12. service_description Total Processes13. check_command check_local_procs!250!400!RSZDT14. notifications_enabled 115. }如果总的没有开启的话,localhost.cfg里面可以一个一个配置,这样比较麻烦。

如果总的开启了,里面有些不想开启就可以notifications_enabled设置成0这样,这个就不用发报警,其他的发报警。

三,添加发报警用户1.[root@localhost objects]# cyradm -u cyrus localhost --auth plain2.verify error:num=18:self signed certificate3.Password:4.IMAP Password:5.localhost> cm nagios6.localhost> quit为什么要添加一个邮件用户nagios呢?可以看一下nagios发邮件的配置文件commands.cfg查看复制打印?1.define command{2. command_name notify-host-by-email3. command_line /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\nHost: $HOSTNAME$\nState: $HOSTSTATE$\nAddress:4. $HOSTADDRESS$\nInfo: $HOSTOUTPUT$\n\nDate/Time: $LONGDATETIME$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Host Alert: $HOSTNAME$ is $HOSTSTATE$ **"5. $CONTACTEMAIL$6. }从上面/bin/mail我们可以看出,它是用了系统mail命令来发邮件的,并且没有指定用户,发邮件时会当前的默认用户,nagios的启动用户默认是nagios,可以在主配置nagios.cfg的123行找到 nagios_user=nagios,所以要加一个nagios邮件用户,当然你可以把启动用户改掉。

基于Nagios的网管系统报警方式研究

基于Nagios的网管系统报警方式研究

基于Nagios的网管系统报警方式研究摘要:简述nagios及其工作原理,重点研究该系统可采用的多种报警方式,并结合实例给出部分配置与实现方法。

最后讨论和分析各报警方法的特点与应用前景,为有效实现网络监控与管理提供应用参考。

关键词:nagios;网络监控;报警引言随着各行业信息化进程的快速发展,机房规模、设备数量、服务类型均不断加大和丰富。

保障系统的稳定、可靠是高质量服务的基础和重要任务,而庞大而繁杂的网络环境运维是每位管理员面临的艰难挑战,因此科学的监控方法与管理模式是系统维护的重要组成部分,有效的监控管理系统是故障快速响应与处理的必要手段。

具有一个能够完成对主机或服务进行检测的自动化工具就非常重要,nagios(nagios ain’t gonna insist on sainthood)就是实现对远程主机、服务以及网络全面监控的开源管理软件,其在众多监控系统中具有成本低廉、结构简单、使用灵活、功能强大、可维护性强等诸多特点[1]。

当发生故障时,基于nagios的监控系统能够以多种报警方式通知维护人员,并且准确地描述故障点位置,为高效地处理故障提供保障。

本文以suse linux 10.2、nagios 3.2.3、apache2.2.3、php5.2.5为配置环境,对nagios系统各种报警功能进行测试与应用描述。

1 nagios及其工作原理nagios是一款基于gplv2许可开发的开源网络监控软件[2,3],其在linux/unix环境下运行,基于浏览器的接口允许从任意平台上进行操作控制。

nagios采取灵活的模块化设计,其本身不包含任何监控机制,主要利用其众多插件对多种系统的主机和服务进行检查[4,5]。

当被监控设备工作状态发生异常变化时,nagios可通过web页面、声音、电子邮件、短信等[6-10]多种报警方式通知管理员,从而缩短故障的响应和排查时间,提升服务质量与效率[11]。

2 报警方式与实现2.1 web页面报警nagios提供web界面查看和管理,其web页面报警即登录后通过浏览器观看被监控的对象及相关日志。

nagios页面操作说明

nagios页面操作说明

第二章Nagios的WEB操作说明前言推荐使用Firefox来浏览Naigos的页面,同为开源软件,Firefox与Nagios 结合得很不错:1.Firefox登录Nagios页面后,当监控目标异常时,有声音告警,而且在故障没解决前,始终周期性声音告警,IE没有这个功能。

2.Firefox提供了一个插件nagios checker,如果安装了这个插件,就不需要时时刻刻登录Nagios了,只要打开Firefox就可以了。

当监控目标出错时,Firefox的插件会自动告警。

见下图插件安装及设置方法略。

由于帐户权限可能有限,本文中提供的部分功能在部分帐号上无法看到。

2.1.Nagios登录打开浏览器,输入nagios页面地址,进入Nagios首页,会看到Nagios相关版本和操作选项。

登录页面后,会看到Nagios默认页面的相关信息,左侧显示的是操作按钮选项,右侧是Nagios版本和帮助说明,我们就以Nagios页面中左侧显示的内容为参考,进行本章的划分,如下图所示。

2.2.General选项说明单击“General→Home”会显示默认页面,如上图所示,单击“General→Documentation”显示Nagios版本帮助信息,如下图:2.3.MonitoringMonitoring包括的选项如下图左侧所示:下面针对Monitoring下面的选项的功能做具体的说明。

2.3.1 Tactical Overview(总览)通过上面的介绍,相信对Nagios的登录界面有初步的认识,下面将介绍WEB 页面的Monitoring监控选项具体监控操作,需重点掌握。

单击“Monitoring Tactical Overview(基本概况)”,如下图所示:这个页面上显示了所有主机的状态信息,可以看到停机(down)、不可达(Unreachble)、UP(启动)、等待返回状态(pending)。

同时列出了所有服务的状态信息。

nagios全攻略

nagios全攻略

nagios全攻略(一)----准备阶段一. 准备阶段:1.实验环境注:监控机:安装了nagios软件的机器,对监控的数据做处理,并且提供web界面查看和管理.当然也可以对本机自身的信息进行监控.被监控机:安装了NRPE等客户端,根据监控机的请求执行监控,然后将结果回传给监控机.2.nagios原理3.Nagios定义的监控状态nagios定义了4中监控状态,代表不同的严重级别,除了OK代表正常不用关心4.所用软件nagios-2.9.tar.gznagios-plugins-1.4.9.tar.gznrpe-2.8.1.tar.gzNSClient++-0.2.7.zip注:前三个的下载地址:[url][/url],后一个的[url]/projects/nscplus[/url] 5.总体目标学习嘛,总要有个目标,很简单,就是看到下面这张图主机名要监控的服务nagios-server 是否活动是否开启ftp磁盘使用情况dbpi 是否活动是否开启ssh磁盘使用情况cpu负载swap分区使用情况其中蓝色字体的服务是外部服务,也就是说不需要登陆被监控机,直接在外部就可以进行检查.例如我们需要检查被监控机是否打开80端口,就可以在别的一台机器上telnet被监控机的80端口即可.绿色字体表示是内部服务,意思是必须登陆到被监控机上才能查看.因为它们属于”本地信息”(nagios将之称为LOCAL).很容易理解,你不登陆到被监控机上,如何知道当前磁盘的使用情况呢?nagios是不是很强大,基本上对监控对象的任何信息都可以一手掌握了.而且不用登陆到目的机就可以看到那台机器私密的”本地信息”,比木马还厉害啊.但是别误会,这可不是什么木马.nagios有着十分安全的措施.这确实是一个庞大的工程,你想想这还只是三台机器而已都已经监控这么多服务了,那要是多个几十台怎么办,不用紧张,从现在开始,跟我动手吧.家庭作业,将所用的软件下载好,配置好监控机192.168.0.111上的apache.敬请期待nagios全攻略(二)----基本安装和配置(上)二. 基本安装和配置本部分主要参考官方文档和田逸的文章<<看我出招之:我用Nagios(技术细节)>>来修改完成.最后达到如下的功能监控机自身的信息,包括主机信息以及对外提供的服务被监控机对外提供的服务如下所有的操作都在监控机192.168.0.111上进行1.安装nagios主程序解压缩tar -zxvf nagios-2.9.tar.gzcd nagios-2.9编译,指定安装目录为/usr/local/nagios./configure --prefix=/usr/local/nagiosmake all输出如下信息求救,而实际上输出的内容包含很多有价值的信息,例如安装路径,版本,每一步做什么,接下来的步骤等.尤其是输出的最后一屏信息,我个人建议好好的读一下.例如上面就列出了很多有价值的信息,我们只需要按照他说的做就行了.安装make install[root@localhost nagios-2.9]#useradd nagios[root@localhost nagios-2.9]#mkdir /usr/local/nagios[root@localhost nagios-2.9]# chown nagios.nagios /usr/local/ nagios查看目录权限[root@localhost nagios-2.9]# ll /usr/localdrwxr-sr-x 2 nagios nagios 4096 Jul 10 11:14 nagios 看到nagios目录的权限已经被正确修改了执行如下命令来安装脚本make install-init执行make install-commandmode执行make install-config验证程序是否被正确安装。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

nagios报警配置
一、邮件报警
修改contact.cfg中联系人模版的email,如下
安装邮件客户端组件mailx
yum install mailx
关闭nagios客户端服务器,产生警报
当尝试连接次数达到4次时,发送通知,收到邮件
二、微信报警
微信报警的原理是使用微信开放的API来向微信发送信息1.创建微信企业微信
登录https:///,创建企业微信
创建后,添加第三方应用
添加成功后,取得secret
在我的企业中,取得CorpID
下载python脚本https:///zhangnq/nagios/tree/master/weixin,上传到nagios服务器中,放到/usr/local/nagios/python/weixin目录下
修改config-sanmple.py 文件名为config.py并修改内容如下
修改文件权限
chmod 777 config.py NotifyByWeixin.py
commands.cfg命令文件中添加weixin命令,如下
define command{
command_name notify-host-by-weixin
command_line /usr/local/nagios/python/weixin/NotifyByWeixin.py "host-@@-$NOTIFICATIONTYPE$-@@-$HOSTNAME$-@@-$HOSTSTATE$-@@-$HOSTAD DRESS$-@@-$HOSTOUTPUT$-@@-$CONTACTALIAS$"
}
define command{
command_name notify-service-by-weixin
command_line /usr/local/nagios/python/weixin/NotifyByWeixin.py "service-@@-$NOTIFICATIONTYPE$-@@-$SERVICEDESC$-@@-$HOSTALIAS$-@@-$HO STADDRESS$-@@-$SERVICESTATE$-@@-$SERVICEOUTPUT$-@@-$CONTACTALIAS$" }
templates.cfg模板文件中添加联系人模板
define contact{
name weixin-contact
service_notification_period 24x7
host_notification_period 24x7
service_notification_options w,u,c,r,f,s
host_notification_options d,u,r,f,s
service_notification_commands notify-service-by-weixin
host_notification_commands notify-host-by-weixin
register 0
}
contacts.cfg联系人中添加微信通知联系人,这里alias名字要和微信公共平台通讯录中名字帐号一样才会发送成功。

define contact{
contact_name zhangnq-weixin
use weixin-contact alias asdf
email admin@ }。

相关文档
最新文档