如何使用SNMP监视VMware ESX的服务器参数

如何使用SNMP监视VMware ESX的服务器参数
如何使用SNMP监视VMware ESX的服务器参数

使用简单网络管理协议(SNMP)监视服务器性能并发送通知(叫做traps)是所有VMware 管理员最终必须掌握的一项技能。在本文中,TechTarget中国的特约虚拟化专家David Davis将解释VMware ESX与ESXi可用的不同类型的SNMP代理,并给出使用SNMP 进行监控的例子。最后,你将学习如何配置ESX SNMP代理和ESXi代理以发送SNMP traps到网络管理站(NMS)。

为什么需要为VMware ESX Server配置SNMP?

SNMP用于收集如PC、服务器、网络设备等的信息。SNMP也能用于发送traps到SNMP管理站(如Dell OpenManage)。我会简短地提及如何配置traps,本文将着重介绍如何配置ESX以便收集信息。

为什么想要使用SNMP?例如,如果你下载一个新的ESX Server监控工具SolarWinds VM Monitor,首先必须启用ESX上的SNMP,这是由于SolarWinds的VM Monitor使用SNMP收集数据。由于越来越多的应用用于监控VMware ESX Server,并且许多应用都使用SNMP。我们也开始听说现有的监控应用能监视VMware ESX——如果你启用SNMP。

VMware ESX Server(而不是ESXi)带有两个SNMP代理。一个代理基于net-snmp (这是一个在互联网上很出名的Linux SNMP)。另一个代理非常简单,并且只支持traps。这与ESXi所提供的代理是相同的。在本文中,我将配置更加高级的SNMP代理,即

net-snmp。(关于如何配置小型ESX代理与ESXi代理请参见VMware的文章―在ESXi 上使用SNMP‖)。不过要注意,你不能使用我下面所提到的应用监控服务器。你只能配置ESX和ESXi以发送traps到NMS。

但是不能使用图形界面(如VMware Infrastracture Client)启用SNMP。这就是说很难使用命令行。下面我们看看如何通过使用SSH命令行和SNMP命令启用SNMP。

如何通过SSH在ESX Server里启用SNMP?

通过SSH配置SNMP是唯一的方法,而不是通过服务器的控制台。

一旦使用SSH连接SNMP到ESX Server,就能使用标准的Linux命令配置SNMP。配置(使用加密等技术的版本3)SNMP很复杂,我只介绍标准的SNMP配置。

SNMP进程在默认下不会运行,SNMP监控应用不能与ESX Server对话。

首先使用nano或vi编辑/etc/snmp/snmpd.conf文件。例如:

nano /etc/snmp/snmpd/conf

进入只读community字符串(ROcommunity)。我进入的是system contact、system location、read only community string和trap community string。

这时候,配置了SNMP进程但没有启动。通过输入以下语句人工启动SNMP进程:

/etc/rc.d/init.d/snmpd start

service snmpd start

不过你更想在每次启动服务器时自动启动SNMP进程,请输入:

chkconfig snmpd on

这样就配置了SNMP读(没有配置traps),并且在服务器启动时SNMP进程将启动。

如果启动没成功,可以重启服务器,或者使用上面的snmpd start命令,。此外,为了确保SNMP的运行,可以实施ps –ef | grep snmp查看运行状态,如:

[root@ESX2 snmp]# ps -ef | grep snmp

root 1058 1 0 Oct15 ?

00:00:05 /usr/sbin/snmpd -s -l

/dev/null -P /var/run/snmpd -a

root 2223 2116 0 01:18 pts/0

00:00:00 grep snmp

[root@ESX2 snmp]#

或者运行:

[root@ESX2 snmp]# service snmpd status

snmpd (pid 1058) is running...

在ESX里也有大量SNMP命令。在/usr/bin里你可以找到如snmpstatus、snmptest 和snmpwalk这样的命令。如图所示:

实际上,这些不是ESX所具有的命令,而是Red Hat Enterprise Linux 的。这意味着你能参考net-snmp文档完成所有这些命令如何工作的说明。

如果要配置ESX发送traps到NMS,可以在/etc/snmp/snmpd.conf文件里编辑trapcommunity和trapsink命令。trapsink是NMS的主机名。在ESX服务器里完全启用或禁用traps可以编辑/etc/vmware/hostd/config.xml。更多信息参见VMware的Using SNMP with ESX Server 3 documentation。

如何使用SolarWinds VM Monitor监控VMware ESX Server?

你几乎可以使用任何SNMP监控工具(WhatsUP、Solarwinds Orion、Nagios等)来监视VMware ESX Server。我选择使用最近所知的一款简单的免费工具。这款工具来自Solarwinds,叫做SolarWinds VM Monitor。可以免费下载使用,它的局限在于每次只能监控单个VMware ESX Server。我喜欢VM Monitor简单易操作的界面。它就像Windows侧边栏或Mac OS 小工具。

配置好SNMP并运行VM Monitor,所需要的只是主机名和ESX Server的SNMP read community。如图所示:

在连接后,使用SNMP收集数据并显示ESX Server和子虚拟机的基本性能参数,如:

这只是使用一款免费的SNMP性能工具监控ESX Server的例子。

如何使用Remote CLI启用VMware ESX或ESXi SNMP traps?

要配置基本的SNMP代理发送traps,可以使用免费的VMware远程命令行界面(Remote CLI)。运行CLI并输入DIR,可以看见命令vicfg-snmp.pl。

如下图所示,我使用命令检查SNMP代理的参数。

traps的基本配置如下:

vicfg-snmp.pl --server --username root

--password

-c -t

@162/

对于所有选项,运行vicfg-snmp.pl –help。

通过SNMP在ESX服务器上启用系统工具监控和报道能使管理员的工作更容易一些。

如何使用SNMP监视VMware ESX的服务器参数

使用简单网络管理协议(SNMP)监视服务器性能并发送通知(叫做traps)是所有VMware 管理员最终必须掌握的一项技能。在本文中,TechTarget中国的特约虚拟化专家David Davis将解释VMware ESX与ESXi可用的不同类型的SNMP代理,并给出使用SNMP 进行监控的例子。最后,你将学习如何配置ESX SNMP代理和ESXi代理以发送SNMP traps到网络管理站(NMS)。 为什么需要为VMware ESX Server配置SNMP? SNMP用于收集如PC、服务器、网络设备等的信息。SNMP也能用于发送traps到SNMP管理站(如Dell OpenManage)。我会简短地提及如何配置traps,本文将着重介绍如何配置ESX以便收集信息。 为什么想要使用SNMP?例如,如果你下载一个新的ESX Server监控工具SolarWinds VM Monitor,首先必须启用ESX上的SNMP,这是由于SolarWinds的VM Monitor使用SNMP收集数据。由于越来越多的应用用于监控VMware ESX Server,并且许多应用都使用SNMP。我们也开始听说现有的监控应用能监视VMware ESX——如果你启用SNMP。 VMware ESX Server(而不是ESXi)带有两个SNMP代理。一个代理基于net-snmp (这是一个在互联网上很出名的Linux SNMP)。另一个代理非常简单,并且只支持traps。这与ESXi所提供的代理是相同的。在本文中,我将配置更加高级的SNMP代理,即 net-snmp。(关于如何配置小型ESX代理与ESXi代理请参见VMware的文章―在ESXi 上使用SNMP‖)。不过要注意,你不能使用我下面所提到的应用监控服务器。你只能配置ESX和ESXi以发送traps到NMS。 但是不能使用图形界面(如VMware Infrastracture Client)启用SNMP。这就是说很难使用命令行。下面我们看看如何通过使用SSH命令行和SNMP命令启用SNMP。 如何通过SSH在ESX Server里启用SNMP? 通过SSH配置SNMP是唯一的方法,而不是通过服务器的控制台。 一旦使用SSH连接SNMP到ESX Server,就能使用标准的Linux命令配置SNMP。配置(使用加密等技术的版本3)SNMP很复杂,我只介绍标准的SNMP配置。 SNMP进程在默认下不会运行,SNMP监控应用不能与ESX Server对话。 首先使用nano或vi编辑/etc/snmp/snmpd.conf文件。例如: nano /etc/snmp/snmpd/conf

SNMP(简单网络管理协议)

SNMP(Simple Network Management Protocol,简单网络管理协议) 通信线路进行管理。SNMP的目标是管理互联网Internet上众多厂家生产的软硬件平台,现在SNMP已经出到第三个版本的协议,其功能较以前已经大大地加强和改进了。说白了就是一网管系统。网络管理功能一般分为性能管理,配置管理,安全管理,计费管理和故障管理等五大管理功能。 Windows NT是纯32位操作系统,采用先进的NT核心技术。Windows NT Workstation的设计目标是工作站操作系统,适用于交互式桌面环境;Windows NT Server的设计目标是企业级的网络操作系统,提供容易管理、反应迅速的网络环境。两者在系统结构上完全一样,只是为适应不同应用环境在运行效率上做相应调整。 另一个可以采用的保护措施是在网络边界上过滤SNMP通信和请求,即在防火墙或边界路由器上,阻塞SNMP请求使用的端口。标准的SNMP服务使用161和162端口,厂商私有的实现一般使用199、391、705和1993端口。禁用这些端口通信后,外部网络访问内部网络的能力就受到了限制;另外,在内部网络的路由器上,应该编写一个ACL,只允许某个特定的可信任的SNMP管理系统操作SNMP 1.按应用层次划分为入门级服务器、工作组级服务器、部门级服务器和企业级服务器四类。 (1)入门级服务器 (2)工作组级服务器 (3)部门级服务器 (4)企业级服务器 2.按服务器的处理器架构(也就是服务器CPU所采用的指令系统)划分把服务器分为CISC(复杂指令集)架构服务器、RISC架(精简指令集)构服务器和VLIW架构服务器三种。 (1)CISC架构服务器 (2)RISC架构服务器 (3)VLIW架构服务器 3.按服务器按用途划分为通用型服务器和专用型服务器两类。 (1)通用型服务器 (2)专用型服务器 4.按服务器的机箱结构来划分,可以把服务器划分为“台式服务器”、“机架式服务器”、“机柜式服务器”和“刀片式服务器”四类。 (1)台式服务器 (2)机架式服务器 (3)机柜式服务器 (4)刀片式服务器 入门级服务器通常只使用一到两颗CPU,主要是针对基于Windows NT,NetWare等网络操作系统的用户,可以满足办公室型的中小型网络用户的文件共享、打印服务、数据处理、Internet接入及简单数据库应用的需求,也可以在小范围内完成诸如E-mail、Proxy 、DNS等服务。

常见网络设备SNMP配置指南

错误!未找到引用源。

文档说明 本文档目的是为了推进互相交流学习使用,具体配置根据实际环境为准,本文档仅供参考!

目录 1文档说明 (5) 1.1字体约定 (5) 2交换机部分 (6) 2.1RuiJie/Cisco交换机 (6) 2.1.1SNMP配置 (6) 2.1.2TRAP配置 .................................................................... 错误!未定义书签。 2.1.3Syslog配置.................................................................... 错误!未定义书签。 2.2华为/H3C交换机 (6) 2.2.1SNMP配置 (7) 2.2.2TRAP配置 .................................................................... 错误!未定义书签。 2.2.3Syslog配置.................................................................... 错误!未定义书签。 2.3ZTE交换机 (7) 2.3.1SNMP配置 (8) 2.3.2TRAP配置 .................................................................... 错误!未定义书签。 2.3.3Syslog配置.................................................................... 错误!未定义书签。3路由器部分 (9) 3.1RuiJie/Cisco路由器 (9) 3.1.1SNMP配置 (9) 3.1.2TRAP配置 .................................................................... 错误!未定义书签。 3.1.3Syslog配置.................................................................... 错误!未定义书签。 3.2华为/H3C路由器 (10) 3.2.1SNMP配置 (10) 3.2.2TRAP配置 .................................................................... 错误!未定义书签。 3.2.3Syslog配置.................................................................... 错误!未定义书签。 3.3阿尔卡特路由器 (11) 3.3.1SNMP配置 (11) 3.3.2TRAP配置 .................................................................... 错误!未定义书签。

Zabbix运维监控平台解决方案

Zabbix运维监控解决方案

目录 一、背景 (3) 二、目标 (3) 监控的基本内容 (4) 三、采用的软件 (4) 四、软件的特点 (5) 五、软件的优势 (5) 系统架构 (7) 监控实现方式: (8) 监控指标 (8) 规则引擎 (9)

一、背景 网站平台部署运行后会出现各种各样的故障,比如服务器CPU负载高,磁盘容量使用超过80%,内存使用超过阈值,系统进程多,tomcat服务宕机等问题都会给公司平台稳定和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24小时监控您的网站,一旦网站发生异常,会有报警提醒您,如邮件,微信,电话,短信,及时避免流量损失。 Zabbix是一个企业级的开源分布式监控解决方案,它是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 zabbix具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图表绘制)支持自动发现网络设备和服务器;支持分布式,能集中展示、管理分布式的监控点;扩展性强,server 提供通用接口,可以自己开发完善各类监控。 zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD,OS X等平台上。 二、目标 物理范围: 组件:硬件,OS,存储,中间件,数据库,机房,网络等 维度:可用性,性能。 指标:见下。 监控的基本内容 性能数据基本CPU,磁盘,网络,内存等关系系统正常运行的基本指标。 端口状态一般交换机或网络设备,端口启动状态,流量大小,网络状态

服务器监控系统方案及运作模式

服务器监控系统方案及运作模式

目录 一、概述 (3) 二、监控系统架构 (4) 三、功能描述 (5) 3.1、服务器运行状态监控 (6) 3.1.1CPU使用率监控 (6) 3.1.2内存监控 (7) 3.1.3磁盘空间监控 (7) 3.1.4 TCP/IP连接数监控 (8) 3.1.5流量监控 (8) 3.1.6 丢包率监控 (9) 3.2、应用程序监控 (9) 3.2.1 Apache监控 (9) 3.2.2 TOMCAT监控 (10) 3.2.3 Weblogic (10) 3.2.4 WEBSPHERE (11) 3.3、数据库监控 (11) 3.3.1 Oracle监控 (11) 3.3.2 MSSQL监控 (11) 3.3.3 MYSQL监控 (12) 四、该项目的运作模式 (12) 4.1、购买软件 (12) 4.2、租用服务 (12) 4.3、代理系统监控 (13)

一、概述 随着网络技术的发展与进步,作为企业内部网络的核心节点,服务器担负着越来越重要的企业关键服务应用,服务器在企业内部网络中所扮演的角色无可替代。服务器一旦出现故障,将给企业带来的无可估量的巨额损失。 根据美国标准技术研究所(NIST)所公布的数据: 金融行业每停机一分钟,平均损失900,000美元; 其他行业每停机一小时,平均损失800,000美元。 美国Strategic Research Corp.针对美国企业每年因服务器停机或宕机所花费的机会成本研究发现: 必须承担的成本,一年约为2,200,000美元; 每年因服务器定期维护的停机以及不可预期的宕机,给企业带来的业务损失无法估算。 难道企业真的没有办法避免如此巨额的损失或者把损失降至最低呢?现代IT技术认为,在一个完善的IT管理系统体系中,对服务器的预警与监控的重要性甚至超过服务器发生故障后及时修复。通过对大量的实际案例进行分析后,我们可以清楚的认识到:在一套完善的系统中,对企业的关键应用不间断运行有着极高的要求。以前那种“出了问题再来解决”的管理方式早已渐趋势微。随着服务器预警与监控的理念逐渐为企业所熟知与接受,“全面监控,提早预知”的管理方式逐渐成为主流,这对于一个成熟,安全的系统来说已经成为其重要的一个组成部分。 “全面监控,提早预知”的管理方式分为两个重要的部分: 全面监控是对企业服务器进行全方位的信息收集,做到“及时发现,及时反馈,及时通知,及时处理,及时修复”。 提早预知,根据权威数据统计,企业的服务器故障76.4%以上是由于服务器的负载不均衡所引起的,过高的负载不仅会造成服务器的软硬件的不稳定工作,更甚者会造成服务器软硬件的损坏。同时,服务器负载过轻也是对企业资源的一种极大的浪费。提早预知,对可根据服务器一段时间以来的运行数据,通过科学的分析,比较,判断,来找出服务器可能发生故障的故障点,并及时进行相应的调整,把故障排除在即将发生状态,把发生故障的可能性减至最低,从而有力的保障了企业关键应用的不间断运行。 “全面监控,提早预知”的管理方式在实施过程通常会遇到四个比较重要的困难点: 1.无法及时全面的收集服务器运行信息

lotus系统snmp配置手册

Lotus snmp配置手册 Louts snmp 配置流程: 1.配置系统环境变量path 将Lotus Domino的安装路径加入到系统环境变量中,具体操作为:右击我的电脑属性---选择高级选项卡---点击环境变量—双击系统变量中的path变量,在跳出的编辑宽中加入Louts Domino的安装路径(注意:在添加时一定先添加分割符“;”例:安装在C:\Program Files\Lotus\Domino下的话,添加的值必须为:“;C:\Program Files\Lotus\Domino”)。 2.运行Lotus/Domino目录下的lnsnmp.exe文件。(注:该文件运行后会跳出个DOS框,然后会自动关闭,等自动关闭后就说明运行成功了)。 3.将Lotus的snmp服务加入到windows服务中 进入CMD窗口,依次运行如下命令: lnsnmp –Sc net start snmp net start lnsnmp

至此Lotus 的snmp 代理运行完毕. 在以后windows服务中就会有Lotus Domino Snmp Agent服务, 可以根据需要设置启动方式. 4.若要对louts参数进行监控,还必须启动Domino服务器的任务,在Lotus Domino Server 的窗口中输入以下命令: load quryset 启动snmp查询功能

5.加quryset服务加入自启动: 打开Lotus/Domino目录下的notes.ini文件,找到ServerTasks这一行,在最后添加“quryset”这个服务.如下图: 添加前: 添加后: 添加后保存在下次Lotus启动时就会自己启动该服务了。 至此Lotus的snmp配置全部完成,可以进行监控了。

02-Zabbix自动监控交换机

ZABBIX 自动监控华为交换机流量 1、配置交换机的snmp snmp-agent community read zabbix@123 #配置读取snmp的密码 在linux上安装net-snmp net-snmp-utils包,测试snmp访问 #snmpwalk -v 2c -c zabbix@123 14.1.8.1 1.3.6.1.2.1.2.2.1.10.2 #查看端口2的计数 iso.3.6.1.2.1.2.2.1.10.2 = Counter32: 3497833695 2、配置zabbix community变量在[管理]à[一般]à[巨集]里,配置snmp的密码变量,这样就可以调用zabbix自带的snmp模板了。 3、创建主机使用snmp监控 4、连结默认的snmp模板

OK,配置完成,zabbix就可以完成自动监控。 5、网卡监控图过一段时间后,监控项有了数据,可以查看图形啦。 5、常用snmp OID说明下面这些值可以手动连接进行获取数据: snmpwalk -v 2c -c test IP1.3.6.1.2.1.2.2.1.2 #获取端口列表及描述 snmpwalk -v 2c -c test IP1.3.6.1.2.1.2.2.1.8 #获取端口UP/DOWN 情况 snmpwalk -v 2c -c test IP1.3.6.1.2.1.2.2.1.10 #获取端口入流量(byte) snmpwalk -v 2c -c test IP1.3.6.1.2.1.2.2.1.16 #获取端口出流量(byte) snmpwalk -v 2c -c test IP1.3.6.1.4.1.9.2.1.56.0 #获取过去5 秒内的cpu load(百分比) snmpwalk -v 2c -c test IP1.3.6.1.4.1.9.2.1.57.0 #获取过去10 秒内的cpu load(百分比) snmpwalk -v 2c -c test IP 1.3.6.1.4.1.9.2.1.58.0 #获取过去15 秒内的cpu load(百分比) snmpwalk -v 2c -c test IP1.3.6.1.4.1.9.9.48.1.1.1.5 #获取内存使用情况 snmpwalk -v 2c -c test IP1.3.6.1.4.1.9.9.48.1.1.1.6 #获取内存空闲情况 这个是正确的配置方法,已开始我看了这篇添加了没有任何反应,但是过了10来分钟就有效果了

服务器状态监控之snmp

服务器状态监控之snmp&ipmi 一、ipmi 1、简介 IPMI(Intelligent Platform Management Interface)即智能平台管理接口是使硬件管理具备“智能化”的新一代通用接口标准 开源的免费标准、跨不同操作系统 监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源供应及机箱入侵等 核心部件:BMC(Baseboard Management Controller),一种嵌入式微控制器,整个平台管理的大脑, ipmi所有功能都是通过BMC发送命令来完成,BMC接受并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据,支持远程访问 BMC具有以下功能: 1.通过系统的串行端口进行访问 2. 故障日志记录和SNMP 警报发送 3.访问系统事件日志(System Event Log ,SEL) 和传感器状况 4.控制包括开机和关机 5.独立于系统电源或工作状态的支持 6.用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向 基于BMC,最大优势:独立于CPU BIOS和OS,无论是开机还是关机状态下,接通电源就可以实现对服务器的监控 2、使用ipmi的先决条件

(1)服务器硬件本身提供对ipmi的支持 目前惠普、戴尔和NEC 等大多数厂商的服务器都支持IPMI 2.0,但并不是所有服务器都支持,所以应该先通过产品手册或在BIOS 中确定服务器是否支持ipmi,也就是说服务器在主板上要具有BMC 等嵌入式的管理微控制器。 (2)操作系统提供相应的ipmi驱动 通过操作系统监控服务器自身的ipmi 信息时需要系统内核提供相应的支持,linux 系统通过内核对OpenIPMI(ipmi 驱动)的支持来提供对ipmi 的系统接口。在使用驱动之前,请先启动该驱动: service ipmi start 或者启动模块: modprobe ipmi_msghandler modprobe ipmi_devintf modprobe ipmi_si modprobe ipmi_poweroff modprobe ipmi_watchdog (3)ipmi管理工具 选择的是Linux 下的命令行方式的ipmi 平台管理工具ipmitool,开源的还有很多,如:ipmiutil ipmitool通过OpenIPMI接口来访问BMC,实现对服务器的两种管理方式:(1)通过OS 监控本地服务器;(2)通过网络监控远程服务器 本地服务管理:系统结构 监控本地命令格式:ipmitool -I open command,其中-I Open command有以下项:

Zabbix监控平台(三)生产环境案例

一,Zabbix生产环境监测案例概述 1.1 项目规划 ?主机分组 o交换机 o Nginx o Tomcat o MySQL o Apache o PHP-fpm o redis(也有状态页,自己研究) o memcache(也有状态页,自己研究) ?监控对象识别: o使用SNMP监控交换(监控交换机或路由器) o使用IPMI监控服务器硬件 o使用Agent监控服务器(监控操作系统和软件服务) o使用JMX监控JAVA(监控tomcat等java服务) o监控MySQL o监控Web状态

o监控Nginx状态 o监控Apache状态 o监控Tomcat状态 1.2 SNMP监控流程(监控交换机或路由器) 1.交换机上开启snmp 2.在zabbix上添加监控(设置SNMP interfaces) 3.关联监控模版 1.3 IPMI(监控服务器硬件) 建议使用自定义item监控服务器硬件,在本地执行ipmitool命令来获取数据(虚拟机上没有远程控制卡,所以无法测试) 可以在本地执行ipmitool命令获取数据(命令需要安装) 1.4 JMX(使用Zabbix Java Gateway代理) 用来获取java数据,本次的实战内容 1.5 实战监控Nginx,Apache,MySQL,PHP-fpm 今天的实战内容,注意总结过程 1.6 Zabbix的Web监测 今天的实战内容,注意总结过程

所有zabbix模板包和源码包 链接:https://https://www.360docs.net/doc/0e13075152.html,/s/1aezlSsXlfn5A-_CJnTUUhw 提取码:ndhs ---模板包 链接:https://https://www.360docs.net/doc/0e13075152.html,/s/1YwwtmnWATM9DxAQmZCDG4Q 提取码:0nmk ---源码包 二,Zabbix监控MySQL数据库操作实战 我们需要部署一个MySQL服务和一个zabbix-agentd客户端 2.1 编写监控mysql脚本 在nginx服务器(192.168.200.69)上安装一个MySQL 下面是监控mysql状态的一个shell脚本,内容如下: mkdir -p /server/scripts cd /server/scripts vim check_mysql.sh cat check_mysql.sh 1.#!/bin/bash 2.# author:Mr.sun 3. 4.MySQL_USER="root" 5.MySQL_PWD="linyaonie" 6.MySQL_HOST="12 7.0.0.1" 7.MySQL_PORT="3306" 8. 9.MySQL_CONN="/usr/local/mysql/bin/mysqladmin -u${MySQL_USER} -h${MySQL_HOST} -P${MySQL_PORT} -p${MySQL_PWD}" 10.if [ $# -ne "1" ];then

企业信息系统运行状态监控与管理

企业信息系统运行状态监控与管理的信息化 在企业内部运行着许多信息系统,信息系统管理员的主要工作之一就是负责这些系统的运行状态监控与管理,这也是信息系统管理员的日常工作。然而在实际工作中,系统管理员往往疏于日常监控与管理,只是在出现故障时才疲于应急维修。因此加强日常运维管理,用信息化手段提高效率和管理水平是必需的,也是IT专业人员专业性的体现。 本文在以下部分讨论WINDOWS环境下信息系统运行状态监控与管理的信息化实现,文中代码以SERVER2003标准版为例,在.NET2008下调试通过。 一、信息系统维护工作现状 信息系统运维最重要的是服务器软硬件及网络环境的监控与维护管理,包括同下几方面内容: ●服务器操作系统运行状态监控(CPU负载率、内存占用率等) ●服务器日志监控(主要包括操作系统日志、应用程序日志、安全日志) ●相关服务运行状态监控(数据库服务、IIS服务、杀毒软件服务等) ●进程监控 ●漏洞修复管理 ●网络状态监控 ●硬件状态监控 ●信息系统软硬件运行故障处理记录 ●数据库运行状态 对上述工作,常规的方式是人工检查后再填写纸质记录表。这种工作模式存在以下问题: ●不便于追溯分析与相关性分析 信息系统出现问题,可能的原因很多。总体上是软硬件环境,但具体原因有网络、硬件故障、操作系统故障、服务配置与运行、病毒、异常进程、负载等。根据维护经验,许多故障是重新启动一下服务器就好,系统管理员往往对具体什么原因不追查或不便追查。在实际工作中,日志中经常有各种严重错误信息,但也不影响信息系统正常运行。有些原因是积累性或累加性的,如不必要的服务对信息系统安全运行的影响等,这些都要进行相关性分析。在故障处理时,相关性分析尤其重要,可以迅速定位故障、减少判定时间。 ●工作效率低、发现潜在问题难。 系统管理员日常巡检一般是登录到服务器,在系统资源管理窗口看资源使用情况、在性能窗口看系统负载、在事件窗口查看日志、在服务窗口查看相关服务运行情况、在任务管理窗口查看异常进程、PING网关查看网络情况、查看杀毒软件服务日志、查看硬件指示灯。如有异常或故障,则处理故障后,再填写故障处理记录。 由于企业内部信息系统管理员并不是专职的系统管理员,同时用于信息系统维护的工作时间不是很多,特别是在信息系统运行正常时,往往巡查流于形式。在一个个界面切换,在短时间内从满屏信息中排查出异常迹象,效率很低,发现潜在问题的可能性极小。 ●对于全局性问题不易统一处理、根本解决问题 对于一些特定类型的故障,如病毒、漏洞引发的故障,往往是全局性的,在全厂范围内所有服务器都可能存在同样的问题。处理这类故障隐患,需要统一排查统一处理。而人工或纸质记录表方式不能支持这方式。 在信息系统正式上线运行后,才发现设计缺陷或硬件选型、软件不兼容问题也是时有发生。在上线初期,用户数据量很少,运行一段时间后随着数据量和访问量的急剧增加累积,

简单网络管理协议(SNMP)学习理解

简单网络管理协议学习理解 1.SNMP网络管理协议综述 SNMP(Simple Network Management Protocol)是被广泛接受并投入使用的工业标准,它是由SGMP即简单网关监控协议发展以来的。它的目标是保证管理信息在任意两点中传送,便于网络管理员在网络上的任何节点检索信息,进行修改,寻找故障;完成故障诊断,容量规划和报告生成。它采用轮询机制,提供最基本的功能集。最适合小型、快速、低价格的环境使用。它只要求无证实的传输层协议UDP,受到许多产品的广泛支持。 2.1 管理信息 经由SNMP协议传输的所有管理倍息都表现为非聚集的对象类型。这些对象类型被收集到一个或多个管理信息库[MIB]中并且对象类型按照管理信息结构和标识(SMI)定义。简单网络管理协议策l版的sM[于1990年5月定义在一篇题为《基于因特网的了TCP/IP管理信息结构和标识》的RFC中。这一RFC要求所有的管理信息库数据和信息必须根据ISO 8824标准《抽象句法表示法1规范》(ASN.1)编码。按照ASN.1表示所有信息和对象的目的在于方便向OSI的网络管理协议迁移而无需重新定义现已存在的所有对象和MIB。 SMI为每一对象类型定义以下成分: ①名字; ②句法; ②编码说明。 注意:一个对象类型的名字明确地代表一个对象,称为对象标识符。不得分配标识符0给对象类型作为其名字的一部分。为便于阅读,在标准文档中对象标识符旁边包含对这一对象的描述。对象标识符是按照在OSI MIB树中建立的严格分层空间构造的,对象标识符总是一个唯一的从树根开始描述MIB树的整数序列。对象标识符和它的文字描述的组合称为标号。 2.1.1 管理树 SMI明确要求所有被管理的信息和数据都要由管理树来标识。这棵管理树来源于

zabbix监控系统的搭建

最近在实验室搭建了一套zabbix系统,来对实验室的硬件资源,以及软件资源进行监控,zabbix由两部分组成:zabbix server与可选组件zabbix agent,zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监控,数据收集等功能。可以对包括:CPU负荷、内存使用、磁盘使用、网络状况、端口监视、日志监视等功能进行监控,同时也可以对vmware,java,数据库,weblogic 等系统进行监控。 zabbix支持多种网络方式下的监控,可通过分布式的方式部署和安装监控代理,整个结构如下图所示: Zabbix搭建: 1.准备环境 搭建环境:centos6.5_x86_64 zabbix2.2.2 安装centos6.5系统 (1)关闭防火墙: #service iptables stop #chkconfig iptables off (2)关闭selinux vi /etc/selinux/config 修改SELINUX的值为disabled //重启后才能生效 执行setenforce 0 立即关闭selinux (3)配置yum源 (4)修改主机名 vi /etc/sysconfig/network 修改HOSTNAME=zabbix 2.安装server端 (1)安装开发包以及软件依赖包 yum -y groupinstall "Development Tools" yum -y install httpd mysql mysql-server php php-mysql php-common php-mbstring php-gd php-odbc php-pear curl curl-devel net-snmp net-snmp-devel perl-DBI php-xml ntpdate php-bcmath (2)创建服务所需的用户和用户组 groupadd -g 201 zabbix useradd -g zabbix -u 201 -m zabbix (3)启动mysql,并创建zabbix服务器,为zabbix用户开启用户权限 service mysqld start

Linux服务器运行状况全面监测下

四、服务器主板工作状况监测: 服务器主板以及CPU工作温度是否正常是服务器稳定的核心。迄今为止还没有一种CPU散热系统能保证永不失效。失去了散热系统保护伞的“芯”,往往会在几秒钟内永远停止“跳动”。值得庆幸的是,聪明的工程师们早已开发出有效的处理器温度监控、保护技术。以特殊而敏锐的“嗅觉”随时监测CPU的温度变化,并提供必要的保护措施,使CPU免受高温下的灭顶之灾。lm_sensors可以有效监控主板和CPU的工作电压、风扇转速、温度等核心数据。软件安装: #mv lm_sensors-2.8.8.tar.gz /usr/lo ca l/src/ #cd /usr/local/src/ #tar zxvf lm_sensors-2.8.8.tar.gz #cd /usr/local/src/lm_sensors-2.8.8 #tar xzf i2c-2.8.8.tar.gz #make clean ;make dep ;make all ;make install #/sbin/depmod -a 修改配置文件:“/etc/ld.so.conf”加入一行:/usr/local/lib #ldconfig #sensors-detect #扫描主板所有芯片,选择缺省选项即可(按会车)# 加载模块,注意主板不一定相同。 #modprobe i2c-isa #modprobe lm78 #modprobe sis5595 开始检测,见图-8:

#sensors 图 8 lm_sensors 工作界面 可以看到主板温度、CPU温度电压以及风扇转速等信息非常清晰。 高级应用:定时检测主板运行情况: 这里可以使用Linux组合命令: #watch --interval=450 “sensors ” 这样每隔450秒运行因此sensors 令,就可以得知主板运行情况。 五、P2P通信监测 P2P(Peer-to-Peer)是一种用于文件交换的新技术,通过Internet允许建立分散的、动态的、匿名的逻辑网络。P2P为对等连接或对等网络,点对点网络技术,可应用于文件共享交换,深度搜索、分布计算等领域。它允许个体的PC通过Internet共享文

服务器运行状态监控系统

系统目标 本系统的主要功能是对各种服务器进行实时监控,基于Windows 系统(包括Windows XP/2003/2008),采用C/S模式,使用VC6.0开发。其中,Client客户端安装在受监控的服务器上,Server服务器端安装在网管人员的PC机上。网管人员可以随时通过Server端获知任意一台受监控服务器的运行状态,并在服务器出现异常的情况下(如:服务器意外down机、存储空间不足、CPU利用率过高等),及时的收到Server端的短信报警信息。 2.1、Client端主要功能 (1) 采集服务器的各种性能指标数据,并发送到Server端,使网络管理员能实时查看服务器的状态。主要包括:CPU使用率、内存使用率、进程数量监控、进程运行状况监控等。 (2) 采集服务器的相关信息,并保存在服务器的日志文件中,供网络管理员进行定期的数据分析。主要包括:重点分区文件的变动信息、容量大小信息、服务器重新启动信息等。 (3) 服务器进程信息的监测。主要包括进程列表的实时扫描、黑名单监测和白名单监测。其中,黑名单监测是指对非正常进程的监测(如病毒进程),当发现监测服务器上运行着这类非正常进程时,便会向Server端发送告警信息,并自动关闭进程。白名单是指对服务器上守护进程的监控,当发现服务器守护进程没有正常运行时,便会

向Server端发送告警信息,并自动重新启动进程。 (4) 日志文件监控。此项功能实现对服务器日志文件所占存储空间的监控。当监控的日志文件大小超过其预设阀值时,Client端便会向Server端发送告警信息,通知网络管理人员进行及时处理。 (5) Web服务器监控。对WEB服务器的实时监控,当发现受监控的Web服务器不能正常提供服务时,自动重新启动该服务,使其能够正常运行,并将WEB服务器发生问题的时间和处理信息写入日志文件,以供网络管理人员进行分析。主要提供对Tomcat、IIS(6.0)等Web 服务器的监控。 (6) 数据库服务器监控。对服务器上运行的数据库服务器的实时监控,当发现受监控的数据库服务不能正常提供服务时,自动重新启动该服务,以使其能够运行正常,并将问题发生时间和处理信息写入日志文件,以供网络管理人员进行分析。主要提供对SQL Server、Oracle等数据库的监控。 (7) 盘符容量监控。选定某一监控盘符后,设置其容量大小,当容量不足时,向Server端发送报警信息。 2.2、Server端主要功能 Server端的主要功能是接收Client端发送的数据,并根据设置阈值在这些海量数据中筛选出异常数据向网络管理员进行告警。 (1) 参数设置:对一些基本参数进行设置,保存设置后,Server 端按照参数的设定范围对接收的数据进行分析。主要包括:

简单网络管理协议SNMP

SNMP 1概述 (1) 2SNMP的工作原理 (1) 2.1网络管理模型 (1) 2.2网络管理协议结构 (2) 2.3网络管理服务 (3) 2.4委托代理 (4) 3管理信息结构SMI (4) 3.1ASN.1 (4) 3.2文本约定 (5) 3.3对象定义 (6) 3.4T RAP定义 (6) 3.5对象标志符 (7) 3.6表对象的定义 (8) 3.7对象和对象实例的区别 (10) 3.8OID的字典序 (10) 4协议数据单元(PDU--PROTOCOL DATA UNIT) (10) 4.1SNMP报文格式 (10) 4.2SNMP报文类型 (11) 4.3SNMP V2基本的PDU格式 (12) 4.4SNMP消息的生成 (13) 4.5SNMP消息的接受和处理 (13) 5SNMP协议操作 (15) 5.1G ET R EQUES T (15) 5.1.1GetRequest—PDU报文格式 (15) 5.1.2SNMPv2对GetRequest-PDU的处理(参考RFC1905) (15) 5.1.3SNMPv1对GetRequest-PDU的处理(参考RFC1157) (16) 5.2G ET N EXT R EQUEST—PDU (16) 5.2.1GetNextRequest报文格式 (17) 5.2.2SNMPv2对GeNextRequest-PDU的处理(参考RFC1905) (17)

5.2.3SNMPv1对GeNextRequest-PDU的处理(参考RFC1157) (18) 5.3R ESPONSE-PDU (18) 5.3.1Response报文格式 (18) 5.3.2SNMPv2对Response-PDU的处理(参考RFC1905) (20) 5.3.3SNMPv1对响应报文GetResponse的处理(参考RFC1157) (20) 5.4S ET R EQUES T-PDU (20) 5.4.1SetRequest报文格式 (20) 5.4.2SNMPv2实体对SetRequest报文的处理(参考RFC1905) (21) 5.4.3SNMPv1对SetRequest报文的处理(参考RFC1157) (22) 5.5G ET B ULK R EQUES T-PDU (23) 5.5.1GetBulkRequest-PDU报文格式 (23) 5.5.2SNMPv2对GetBulkRequest-PDU报文的处理(参考RFC1905) (24) 5.6I NFORM R EQUES T-PDU (25) 5.6.1InformRequest-PDU的格式 (25) 5.6.2SNMPv2对InformRequest-PDU的处理(参考RFC1905) (26) 5.7T RAP-PDU (26) 5.7.1SNMPv1的Trap (26) 5.7.2SNMPv2的SNMPv2-Trap-PDU (28) 6SNMP的安全控制 (29) 6.1SNMP V2-基于共同体的管理框架 (29) 6.2SNMP V3的安全策略 (30)

Zabbix运维监控平台解决方案

Z a b b i x运维监控平台 解决方案 集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

Zabbix运维监控解决方案 目录 一、背景 网站平台部署运行后会出现各种各样的故障,比如服务器CPU负载高,磁盘容量使用超过80%,内存使用超过阈值,系统进程多,tomcat 服务宕机等问题都会给公司平台稳定和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24小时监控您的网站,一旦网站发生异常,会有报警提醒您,如邮件,微信,电话,短信,及时避免流量损失。 Zabbix是一个企业级的开源分布式监控解决方案,它是一个基于WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。

zabbix具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图表绘制)支持自动发现网络设备和服务器;支持分布式,能集中展示、管理分布式的监控点;扩展性强,server提供通用接口,可以自己开发完善各类监控。 zabbixserver可以通过SNMP,zabbixagent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP-UX,AIX,FreeBSD,OpenBSD,OSX等平台上。 二、目标 物理范围: 组件:硬件,OS,存储,中间件,数据库,机房,网络等 维度:可用性,性能。 指标:见下。 监控的基本内容 性能数据基本CPU,磁盘,网络,内存等关系系统正常运行的基本指标。端口状态一般交换机或网络设备,端口启动状态,流量大小,网络状态日志内容日志内容监控,系统日志,应用程序日志,错误信息。 系统状态DB,OS,中间件等的系统状态 硬件状态硬盘状态,风扇,电池,内存,主板等系统状态

服务器管理监控系统

服务器管理、监控系统 摘要:现今互联网行业发展迅速,底层支撑互联网服务的服务器等各种硬件设备规模越来庞大。如何管理有效地管理这些设备、实时发现其潜在的隐患、获取其运行的状态,而显得至关重要。根据这些信息才能合理地决定设备上所运行系统、应用等服务的关闭与保留与挂起。本文介绍了利用开源监控解决方案,以及对该方案的二次开发而实现对服务器机房的专家系统。 关键字:机房运维服务器监控

目录

1. 引言 随着现今互联网行业的迅速发展,某些物联网服务的用户已经达到了亿级,如淘宝网注册用户已达到3.7亿,仅在2015年“双十一”当天活跃用户过亿[1]。支撑如此庞大用户使用的硬件基础是规模庞大的服务器群。如何获取每一台服务器的运行状态,及时获悉潜在隐患,出现问题及时锁定排除显得至关重要。机房运维人员以及高层决策人员只有在实时掌握这些信息后才可有效地对进行决策,如在访问流量过大或其他恶意攻击后是及时关闭服务还是启动备用服务,服务区瘫痪后是需要工作人员至机房处理硬件问题还是只需远程重启服务器等类似或简单或复杂的决策,都需要底层专家系统信息的支持。 现今比较成熟的开源服务器底层数据的采集解决方案主要有和。 是一个监视系统运行状态和网络信息的监视系统,能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等[2]。可运行在平台之上,同时提供一个可选的基于浏览器的界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。 可以监控的功能有: 1、监控网络服务(、3、、、等); 2、监控主机资源(处理器负荷、磁盘利用率等); 3、简单地插件设计使得用户可以方便地扩展自己服务的检测方法; 4、并行服务检查机制; 5、具备定义网络分层结构的能力,用""主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态; 6、当服务或主机问题产生与解决时将告警发送给联系人(通过、短信、用户定义方式); 7、可以定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用; 8、自动的日志滚动功能; 9、可以支持并实现对主机的冗余监控; 10、可选的界面用于查看当前的网络状态、通知和故障历史、日志文件等[2]; 11、可以通过手机查看系统监控信息;

相关文档
最新文档