服务器运行状态监控系统

合集下载

运维监控方法

运维监控方法

运维监控方法运维监控是指对计算机系统、网络、服务器等进行实时监控,以保证系统的稳定运行和及时发现潜在问题。

以下是几种常见的运维监控方法:1. 服务器监控:通过监控服务器的CPU利用率、内存使用情况、硬盘空间、网络带宽等参数,及时发现服务器性能问题或资源不足的情况。

可以使用常见的服务器监控工具,如Zabbix、Nagios等。

2. 网络监控:通过监控网络设备、交换机、路由器等的工作状态、带宽利用率、丢包率等参数,及时发现网络故障和瓶颈。

可以使用网络监控工具,如Cacti、Zabbix、SolarWinds等。

3. 应用程序监控:通过监控应用程序的运行状态、响应时间、错误日志等参数,及时发现应用程序的异常情况,如应用崩溃、页面加载过慢等。

可以使用应用性能监控工具,如New Relic、AppDynamics等。

4. 日志监控:通过分析系统、应用程序、网络设备等的日志,及时发现异常情况或潜在问题。

可以使用日志管理工具,如ELK Stack(Elasticsearch, Logstash, Kibana)等。

5. 安全监控:通过监控入侵行为、异常访问、登录失败等安全事件,及时发现和阻止网络攻击和数据泄露等安全风险。

可以使用入侵检测系统(IDS)、入侵防御系统(IPS)等安全监控工具。

6. 配置监控:通过监控服务器、网络设备、数据库等的配置信息,确保其符合规范和最佳实践,避免安全漏洞和配置错误。

可以使用自动化配置管理工具,如Ansible、Puppet等。

7. 资源监控:通过监控系统中的资源使用情况,如磁盘空间、内存、CPU等,及时发现系统的负载状况和资源瓶颈。

可以使用资源监控工具,如Zabbix、Nagios等。

除了以上几种常见的运维监控方法,还可以根据具体需求选择合适的监控工具和方法进行运维监控。

同时,监控数据的可视化和报警通知也是运维监控的重要环节,可以帮助运维人员快速发现问题并做出响应。

服务器监控解决方案

服务器监控解决方案

服务器监控解决方案随着信息化时代的快速发展,服务器作为数据存储和业务运行的核心设备,其稳定性和安全性至关重要。

因此,实施有效的服务器监控解决方案,对于保障企业运营和数据安全具有不容忽视的作用。

本文将探讨服务器监控解决方案的重要性,以及如何选择和实施适合的监控方案。

一、服务器监控解决方案的重要性1、保障业务稳定运行:通过对服务器进行实时监控,企业能够及时发现并解决性能瓶颈、硬件故障等问题,避免因服务器异常导致业务中断。

2、提高IT管理效率:通过监控服务器的各项指标,IT管理员可以快速定位和解决潜在问题,提高故障排查速度,进而提高IT管理效率。

3、预防安全风险:实时监控服务器性能和异常行为,有助于及时发现并阻止潜在的恶意攻击和数据泄露等安全风险。

4、优化服务器性能:通过对服务器资源的监控和分析,企业可以对服务器进行合理的优化和调整,提高服务器利用率,降低运营成本。

二、选择合适的服务器监控解决方案1、考虑需求和场景:企业应根据自身的业务需求和服务器类型,选择适合的监控解决方案。

例如,对于云服务器,可以选择云服务商提供的监控服务;对于物理服务器,可以选择独立的第三方监控工具。

2、考虑监控指标:应选择能够全面监控服务器性能的解决方案,包括CPU使用率、内存占用率、磁盘空间、网络带宽等关键指标。

3、考虑可扩展性和灵活性:随着企业业务的发展,服务器数量和规模可能会不断扩大。

因此,选择的监控解决方案应具备可扩展性和灵活性,能够适应企业不同阶段的需求。

4、考虑安全性:监控解决方案应具备完善的数据加密和隐私保护措施,确保监控数据的安全性和隐私性。

5、考虑客户支持和售后服务:应选择提供专业客户支持和售后服务的解决方案提供商,以便在使用过程中获得及时的技术支持和解决方案。

三、实施服务器监控解决方案1、制定实施计划:在实施监控解决方案前,企业应制定详细的实施计划,包括实施时间、目标、步骤等,以确保实施的顺利进行。

2、数据收集与分析:根据实施计划,收集服务器的各项指标数据,并进行深入分析。

系统运行状态监控模板

系统运行状态监控模板

$LOGDIR $tomcat_log
pc_server_6991.log www_server_8991.log z39_gate_7991.log sip2_server_5331.log
catalina.out
$alephe_scratch whu50_p_ret_adm_01.00163
jobd
ps -ef |grep 19725
kill 19725
谢谢您的23观看
查看oracle进程对应的sql
• 先用前面的方法找出问题进程,如果是oracle相关进 程,可以查看这个进程对应的sql,如进程号为29425
• 具体查看 $lcl_proc/check_oracle_pid.sql 谢谢您的24观看
查看oracle锁死进程
• 问题:自定义批处理服务无结果,现象是 tmptable表无法访问
sqlplus /nolog conn aleph_dba/aleph_dba as sysdba
select b.sid||','||b.serial#,a.OBJECT_ID,a.ORACLE_USERN AME,a.OS_USER_NAME,a.PROCESS,a.LOCKED_MODE,b.pr ocess from v$locked_object a,v$session b where a.session _id = b.sid(+);
服务器空间查看
• df -h • du -sh
• linux下可以用ls -lS 来按文件大小排序

谢谢您的22观看
查看问题进程的方法
• 如果工作人员反映服务器响应慢
首先查看aleph服务状态(server_monitor),看是 busy还是free

xweb 300d 500d 服务器监控系统 使用手册 (中文)说明书

xweb 300d 500d 服务器监控系统 使用手册 (中文)说明书

XWEB300D/500D服务器监控系统(中文界面)使用手册V1.6版注意:请仔细阅读本页内容,确保安全操作安全提示注意:为了避免火灾或电击,切勿将这些产品置于雨中或潮湿的地方。

U 注意:为减小电击危险性,严禁移动盒盖或背部。

内部无耐用部件,维修时应让有资格的服务人员操作。

在本产品外壳有此闪电的标志地方,是提醒用户在此处连接的电压为危险电压(高于36V ),有产生电击的危险,请注意人身安全。

本手册中标有此惊叹号标志地方,提醒用户该章节操作为重要操作或与故障维修有关,请一定按照本手册进行操作。

注意:请使用本监控模块支持的调制解调器。

DIXELL 对使用本监控模块不支持的或未经DIXELL 认可的调制解调器而造成的损坏或损失不负任何责任。

注意:DIXELL保留更改本产品使用手册的权利,如有更改,恕不通知。

最新版本产品手册可从DIXELL 网站上下载获得。

注意:此手册适用于XWEB300D和XWEB500D V1.6或更早的版本。

注意: 本监控模块满足EN12830标准,如果与探头一起使用时,也满足EN13485标准。

注意:本手册介绍XWEB500D 和XWEB300D(D:表示导轨安装)这两种监控模块的使用方法。

除非单独说明只有XWEB500D 具有的功能外,描述的内容都满足XWEB300D 的功能描述。

注意:这是A 级产品。

在家庭环境中该产品可能会造成无线电干扰,在这种情况下,用户可能需要采取适当的措施。

XWEB 300D & XWEB500D – rel.1.6目录1概述 (10)2安装 (11)2.1硬件 (11)2.1.1RS485通讯连接 (12)2.1.2串行线缆的连接 (12)2.1.3TTL输出 (13)2.1.4控制器的串行地址 (14)2.1.5终端平衡电阻 (14)2.1.6兼容设备/控制器 (15)2.1.6.1特殊设备/控制器的配置 (15)2.1.7通过客户PC机的本地与远程连接 (15)2.1.7.1通过交叉网线与PC机网卡的本地连接 (15)2.1.7.2调制解调器(猫:MODEM)远程连接 (或称“点对点的连接”) (15)2.1.7.3INTRANET / ETHERNET=企业内部网/ 以太网远程连接 (16)2.1.7.4因特网远程连接 (16)2.2配置与访问 (18)2.2.1微软视窗:阻止弹出窗口和网络服务器传递给浏览器的信息 (18)2.2.2微软W INDOWS:高速缓冲区文件 (20)2.2.3第三方软件与XWEB (21)2.2.4系统配置 (21)2.2.5XWEB的配置 (22)2.2.6S YSTEM SETUP系统设置 (23)2.2.7网络设置 (23)2.2.8调制解调器(猫)的设置 (24)2.2.9拨号设置(这种方式目前比较少用了) (24)2.2.10E-MAIL邮件设置 (25)2.2.11短信(SMS)设置 (25)2.2.12PRINTER SETUP打印机设置 (26)2.2.13XCENTER服务中心 (26)2.2.14SYSTEM MESSAGGES系统通知 (26)2.2.14.1手动测试:E-MAIL,传真或SMS短信发送 (26)2.2.14.2自动发送报告(只有XWEB500D有此功能) (27)3XWEB 的使用 (28)3.1系统登录 (28)3.2HOME PAGE首页 (28)3.2.1系统访问 (28)3.2.2I DENTIFICATION /T IME登录认证识别/时间 (28)3.2.3服务器的属性 (29)3.2.4A CTIVE A LARMS当前激活的报警 (29)3.3CONFIGURATION控制器的相关配置 (29)3.3.1D EVICE FIND搜索接入RS485串行通讯线路的控制器 (29)3.3.2C ATEGORIES类别配置 (30)3.3.2.1控制器类别设置 (30)3.3.2.2RECORDING INTERVAL数据存储间隔 (30)3.3.2.3RTC SYNCRONIZATION实时时钟同步 (31)3.3.3S CHEDULER计划时间表设置(只有XWEB500D有此功能) (32)3.3.3.1PRINTING EVENTS=打印事件 (37)3.3.3.2SYSTEM EVENTS=系统事件 (39)3.3.3.3如何使用计划时间表 (40)3.3.4A LARMS报警配置 (41)3.3.4.1ALARM TYPOLOGY AND ALARM LEVELS报警类别和报警级别 (41)3.3.4.2RECEIVER’S ADDRESS BOOK报警信息接收地址簿 (41)3.3.4.3ALARM LEVELS报警级别 (42)3.3.4.4ALARM TYPOLOGY报警类别管理 (43)3.3.4.5排队功能 (44)3.3.5C ALENDAR日历功能(只有XWEB500D有此功能) (44)3.3.6D EVICES控制器配置 (49)3.3.6.1选择控制器 (49)3.3.6.2指定控制器的名称 (50)3.3.6.3指定控制器的类别 (50)3.3.6.4指定控制器报警类型 (50)3.3.6.5定义数字输入、模拟输入和各种状态(输出、控制器、报警) (51)3.3.6.6CLONE克隆控制器 (52)3.4ACTIVE MONITORING启动数据采集、存储、报警 (53)3.5DEVICES控制器菜单 (53)3.5.1SINGLE VIEW查看单个控制器 (53)3.5.2R UN TIME实时监控 (55)3.5.3P ARAMETERS参数表 (58)3.5.4L AYOUT布局图功能(只有XWEB500D才有此功能) (60)3.5.4.1LAYOUT EDITOR布局图编辑 (60)3.5.4.2VIEW布局图功能(显示) (70)3.5.5G LOBAL COMMANDS群发命令功能(只有XWEB500D才有此功能) (70)3.5.5.1GLOBAL EDIT群发命令编辑 (70)3.5.5.1.1DIGITAL INPUT数字输入命令发送 (73)3.5.6PERFORMANCE METER性能测定(只有XWEB500D才有此功能) (75)3.5.6.1关于制冷百分比%COOL的说明 (78)3.6CRO并联机组优化功能 ((只有XWEB5000有此功能)) (78)3.7DATA 数据菜单 (80)3.7.1D ISPLAY查看曲线图 (80)3.7.2E XPORTING DATA –SINGLE DEVICE输出曲线图数据–单个控制器 (84)3.7.3E XPORTING DATA –MULTIPLE DEVICES曲线图输出–多个控制器 (85)3.7.4DELETE DATA删除控制器数据记录/删除所有数据记录 (87)3.7.5在计算机上独立浏览查看曲线图 (88)3.8ALARMS报警菜单 (92)3.8.1ALARM LOG报警日志 (92)3.9PERMISSIONS权限配置 (94)3.9.1USERS用户的管理 (95)3.10TOOLS工具菜单 (95)3.10.1D ATA LOG数据记录日志 (95)3.10.2RS485网络测试 (96)3.10.3S ERVER LOG服务器日志 (96)3.10.4S ERVER STATUS服务器状态 (97)3.10.5M ESSAGE STATUS消息状态日志 (97)3.11INFORMATION信息菜单 (97)3.11.1I NFORMATION系统信息 (97)3.11.2SYSTEM UPDATE系统软件更新 (98)3.11.3S YSTEM VERSION系统版本 (98)4安全使用注意事项 (99)4.1服务器系统技术参数 (100)5附录 (101)附录A:控制器的高级选项设置 (102)附录B:术语 (104)XWEB 300D & XWEB500D – rel.1.6附录C:XWEB可监控控制器清单 (106)附录D:可选附件 (108)XWEB 300DIN & XWEB500DIN – rel.1.4序言非常荣幸您阅读XWEB 300D/500D服务器产品使用手册,本手册将为您展现该监控系统强大的功能及其控制和监视功能的设置方法。

服务器硬件故障的预警和监控方法

服务器硬件故障的预警和监控方法

服务器硬件故障的预警和监控方法在现代科技时代,服务器扮演着重要的角色,为各种应用和服务提供稳定的运行环境。

然而,服务器硬件故障是不可避免的风险之一,可能导致系统崩溃、数据丢失和服务中断。

为了及时发现和解决这些问题,预警和监控方法变得至关重要。

本文将介绍一些预警和监控服务器硬件故障的方法,以确保服务器的稳定性和可靠性。

1. 远程监控工具远程监控工具是通过网络连接到服务器来实时监测服务器的各种指标和运行状态。

常见的远程监控工具包括Nagios、Zabbix和PRTG等。

这些工具可以监测服务器的CPU使用率、内存利用率、硬盘空间、网络流量和温度等重要指标。

一旦服务器出现异常情况,远程监控工具会立即发出警报通知管理员采取相应的措施。

2. 温度和湿度传感器服务器的正常运行需要适宜的温度和湿度环境。

过高或过低的温度和湿度都可能导致服务器硬件故障。

因此,安装温度和湿度传感器是一种有效的预警和监控方法。

传感器可以实时监测机房或服务器机柜的温度和湿度,一旦超过预设的阈值,即可通过报警器或邮件通知管理员,以便及时采取措施避免服务器硬件故障。

3. 磁盘容量监控服务器的硬盘容量是存储数据的重要指标,过高的磁盘使用率可能导致服务器性能下降,甚至无法正常工作。

为了监控磁盘容量,可以使用磁盘监控工具,如Zabbix、Cacti等。

这些工具可以实时监测硬盘使用情况,并通过图形化界面展示,方便管理员及时采取行动,如释放磁盘空间或扩容硬盘,以避免硬盘故障和数据丢失。

4. 电源供应监控服务器的电源供应是维持其正常工作的关键。

在监控服务器硬件故障时,监控电源供应是至关重要的。

可以使用电源供应监控设备或工具来监视服务器的电压和电流情况。

一旦电源供应出现异常,如电压过高或过低,设备可以自动发出警报通知管理员,以便及时修复或更换电源供应,确保服务器的稳定性。

5. RAID阵列监控对于服务器中的硬盘阵列(RAID),监控其状态和运行情况也是非常重要的。

服务器监控指标范文

服务器监控指标范文

服务器监控指标范文服务器监控是保证服务器正常运行以及及时发现和解决服务器问题的重要手段。

通过监控服务器指标,我们可以了解服务器的运行状态、性能表现和负载情况,从而进行服务器优化和故障排查。

本文将详细介绍几个常见的服务器监控指标。

1.CPU使用率CPU使用率是指服务器CPU的使用情况。

通过监控CPU使用率,可以了解服务器负荷情况,并预测系统资源是否足够满足用户需求。

常见的监控指标包括平均CPU使用率、最大CPU使用率、CPU核心数和每个核心的使用率等。

2.内存使用率内存使用率是指服务器内存的使用情况。

通过监控内存使用率,可以了解服务器内存是否足够满足系统运行需求,以及是否需要扩容。

常见的监控指标包括平均内存使用率、最大内存使用率和可用内存等。

3.磁盘使用率磁盘使用率是指服务器磁盘存储空间的使用情况。

通过监控磁盘使用率,可以了解服务器存储空间是否足够满足系统数据存储需求。

常见的监控指标包括平均磁盘使用率、最大磁盘使用率和可用存储空间等。

4.网络带宽网络带宽是指服务器与外界通信的速率。

通过监控网络带宽,可以了解服务器与用户之间的网络状况,以及是否需要增加带宽来提高网络传输速度。

常见的监控指标包括入口带宽、出口带宽、平均带宽和峰值带宽等。

5.网络延迟网络延迟是指从服务器发送请求到接收响应所需的时间。

通过监控网络延迟,可以了解服务器与用户之间的响应速度,以及是否需要优化网络设置来减少延迟。

常见的监控指标包括平均延迟、最大延迟和丢包率等。

6.服务可用性服务可用性是指服务器在一定时间内正常运行的能力。

通过监控服务可用性,可以及时发现服务器故障或服务不可用的情况,并采取相应措施进行修复。

常见的监控指标包括服务运行时间、服务中断时间和服务可用率等。

7.系统日志系统日志是服务器记录的系统运行和操作日志。

通过监控系统日志,可以及时发现服务器异常和错误,从而提供故障排查的依据。

常见的监控指标包括系统错误日志数量、异常事件数量和操作记录等。

使用nonm监控服务器

使用nonm监控服务器

使用nmon监控Linux系统在对服务器的运维过程中,需要对服务器状态进行监控,这时候如果以人工的方式来对每一台服务器进行巡检,不仅费时,还浪费了人力。

我们只需要使用自动化的巡检工具对系统进行检查,定时输出检查数据,这样可以减少工作量,减少人力投入。

本文介绍使用nmon监控服务器状态的方法。

1Nmon介绍Nmon是IBM提供的免费的监控AIX系统与Linux系统资源的工具。

该工具可以将服务器的系统资源耗用情况收集起来并输出一个特定的文件,并可利用excel分析工具进行数据的统计分析,可以用来进行性能数据分析。

Nmon工具可以帮助在一个屏幕上显示所有重要的性能优化信息,并动态地对其进行更新。

这个高效的工具可以工作于任何哑屏幕、telnet 会话、甚至拨号线路。

另外,它并不会消耗大量的 CPU 周期,通常低于百分之二。

在更新的计算机上,其 CPU 使用率将低于百分之一。

使用哑屏幕,在屏幕上对数据进行显示,并且每隔两秒钟对其进行更新。

同时可以将这个时间间隔更改为更长或更短的时间段。

nmon 工具可以同时输出大量的信息。

nmon还可以将相同的数据捕获到一个文本文件,便于以后对报告进行分析和绘制图形。

输出文件采用电子表格的格式 (.csv)。

2Nmon的使用方法Nmon不需要安装,直接将对应版本的安装包放到服务器上的某个目录下,运行执行文件即可,例如:# ./nmon_x86_rhel4图2-1Nmon启动界面显示CPU可按C,同样,Memory—M,Network I/O----N, Disk I/O---D 如下:图2-2Nmon监控窗口按q键可以退出nmon,但是此时的屏幕很乱,可以执行clear命令清屏一下。

下面提供几种参数来执行nmon。

# ./nmon –f -s 30 –c 100参数说明:-f 以文件的形式输出,默认输出是机器名+日期.nmon的格式,也可以用-F指定输出的文件名,例如: # ./nmon_x86_rhel4 –F test.nmon -s 30 –c 100;-s是采样频率,隔多长时间收集一次,这里我指定的是30秒一次;-c是采样次数,一共要收集多少次,这里我指定的是100次。

服务器监控告警设置指南第一时间发现问题并解决

服务器监控告警设置指南第一时间发现问题并解决

服务器监控告警设置指南第一时间发现问题并解决在当今信息化时代,服务器已经成为企业运营的重要基础设施之一。

为了确保服务器的稳定运行,及时发现问题并解决是至关重要的。

因此,服务器监控告警设置成为了每个企业必备的一项工作。

本文将为您介绍服务器监控告警设置的指南,帮助您第一时间发现问题并解决。

一、监控告警设置的重要性服务器监控告警设置是指通过监控系统对服务器的各项指标进行实时监控,并在出现异常情况时及时发送告警通知,以便管理员能够第一时间做出响应和处理。

这项工作的重要性主要体现在以下几个方面:1. 及时发现问题:通过监控告警设置,管理员可以实时监控服务器的运行状态,一旦出现异常情况,能够第一时间发现问题,避免问题进一步扩大。

2. 预防故障发生:监控告警设置可以帮助管理员提前发现潜在的故障迹象,及时进行预防性维护,降低故障发生的概率。

3. 提高运维效率:通过监控告警设置,管理员可以及时了解服务器的运行情况,有针对性地进行故障排查和处理,提高运维效率。

4. 保障业务连续性:服务器是企业重要的信息基础设施,及时发现问题并解决可以保障业务的连续性,避免因服务器故障导致的业务中断。

二、服务器监控告警设置的指南在进行服务器监控告警设置时,需要考虑以下几个方面:1. 选择监控工具:首先需要选择适合自己企业的监控工具,常见的监控工具有Zabbix、Nagios、Prometheus等,根据企业的实际需求选择合适的监控工具。

2. 设置监控指标:根据服务器的实际情况,设置监控指标,包括CPU利用率、内存利用率、磁盘空间、网络流量等,确保监控指标全面覆盖服务器的各个方面。

3. 配置告警规则:针对不同的监控指标,设置相应的告警规则,包括阈值设置、告警通知方式等,确保在服务器出现异常情况时能够及时发送告警通知。

4. 告警通知设置:设置告警通知方式,可以通过邮件、短信、微信等方式发送告警通知,确保管理员能够第一时间收到告警信息。

5. 告警处理流程:建立完善的告警处理流程,包括告警接收、告警确认、故障定位、故障处理等环节,确保在收到告警通知后能够迅速做出响应和处理。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

系统目标
本系统的主要功能是对各种服务器进行实时监控,基于Windows
系统(包括Windows XP/2003/2008),采用C/S模式,使用VC6.0
开发。其中,Client客户端安装在受监控的服务器上,Server服务
器端安装在网管人员的PC机上。网管人员可以随时通过Server端获
知任意一台受监控服务器的运行状态,并在服务器出现异常的情况下
(如:服务器意外down机、存储空间不足、CPU利用率过高等),
及时的收到Server端的短信报警信息。

2.1、Client端主要功能
(1) 采集服务器的各种性能指标数据,并发送到Server端,使
网络管理员能实时查看服务器的状态。主要包括:CPU使用率、内存
使用率、进程数量监控、进程运行状况监控等。
(2) 采集服务器的相关信息,并保存在服务器的日志文件中,供
网络管理员进行定期的数据分析。主要包括:重点分区文件的变动信
息、容量大小信息、服务器重新启动信息等。
(3) 服务器进程信息的监测。主要包括进程列表的实时扫描、黑
名单监测和白名单监测。其中,黑名单监测是指对非正常进程的监测
(如病毒进程),当发现监测服务器上运行着这类非正常进程时,便
会向Server端发送告警信息,并自动关闭进程。白名单是指对服务
器上守护进程的监控,当发现服务器守护进程没有正常运行时,便会
向Server端发送告警信息,并自动重新启动进程。
(4) 日志文件监控。此项功能实现对服务器日志文件所占存储空
间的监控。当监控的日志文件大小超过其预设阀值时,Client端便
会向Server端发送告警信息,通知网络管理人员进行及时处理。
(5) Web服务器监控。对WEB服务器的实时监控,当发现受监控
的Web服务器不能正常提供服务时,自动重新启动该服务,使其能够
正常运行,并将WEB服务器发生问题的时间和处理信息写入日志文件,
以供网络管理人员进行分析。主要提供对Tomcat、IIS(6.0)等Web
服务器的监控。
(6) 数据库服务器监控。对服务器上运行的数据库服务器的实时
监控,当发现受监控的数据库服务不能正常提供服务时,自动重新启
动该服务,以使其能够运行正常,并将问题发生时间和处理信息写入
日志文件,以供网络管理人员进行分析。主要提供对SQL Server、
Oracle等数据库的监控。
(7) 盘符容量监控。选定某一监控盘符后,设置其容量大小,当
容量不足时,向Server端发送报警信息。

2.2、Server端主要功能
Server端的主要功能是接收Client端发送的数据,并根据设置
阈值在这些海量数据中筛选出异常数据向网络管理员进行告警。
(1) 参数设置:对一些基本参数进行设置,保存设置后,Server
端按照参数的设定范围对接收的数据进行分析。主要包括:
①告警时间间隔:两次告警间的时间间隔。即在前一次告警发出
后,网络管理员没有做出响应的前提下,确定下一次告警的时间。
②CPU使用率:设置CPU使用率正常值的范围,超出该范围,
Server端便会将其筛选出来进行告警。
③内存空闲率:设置内存空闲率正常值的范围,超出该范围,
Server端便会将其筛选出来进行告警。
④进程数:设置服务器系统在正常情况下进程数的范围,超出该
范围,Server端便会将其筛选出来进行告警。
⑤短信猫:设置发送短信的间隔时间和设备管理人员的电话号码,
将服务器的各种报警信息自动发送到管理员。
(2) 端口扫描:对任意一台受监控的服务器的相关端口进行扫描,
以获取其端口状态。此功能既支持对某一特定端口进行扫描,也支持
对多个连续的端口进行扫描。
(3) 端口分析:显示传输层中各种端口的使用情况,包括listen、
Time_wait、Established等状态。列出当前系统中全部使用TCP或
UDP协议进行通信的进程和端口状态,当发现异常时,可关闭端口停
止进程的运行。
(4) 远程监控:当位于Server端的网络管理员发现某台服务器
出现异常时,可以通过此项功能在自己的PC机上直接进行处理。
(5) 数据库的备份:对Server端收集到的数据进行备份,以供
网络管理员对历史数据进行分析。
(6) 历史数据显示:对收集到的Client端的历史告警数据进行
显示。这些告警数据主要包括:CPU、内存、邮件、黑名单、白名单、
进程数、日志等。
(7) 数据动态波形图:对CPU、Mail、文件变动数等数据动态生
成波形图,将这些数据以直观的图形方式显示给网络管理员。
(8) 告警数据显示:显示问题服务器的列表,并列出这些服务器
的告警信息。
(9) 告警分析:按照监控类型、设备地址、监控时间分别对告警
事件进行图形分析,直观展现报警事件的发生规律,确定重点维护的
服务器和易发生告警事件的时间段。

3、项目研究工作开展情况
Client端和Server端具体的功能模块如下图:
Client端

基本信息进程信息配置信息设备类型采集信息连接状态信息黑名单白名单WEB服务监控数据库服务监控日志文件监控TomcatIIS5.0和6.0服务进程监控SqlServerOracle磁盘容量日志采集数


图3-1 Client端总功能模块图
Server端
历史数据图表显示CPU监控内存监控进程运行监控进程数量监控告警数据告警分析工具告警设置日志浏览按监控类型分析按设备地址分析打印端口扫描远程控制按监控时间分析容量监控CPU数据内存数据文件数据进程信息端口分析短


图3-2 Server端总功能模块图

相关文档
最新文档