AIX操作系统关键性能指标监控

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对于一个满负荷运行的系统,需要定时检查机器的运行状态,及时了解系统的性能,避免由于机器过负荷的故障。主要的检查项:CPU、内存、磁盘I/O。

观察主要使用的iostat和vmstat等命令观察。如图1所示,主要对AIX系统性能进行在线判断的相关命令,其中常用的命令如下的vmstat、iostat、sar、topas、smvon 等,主要介绍vmstat、iostat、sar三个命令。

1 磁盘I/O 监控Iostat可以用来查看系统的 I/O的输入输出情况,在这里主要查看阵列上的硬盘的每秒读写量,同时估算磁盘阵列读写速度。iostat命令显示结果,如图2所示。

参数说明:

● TTY的I/O状态

-tin:每秒从tty那里读取的字符数

-tout:每秒写到tty那里的字符数

其中tty设备包括真实(real)和虚拟 (pseudo)的tty

● CPU的使用状态

图1 AIX系统性能在线判断的相关命令

图2 iostat命令显示结果

-% user,表示平均用户占用时间

-% sys,表示系统花费CPU时间

-% idle,表示CPU空闲时间

-% iowait,表示CPU等待I/O所花费时间

如果%idle数值都很高而且%iowait数值也很高,大于25,这个说明系统存在I/O或者硬盘瓶颈。

注意:出现瞬间高的值是可能的,比如系统写CDR话单文件的时候。

高数值的%iowait有可能下面几个原因:

(1)内存不够而引起频繁的swap空间的数据交换,导致数据存取存在交换空间的 I/O 瓶颈;

(2)硬盘上面数据不合理的分布;

(3)数据的fragment不合理。

● 硬盘使用状态

-% tm_ a c t :表示某个硬盘处于active状态的百分比

-tps:表示每秒某个硬盘有多少个数据传输次数

-Kb_readKb_wrtn:分别显示从开机到运行iostat这个命令这段时间内对硬盘的read 和write的总数据量,单位kb。

2 内存使用情况监控VMSTAT

由于AIX操作系统的内存管理机制与其它UNIX内存管理机制不同,因此其内存分配机制也不一样,在VMSTAT中看到的FREE MEM值并不是真正内存的FREE值。当操作系统发现其FREE MEM的值小于系统参数MINFREE值时,就在内存中查找剩余可用的空间,当发现FREEMEM值大于MAXFREE值时就停止查找,当发现内存中总的FREEMEM值小于MINFREE值时才有MEM的页交换动作,因此内存的页交换频繁程度可以反映内存的使用情况,同时也可以发现内存是否存在瓶颈。VMSTAT命令显示结果如图3所示。

图3 VMSTATT命令显示结果

参数说明:

● CPU空闲时间百分比= id % + wa %

计算CPU平均一分钟空闲多少时间

(99+92+95+86+7+96)÷100÷5×60=56.16(秒)

● kthr 参数

-r:等待CPU运行的队列个数。若r 数值偏大,表明CPU太忙,一般情况下为1。

-b:等待I/O操作的阻塞队列个数。若b 数值偏大,表明系统I/O出现瓶颈。

● CPU 瓶颈

如果sy 和us参数的数值加起来接近100,表示系统CPU使用率太高,同时也会看到r

的数值也大于1。

● 内存瓶颈

内存不足,换页将变得频繁,这时pi(page-in )和po(page-out ) 参数将不是0,同时avm 和fre 数值的比值悬殊很大,fre 数值很小。

pi 每秒从page space调入内存的页面数(4KB/page)。

po 每秒从内存调入page space页面数(4KB/page)。

当进程请求的mem页面数大于内存中可用的页面数时,一些内存页会被换出内存,放到page space,以后使用时再调入;由于访问page space 的速度远小于对mem的访问速度,所以频繁的换页会降低系统的运行速度。

当fr和sr的数值增大时,表明内存的负载增大。

Fr 为填充内存空闲表或分配给某进程所需释放的内存页面。

Sr 为得到FR数量的空闲页面所需检查的页面数。

Fr/sr=1:4表明每释放一个内存页面需检查4个页面。

当po*SYS>fr (SYS为系统参数,可用schedtune查看),系统认为已到崩溃的边缘。(SYS default 为0 (当物理内存大于128M)。否则为6,当po*SYS>fr,进程被临时挂起,系统运程明显减慢。

在正常情况下,内存的PAGE IN(PI )和PAGEOUT(PO)值都为0,当偶尔有内存页交换时并不能说明内存有瓶颈,只有发现频繁的内存页交换时才说明内存可能有瓶颈。常用来监控内存性能的方法是监控内存页交换的情况,即PI与PO的和,常用的监控公式为sum=sum(n)+sum(n-1)/2,sum(n)为用VMSTAT 第n次采集值PI与PO的和,sum(n-1)为用VMSTAT第n-1次采集值PI与PO的和。监控的结果偏重现在的内存状况,以前内存值的状况也有参考,这样监控的值就比较全面。具体的sum值设为多少比较合适,这要取决于应用的重要程度、用户的可容忍程度、以及系统的要求等多方因素决定。目前有一个经验值20提供参考,当然这仅是一个参考值,用户完全可以根据自己的应用需要,在测试的基础上加以修改。

从上面对内存的叙述可以看出,AIX上无法获取精确的内存信息,但可以利用平均内存使用情况,对AIX的空闲内存的一段时间的情况做个描述, vmstat命令中的avm值可以较好的描述AIX上的内存使用情况。综上所述,AIX空闲内存可采用如下公式计算:FRE E _MEMORY = TOTAL _MEMORY - AVM_MEMORY×4K

即:空闲内存 = 总内存 - 平均使用内存(内存块数) ×4K(内存块的大小)

3 CPU使用情况监控Sar

Sar可以用来收集反映系统运行状况,在这里主要是查看CPU的运行状况,CPU是否负载均衡,是否存在分配不均的情况。

使用方法:

sar t [n] 其中,t指时间间隔,n指输出次数

例如执行命令sar 1 10 时会显示如图4所示的结果。

主要看%idle的值,如果%idle的值小于20,则说明系统已经很忙了,看一看是否有什么进程在死循环做什么事情,或者数据库正在做什么特别大的任务等。如果CPU占用率一直居高不下,那么系统就很危险了;如果是短时的,一般没什么问题。

sar命令中的“-b”选项可以用于监控裸设备I/O。裸设备一般用于存放数据库数据。如图5所示。

其中bread/s 和bwrit/s显示了块裸设备(block raw device)I/O操作的数目。pread/s

相关文档
最新文档