AIX的日常维护

合集下载

aixibm日常维护命令

aixibm日常维护命令

AIX IBM日常维护命令一、检查AIX系统状态1、文件系统:df -k2、设备:lsdev -C3、磁盘(物理卷):lspv4、paging space:lsps -a5、配置:lscfg -vp6、软件:lslpp -l7、用户:who8、处理器个数:lsdev -C|grep proc9、内存大小:lsattr -El mem0二、关机1、shutdown使用wall命令提醒用户若干时间后关机;2、shutdown +22分钟后关机3、shutdown -Fr-r = 关机后重新启动三、错误记录1、显示错误:errpt2、显示详细的错误信息:errpt -a3、清空错误记录信息:errclear 0四、smit/smitty部分快捷菜单方式:#smitty tape#smitty user#smitty tcpip#smitty inet#smitty nfs#smitty jfs#smitty lvm五、关于卷组(smitty vg)1、显示卷组状态:列出卷组细节:lsvg <vgname>列出卷组中的逻辑卷:lsvg -l <vgname>列出卷组中的物理卷:lsvg -p <vgname>2、增加卷组:smitty mkvg3、修改卷组属性:smitty chvg4、激活卷组:varyonvg vg_name5、解除卷组:varyoffvg vg_name6、向卷组中增加一个物理卷:extendvg vg_name hdiskn 注:extendvg命令用于向已存在的卷组增加新的物理卷,这个物理卷设备的状态必须是可用的(Available)。

7、从卷组中删除一个物理卷:reducevg [-d] vg_name hdiskn注:删除物理卷时其所在的卷组必须处于非活动状态,如果被删除的物理卷是卷组中仅存的一个,那么这个卷组同时也被删除。

AIX5.3+oracle10g日常维护手册

AIX5.3+oracle10g日常维护手册

AIX5.3+Oracle10g日常维护手册小型机维护步骤:1、首先查看小型机机房的温度、湿度、电气条件。

温度(摄氏℃)10 ℃-40℃湿度(%)8% -80%零地之间的电压小于1V2、查看小型机、磁盘阵列的指示灯。

主机故障灯面板上不能有数字显示,如果有的话,说明系统有故障。

告警灯为黄色表示有故障磁带机故障灯告警灯为黄色说明有故障或磁带机太脏,须清洗。

#/usr/lpp/diagnostics/bin/utape -cd rmt0 –n //清洗命令磁盘阵列故障灯告警灯为黄色表示有故障3、登录系统,查看小型机的错误日志硬件故障检测命令:# errpt -d H -T PERM若没有故障,则显示为空白,若有故障执行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,下载之后,将其报给集成商或者硬件厂家进行分析。

软件故障检测命令:# errpt -d S -T PERM若没有故障,则显示为空白,若有故障执行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,下载之后,将其报给集成商或者软件厂家进行分析。

4、有否发给root用户的错误报告(mail)观察所有未读消息,注意有关diagela的消息。

#mail如果有信息,则使用# Ctrl+d ; 存盘退出,存在/var/spool/Mail目录下,每个用户一个文件,将其下载,发给系统集成商或者硬件厂商5、查看文件系统的使用率%Used为文件系统的使用率。

所有文件系统的使用率不能大于70%,如果超过70%,则应该选择文件系统空间扩容或者删除该文件夹下某些无用数据#df –k //以KB为单位查看Filesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 24576 1452 95% 2599 22% //dev/hd2 614400 28068 96% 22967 15% /usr/dev/hd9var 8192 4540 45% 649 32% /var/dev/hd3 167936 157968 6% 89 1% /tmp/dev/hd1 16384 5332 68% 1402 35% /home 上表中,超过70%的/ 和/usr均需要增加容量,或者删除其中不需要的文件。

AIX操作系统错误日志及日常维护

AIX操作系统错误日志及日常维护

AIX操作系统错误日志及日常维护一、系统故障记录(errorlog)errdemon 进程在系统启动时自动运行记录包括硬件软件及其他操作信息故障记录文件为/var/adm/ras/errlog 可备份下来或拷贝到别的机器上分析errpt 命令的使用(普通用户权限也可使用)#errpt |more 列出简短出错信息ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION192ACror logging turned off038FTIMESTAMP: MMDDHHMMYY (月日时分年T 类型: P 永久; T 临时; U 未知永久性的错误应引起重视C 分类: H 硬件; S 软件; O 用户; U未知#errpt -d H 列出所有硬件出错信息#errpt -d S 列出所有软件出错信息#errpt -aj ERROR_ID 列出详细出错信息# errpt -aj 0502f666 <--- ERROR_ID用大小写均可,例:LABEL: SCSI_ERR1ID: 0502F666Date/Time: Jun 19 22:29:51Sequence Number: 95Node ID: host1Class: HType: PERMResource Name: scsi0Resource Class: adapterResource Type: hscsiLocation: 00-08VPD: <--- Virtal Product DataDevice Driver Level (00)Diagnostic Level (00)Displayable Message.........SCSIEC Level....................C25928FRU Number..................30F8834 Manufacturer................IBM97FPart Number.................59F4566Serial Number (00002849)ROS Level and ID (24)Read/Write Register Ptr (0120)DescriptionADAPTER ERRORProbable CausesADAPTER HARDWARE CABLECABLE TERMINATOR DEVICEFailure CausesADAPTERCABLE LOOSE OR DEFECTIVERecommended ActionsPERFORM PROBLEM DETERMINATION PROCEDURESCHECK CABLE AND ITS CONNECTIONSDetail DataSENSE DATA0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000二、控制面板上的LED 代码.8 位代码通常系统故障灯会同时亮起某些机型还会同时显示故障设备位置代码.4 位代码通常是Exxx.3 位代码通常为0yyy 只看后3位.8 位和4位代码可查看系统服务手册 (Service Guide)3 位代码可查看系统诊断手册(Diagnostic Information for Multiple Bus System).闪动的 888, 系统崩溃硬件或软件原因造成按reset 键会显示更多内容888-102 一般为软件故障888-102-207 例外系统会产生一个dump888-102-xxx-0C9 系统正在做dump, 请等待888-102-xxx-0C0 系统dump完成可关电重启888-103 或 105硬件故障一般有 SRN 代码及位置代码三、其他用于收集系统信息的命令lsdev -C 系统设备信息#lsdev -Cc diskhdisk0 Available 00-06-00-2,0 4.5 GB 16 Bit SCSI Disk Drivehdisk1 Available 00-06-00-1,0 4.5 GB 16 Bit SCSI Disk Drivehdisk2 Defined 00-06-00-4,0 16 Bit SCSI Disk Drivelspv 查看物理卷信息#lspvhdisk0 0007821160af3d76 rootvghdisk1 000782117f571294 rootvghdisk2 0000000045c45bde datavglsvg 查看卷组信息#lsvg datavgVOLUME GROUP: datavg VG IDENTIFIER: 0000000055e2458bVG STATE: active PP SIZE: 4 megabyte(s)VG PERMISSION: read/write TOTAL PPs: 2169 (8676 megabytMAX LVs: 256 FREE PPs: 1 (4 megabytes)LVs: 3 USED PPs: 2168 (8672 megabytOPEN LVs: 2 QUORUM: 2TOTAL PVs: 1 VG DESCRIPTORS: 2STALE PVs: 0 STALE PPs: 0ACTIVE PVs: 1 AUTO ON: yesMAX PPs per PV: 2032 MAX PVs: 16#lsvg -l rootvgrootvg:LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd5 boot 1 1 1 closed/syncd N/A...lv00 jfs 51 102 1 closed/stale /ibmcxxlv01 jfs 1 1 1 open/syncd /cics_regionslv02 jfs 4 4 1 open/syncd /var/mqmlslpp 查看文件组信息# lslpp -L |grep 23100020....100020.rte 4.3.2.7 C IBM PCI 10/100 Ethernet Adapt看某个文件组是否已安装如以太网卡驱动也用于查询补丁程序的版本lsattr 查看设备参数设置# lsattr -El ent2busio 0x7fffc00 Bus I/O address Falsebusintr 9 Bus interrupt level Falseintr_priority 3 Interrupt priority Falsetx_que_size 512 TRANSMIT queue size Truerx_que_size 256 RECEIVE queue size Truerxbuf_pool_size 384 RECEIVE buffer pool size Truemedia_speed 10_Half_Duplex Media Speed Trueuse_alt_addr no Enable ALTERNATE ETHERNET address Truealt_addr 0x000000000000 ALTERNATE ETHERNET address Trueip_gap 96 Inter-Packet Gap Truelscfg 查看VPD信息Virtual Product Data)# lscfg -vl ssa1DEVICE LOCATION DESCRIPTIONssa1 30-68 IBM SSA Enhanced RAID Adapter(14104500)Part Number.................097H0645FRU Number..................097H0645 <-- 备件号Serial Number...............C8217227EC Level....................0000F20825 Manufacturer................IBM053ROS Level and ID............7201 <-- 微码版本Loadable Microcode Level (04)Device Driver Level (00)Displayable Message.........SSA-ADAPTERDevice Specific.(Z0)........DRAM=032Device Specific.(Z1)........CACHE=0Device Specific.(Z2)........000000062955dab2Device Specific.(YL)........P2-I7 <-- 槽号不同的硬件设备有不同的VPD 所含的格式和信息都不一样通常备件号和微码版本最有参考价值注FRU(Field Replace Unit)才是真正的备件号。

aix系统日常维护

aix系统日常维护
当系统运行发现错误时,SRNs码(Service request numbers,服务请求码)会以xxx-xxx的形式显示在显示面板上,同时在AIX的errorlog中也会进行登记;当SSA磁盘柜出现故障时,在磁盘柜前面板的液晶显示屏上会显示相应的SRNs,同时黄色的显示灯会闪动,在AIX的errorlog中会登记相应错误信息,在出现问题后记录下代码,并告之IBM公司解决。
(1)系统故障记录
errdemon 进程在系统启动时自动运行,记录包括硬件、软件及其他操作信息,故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析,使用errpt 命令(普通用户权限也可使用)。
#errpt |more 列出简短出错信息
#errpt -d H 列出所有硬件出错信息
1.系统用户的最大登录数maxlogin
maxlogin的具体大小可根据用户数设定,可以通过smitty chlicense命令修改,该参数记录在/etc/security/login.cfg文件中,修改在系统重新启动后生效。
2.系统用户的limits参数
这些参数位于/etc/security/limits文件中,可以把这些参数设为-1即无限制,可以用vi修改/etc/security/limits文件,所有修改在用户重新登录后生效。
(2)系统错误报告。
(3)检查是否有发给root用户的错误报告。
(4)检查hacmp.out,smit.log,boot.log。
(5)关键系统的文件使用率不大于80%。
(6)逻辑卷有否stale。
(7)内存交换区使用率是否超过70%。
(8)内存交换区的大小是否为物理内存的1.5倍。

AIX系统日常维护

AIX系统日常维护

AIX系统日常维护1.检查文件系统是否满检查方法:df –m 可以以兆为单位检查文件系统的使用率。

解决方法:如果文件系统的使用率达到90%以上,则需要扩大文件系统。

如果文件系统类型为jfs,使用命令smitty chjfs;如果文件系统类型为jfs2,使用命令smitty chjfs2。

检查周期:一周一次。

2.检查系统错误日志检查方法:使用errpt | more来检查系统生成的错误日志。

解决方法:如有错误生成,可使用errpt –aj 错误ID号,来查看错误的详细情况。

如果错误日志太长,可使用如下命令清除:errclear 0。

检查周期:一周一次。

3.检查系统合法/非法登陆情况检查方法:last命令可检查登陆信息。

如需查看root用户或从控制台终端的登陆和注销,可输入:last root console;如需查看系统两次重新引导间的时间,可输入:last reboot;如要显示所有在4月15日上午10:30仍登陆的用户,可输入:last –t 04151030;如只需显示列表中的十行,可输入:last –n 10。

检查周期:根据应用对安全性的要求决定检查周期。

4.检查系统是否有巨大的core文件生成检查方法:使用find / –name ‘core.*’–print来检查。

解决方法:对core文件,一般用rm命令直接删除。

检查周期:一月一次。

5.硬件检查检查方法:使用diag命令。

检查周期:一月一次。

6.系统性能检查a) CPU性能:使用vmstat,topas来检查。

b) 内存使用情况:也是使用topas,vmstat来检查。

c) 检查IO平衡使用情况:使用iostat来检查。

d) 内存交换页使用情况:使用lsps –a来检查。

机器性能优化主要从四个方面去考虑:CPU,内存,磁盘I/O,网络。

1,CPUsar命令可以使用sar命令来查看cpu的使用率。

ibm150:[/]#sar 1 5AIX ibm150 1 5 000AF70D4C00 01/24/0613:13:25 %usr %sys %wio %idle13:13:26 0 0 0 10013:13:27 0 0 0 10013:13:28 0 0 0 10013:13:29 0 0 0 10013:13:30 0 0 0 100Average 0 0 0 100%usr +%sys > 80%的时候CPU将是瓶颈ibm150:[/]#ps aux | head -4 查看前3位占用cpu的进程USER PID %CPU %MEM SZ RSS TTY STAT STIME TIME COMMANDroot 774 49.7 8.0 12 18052 - A 10:07:58 188:24 wait root 516 49.78.0 12 18052 - A 10:07:58 188:20 wait root 5688 0.1 0.0164 168 - A 10:09:13 0:21/usr/sbin/syncd 6%CPU表示进程使用cpu时间的百分比;%MEM表示进程使用实际内存的百分比ps –elf命令将查看进程的优先级别ibm150:[/]#ps -elfF S UID PID PPID C PRI NI ADDR SZ WCHAN STIME TTY TIME CMD200003 A root 1 0 0 60 20 28034 1876 10:08:23 0:00 /etc/init240401 A root 2968 4502 0 60 20 2c376 2176 *10:10:230:00 /usr/sbin/rsct/bin/IBM.ServiceRMd40001 A root 3192 1 0 60 20 3417a 1472 10:09:00 -0:00 /usr/dt/bin/dtlogin -daemon240001 A root 3730 4158 3 61 20 321b9 2568 10:10:19 -0:20 dtgreetPRI值越小,优先级越大。

AIX主要日常维护命令

AIX主要日常维护命令

查看硬件设备#prtconf AIX4只能用#lscfg -vp|more#ssaxlate -l hdisk2#lsslot -cpci#lsdev -Cc disk/-CH#lsdev –Cc adapter 查看系统中光纤卡安装情况#lsdev –Cc tape 查看磁带设备#lscfg -pvl sysplanar0# lscfg -vpl hdisk0 / fcs0 查看光纤卡的wwn#lsattr -EHl hdisk0/proc0/pdisk100/fscsi4/fcs0 (可查光纤HBA卡如‘fcs0’的WWN号) #lsmcode <55A:sf240-284>#bootinfo -y(-K)#tty#cfgmgr -i /dev/cd0,-v (刷新、安装设备)查看硬盘、存储#lsps -a pagespace虚拟缓存#df -m (-g -v)#lsvg [-l xxxx] VG rootvg datavg1 PV>>VG>>LV lv001>>\test >>file#lspv [[-l] hdisk1]#mount# mount -o ro -v cdrfs /dev/cd0 /mnt# mount -t ext -o loop initrd.img /mnt/initrd#lsfs#lslv [[-m] hd5],,lslv -l hd?,,#fget_config -v -A 查看光纤盘阵状态查看软件、进程#uname -uM#oslevel -s#ps -ef | more 或者ps x | more#ifconfig -a#netstat -rn 路由查看#topas#lslpp -l xx.xx如#lslpp -l Atape.driver 查看系统中是否已安装了磁带库驱动程序#lppchk -v 【校验所有安装lpp】#lssrc -a#startsrc#stopsrc : stopsrc -g sna(中断) stopsrc -f -s sna(强行中断) ) [-s subsystem_name][-g group_name]xhost+=============================================【】#rpm -Uvh --ignoreos /tmp/fwupdate/filename.rpm 升级安装rpm包#rpm -ihv --ignoreos pci.1014028C.13-05130080-1.aix5.1.noarch.rpm 安装rpm包rpm -qlp openssl-0.9.7l-2.aix5.1.ppc.rpm 查询rpm包文件安装位置rpm -e openssl# tar xxxx ,gzip -c xxxx tar 目录,可选择压缩,通常用tgz后缀# gzip xxxx 压缩普通文件,通常gz后缀# gzip –d xxxxx.gz 普通解压(uncompress ?)# tar -xvf xxxxx.tar 解压tar文件,如果tar是绝对路径,必须有该绝对路径的写入权限# gzip -dc *.tgz |tar -xvf - gzip的c参数为标准输出,然后由tar解压,“-”代表使用管道符号前的结果作为标准输入tar不支持8个G以上,以前是2个G【】tar 不压缩用法:1、创建tar备份tar -cvf device files,如:tar -cvf /dev/rmt0 /home2、从档案备份中恢复tar -xvf device files,如:tar -xvf /dev/rmt1 /home/liu3、列出tar 档案中的内容tar -tvf device,如tar -tvf /dev/rmt0【】tar 并压缩用法压缩:tar cvfz 目标文件源文件1 [源文件2...]例如:tar cvfz m.tar.gz hello.cpp hello.h //m.tar.gz是目标文件,hello.cpp和hello.h是源文件解压:tar xvfz 目标文件例如:tar xvfz m.tar.gz //在当前目录下将压缩包文件m.tar.gz解压缩其他一些用法:1.文件或目录打包:tar -cvf /u0/temp2.tar /usr/lib将/usr/lib目录下的文件与子目录打包成一个文件库为/u0/temp2.tar。

aix日常启停运维

aix日常启停运维

正常关闭主机流程关闭数据库关闭实例(grid)实例名需要修改成中银国际相应的实例名称登录grid用户su - gridsrvctl stop instance -d pdctdb -i pdc061 –关闭pdc061实例关闭oracle集群服务(root)/u01/app/oracle/product/10.2.0/crs/bin/crsctl stop crs或/etc/init.d/init.crs stop关闭HACMP(root)# smitty clstop关闭主机操作系统(root)通过shutdown –F 命令可以使系统快速关机,该命令在最短的时间内终止系统中的所有进程,然后把系统关闭。

# shutdown –F正常启动主机流程通过HMC来启动OS登录hmc,勾选要开机的分区选择oparations →activate →profile点击OK,开启启动OS勾选open a terminal windows会打开一个命令窗口。

启动HACMP(root)通过smitty clstart命令可以启动节点的HA 服务。

# smitty clstart启动oracle集群服务(root)1)启动集群服务(必须以root用户启动,每个节点)/u01/app/oracle/product/10.2.0/crs/bin/crsctl start crs或/etc/init.d/init.crs start查看系统错误日志信息errpt命令可以查看系统的错误日志信息,其中包括了系统的硬件损坏、软件错误等都会记录在该日志中。

errpt 的错误日志有多种类型,分别表示错误的不同等级:PERM 永久,不可恢复TEMP 临时,关注,没有丢数据PERF 性能降低UNKN 未知的。

INFO 信息,不是错误其中主要关心的PERM的错误信息,其他信息对系统都没有太大的影响。

查看系统硬件错误信息:# errpt -d HIDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTIONA6D1BD62 0406091207 I H Firmware EventA6D1BD62 0406091207 I H Firmware Event查看系统软件错误信息:# errpt –d SIDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTIONA63BEB70 0410151507 P S SYSPROC SOFTWARE PROGRAM ABNORMALLY TERMINATED2BFA76F6 0406091207 T S SYSPROC SYSTEM SHUTDOWN BY USER查看错误信息的具体内容,例如需要查看ID 为A63BEB70 的错误信息,可以通过以下命令查看# errpt –a –j A63BEB70根据错误信息的提示,把相关错误信息发给安庭或IBM 进行错误的分析。

小型机AIX教程十五

小型机AIX教程十五

实验15项目名称:日常维护及配置(一)1、实验目的了解小型机系统日常维护及配置的基本内容。

掌握系统及用户环境管理的基本方法。

在理解系统日志概念的基础上,掌握错误日志文件的管理方法。

2、实验内容日常维护及配置的基本内容前面我们分别按专题分别介绍了在小型机系统上对用户、进程、内存、文件系统、存储、外围设备以及网络等方面的基本管理。

本实验则是从用户与系统环境的维护及配置角度,讨论系统管理员日常需做各项工作,其中包括系统及用户环境的配置、系统日志的管理与维护、错误和异常的排查和分析、系统安全管理、基本的数据备份和恢复等等。

这些工作本身并不对应于系统中的某个硬件或软件子系统,但却贯穿于系统管理工作的始终,系统管理员往往是通过这些日常工作逐渐积累各种经验,特别是对系统各类问题,如硬件错误、安全异常等方面的经验,最终成为一名优秀的系统管理员。

因此,这些系统管理知识和技能是大家所必须掌握的内容。

本专题分为两部分,本次实验主要介绍系统及用户环境的配置、系统日志的管理与维护等方面的内容。

系统及用户环境管理对于一个系统管理员,在开展工作前,最起码要对当前系统和用户所使用的环境有一个基本的了解。

以下所介绍的命令,主要用在获取基本系统和用户环境的基本信息。

命令:lscfg功能:显示系统的配置信息、诊断信息和重要产品的信息格式:lscfg例子:lscfg命令的使用#lscfgINSTALLED RESOURCE LISTThe following resources are installed on the machine.+/- = Added or deleted from Resource List.* = Diagnostic support not available.Model Architecture: chrpModel Implementation: Multiple Processor, PCI bus+ sys0 System Object+ sysplanar0 System Planar* vio0 Virtual I/O Bus* vsa1 LPAR Virtual Serial Adapter* vty1 Asynchronous Terminal* vsa0 LPAR Virtual Serial Adapter显示单个设备的基本信息#lscfg | grep ProcessorModel Implementation: Multiple Processor, PCI bus+ proc0 Processor+ proc2 Processor问题:请完成如下问题,并将截图结果附于问题之后。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.文件系统是否满方法:df –k 可以以K为单位检查文件系统的使用率。

(90%以上,需要调整)2.检查系统出错日志使用errpt |more来检查清除现有的log: Errclear 03.检查系统合法/非法登陆情况使用Last命令来检查来自登陆的地方。

4.检查系统是否有巨大的Core文件生成使用find / -name core –print来检查。

对Core文件,一般直接删除就可以了。

5.系统性能检查:a) CPU性能:使用Vmstat, topas来检查b) 内存使用情况:也是使用topas, vmstat来检查c) 检查IO平衡使用情况:使用iostat来检查d) 交换空间使用情况:使用lsps –a来检查6.Mail检查7.Diag 一个月一次补充两点:1。

硬件检查,检查各指示灯状态和各物理设备的可用情况。

2。

进程检查,检查是或有死进程。

用who -d 查出一些死进程!AIX日常指令和常用操作一:开机登录在开机之前,先检查电源是否插好;然后,按下前面板上白色电源开关后,主机会进入硬件自检和引导阶段;此时,前面板上的液晶会有代码跳动,每一个代码表示自检或引导的不同阶段,最后在引导结束时,前面板液晶上的代码消失,彩显或终端上有显示,进入系统初始化和登录提示。

如果主机停在某一代码上,引导不下去(大于半小时),说明系统可能有故障,请与IPACS 联系,并把代码一起报给我们。

二:关机1)关闭应用程序2)HACMP软件,先用smit clstop关闭HACMP。

3)命令行打“shutdown -F”进关机,显示器上出现“Halt Completed”可按下前面板上白色电源开关,关电源。

如果需要关机后重新引导,打“shutdown -Fr”命令。

三:基本定义1) Physical Volume(PV)Physical Volume就是指硬盘,在AIX中用hdiskx表示。

7133磁盘阵列中的某个硬盘用pdiskx表示,pdiskx对应的AIX操作系统中Physical Volume 用hdiskx表示。

用lspv命令来看一下PV与VG对应关系用lsdev -Cc disk命令看一下硬盘状态,Available 表示硬盘可用,Defined 表示物理硬盘找不到,只有逻辑定义。

2)Volume Group(VG)Volume Group 是由多个Physical Volume组成的集合。

Physical Partition是VG分配空间的最小单位。

AIX操作系统所在的卷组就是rootvg可用lsvg 查看VG信息,用lsvg -o 查看打开的卷组。

3)Logical Volume(LV)和FileSystem(FS)Logical Volume和Filesystem是在卷组上划分的空间,不能跨多个卷组而且只能扩大不能缩小。

Filesystem是在LV上建的,使用时,需mount在AIX某一目录上。

可用lsvg -l VG_Name来看VG 上所有的LV和FS用df 命令来看Filesystem 使用情况用mount命令来看已mount的Filesystem四:日常系统管理AIX通过smit 工具(smitty是字符界面)来进行系统管理。

1)增加修改删除用户smit user2)增加修改删除卷组smit vg3)增加修改删除逻辑卷smit lv4)增加修改删除文件系统smit fs5)网络设置和查询smit tcpipMinimal Configuration◊填入IP地址,子网掩码,网关等参数;◊Start Now改为Yesnetstat -i / netstat -in 查看网卡interface状态和参数6)日常维护平时需用df 和errpt 检查一下文件系统使用率和有无新的错误日志。

如果文件系统使用率大于90%,需扩大该文件系统。

命令行打errpt后,可以显示类似下列错误日志;ERROR_IDENTIFIER TIMESTAMP T CL RESOURCE_NAME ERROR_DESCRIPTION 192AC071 010******* I 0 errdemon Error logging turned off0E017ED1 0405131090 P H mem2 Memory failure9DBCFDEE 010******* I 0 errdemon Error logging turned on038F2580 0405131090 U H scdisk0 UNDETERMINED ERRORAA8AB241 0405130990 I O OPERATOR OPERATOR NOTIFICATION其中,TIMESTAMP代表日期,以MMDDhhmmYY格式;如0405131090表示1990年4月5日13时10分T(Type)一栏中,P表示永久性错误,T 表示零时性错误,U 表示不能决定是什么错误,I 表示信息而非错误。

CL(CLass)一栏中,H表示硬件错误,S 表示硬件错误,O 表示通知操作员。

如果T(Type)一栏中是P且CL(CLass)一栏中是H,表示较严重错误,需跟IBM联系。

五:系统备份(仅rootvg备份)备份是用户的责任,可用下列步骤备份rootvg,其它数据需另外备份。

系统备份要定时做,一般1--2月做一次,凡rootvg数据有变化(如系统参数修改)要马上备份。

最好用几合带子轮流备份。

备份带上要标明备份时间和内容。

1)用root用户登录2)mount rootvg下需备份的文件系统3)smit mksysb选择备份介质◊Expand /tmp filesystem if needed 改为Yes六:诊断diag->System Verification选择需诊断的硬件设备◊七:常用命令set -o vi 类似PC DOS 中doskey命令,先按ESC键再按几下k键,可重现以前打过的命令。

export TERM=vt100/ibm3153/lft 设置终端类型lsdev -C和lscfg -v 显示硬件配置1、df -k文件系统空间使用情况2、lsvg 列出系统中所有vg的名字lsvg -o 列出激活vg名字lsvg vgname列出指定vg的详细信息lsvg -l vgname列出指定vg上的lv情况3、lsdev -P -H列出AIX支持的设备(即预定义odm数据库中的设备对象)lsdev -C 列出AIX支持的设备已定义的odm数据库中的设备对象lsdev -Cc xxx列出定制odm数据库中某个设备对象的信息例如:lsdev -Cc disklsdev -Cc tapelscfg列出系统上已安装的资源的配置信息lscfg -vl列出某个设备的VPD信息例如:lscfg -vl ent1lscfg -vl hdisk1lscfg -l xxx\*列出设备的不带VPD的相关信息lscfg -l proc\*lscfg -l hdisk\*4、修改文件及目录的属性4.1 chmod例如:chmod 765 xxx 修改文件xxx属性为765chmod -R 765 XXX 修改目录xxx及其下子目录及文件属性为7654.2 chown例如:chown user:usergroup xxx修改文件xxx的属主为user:usergroupchmod -R user:usergroup xxx 修改目录xxx及其下子目录及文件属主为user:usergroup 5、系统性能检测工具vmstat内存、pagespace、CPU等监测(vmstat 2 10每隔2秒钟执行一次,共执行10次)iostat 硬盘I/O监测netstat网卡监测topas综合检测工具6、ps进程察看ps -ef|grep 进程名例如:ps -ef|grep sapps -ef|grep oracleps -ef|grep tsmps -ef|grep cluster其他的指令可参照smitty工具来操作Basis学习showmount -e iplsdev -Cc adapter|grep ent 查看网卡lsdv -Cc if 查看网卡接口ifconfig -anetstat -in 看网卡IP信息netstat -rn 路由lssrc -t telnetlssrc -t ftpvi /etc/inetd.conf禁止远程通过root 登陆,修改/etc/security/user 文件,在root选项将false 作为rlogin 的值进行AIX 的日常维护,需要关注哪些日志文件?文件描述建议core 和snapcore 由应用产生的dump 文件,可用于诊断错误可删除nohup.out nohup 命令的输出结果可删除.xerrors X11的输出结果可截短mbox 用户邮箱中的邮件可截短smit.log 和smit.script 用户使用smit 命令后的日志可适当保留最后1000行,或删除/var/adm/wtmp 记录用户的登录信息,是二进制文件,用who 命令来阅读其内容根据需要保留60天中有用的内容,其余删除/etc/security/failedlogin 记录用户失败的登录信息,是二进制文件,用who 命令来阅读其内容可根据需要保留60天中有用的内容,其余删除/var/adm/sulog 用户使用su 命令的日志可根据需要保留60天中有用的内容,其余删除/var/adm/cron/log cron的日志可截短/var/tmp/snmpd.log snmp 监控进程日志可截短/var/tmp/dpid.log/var/tmp/dpid2.log/var/tmp/hostmidb.log/var/tmp/muxatmd snmp 子系统日志可截短dead.letter 未成功的邮件可删除trcfile trace 实用程序的输出可删除/var/adm/messages 用于记录syslog进程的日志可适当保留最后1000行,或删除/etc/shutdown.log 系统关机过程日志,用shutdown -l 命令产生可适当保留最后1000行,或删除如何自动杀死UNIX僵死的进程作者:曹苏华人保系统的计算机应用,已从单机运行方式过渡到以公司为中心的集中处理方式,各县级支公司通过广域网、远程telnet登录到市公司主机。

由于网络的原因,有些进程会突然僵死。

这些僵死的进程,会消耗系统大量的资源,直接影响机器的正常运行。

为了实时地、自动地杀死这些僵死的进程,本人编写了Shell程序Autokill。

Autokill程序脚本## autokill#ps -ef | awk …{ print $1,$2,$7,$8 }… |awk …/[0-9][0-9]:[0-9][0-9]:[1-9][0-9]/ { print $1,$2,$3,$4 }… |awk …!/root/ { print "kill -9 " $2}… >/tmp/k_killchmod 777 /tmp/k_kill/tmp/k_killAutokill程序解释首先,用UNIX 命令ps -ef 查看进程状态,通过管道传送给awk 进行处理。

相关文档
最新文档