aix系统日常维护手册

合集下载

AIX系统运维手册

AIX系统运维手册

项目运维手册目录第1 章AIX日常运维操作 (1)1.1 关于内核: (1)1.2 关于硬件: (2)1.3 关于AIX: (3)1.4 关于HACMP (4)第2 章例检 ................................................................................................ 错误!未定义书签。

2.1 例检部件一: ................................................................................ 错误!未定义书签。

2.2 例检部件二: ................................................................................ 错误!未定义书签。

2.3 例检部件N: ................................................................................ 错误!未定义书签。

第3 章系统重新启动步骤 .. (6)3.1 关闭 (6)3.2 启动 (6)3.3 验证 (8)第4 章备份恢复策略 ................................................................................ 错误!未定义书签。

4.1 备份 ................................................................................................ 错误!未定义书签。

4.1.1 系统备份.................................................................................... 错误!未定义书签。

AIX维护手册 第 1 部分:启动过程

AIX维护手册 第 1 部分:启动过程

IBM AIX V5.3 系统管理(Test 222)认证指南:第1 部分:启动过程级别:中级Shiv Dutta, 技术顾问, IBM2007 年11 月15 日作为一名系统管理员,您应该对启动过程具有全面的认识。

对于解决影响系统正常启动的问题来说,这种认识是非常有帮助的。

这些问题可能涉及软件和硬件两方面。

我们还建议您应该熟悉您的系统的硬件配置。

文章是节选自IBM 的红皮书《IBM Certification Study Guide eServer p5 and pSeries Administration and Support for AIX 5L Version 5.3 》。

启动过程启动过程包含下面的一些步骤:启动一个系统的初始步骤是上电自检(Power On Self Test,POST)。

其目的是验证基本硬件是否处于正常的工作状态。

同时初始化内存、键盘、通信,以及音频设备。

您可以看到在屏幕上显示了所有的这些设备。

在这个步骤中,您可以按下功能键,以选择不同的启动列表。

这个阶段中所显示的LED 值是模型特定的。

硬件和软件方面的问题都可能使得系统无法启动。

注意:基于MCI 体系结构的旧系统在这个步骤之前还将执行一个附加的步骤,即所谓的内建自检(Built In Self Test,BIST)。

对于基于PCI 体系结构的系统,不再需要执行这个步骤。

系统只读存储器(System Read Only Storage,ROS)对于每种类型的系统来说都是特定的。

它是启动AIX 5L Version 5.3 所必需的,但是它并不为启动工作构建所需的数据结构。

它将定位和加载引导(bootstrap) 代码。

系统ROS 中包含通用的启动信息,并且是独立于操作系统的。

软件ROS(也称为引导程序)构成了IPL 控制块,它与AIX 5L Version 5.3 是兼容的,用于接收控制和构建AIX 5L 的特定启动信息。

aixibm日常维护命令

aixibm日常维护命令

AIX IBM日常维护命令一、检查AIX系统状态1、文件系统:df -k2、设备:lsdev -C3、磁盘(物理卷):lspv4、paging space:lsps -a5、配置:lscfg -vp6、软件:lslpp -l7、用户:who8、处理器个数:lsdev -C|grep proc9、内存大小:lsattr -El mem0二、关机1、shutdown使用wall命令提醒用户若干时间后关机;2、shutdown +22分钟后关机3、shutdown -Fr-r = 关机后重新启动三、错误记录1、显示错误:errpt2、显示详细的错误信息:errpt -a3、清空错误记录信息:errclear 0四、smit/smitty部分快捷菜单方式:#smitty tape#smitty user#smitty tcpip#smitty inet#smitty nfs#smitty jfs#smitty lvm五、关于卷组(smitty vg)1、显示卷组状态:列出卷组细节:lsvg <vgname>列出卷组中的逻辑卷:lsvg -l <vgname>列出卷组中的物理卷:lsvg -p <vgname>2、增加卷组:smitty mkvg3、修改卷组属性:smitty chvg4、激活卷组:varyonvg vg_name5、解除卷组:varyoffvg vg_name6、向卷组中增加一个物理卷:extendvg vg_name hdiskn 注:extendvg命令用于向已存在的卷组增加新的物理卷,这个物理卷设备的状态必须是可用的(Available)。

7、从卷组中删除一个物理卷:reducevg [-d] vg_name hdiskn注:删除物理卷时其所在的卷组必须处于非活动状态,如果被删除的物理卷是卷组中仅存的一个,那么这个卷组同时也被删除。

AIX5.3+oracle10g日常维护手册

AIX5.3+oracle10g日常维护手册

AIX5.3+Oracle10g日常维护手册小型机维护步骤:1、首先查看小型机机房的温度、湿度、电气条件。

温度(摄氏℃)10 ℃-40℃湿度(%)8% -80%零地之间的电压小于1V2、查看小型机、磁盘阵列的指示灯。

主机故障灯面板上不能有数字显示,如果有的话,说明系统有故障。

告警灯为黄色表示有故障磁带机故障灯告警灯为黄色说明有故障或磁带机太脏,须清洗。

#/usr/lpp/diagnostics/bin/utape -cd rmt0 –n //清洗命令磁盘阵列故障灯告警灯为黄色表示有故障3、登录系统,查看小型机的错误日志硬件故障检测命令:# errpt -d H -T PERM若没有故障,则显示为空白,若有故障执行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,下载之后,将其报给集成商或者硬件厂家进行分析。

软件故障检测命令:# errpt -d S -T PERM若没有故障,则显示为空白,若有故障执行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,下载之后,将其报给集成商或者软件厂家进行分析。

4、有否发给root用户的错误报告(mail)观察所有未读消息,注意有关diagela的消息。

#mail如果有信息,则使用# Ctrl+d ; 存盘退出,存在/var/spool/Mail目录下,每个用户一个文件,将其下载,发给系统集成商或者硬件厂商5、查看文件系统的使用率%Used为文件系统的使用率。

所有文件系统的使用率不能大于70%,如果超过70%,则应该选择文件系统空间扩容或者删除该文件夹下某些无用数据#df –k //以KB为单位查看Filesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 24576 1452 95% 2599 22% //dev/hd2 614400 28068 96% 22967 15% /usr/dev/hd9var 8192 4540 45% 649 32% /var/dev/hd3 167936 157968 6% 89 1% /tmp/dev/hd1 16384 5332 68% 1402 35% /home 上表中,超过70%的/ 和/usr均需要增加容量,或者删除其中不需要的文件。

aix系统日常维护

aix系统日常维护
当系统运行发现错误时,SRNs码(Service request numbers,服务请求码)会以xxx-xxx的形式显示在显示面板上,同时在AIX的errorlog中也会进行登记;当SSA磁盘柜出现故障时,在磁盘柜前面板的液晶显示屏上会显示相应的SRNs,同时黄色的显示灯会闪动,在AIX的errorlog中会登记相应错误信息,在出现问题后记录下代码,并告之IBM公司解决。
(1)系统故障记录
errdemon 进程在系统启动时自动运行,记录包括硬件、软件及其他操作信息,故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析,使用errpt 命令(普通用户权限也可使用)。
#errpt |more 列出简短出错信息
#errpt -d H 列出所有硬件出错信息
1.系统用户的最大登录数maxlogin
maxlogin的具体大小可根据用户数设定,可以通过smitty chlicense命令修改,该参数记录在/etc/security/login.cfg文件中,修改在系统重新启动后生效。
2.系统用户的limits参数
这些参数位于/etc/security/limits文件中,可以把这些参数设为-1即无限制,可以用vi修改/etc/security/limits文件,所有修改在用户重新登录后生效。
(2)系统错误报告。
(3)检查是否有发给root用户的错误报告。
(4)检查hacmp.out,smit.log,boot.log。
(5)关键系统的文件使用率不大于80%。
(6)逻辑卷有否stale。
(7)内存交换区使用率是否超过70%。
(8)内存交换区的大小是否为物理内存的1.5倍。

AIX系统日常维护

AIX系统日常维护

AIX系统日常维护1.检查文件系统是否满检查方法:df –m 可以以兆为单位检查文件系统的使用率。

解决方法:如果文件系统的使用率达到90%以上,则需要扩大文件系统。

如果文件系统类型为jfs,使用命令smitty chjfs;如果文件系统类型为jfs2,使用命令smitty chjfs2。

检查周期:一周一次。

2.检查系统错误日志检查方法:使用errpt | more来检查系统生成的错误日志。

解决方法:如有错误生成,可使用errpt –aj 错误ID号,来查看错误的详细情况。

如果错误日志太长,可使用如下命令清除:errclear 0。

检查周期:一周一次。

3.检查系统合法/非法登陆情况检查方法:last命令可检查登陆信息。

如需查看root用户或从控制台终端的登陆和注销,可输入:last root console;如需查看系统两次重新引导间的时间,可输入:last reboot;如要显示所有在4月15日上午10:30仍登陆的用户,可输入:last –t 04151030;如只需显示列表中的十行,可输入:last –n 10。

检查周期:根据应用对安全性的要求决定检查周期。

4.检查系统是否有巨大的core文件生成检查方法:使用find / –name ‘core.*’–print来检查。

解决方法:对core文件,一般用rm命令直接删除。

检查周期:一月一次。

5.硬件检查检查方法:使用diag命令。

检查周期:一月一次。

6.系统性能检查a) CPU性能:使用vmstat,topas来检查。

b) 内存使用情况:也是使用topas,vmstat来检查。

c) 检查IO平衡使用情况:使用iostat来检查。

d) 内存交换页使用情况:使用lsps –a来检查。

机器性能优化主要从四个方面去考虑:CPU,内存,磁盘I/O,网络。

1,CPUsar命令可以使用sar命令来查看cpu的使用率。

ibm150:[/]#sar 1 5AIX ibm150 1 5 000AF70D4C00 01/24/0613:13:25 %usr %sys %wio %idle13:13:26 0 0 0 10013:13:27 0 0 0 10013:13:28 0 0 0 10013:13:29 0 0 0 10013:13:30 0 0 0 100Average 0 0 0 100%usr +%sys > 80%的时候CPU将是瓶颈ibm150:[/]#ps aux | head -4 查看前3位占用cpu的进程USER PID %CPU %MEM SZ RSS TTY STAT STIME TIME COMMANDroot 774 49.7 8.0 12 18052 - A 10:07:58 188:24 wait root 516 49.78.0 12 18052 - A 10:07:58 188:20 wait root 5688 0.1 0.0164 168 - A 10:09:13 0:21/usr/sbin/syncd 6%CPU表示进程使用cpu时间的百分比;%MEM表示进程使用实际内存的百分比ps –elf命令将查看进程的优先级别ibm150:[/]#ps -elfF S UID PID PPID C PRI NI ADDR SZ WCHAN STIME TTY TIME CMD200003 A root 1 0 0 60 20 28034 1876 10:08:23 0:00 /etc/init240401 A root 2968 4502 0 60 20 2c376 2176 *10:10:230:00 /usr/sbin/rsct/bin/IBM.ServiceRMd40001 A root 3192 1 0 60 20 3417a 1472 10:09:00 -0:00 /usr/dt/bin/dtlogin -daemon240001 A root 3730 4158 3 61 20 321b9 2568 10:10:19 -0:20 dtgreetPRI值越小,优先级越大。

AIX操作系统运行维护手册-Ver11

AIX操作系统运行维护手册-Ver11

AIX操作系统工作手册修改履历目录1引言 (4)1.1编写目的 (4)1.2适用范围 (5)1.3预期读者 (5)1.4文档说明 (5)2操作系统健康性检查 (5)2.1系统日志 (6)2.1.1系统硬件错误日志检查 (6)2.1.2系统所有错误日志检查 (7)2.1.3系统错误日志Core_dump检查 (8)2.1.4系统错误日志DELAYED_INT检查 (8)2.1.5系统邮件日志内容检查 (9)2.1.6系统邮件日志大小检查 (10)2.1.7登录失败日志文件大小检查 (11)2.1.8登录日志文件大小检查 (11)2.1.9su日志文件大小检查 (12)2.1.10异常终止的vi日志文件大小检查 (13)2.2系统性能 (13)2.2.1系统CPU使用率检查 (13)2.2.2查看占用CPU资源最多的进程 (17)2.2.3系统内存使用率检查 (17)2.2.4系统占用内存资源最多的进程 (19)2.2.5系统磁盘繁忙程度检查 (21)2.3交换空间 (23)2.3.1交换空间使用率检查 (23)2.4进程状态 (23)2.4.1僵尸进程检查 (23)2.5网络状态 (24)2.5.1网卡状态检查 (24)2.5.2路由状态检查 (25)2.5.3网络传输检查 (26)2.5.4网络连接数量及状态检查 (29)2.5.5主机解析检查 (31)2.6存储状态 (31)2.6.1HBA卡状态检查 (31)2.7文件系统状态 (32)2.7.1文件系统使用率检查 (32)2.7.2文件系统挂载检查 (33)2.7.3NFS文件系统挂载检查 (34)2.7.4dump设备空间检查 (34)2.8逻辑卷状态 (35)2.8.1Rootvg的剩余空间检查 (35)2.8.2PV状态检查 (36)2.8.3是否存在stale的pp检查 (36)2.9系统安全 (37)2.9.1系统登录情况检查 (37)2.9.2特权用户检查 (38)2.9.3Su操作次数检查 (38)2.9.4失败登录记录检查 (39)2.10双机状态 (40)2.10.1双机心跳状态检查 (40)2.10.2Hacmp.out日志检查 (41)2.10.3Cluster.log日志检查 (41)2.10.4双机节点状态检查 (42)2.11其它 (42)2.11.1操作系统时间检查 (42)3操作系统异常快速排查规范 (43)3.1系统日志检查 (43)3.2CPU使用率检查 (44)3.3内存使用率检查 (44)3.4I/O使用率检查 (45)3.5网络检查 (45)3.6交换区检查 (46)3.7文件系统检查 (46)3.8双机检查 (47)1引言1.1 编写目的为了保证项目组所运维系统的持续健康运行,降低操作系统的出错几率,并在出现问题时及时且有效的进行排查、处理,故编写本手册。

AIX日常维护手册

AIX日常维护手册

日常简易维护与报修指南目录一、系统命令 (3)二、备份与恢复 (6)三、AIX安全 (10)四、错误日志查看 (12)五、Performance Tools (14)六、错误报告流程 (17)附录一硬件接线图 (18)附录二、IBM设备前后视图 (19)一、系统命令检查系统状态:系统整体: prtconf文件系统:df –k,df -g设备: lsdev –C 获取设备名称、状态、位置和描述。

例:查看硬盘: lsdev –Cc disk查看磁带机: lsdev –Cc tape查看适配卡: lsdev –Cc adapter处理器个数 lsdev –C|grep proc系统配置lscfg –vp 获取所有已配置硬件设备的详细信息。

例:查看硬盘信息: lscfg –vl hdiskx x表示数字查看网卡信息: lscfg –vl entx x表示数字查看磁带机: lscfg –vl rmtx x表示数字查看硬件属性: lsattr –El 获取已配置设备的属性信息。

例:查看硬盘属性: lsattr –El hdiskx x表示数字查看网卡属性: lsattr –El entx x表示数字查看磁带机属性: lsattr –El rmtx x表示数字内存大小: lsattr –El mem0磁盘lspv交换分区lsps –a软件lslpp –l 文件包名字用户who关机命令:–shutdown一分钟后关机–shutdown +2二分钟后关机–shutdown –Fr关机重启(-r)关机命令调用/etc/rc.shutdown关闭程序可以在这个文件里加上你自己的脚本其它基本命令# passwdpasswd:—输入旧口令new passwd:—输入新口令re-enter new passwd:—重新输入新•mkdir/rm/mv/cd -用于创建目录/删除文件或目录/更改文件或目录名/进入某一目录•ls 显示目录中的内容(文件名)#ls –a 列出当前目录中的所有文件#ls –l 显示文件的详细信息•ps / kill 显示后台进程的有关信息或杀死后台进程#kill -9 253432•find 在一个/多个目录中查找符合条件的文件#find –name ‘t*’ -print•head/tail 显示文件头/尾声的内容#tail +200 filename•who/finger 列出系统注册/已登录的用户#who am I#finger user2光驱cdrom•加载cdrom•使用:mount -rv cdrfs /dev/cd0 /cdrom–或者创建一个CD-ROM文件系统并进行加载•smit cdrfs•mount /cdrom•卸载cdrom– unmount /cdrom。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

小型机日常维护手册第一章HACMP的启动与关闭一、HACMP软件的启动与关闭1.Cluster Servicesa)启动HACMP键入命令行# smitty clstart 后,按ENTER。

如图:b)停止HACMP键入命令行# smitty clstop后,按ENTER。

如图:c)监测HACMP#tail –f /tmp/hacmp.out#netstat –i#lsvg –o#ps –ef |grep ***第二章全系统备份与恢复一、全系统备份1.停止HACMP软件的运行(可选步骤)键入命令行# smitty clstop后,按ENTER。

如图:2.插入4mm磁带到磁带机作系统备份#smitty mksysb*注:a.全系统备份工作只将rootvg中且mount的文件系统备份b.全系统备份带可直接引导进行全系统恢复。

二、全系统恢复1.用全系统备份带将rootvg进行全恢复1)加电所有外设2)加电主机3)插入系统备份带4)等待一段时间后,当屏幕显示“IBM RS/6000 …”时,按5(或者F5)进入默认启动模式注:被覆盖的原有系统若能正常运行,则建议在原有系统关机前,进行如下操作:#bootlist –m normal rmt0 hdisk0 hdisk1#bootlist –m normal -o#shutdown –Fr5)屏幕显示:“Type F1 and press Enter to use this display as the system console”按数字“F1”键,并按Enter键把当前终端作为系统主控台。

6)屏幕显示“Type 1 and press Enter to have English during install.”按数字“1”键,并按Enter键选择英语为安装过程中的提示语言。

7)屏幕显示“Welcome to Base Operating System Installation and Maintenance”安装设置主菜单。

选择“3”:Start Maintenance Mode for System Recovery8)选择“4”:Install from a System Backup9)选择恢复设备/dev/rmt02。

rootvg恢复完后,等待系统重新启动第三章系统日常维护一、开机步骤为保证HACMP软件的正常运行,请严格遵守!!1.加电7133磁盘子系统2.加电主控终端、打印机等所有外设(根据需求)。

3.加电2台小型机主机,等待主控终端显示Login后再进行下一步。

4.在H85A主机启动HACMP软件:# smitty clstart6.键入下列命令监视HACMP后台启动情况# tail –f /tmp/hacmp.out等待出现“Application starting completed!!!”,按ctrl+c退出。

7.启动HB5B主机的HACMP服务,方法同H85A主机。

8.整个开机过程完毕二、关机步骤1.停止HACMP在每台主机键入命令行# smitty clstop后,按ENTER。

如图:2.关闭主机在每台主机上可输入如下命令进行关机:# shutdown now 立即关机# shutdown -Fr 关机后重新开机。

3.关闭所有设备电源。

三、几种故障情况的处理1.当生产机因电源、cpu、内存等故障导致死机时,HACMP软件会自动控制备份机接管生产机的应用。

从生产机死机到备份机接管完毕大约需要3分钟的时间。

2.当生产主机修好后,不应在备份机正在运行应用时进行接换,这会导致不必要的业务中断。

因此,在生产主机修好后,应按正常情况下的开机步骤重新加电生产机和备份机,让生产机重新投入运行。

3.在生产机未修好的情况下,备份机会自动启动所有应用。

4.当生产主机在运行中,主用网卡出现故障时,备用网卡将自动接管,接管时间小于两分钟。

第四章AIX常用命令1、HACMP起停命令:smitty clstartsmitty clstop查看HACMP启动信息:tail -f /tmp/hacmp.outctrl + c退出2、网络查看命令:netstat -inetstat -in3、查看VG命令:lsvg rootvglsvg -l rootvglsvg -o4、查看硬件设备命令:lscfg -vp|morelscfglscfg |grep hdisklsdevlsdev -Cc disk(或其他设备类型,adapter)5、查看具体设备的详细信息:lsattr -El proc0lsattr -El mem06、查看系统资源命令:topasq退出7、查看文件系统空间命令:df –k 文件系统空间使用率尽可能保证<80%。

8、查看操作系统版本命令:oslevel -r9、查看操作系统内核大小:bootinfo -K(内核为64位)bootinfo -y(支持64位应用)10、启动列表设置和显示:bootlist -m normal hdisk0 hdisk1 cd0bootlist -m normal -o11、查看进程:ps -efps -ef |grep [匹配字符]12、修改属主chown -R [用户]:[组] [目录名]chown [用户]:[组] [文件名]13、命令帮助man [命令]14、查看系统错误日志errpt |more 查看错误信息列表errpt –aj <错误代码> |more 查看具体错误代码的详细错误信息(二)oracle启动关闭方法:(1)双机环境A、B主机:所有oracle数据库服务均由HACMP的脚本文件来管理,具体命令参见脚本文件。

启动脚本内容为:su - oracle -c "sqlplus /nolog <<EOFconnect sys/change_on_install as sysdbastartupexitEOF"sleep 10su - oracle -c "lsnrctl start"sleep 10echo "The oracle Server is successful start"停止脚本内容为:su - oracle -c "lsnrctl stop"sleep 10su - oracle -c "sqlplus /nolog <<EOFconnect sys/change_on_install as sysdbashutdown immediateexitEOF"sleep 10echo "The oracle Server is successful stop"(2)单机环境的方法如下:数据库监听器启动方法:(用oracle用户登入AIX)$lsnrctl start数据库启动方法:(用oracle用户登入AIX)$sqlplus /nologsqlplus> connect / as sysdbasqlplus>startup数据库关闭方法:(用oracle用户登入AIX)$sqlplus /nologsqlplus> connect / as sysdbasqlplus>shutdown immediate数据库监听器关闭方法:(用oracle用户登入AIX)$lsnrctl stop注意:如果要关闭主机,请先关闭数据库,然后关闭数据库监听器。

当重启主机后,请先启动数据库监听器,再启动数据库。

在AIX 5L中,增强了pax命令的功能:系统缺省支持64-位POSIX-定义的数据格式。

目的是允许归档大文件,例如dump 文件。

cpio和tar命令由于32-位格式的限制不支持输入大于2 GB的文件。

如果要归档大于2GB的文件,目前唯一的选择是pax命令。

经过测试:-rw-r--r-- 1 root system 11237539840 Dec 06 12:40 ptf操作正常使用方法(与tar类似):Pax–r|-w|-rw–c–d–i–k–l–n–t–u–v–X–H|-L–pString–oOptions–sReplacementString -xFormatFileDirectory-a:添加文件到归档的末尾-c:匹配所有归档成员或文件(pattern参数指定的除外)-d:只考虑路径不考虑路径的内容-fArchive:指定要使用的归档文件的路径-i:重命名文件或归档-k:防止该命令覆盖存在的文件-r:从标准输入读一归档文件-v:写进程的信息-w:以指定的归档格式写文件到标准输出-xFormat:指定输出的归档格式(pax----可以大于2G,cpio,ustar)注意:不指定-x参数,缺省为tar格式,指定-x不指定Format,缺省为pax格式pax–vf/etc/temp.tar查看tar文件pax–xpax–wvftemp.tar /home/user/soft.tar /home/user/temp.tar 建立一个pax格式文件temp.tar,包含文件/home/user/soft.tar和/home/user/temp.tar,大于2Gpax–wvf/dev/rmt0 dump.out 拷贝dump.out文件到磁带机pax–rvf/var/adm/link.tar 解压缩tar文件/var/adm/link.tar到当前目录pax–rwrun.pax /tmp 拷贝run.pax文件到/tmp目录。

相关文档
最新文档