HP小型机服务器应急处理方案

HP小型机服务器应急处理方案
HP小型机服务器应急处理方案

HP小型机应急处理方案

系统开、关机简介

一般地说,系统开关机应严格遵循以下步骤:

1. 开机顺序

1). 打开总电源。

2). 打开计算机机柜电源

3). 打开外部设备电源.(如磁盘阵列,磁带库等)

4). 最后打开主机电源.

2. 关机顺序

1). 进行操作系统的关闭(#shutdown -h -y 0)

2). 关闭主机电源.

3). 关闭外设电源.(如磁盘阵列,磁带库等)

4). 关闭其他设备电源和机柜电源;

5). 最后关闭总电源。

日常维护检查

在对广大客户的支持服务中,我们经常发现,由于种种原因,客户往往未能及时发现系统中的一些异常现象,最终导致了对系统和应用的重大影响。

为了帮助客户各有效、方便地管理系统,我们设计了《日常检查维护表》,希望能够帮助广大用户加强日常管理,从而做到防患于未然,尽可能保障系统的运行。

我们分成以下几个部分进行介绍:

使用指南:

如何使用表格,如何使用相关命令进行检查。

同时由于客户的配置千变万化,允许HP客户支持工程师和客户共同对表格和指南进行定制。

日常检查表

日常维护检查使用指南

在《日常维护检查表》中,我们把日常的检查分成以下几个部分:

?硬件操作系统备份

?应用

我们下面分别描述各类检查的内容和方法。HP支持工程师和客户可以一起定制这份指南,例如,定制要检查那些应用日志和进程等等。

?硬件

在这部分中,我们检查以下内容:

1:面板指示:

在大多数的服务器中,都由一个液晶面板,显示服务器的执行状态。在正常情况下,应该是FxxF的格式。在系统出现故障时,会出现WARNING或FAULT的提示。具体请参见《技术指南》。

系统管理员应该定期检查该指示,确认系统正常工作;否则,应该立即联系HP公司。

2:服务器中的各个扩展卡的指示灯

在服务器中,存在多种扩展卡,例如,SCSI卡(连接SCSI设备),以太网卡等。这些卡都由一个或多个指示灯。从这些指示灯可以了解这些卡的工作情况。

具体情况,请参见各个卡的说明书。

?SCSI卡:

在正常情况下,自检灯(self test)应该是暗的;终结电源指示灯(Terminator PWR)是亮的

?以太网卡:

在正常情况下,自检灯(self test)应该是暗的;连接灯(Link)是亮的

?其他卡:

3:外设的状态

大部分外设也都由自己的状态指示。下面是比较常见的几种:

?M10,M20,M30磁盘阵列

这些磁盘阵列,正常情况下,硬盘的指示灯:应该是绿色;如果变成黄色,则说明该磁盘发生故障。

维修灯(Service Lamp):

应该是绿色;如果变成黄色,则说明该阵列中存在故障部件。例如,硬盘故障。

?AutoRAID磁盘阵列

该磁盘阵列有一个液晶面板。如果出现故障,在面板上会出现Warning提示信息。

?磁带库

磁带库一般也有一个液晶面板。如果出现故障,在面板上会出现报错信息。

?其他外设

XP256:该外设实全冗余的如果有部件发生故障,会自动通过DDN拨号到美国技术中心。

4:其他硬件检测:

在N4000中,有一个attention灯,正常情况下,该灯应该是暗的。如果是黄色的,则说明系统中存在一些问题。

?操作系统

在这一部分,通过一些实用、简单的命令,检查系统的情况:

1.控制台(console )显示

在系统出现问题时,常常会在控制台上显示一些出错信息。系统管理员应该定期检查这些信息。这往往是最方便的方式。

另外,在使用完毕后,应该确保退出控制台,从而避免一些安全性问题。

2.命令“dmesg”

系统中存在一个错误缓冲区,系统将自检信息和遇到的错误、报警放在该缓冲区中。

我们可以通过dmesg命令,阅读该缓冲区。

在正常情况下,该缓冲区只应该包含自检信息。如果出现了warining、error或者是一些不熟悉的信息,应该仔细检查或通知HP服务人员。

3.命令“uptime”

该命令显示了系统自从上次重启以来运行的时间。通过该命令,可以知道系统是否发生了异常的重启。

4.命令“bdf”

系统中文间系统过满,有时会导致系统工作不正常。我们可以用该命令显示了文件系统的使用情况。

如果发现某个文件系统过满,需要及时采取措施,或者删除无用的信息,或者扩大该文件系统。

5.命令“mail”

系统在发现问题时,往往会把一些信息发给root用户。

系统管理员应该定期检查root的mail信息,以确认系统中不存在异常。

6.日志“/var/adm/syslog/syslog.log”

该日志文件中包含一些重要的维护信息。系统管理员应该定期用more或者vi命令,检查该文件。

系统管理员如果发现warning、error、failure以及一些不熟悉的信息,应该提高警惕。

7.命令“cmviewcl”

对于运行了双机备份软件的用户而言,应该定期检查系统的运行情况。

确认应用包、节点和网络均正常工作。

8.其他命令

用netstat –in检查网络状况,尤其是ATM网卡。

?备份

系统管理员应该检查:

o是否按照计划完成了备份备份过程是否正常

o应用

系统管理员也应该养成定期检查应用的习惯。在支持服务中,操作系统工作正常,但用户应用由于种种原因无法正常工作的例子并不罕见。

根据具体情况,系统管理员应该检查:

o应用的日志文件

o组成应用的主要进程的执行情况,例如数据库的DBWR,LGWR等等。

日常检查维护表

系统有多少CPU 或MEMORY

SAM->performance monitor->system property->processer or memory

文件系统维护

文件系统是操作系统中的重要组成部分,由于系统需要经常的对文件系统进行操作,当文件系统空间满了或者有问题时,容易引起系统运行异常,因此客户应当经常对文件系统进行维护。

具体的维护方法主要是通过bdf命令来观察各个文件系统的使用情况,如果某个文件系统的使用率超过一定限度(一般为90%)时,应该采取行动删除此文件系统内无用的文件或者扩充文件系统的空间大小。

请参见下面的“HP-UX技术专题--逻辑卷与文件系统”。

逻辑卷管理

根据以上介绍,在HPUX下正确使用硬盘的顺序及相应命令如下:

1.先建物理卷

# pvcreate -f /dev/rdsk/cCdDtT

这里必须使用硬盘的字符设备文件

2.再建逻辑卷组

# mkdir /dev/vg0X

X:0~f,逻辑卷组名

# mknod /dev/vg0X/group c 64 0x0X0000

# vgcreate vg0X /dev/dsk/cCdDtT

3.然后划分逻辑卷

# lvcreate -L size –n /dev/vg0X/lvolY vg0X

size:该逻辑卷大小

4.在LV上建文件系统

# newfs -F /dev/vg0X/rlvolY

:文件系统类型,包括hfs和vxfs,注意此时用该逻辑卷的字符设备文件。

5.将此文件系统Mount到一个目录下

# mkdir /directory

# mount /dev/vg0X/lvolY /directory

到此为止,您已经可以使用这个硬盘了。有时您可能在现有的环境下,需要添加、删除逻辑卷,或者是需要扩大文件系统。我们可以这样做:

6.添加逻辑卷

1)添加文件系统卷。例如:在vg01上添加一个200M的文件系统卷,卷名为data,mount到目录/sample 上。

A.创建逻辑卷,在系统提示符下键入命令:

# lvcreate -L 200 -n data /dev/vg01

B.在逻辑卷data上创建文件系统:

# newfs -F hfs /dev/vg01/rdata

注:如果是vxfs文件系统,则用

# newfs -F vxfs /dev/vg01/rdata

C.创建目录/sample,并将逻辑卷data mount 到/sample.

# mkdir sample

# mount /dev/vg01/data /sample

D.用bdf命令,将会看到/dev/vg01/datamount 到/sample上。

2)添加非文件系统卷(raw data volume)。例同上。

A.创建逻辑卷,在系统提示符下键入命令:

# lvcreate -L 200 -n data /dev/vg01

7.删除逻辑卷

例如:删除vg01 中名为data 的逻辑卷,mount 到/sample。

1)卸载所要删除的逻辑卷:

A.首先用umount 命令将逻辑卷data 从/sample上卸载下来:

# umount /sample

B.若系统提示设备忙,不能卸载;则在根目录系统提示符下,键入以下命令,进入单用户:

# shutdown -y 0

C.在单用户下,先将所有文件系统mount上,键入命令:

# mount -a

D.用bdf命令看该逻辑卷是否已经mount上,如果mount上,键入以下命令:

# umount /sample

2)删除逻辑卷/dev/vg01/data ,用命令:

# lvremove /dev/vg01/data

8.扩大文件系统

1)扩大文件系统,首先要找到这个文件系统所对应的逻辑卷,只有首先扩大逻辑卷,给文件系统以扩大的空间,才能扩大文件系统。

2)为扩大逻辑卷,先进单用户,在根目录系统提示符下,键入命令:

# shutdown -y 0

3)进入单用户后,先将所有文件系统mount上,键入命令:

# mount -a

4)用bdf命令看该文件系统是否已经mount上,如果mount上,用命令#umount文件系统名umount该文件系统。例如,想要扩大“/usr”到500M ,就键入命令:# umount /usr

5)用命令:

# lvextend -L 500 /dev/vg00/lvol4

这里,假定/usr 对应/dev/vg00/lvol4

6)用命令:

# extendfs /dev/vg00/lvol4 扩大文件系统。

注:如果是vxfs文件系统,则用

# extendfs -F vxfs /dev/vg00/lvol4

7)用命令:# mount /dev/vg00/lvol4 /usr

将文件系统mount 到/usr,这样,文件系统“/usr”就被扩大了,

8)用命令:# init 3 进入原来多用户运行级。

网络系统维护

同用户和用户组管理一样,维护网络系统可以用命令行的方式执行,但推荐用户使用SAM管理。

1. 相关配置文件

1). 主机名定义文件:/etc/hosts文件格式如下:

internet address official host name aliases

internet address:IP地址

official host name:主机名

aliases:别名

例如:

192.45.36.5 hdxsg testhost

2). 主机网络配置文件:/etc/rc.config.d/netconf文件,主要内容如下:

INTERFACE_NAME[0]=lan1 网卡设备

IP_ADDRESS[0]="" IP地址

SUBNET_MASK[0]="" 子网掩码

BROADCAST_ADDRESS[0]="" 广播地址

2. 相关管理命令

1). 查看所有网卡设备:lanscan,参见《系统维护常用命令及工具》之“常用命令”;

2). 查看、配置某个网卡:ifconfig,参见《系统维护常用命令及工具》之“常用命令”;

3). 查看网络状态:netstat,参见《系统维护常用命令及工具》之“常用命令”;

4). 增加动态路由– route add, 显示如下:

route add destination gateway metric

5). 删除动态路由– route delete, 显示如下:

route delete destination gateway

6). 配置静态路由- /etc/rc.config.d/netconf, 显示如下:

将需要配置的路由信息按照文件规定格式写入此文件,注意路由设置的编号不能重复。

7). 更改主机IP地址

A. 首先使用“lanscan”和“ifconfig”命令查出该网卡的设备名

B. 使用vi命令编辑/etc/rc.config.d/netconf文件。找到

INTERFACE_NAME[0]=lan1

IP_ADDRESS[0]=""

SUBNET_MASK[0]=""

BROADCAST_ADDRESS[0]=""

将原有的IP地址和SUBNET_MASK改成新值

C. 使用vi 命令编辑/etc/hosts文件,改变对应主机名的IP地址

注意:不要在CDE环境中,直接改变IP地址,应退出CDE环境,完成修改过程。

8). 其它命令

hostname,nslookup,ping, linkloop等

硬件维护常识

1. 开机顺序

一般地说,系统开关机应严格遵循以下步骤:

-> 打开总电源。

-> 打开计算机机柜电源

-> 打开外部设备电源(如磁盘阵列,磁带库等)

-> 待外部设备自检完成后,最后打开主机电源.

2. 关机顺序

-> 进行操作系统的关闭(shutdown -h -y 0)

-> 关闭主机电源.

-> 关闭外设电源.(如磁盘阵列,磁带库等)

-> 关闭其他设备电源和机柜电源;

-> 最后关闭总电源。

3. 电缆连接注意事项

在进行电缆连接(插拔)时,最重要的一点是,通过该电缆连接(或将要连接)的设备应当是没有加电的,即应当先将设备的电源关掉,然后再进行电缆连接(插拔)操作。否则,如果带电进行电缆连接,会造成对设备无法预料的损坏。

4. 硬件故障诊断

在此介绍简单的常见故障处理。

-> 电缆连接

注意计算机及各外设之间连线接触良好,不要无故拔插电缆;如果发生计算机不能识别某个设备,有可能是电缆的接触问题。

-> 硬件状态指示灯

如果发现系统工作不正常,可以观察硬件状态指示灯的情况。

开机后系统将自动完成自测试,诊断及引导启动代码。检测顺序大致为:高速缓存,中央处理器,总线,内存,I/O设备。当检测到相关的硬件时,对应的显示灯会亮。

硬盘,软盘,磁带机及光盘驱动器自检时,能从前面板上看到相应的灯亮一下,表明系统已经识别到上述设备。相反,如果某驱动器的自检灯没亮,很可能是该设备有问题。

另外,主机背后的SCSI接口卡及网络接口卡上的自检指示灯亮为正常状态。否则,可能该接口卡有问题。如果发现这种问题,请马上与HP联系,考虑更换备件。

-> 错误代码

每次开机后,系统都会进行硬件自检及初始化,假如系统出现硬件故障,一般都不能正常启动,并在液晶显示屏及控制台上相应的显示出错误代码及出错信息。

若屏幕上出现ERROR且液晶显示上出现FLT,表明有故障发生,应根据上述提示确定故障点。

绝大部分硬件错误都能在自检时暴露出来,在液晶显示及控制台的左下角都有四位错误代码:FLT xxxx。分析这四位代码可以进一步检测出故障。发现这种问题,请马上与HP联系,分析相应的故障原因。

HP设备运行环境要求

1. 机房总体要求

1) 机房应避免下列因素:

-> 温度:20 ~ 25 ℃,最佳22℃

-> 电磁场

-> 磁场

-> 腐蚀性气体

-> 易燃物或易燃性气体

-> 爆炸物品

-> 湿气

2). 计算机的前后左右应有足够的散热空间。

3). 窗密封,机房场地保持清洁。

4). 房避免阳光直射。

5). 内不可铺设地毯,以防静电。

6). 无线电杂波干扰应低于0.5V/米。

2. 电源要求

1) 电压和频率容许变动范围:

电压:单相交流,220V +4%,-8%(198~232V)

频率:50Hz +/- 0.5Hz

2) 瞬间电压波动不能超过220V+/-15%,且必须在25个周期(0.5秒)恢复,对于磁盘存储设备则需在三个周期内恢复。

3) 总谐波(Harmonic)成分不得高于5%。

4) 瞬间脉冲电压(Impulse)若大于100V(up to 200us)时,将影响计算机系统的正常运行。下表列出瞬间脉冲在不同情况下的摘要:

脉冲电压(V)出现次数(次/天)采取行动

50 ~100

不需校正

20

50 ~100 20 ~50 需要校正

50 ~100 > 50 必须校正

100 ~250 2 ~3 需要校正

100 ~250 > 3 必须校正

> 250 > 1 必须校正

5) 电源插座及电缆

(1) 如果购置了计算机机柜,请给每一个机柜由配电盘单独引出两

条大于20安培的电缆及两套插头座。

(2) 若订购是V系列主机,需为每台主机配一条50安培的电缆。

(3) 请为每条电缆配相应容量的空气开关并将电缆引致机柜所在位置的地板下面。

(6) 请准备充足的电源接线板用于连接终端、Modem、及其他非机柜中设备。

(7) 请确认电源保护地线的专用接地线电阻小于1欧姆且零地电压小于1V。

电源插座要求(俯视图):

由于HP服务器机柜原电源插头是美国标准,在发往中国时工厂已将插头取下,因此请根据所购买的机柜数量准备数套插头及插座,要求容量大于20A,插座接法如上。

保护地和零线间的电压要小于1.0伏。

3. 机房内环境要求

1) 温度与湿度:

-> 温度:20-25℃,最佳:22℃

-> 相对湿度:40%-60%,最佳:55%

-> 机房最大温度变化率:10℃/小时

-> 北部地区气候干燥,建议使用加湿器

-> 南方地区气候潮湿,建议使用去湿器

2) 机房散热量计算:

保持机房内计算机系统操作于最佳温/湿度空间,必须计算机房内总散热量,其中包括

-> 机房内机器散热量总和

-> 灯光

-> 人员散热量:每人平均600BTU/小时

-> 未来扩充的设备

-> 机房空间散热量:50BTU/平方英尺

-> 总散热量为上述各项散热量之和,下列有公式可换算成冷气机使用千卡:BTU/hr = WATTS×3.413

K/hr=BTU/hr*0.25

3). 空气含尘量:

机房应保持清洁,空气中大于0.5Micron的杂质在每立方英尺不多于45000个,若空气灰尘过多,很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁损。

4). 机房颤动度:

机房内颤动度不得高于0.5G,机房内产生震动的机器避免放置在一起,因颤动将使机器内机械部分、接头、主机面板接触部分产生松动,而造成机器不正常。

5). 磁场杂波干扰:

机房附近的无线电杂波干扰应低于0.5V/M(频率范围从14KHz到1GHz),若机房附近有强烈磁场干扰时,应迁移机器,倘若还是无法避免,将机房四周用金属隔离,使磁场干扰降至标准之下。

4. 机房空间及结构

1) 如果配置有惠普标准机柜,要求机柜摆放前后需留出1米空间以便机柜门可以打开。由于机柜之间

可能有数据电缆相连,要求惠普机柜尽量靠紧摆放。

2) 高架地板承重要求:点荷重454 kg,地板应使用防静电材。

3) 准备足够数量的带边孔(30cm x 20 cm 以上)的地板,以备设备走线。一般为每个机柜备一块。

5. 其它辅助设备要求

1. 根据桌上设备的数量,准备适量的桌子或工作台。

2. 请在机房准备一部直拨电话,以便我公司可以有效地提供远程登录和诊断服务。

常用工具--系统管理工具SAM

启动SAM

选择相应的项目

系统维护常用配置文件

1./etc/hosts

主机名字解析文件,提供主机名和IP地址的对应。

2./etc/passwd

口令文件,内容为:

登录用户名:加密口令:用户ID:组ID:保留:初始工作目录:shell路径

3./etc/group

内容为:

组名:加密密码:组ID:所有属于该组的用户。

4./etc/profile

如果该文件存在,则每个用户登录时将执行该文件。该文件一般用于设置一些通用环境变量,如果用户的home目录中存在.profile文件,则在执行/etc/profile之后,再执行用户的.profile 文件。

5./etc/inittab

内部初始化之后,系统将启动/etc/init这个deamon进程,使/etc/init进程取得引导序列的控

制权。而init进程从文件/etc/inittab(init table,初始化表)取得指示,该文件的内容控制所有init

状态,同时也控制那些已消亡进程的再生。

6./etc/fstab

系统中可以mount的文件系统的信息。

7./etc/lvmtab

使用命令:

# strings /etc/lvmtab;查看系统VG和磁盘信息。

8./etc/rc.config.d/netconf

包含系统名称和网络配置信息,如IP地址、子网掩码和路由信息等。

9./stand/system

包含系统的驱动程序和子系统信息,内核设备信息和一些系统可调参数信息。

系统管理员的日常工作

系统管理员对小型机系统的正确管理是系统稳定运行的保障,作为系统管理员应注意以下几个方面:1.开关机步骤

2.用户组及用户管理

参见手册HP-UX System Administration Tasks

3.文件系统维护

发现文件系统已满,应及时删除无用文件或扩大文件系统。

4.系统日常管理

系统管理员最好用sam (System Administrator Manager)来进行系统管理。Sam是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。

5.系统备份

备份是保护用户数据不丢失的重要手段。一般系统备份的要求如下:

A. 每一台机器的操作系统至少有一个全备份。

B. 每天备份用户数据。

C. 操作系统配置修改后重新备份操作系统。

6.定时清洗磁带机

7.定时检查设备指示灯状态

8.简单故障的判断

9.熟悉HP-UX操作系统

在用户手册中,以下两本书对系统管理员的日常工作会有很大帮助:『HP-UX System Administration Tasks』

『Configuring HP-UX for Peripherals』

日志文件监控

1. 常用日志文件

2. 日志文件清理

执行以下命令清空日志文件:

# > 文件名

或者

# cat /dev/null > 文件名

注意:清空文件前请确认文件是否正在使用。

/、/var满了怎么办?

用“find 目录-xdev –size +8000” “du –kx 目录” 来找可疑文件,移走。/dev /etc / 下有文件都会报告“/”满。

怎么修改IP,网关,HOSTNAME等

1.SAM;

2 set_parms initial;

3.ifconfig

4./etc/rc.config.d/netconf

硬件故障诊断与处理

在此介绍根据指示灯液晶显示等方面的信息,了解硬件故障诊断方面的情况。

电缆连接

注意计算机及各外设之间连接触良好,不要无故拔插电缆;如果发生计算机不能识别某个设备,有可能是电缆的接触问题。

硬件状态指示灯

如果发现系统工作不正常,可以观察硬件状态指示灯的情况。开机后系统将自动完成自测试,诊断及引导启动代码。检测顺序大致为:高速缓存,中央处理器,总线,内存,I/O设备。当检测到相关的硬件时,对应的显示灯会亮。

硬盘,软盘,磁带机及光盘驱动器自检时,能从前面板上看到相应的灯亮一下,表明系统已经识别到上述设备。相反,如果某驱动器的自检灯没亮,很可能是该设备有问题。

另外,主机背后的SCSI接口卡及网络接口卡上的自检指示灯亮为正常状态。否则,可能该接口卡有问题。发现这种问题,请马上与HP联系,考虑更换备件。

错误信息

每次开机后,系统都会自动进行硬件自检及初始化,假如系统出现硬件故障,一般都不能正常启动,并在液晶显示屏及控制台上相应的显示出错误代码及出错信息。

对于部门级Alpha服务器如DS系列,可能会通过嘟嘟声音反馈错误信息,不同次数和频率均有不同含义,请注意记录并报告给惠普公司。

企业级Alpha服务器如ES系列,除了可以利用嘟嘟声音报错外,还可以通过液晶屏直接提示错误信息,如“TIG Error”,“FAN3 Failed”等。

Marvel系列的服务器如ES47、ES80等,在液晶屏上配置了用按钮选择的菜单功能,需要使用的菜单可能有“View Alerts”,“Show Drawer”等。

存储产品如HSZXX系列和HSGXX系列等控制器的指示灯可以组合出十六进制的错误代码,通过硬件手册可以对错误进行快速定位。

详细记录硬件指示灯的状态,液晶屏的错误信息以及在控制台上输出的错误信息,将对故障的定位和修复提供十分有效的帮助。

怎样进行双机热备份系统的切换?

MC系统切换发生在两种情况下:一种情况是由于系统的硬件出现故障或者应用程序故障,此时的切换是自动进行的;另一种情况是根据实际操作环境需要进行人为地切换。有两种办法来实现后一种切换。

方法1: 使用cmhaltnode 命令来停止运行有程序包的节点。

cmhaltnode -f nodename

这样,在停止该节点的同时,应用程序包会自动迁移到另外一个节点上。

方法2: 使用cmhaltpkg 来启停应用程序包

1) 用cmhaltpkg 命令来停止需要迁移的程序包

cmhaltpkg pkgname

2) 用cmrunpkg 来重新在别的节点上运行程序包

cmrunpkg -n nodename pkgname

3) 用cmmodpkg 修改切换属性

cmmodpkg -e pkgname

一般来说,建议采用方法2

用户及用户组管理

客户根据应用系统及使用的要求,应该给不同的用户创建相应的系统帐户和系统目录,对于具有类似职能的用户,应当进行分类,即创建不同的用户组以区分。

当系统中的用户或用户组已经不再使用时,应当及时的删除相关的帐户并清除相应的文件及目录。

创建用户和用户组可以用命令行的方式执行,但推荐用户使用SAM管理。

1.相关配置文件

1).用户定义文件:/etc/passwd文件:格式如下:

login_name:password:user_ID:group_ID:comment:home_dir:command

login_name:用户名

password:加密后的用户密码

user_ID:用户ID,(1 ~ 6000)

若用户ID=0,则该用户拥有超级用户的权限group_ID:用户组ID

comment:用户全名或其它注释信息

home_dir:用户根目录

command:用户登录后的执行命令

一般是启动用户环境初始化的命令,如/usr/bin/ksh

例如:

kim:Abm,k7j:199:437:Kim Park Ext.9431:/home/kim:/usr/bin/sh

2).用户组定义文件:/etc/group文件,格式如下:

group_name:password:group_id:member(s)

group_name:用户组名

password:用户组密码,通常不用、使之为空

group_id:用户组ID

members:用户组成员,用逗号隔开

例如:

support::215:root,hpuser

3).用户环境配置参数文件:$HOME/.profile、$HOME/.login、$HOME/.cshrc等

?

2.用户登录系统的流程图

3.相关管理命令

IBMPower740小型机+11G数据库维护教程

露露Power740小型机+11G数据库维护教程 硬件环境: 1、Power740小型机+AIX6.1操作系统 2、数据库版本:oracle 11.2.0.4 3、数据库安装模式:Oracle11R2+ASM+RAC(集群负载) 一、开机步骤 1、打开Power740小型机1和2开关机开关 两台服务器都要开机,在确定小型机电源处于关闭情况下开机,如果小型机处于开机状态跳过此步骤。 2、开启集群和数据库 小机开机后集群和数据库自动启动,一般不需要手工启动。 Ping 192.168.0.31\32\33\34\35 -t ping通后查询数据库状态。 通过实际IP登录小机1 登录方式1:windows开始菜单-运行 telnet 192.168.0.31 登录方式2:远程连接小机工具 登录方式3:直接在小机操作 用户名:root 密码:root #su – grid 切换到grid网格用户 $crs_stat –t 查询集群状态

ORACLE正常工作状态:3个gsd进程是OFFLINE 其他进程都是ONLINE。 此时完成开机和数据库启动操作,应用程序可以正常使用。 如果等待30分钟还没有正常启动,启动出现异常,可执行以下操作: #su – grid $srvctl start nodeapps -n dbserver1 $srvctl start nodeapps -n dbserver2 $srvctl start asm -n dbserver2 $srvctl start asm -n dbserver1 $srvctl start database -d lolo 单独启动监听 srvctl start listener -n dbserver1 srvctl start listener -n dbserver2 3、启动客户管理系统接口 远程桌面192.168.1.24->露露运营绩效管理系统->业务查询->WEB定时任务->【启动任务】4、启动EM 说明:EM为ORACLE数据库WEB管理,可以不启动,不启动不影响应用程序使用。 1)通过服务IP登录小机1 登录方式1:windows开始菜单-运行 telnet 192.168.0.33 登录方式2:远程连接小机工具 登录方式3:直接在小机操作 以下以登录方式1说明。 用户名:root 密码:root

HP小型机MP简易使用手册

第二章访问MP 可以通过MP serial port 或者MP LAN port 登陆MP,默认的用户名/口令为:Admin/Admin 登陆过程: ************************************************************************* This is a private system. Do not attempt to login unless you are an authorized user. Any authorized or unauthorized access or use may be monitored and can result in criminal or civil prosecution under applicable law. ************************************************************************* ************************************************************************* Only default users are configured. Use one of the following user/password pairs to login: Admin/Admin Oper/Oper *************************************************************************

IBM P750小型机日常维护手册

IBM P750小型机 日常维护手册 一、服务器硬件运行状态检查 1.当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各硬盘的状态灯(一排 小灯,与各硬盘位置一一对应)应显示为绿色。 2.当服务器的状态灯出现橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘等。如果有 硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。 3.当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作, 则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以1~3秒的频率有规律地、不停地闪烁。 如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。 二、HMC(硬件管理平台)管理与操作 HMC的两种访问途径: 1、在机房直接通过显示器和键盘进行管理维护等相关操作 2、通过web远程访问,登录HMCweb管理界面,访问地址为:https://

1、登录HMC 1.1 浏览器访问连接HMC后,首页界面如下图所示。 1.2 点击下图所示链接,进入HMC验证登录界面。 1.3 输入用户名与口令,登录HMC。 用户名:hscroot 口令:

1.4 成功登录到HMC管理界面如下图所示。 2、注销HMC 在HMC console右上角有(hscroot|help|log off)链接,单击log off,会出现如下图所示注销界面:

选择Log off,系统返回到HMC初始登录界面状态。 3、重启HMC 左边导航栏中选择→HMC Management→shut down or Restart,如下图所示,对HMC进行正常重启及关机操作。 请谨慎对HMC进行关机和重启操作!

HP小型机服务器应急处理方案

HP小型机应急处理方案 系统开、关机简介 一般地说,系统开关机应严格遵循以下步骤: 1. 开机顺序 1). 打开总电源。 2). 打开计算机机柜电源 3). 打开外部设备电源.(如磁盘阵列,磁带库等) 4). 最后打开主机电源. 2. 关机顺序 1). 进行操作系统的关闭(#shutdown -h -y 0) 2). 关闭主机电源. 3). 关闭外设电源.(如磁盘阵列,磁带库等) 4). 关闭其他设备电源和机柜电源; 5). 最后关闭总电源。 日常维护检查 在对广大客户的支持服务中,我们经常发现,由于种种原因,客户往往未能及时发现系统中的一些异常现象,最终导致了对系统和应用的重大影响。 为了帮助客户各有效、方便地管理系统,我们设计了《日常检查维护表》,希望能够帮助广大用户加强日常管理,从而做到防患于未然,尽可能保障系统的运行。 我们分成以下几个部分进行介绍: 使用指南: 如何使用表格,如何使用相关命令进行检查。 同时由于客户的配置千变万化,允许HP客户支持工程师和客户共同对表格和指南进行定制。 日常检查表

日常维护检查使用指南 在《日常维护检查表》中,我们把日常的检查分成以下几个部分: 硬件操作系统备份 应用 我们下面分别描述各类检查的内容和方法。HP支持工程师和客户可以一起定制这份指南,例如,定制要检查那些应用日志和进程等等。 硬件 在这部分中,我们检查以下内容: 1:面板指示: 在大多数的服务器中,都由一个液晶面板,显示服务器的执行状态。在正常情况下,应该是FxxF的格式。在系统出现故障时,会出现WARNING或FAULT的提示。具体请参见《技术指南》。 系统管理员应该定期检查该指示,确认系统正常工作;否则,应该立即联系HP公司。 2:服务器中的各个扩展卡的指示灯 在服务器中,存在多种扩展卡,例如,SCSI卡(连接SCSI设备),以太网卡等。这些卡都由一个或多个指示灯。从这些指示灯可以了解这些卡的工作情况。 具体情况,请参见各个卡的说明书。 SCSI卡: 在正常情况下,自检灯(self test)应该是暗的;终结电源指示灯(Terminator PWR)是亮的 以太网卡: 在正常情况下,自检灯(self test)应该是暗的;连接灯(Link)是亮的 其他卡: 3:外设的状态 大部分外设也都由自己的状态指示。下面是比较常见的几种: M10,M20,M30磁盘阵列 这些磁盘阵列,正常情况下,硬盘的指示灯:应该是绿色;如果变成黄色,则说明该磁盘发生故障。

HP系统维护命令大全

下面是查看H P小型机的信息的命令集:1、机型 #model 9000/800/L2000-44 注意:其中44是指每个cpu有440MHZ。 2、cpu个数 #top CPU LOAD USER NICE SYS IDLE BLOCK SWAIT INTR SSYS 0 0.02 0.0% 0.0% 0.% 0.0% 0.0% 0.0% 0.0% 1 0.00 0.6% 0.0% 0.% 0.0% 0.0% 0.0% 0.0% 2 0.00 2.% 97.0% 0.0% 0.0% 0.0% 0.0% 3 0.00 0.4% 0.0% 0.0% 99.6% 0.0% 0.0% 0.0% 0.0% 同时显示内存 SWAPINFO 也可显示内存 3、硬盘的大小信息 #diskinfo /dev/rdsk/c1t0d0 SCSI describe of c1t0d0: vendor: SEAGATE product id: ST39204LC type: direct access size: 8891556 Kbytes bytes per sector: 512 4、硬盘的个数 #ioscan -funC disk disk 0 0/0/1/1.0.0 sdisk CLAIMED DEVICE SEAGATE ST39204LC /dev/dsk/c1t0d0 /dev/rdsk/c1t0d0 disk 1 0/0/1/1.2.0 sdisk CLAIMED DEVICE SEAGATE ST39204LC /dev/dsk/c1t2d0 /dev/rdsk/c1t2d0 disk 2 0/0/2/0.0.0 sdisk CLAIMED DEVICE SEAGATE ST39204LC /dev/dsk/c2t0d0 /dev/rdsk/c2t0d0 disk 3 0/0/2/0.2.0 sdisk CLAIMED DEVICE SEAGATE ST39204LC /dev/dsk/c2t2d0 /dev/rdsk/c2t2d0 disk 4 0/0/2/1.2.0 sdisk CLAIMED DEVICE HP DVD-ROM 305 /dev/dsk/c3t2d0 /dev/rdsk/c3t2d0 disk 5 0/4/0/0.8.0 sdisk CLAIMED DEVICE SEAGATE ST39236LC /dev/dsk/c4t8d0 /dev/rdsk/c4t8d0 5、查看操作系统版本和license #uname -a 27 unlimited-user license 6、如何查看内存swapinfo cpu 同样可以显示内存 #dmesg Memory Information: physical page size = 4096 bytes, logical page size = 4096 bytes Physical: 2097152 Kbytes, lockable: 1866308 Kbytes, available: 1902728 Kbyts

HPUX小型机命令

1、机型 #model 9000/800/L2000-44 注意:其中44是指每个cpu有440MHZ。 2、cpu个数 #top CPU LOAD USER NICE SYS IDLE BLOCK SWAIT INTR SSYS 0 0.02 0.0% 0.0% 0.% 0.0% 0.0% 0.0% 0.0% 1 0.00 0.6% 0.0% 0.% 0.0% 0.0% 0.0% 0.0% 2 0.00 2.% 97.0% 0.0% 0.0% 0.0% 0.0% 3 0.00 0.4% 0.0% 0.0% 99.6% 0.0% 0.0% 0.0% 0.0% 3、硬盘的大小信息 #diskinfo /dev/rdsk/c1t0d0 SCSI describe of c1t0d0: vendor: SEAGATE product id: ST39204LC type: direct access size: 8891556 Kbytes bytes per sector: 512 4、硬盘的个数 #ioscan -funC disk disk 0 0/0/1/1.0.0 sdisk CLAIMED DEVICE SEAGATE ST39204LC /dev/dsk/c1t0d0 /dev/rdsk/c1t0d0 disk 1 0/0/1/1.2.0 sdisk CLAIMED DEVICE SEAGATE ST39204LC /dev/dsk/c1t2d0 /dev/rdsk/c1t2d0 disk 2 0/0/2/0.0.0 sdisk CLAIMED DEVICE SEAGATE ST39204LC /dev/dsk/c2t0d0 /dev/rdsk/c2t0d0 disk 3 0/0/2/0.2.0 sdisk CLAIMED DEVICE SEAGATE ST39204LC /dev/dsk/c2t2d0 /dev/rdsk/c2t2d0 disk 4 0/0/2/1.2.0 sdisk CLAIMED DEVICE HP DVD-ROM 305 /dev/dsk/c3t2d0 /dev/rdsk/c3t2d0 disk 5 0/4/0/0.8.0 sdisk CLAIMED DEVICE SEAGATE ST39236LC /dev/dsk/c4t8d0 /dev/rdsk/c4t8d0 5、查看操作系统版本和license #uname -a HP-UX scp1 B.11.00 U 9000/800 1124961527 unlimited-user license 6、如何查看内存 #dmesg Memory Information: physical page size = 4096 bytes, logical page size = 4096 bytes Physical: 2097152 Kbytes, lockable: 1866308 Kbytes, available: 1902728 Kbyts 7、如何查看文件系统 #bdf Filesystem kbytes used avail %used Mounted on

(完整版)小型机及存储维保服务方案

XXXX小型机和存储维保服务 技 术 方 案 XXXX 2015年5月15日

目录 一、专业化第三方服务的需求 _________________________________________________ 2 二、技术服务方案 __________________________________________________________ 4 1.服务对象和目标____________________________________________________________ 4 2.服务内容要点 _____________________________________________________________ 6 3.服务内容要点说明__________________________________________________________ 7 3.1保修期内服务范围_______________________________________________________ 7 3.2服务响应_______________________________________________________________ 8 3.3维护间隔与维护情况汇报_________________________________________________ 8 3.4定期巡检与预防性维护___________________________________________________ 8 3.5免费备件保证___________________________________________________________ 9 3.6免费技术服务___________________________________________________________ 9 3.7免费远程诊断___________________________________________________________10 3.8技术人员保障___________________________________________________________10 3.9保修期终止_____________________________________________________________11 4.服务质量保证______________________________________________________________11 4.1技术服务流程___________________________________________________________11 4.2服务的监督_____________________________________________________________13 4.3紧急事件升级机制_______________________________________________________14 4.4客户满意度调查_________________________________________________________15 4.5备件管理监督___________________________________________________________15 4.6项目组织监督___________________________________________________________15 4.7服务文档管理___________________________________________________________15 4.8服务质量评估___________________________________________________________15 4.9违约赔偿_______________________________________________________________15 4.10保修终止______________________________________________________________16 5.技术服务组织方案___________________________________________________________16 6.备件管理___________________________________________________________________16 6.1备件渠道_______________________________________________________________16 6.2备件管理流程___________________________________________________________16 6.3本项目的备件准备_______________________________________________________17 7.技术培训方案 _____________________________________________________________17 7.1专业培训内容___________________________________________________________17 8.免费的技术增值服务________________________________________________________17 8.1提供系统及应用整合方案_________________________________________________18 8.2出保期后技术支持服务___________________________________________________18

IBM小型机维护指导书

江西建行IBM小型机日常维护第一篇:日常维护部分 第二篇:故障处理部分 第三篇:安图特公司技术支持电话

第一篇日常维护部分 目录 第1章AIX系统管理日常工作(检查篇) (1) 1.1 常用的命令 (1) 1.2 语法介绍 (1) 1.2.1 vmstat:检查内存、CPU、进程状态 (1) 1.2.2 .................................... sar:检查CPU、IO 3 1.2.3 PS:检查进程状态命令 (3) 1.2.4 .............................. s vmon:显示进程占用内存 4 1.2.5 .................................. iostat:显示磁盘IO 4 1.2.6 ....................... n etstat, entstat:显示网卡信息 5 1.2.7 ............................... n o:显示tcpip参数设置 6 1.2.8 其它命令 (6) 第2章AIX系统管理日常工作(LV篇) (7) 2.1 IBM AIX系统管理的日常工作 (7) 2.1.1 开关机步骤 (7) 2.1.2 用户组及用户管理 (7) 2.1.3 文件系统维护 (7) 2.1.4 系统日常管理 (8) 2.1.5 系统备份 (8)

2.1.6 定时清洗磁带机 (8) 2.1.7 定时检查设备指示灯状态 (9) 2.1.8 简单故障的判断 (9) 2.1.9 熟悉ibm aix操作系统 (9) 2.2 关于IBM AIX的逻辑卷管理 (9) 2.3 LVM命令 (10) 第3章AIX系统管理日常工作(关键参数检查篇) (13) 3.1 AIO参数检查 (13) 3.2 磁盘阵列QUEUE_DEPTH参数检查 (14) 3.3 用户参数检查 (14) 3.4 激活SSA F AST-W RITE C ACHE (15) 3.5 IO参数设置 (15) 3.6 SYNCD DAEMON的数据刷新频率 (15) 3.7 检查系统硬盘的镜像 (15) 第4章AIX系统管理日常工作(性能分析篇) (17) 4.1 性能瓶颈定义 (17) 4.2 性能范围 (17) 第5章AIX系统管理日常工作(SHUTDOWN篇) (18) 5.1 概念 (18) 5.2 关机命令 (18) 第6章AIX系统管理日常工作(备份与恢复篇) (18) 6.1 用SMIT备份 (18) 6.2 手工备份 (18) 6.3 恢复系统 (19) 第7章HACMP的双机系统的管理和维护 (19) 7.1 HACMP双机系统的启动 (19) 7.2 HACMP双机系统的关闭 (20)

HP小型机系统常用命令

HP-UX COMMAND # ioscan –fnkCdisk # swinstall –s /cdrom/(filename) <安装软件补丁从cdrom下> # swremove <卸除应用程序> # shutdown 0 <进入单用户模式> # init 3 <进入多用户> # umount /opt <卸除opt> -9 强行关掉命令,5988 进程名 # swlist –l fileset –a state|grep PHKL_18543 <查找PHKL_18543这个补丁是否安装> # lvextend –L 30 /dev/vg00/lvol5 <扩大逻辑卷为30兆> # extendfs /dev/vg00/rlvol5 # mount /opt # mount –a <全部设备mount> # bdf <查看容量是否扩大> # lvextend –L 200 /dev/vg00/lvol6 <在线将tmp文件系统扩展到800Mb> # fsadm –b 819200 /tmp # bdf # tsm <启动多进程,用ctrl_t切换窗口或按F1、F2来切换> # make_tape_recovery –A v <备份系统到磁带上、备份到磁带上的系统文件 看不到。用这个命令之前必须安装Ignite-ux这个软 件> # chmod 777 或444 <该文件执行属性,777 改为可执行文件同时放开权 限,444 收回权限同时改为不可执行文件> # mstm <查看机器信息> # armdsp –i <查看V A信息> # cvui <设置V A命令> < /opt/sanmgr/hostagent/sbin (先进入这个目录) /HA_trigger 先stop 后start /dial_trigger stop start 磁盘柜进程全部先stop 后starl,否则找不到V A>

IBM P570小型机典型故障案例的分析与处理

IBM P570小型机典型故障案例的分析与处理 摘要:根据近年来本地区P570主机的典型故障及处置方法,总结了一套P570 小型机典型故障的维护管理的经验,提高了信息系统检修质量和健康水平。同时 总结管理思路,与时俱进,完善运维体系、加强运维管理、提升信息安全运维水平,保证系统安全及可靠运行,为电力网数据信息安全交互提供了有力保障。 关键词:故障处理,运维管理 引言 P570小型机作为具有很高的可靠性与稳定性能,做为本公司核心服务器,它 具有较高的专业性、复杂性、实时性、不间断性等特点,是电力企业普遍采用的 服务器。随着使用年限的增加,设备老化等原因会造成整个系统可靠性降低,硬 件设备发生故障的频率也越来越高。现根据近年来本地区P570主机机常出现的 一些典型故障及处理方法,总结出一套P570小型机典型故障的维护管理经验, 提高了信息系统检修质量和健康水平,确保信息系统安全稳定运行。同时我们在 此运维基础上,扩展了信息系统基础安全运维的管理思路。 1 小型机典型故障处理及运维管理提升 统计570小型机自2007年投运到目前为止,共发生电源故障、风扇故障、背板故障、HBA卡故障、硬盘故障等94次,随着公司推进运维检修精细化管理工作,加强对信息设备状态的监视,准确掌握信息设备的状态,当主机系统发生故 障时,依靠专业的管理经验,可以在最短的时间内查明故障原因,迅速将系统恢 复到正常工作状态,是保证设备及软件安全、稳定、高效运行的关键。同时完善 小型机设备的运维管理制度,是对小型机系统稳定运行的有效保障。除了采用技 术手段外,我们还需建立有效的安全管理机制,“三分技术,七分管理”是信息安 全领域的管理的精髓,在实际的工作中如何“管理”到位,更需要在实践中总结经验,不断的更新,两者有机的结合起来,通过管理提升我们发现,小型机的设备 故障主动发现率由38%上升到93%(如图1),说明通过运维管理的提升设备故 障的主动发现率有了显著的提升,确保了处理故障和更换备件的宝贵时间。 图1采用管理提升前后故障发现率对比 运维过程中发现各地市典型发生的故障,如P570小型机的CEC柜电源模块故障是最常见的故障之一,我公司原八块电源模块已全部陆续更换,其间还发生过同一CEC柜两路冗余电 源都发生故障的宕机事件,如果管理及巡视得当,处理方法的得当会减少事故的发生,并且 减少系统恢复时间;交换机模块故障也是常见故障,但由于双通道的原因很难会被人发现, 具有很强的隐蔽性;HA故障也偶有发生,需耐心排查、调试;本文还列举两类硬件故障,分别是使机器宕机或无法启动的硬件故障和仅对系统产生功能影响机器的硬件故障。通过以下 故障在运维过程中不断总结经验同时完善运维制度和安全管理机制。 1.1、电源模块常见故障 小型机的每个CEC柜都有两路电源,互为冗余,如两路冗余电源发生一块电源模块故障,此时不影响系统及运行,但应立即报修、密切观察、加强巡视,待备件到场立即更换; 如在同一CEC柜的两路冗余电源都发生故障系统必将宕机,此时应立即报修,等待备件 到场,如果参考以往经验及设备特性,进一步进行后故障时刻的思考,得出结论:可将一路 故障电源与未发生故障的CEC柜进行调换,开机恢复分区,恢复系统运行,待备件到场后再 进行备件更换,本方案可以提前3到4小机恢复系统的运行,我们将此经验方法更新在相应“专项应急预案”中。 1.2、小型机光纤交换机常见故障 光纤交换机故障灯亮时,可检查各光纤模块指示灯(在光纤模块左侧)有无亮黄灯,如

HP系统管理员手册HP小型机

C a t c h e y D i n g 二OO三年五月

前言 尊敬的客户,首先欢迎您购买HP9000小型机服务器。 尊敬的系统管理员,您选择了惠普的产品,同时也就选择了惠普的服务。您在任何时候都不是孤立无援,在您们的身后有一个惠普计算机系统响应中心在时刻准备着为您提供技术服务。不论是系统故障,还是Unix方面的技术问题,甚至是某条命令用法,您都可以致电惠普响应中心。该中心配有经验丰富的软件、硬件工程师,可以通过电话或计算机远程访问确定故障点,以最快速度解决用户问题。 所以,在系统运行发生故障时,欢迎拨打惠普计算机系统服务响应中心电话请求援助。联系方法是: 1)( 010 ) 6564 3800 2)800-810-7000(免费服务电话) 3)传真:(010)6566 8208 为了让系统管理员在最短的时间内尽快获得有关HPUX操作系统的基本知识以及HP 9000小型机硬件的基本构造,指导管理员进行日常系统维护,我们特意为您订做了这本『必读』。 该『必读』分为机房环境、系统管理员日常工作、数据备份与恢复以及双机热备的方面简单介绍了HP9000小型机及其操作系统的正确使用方法及故障诊断的简单技巧。尽管惠普计算机系统服务响应中心和分布在全国十四个城市的惠普技术服务工程师都准备为您提供优质的服务,但对于一些简单的技术问题和故障,通过您的努力,能够亲手排除。一来可以最快的解决问题,二来您也可以小有成就感。这是我们编制此『必读』的另一目的。

目录 前言............................................................ 第一章、有关机房现场环境.............................................. 一、机房总体要求...................................................... 二、机房内环境要求.................................................... 三、电源要求.......................................................... 四、HP9000小型机的功率及散热量指标.................................... 五、HP9000小型机和机柜的尺寸及重量................................... 第二章、故障诊断(TROUBLE-SHOOTING) ................................... 一、硬件故障诊断...................................................... 二、软件故障诊断...................................................... 三、网络故障.......................................................... 第三章、系统管理员的日常工作 .......................................... 一、关于HP-UX的硬盘资源的逻辑卷管理.................................. 二、关于系统主控台C ONSOLE的说明与设置 ................................. 三、系统的开关机和PDC简介............................................ 四、HP S ECURE W EB C ONSOLE 的配置与维护 ................................... 五、有关DDS磁带机.................................................... 六、日常设备维护检查.................................................. 第四章、系统备份与灾难恢复 ............................................ 一、系统备份与恢复常用命令............................................ 二、系统备份/恢复方法及策略 ......................................... 第五章、有关HP双机热备软件 ........................................... 一、手动启动MC/SG ..................................................... 二、单点启动后,加入另一个节点:...................................... 三、实现节点切换...................................................... 四、监测C LUSTER 运行状态............................................... 五、停止C LUSTER 运行................................................... 六、停止运行某个节点而C LUSTER 在其它节点继续运行....................... 七、在R UNNING C LUSTER 中运行某一个包.................................... 八、停止一个运行中的包................................................ 九、改变一个包的切换属性.............................................. 后续............................................................

小型机系统维护方案

系统维护方案 1.1. 数据库维护 数据库系统维护服务由五部分构成 监控服务 数据备份 安全管理 性能调整 故障排除 1.1.1. 24小时监测服务 可进行紧急情况监测的服务包括: 1、网络连接监控 2、数据库应用是否正常运行 3、数据完整性 1.1. 2. 数据库备份和恢复 1、系统备份 2、数据库的备份 3、数据库的恢复 1.1.3. 安全管理 1、数据库系统漏洞的修补 2、服务漏洞的修补 3、系统访问管理 4、服务访问管理 1.1.4. 性能调整 1.针对数据库系统:主要包括CPU/内存使用状况、优化数据库设计、优化数据库管理、以及进程/线程状态、、硬盘剩余空间、日志文件大小等 2.针对应用系统:主要包括应用系统的可用性、响应时间、并发用户数,以及特定应用的系统资源占用等 1.1.5. 故障排除 对数据库发生的故障(如数据库不能正常运行,备份与恢复不能进行,数据文件一致性破坏等)在第一时间进行排除并提交故障报告。 1.2. 应用系统维护 1.2.1. 例行检查服务 例行检查时间间隔: 本公司负责对应用系统进行例行检查,从系统验收完毕起每月检查一次。 1.2.2. 检查内容 检查数据库服务器:检查数据库的运行状况; 核实原系统配置:核实系统软件配置及版本;

检查各监控终端软件:检查各计算机监控系统用户端软件使用情况; 检查软件系统运行环境:检查网络操作系统软件、操作系统软件稳定性等; 1.2.3. 检查方式 制定例行检查计划:根据软件系统的检查时间,本公司制定相应的检查计划,其中包括每 次例行检查时间、例行检查小组成员、例行检查内容; 核实例行检查方案:例行检查前,由客户提前三天通知本公司具体检查时间. 对于客户每次的服务请求,维护小组设有专人负责实施、跟踪、并以客户监控系统最后确认为准。 1.2.4. 检查结果处理 例检记录:每次检查完成后,均作标准的检查报告。包括检查发现的问题、系统现状评价、改进建议; 对于例检发现的问题,若属于负责维护的软件系统,均作及时的解决。 对于每次维护,都作规范的维护记录。包括故障原因、实施工程师、解决办法、实施过程、维护结果。服务记录应于每次服务完成后均将作为系统资料保存。 1.2.5. 系统运行维护服务 当应用系统出现软件改进、模块更换、故障确认、系统错误等问题时,本公司在24小时内将派工程师前往现场响应。 1.3. 系统软件和其它软件系统维护 正版系统软件的技术支持和维护工作主要由软件提供商的维护服务商来提供,在此基础上金旅雅途将提供一下服务: 1.3.1. 例行检查服务 例行检查时间间隔: 本公司负责对应用系统进行例行检查,从系统验收完毕起每月至少检查一次,安装相关的最新系统补丁和升级文件,并对有关问题进行处理。 1.3. 2. 系统运行维护服务 当系统软件出现系统错误等问题时,本公司在24小时内将派工程师前往现场响应。 1.3.3. 维护范围 ? 包括各服务器使用的操作系统:Windows 2000 Advance Server ,Windows 2000 Server ? 台式机操作系统:Windows XP,Windows 2000 Professor ? 邮件系统 ? 其它有关服务器上的系统。 1.4. 服务系统维护 服务系统维护内容包括: ◆系统运作检测 ◆以保证系统无病毒污染的病毒检查服务 ◆优化服务器与客户机的设置 ◆系统管理文件的打印与归档 ◆服务器的硬件配置及软件的更换服务 ◆工作站的硬件配置及软件的更换服务

《小型机具管理组织规定》

小型机具管理制度 为加强小型机具管理,规范管理流程,确保各类小型机具的正常、高效运转,满足施工生产的需要,特制定本制度。 第一条适用范围 公司内各单位、各项目、各部门 第二条管理部门 财务部、物料部及各使用部门 第三条管理原则 (一)财务副总审核、总经理批准的原则 小型机具的购置、转让、报废等处理必须经财务副总审核,报总经理批准。 (二)小型机具保值、增值的原则 使用部门有偿使用小型机具。小型机具转让、出售其价格要高于财务账面净值。 (三)采取三级管理的原则 1.财务部为一级管理部门,负责对小型机具的核算; 2.物料部为二级管理部门,负责小型设机具的采购、保管、调拨、收回等管理工作;

3.使用部门为三级管理部门,负责小型设机具使用过程管理、维护。 第四条管理部门职责 (一)财务部(一级管理) 1.根据小型机具的类别和特点,纳入固定资产核算,设置“固定资产—小型机具科目”,构成固定资产的,按固定资产管理,分别制定小型机具的目录及编码规则,包括名称、规格、型号、存放地点、数量、原值、折旧年限、预计净残值等; 2.负责建立小型机具总账及明细账,对物料部及使用部门进行业务指导与监督; 3.每年进行两次小型机具的盘点,做到账、物相符。如果出现不相符的情况,在编制差异表,注明原因; 4.审核小型机具的增加、减少及调拨,并予以确认,按规定处理; 5.负责审批小型机具的使用费价格及扣款处理。 (二)物料部(二级管理) 1.负责小型机具的采购管理;依据经主管经理批准的材料计划进行采购,采购过程要货比三家,选择质量好、价格合理产品; 2.负责对所购置小型机具合格证、使用说明、配件清单、技术资料等验收、收集与保管; 3.负责小型机具的入库验收与保管。保管人员验收合格后办理入库、检查产品合格证、使用说明书、零部件等是否完整、开机

IBM小型机维护手册资料

精品文档 IBM小型机维护手册 网友:xcw0605 发布于:2008.07.15 16:09(共有条评论) 查看评论| 我要评论 IBM小型机维护手册 一、AIX操作系统简介 AIX操作系统是有IBM公司研发的Unix操作系统,在技术、功能上又有许多增强:模块化的内核; 动态调整内核; 多线索内核; 高效率的输入/输出; 实时处理; 安全性能; 日志文件系统; 存储管理(包括镜像技术和条块化技术); 系统管理; 在线帮助查询。 二、设备管理 2.1块设备(Block Device): 采用结构化的随机访问方式的具有缓冲的设备。块设备通常为磁盘文件系统(Disk File System)。 2.2字符设备(Character Device): 裸设备(Raw Device),是无缓冲的连续、定向流设备。字符设备通常为系统周边设备,如终端、打印机等。 2.3主设备号(Major Number): 标识系统内核中的设备驱动号。 2.4次设备号(Minor Number): 精品文档. 精品文档 标识特殊的设备类型。 ODM数据库由预定义数据库(Predefined Database)和定制数据库(Customized Database)组成。用于存储系统中所有逻辑设备的信息及其属性。其中: 预定义数据库:包含所有基于系统配置的系统可支持的设备(Supported Devices)的配置数据。 定制数据库: 包含当前系统中所有定义的(Defined Devices)和可用的(Available Devices)设备配置数据。 设备的类(Class):标识设备

设备的子类(Subclass):标识设备如何连接至系统 设备的类型(Type):标识设备的类型 设备的名字(Name):标识逻辑设备名 # lsdev 设备列表 # lsattr 设备属性列表 # chdev 更改设备属性 # lscfg 显示当前系统中设备的配置信息 2.5设备的配置: # mkdev –c Class –s Subclass –t Type –p Parent_Adapter –w Connection_Location –a Attribute=value -c Class:指定设备所属的类(如:tape) -s Subclass:指定设备所属的子类(如:scsi) -t Type:指定设备所属的类型(如:150mb) -p Parent_Adapter:指定设备的父卡号(如:scsi0) -w Connection_Location:指定设备连接在父卡上的位置或地址(如:5,0) -a Attribute=value:指定设备的属性(如:ret=no) 2.6设备的状态: 精品文档. 精品文档 Undefined:系统中没有此设备的存在记录(设备信息存储于预定义数据库中)(Supported)Defined:系统已为此设备分配了逻辑设备名和端口,但系统当前不能访问此设备(设备信息存储于定制数据库中)(Defined) Available:设备在系统中已经定义了并且可以使用(设备信息存储于定制数据库中)(Available)# cfgmgr自动配置系统中的自适应设备(Self-Configuring Devices) 三、存储管理 3.1AIX中逻辑存储的限制 卷组(VG)255个/每个系统 物理卷(PV)32个/每个卷组 物理分区(PP)1016个/每个物理卷 逻辑卷(LV)256个/每个卷组 逻辑分区(LP)32512个/每个逻辑卷 AIX系统逻辑卷: Paging Space:/dev/hd6,用于存储虚拟内存中信息的固定的磁盘空间 Journal Log:/dev/hd8,用于记录系统中文件系统结构的改变 Boot LV:/dev/hd5,用于系统启动映象的物理上连续的磁盘空间 AIX系统文件系统: /(root):系统启动进程所需的重要的系统设备信息及应用程序的存储空间 /usr:/dev/hd2,系统命令、信息库以及应用程序的存储空间 /var:/dev/hd9var,系统的日志文件和打印数据文件的存储空间 /home:/dev/hd1,系统中用户数据的存储空间 /tmp:/dev/hd3,系统临时文件和用户工作的存储空间 3.2LVM操作命令:

相关文档
最新文档