光大证券-novell篇

光大证券有限责任公司Everbright Securities Co.,Ltd

故障速查手册

光大证券信息技术部

2002年3月26日

目录

前言 (7)

NOVELL篇 (8)

一、服务器相关的问题 (8)

1、CPU高利用率的问题 (8)

1)系统参数设臵不合理,应进行调整 (8)

2)内存配臵不合理 (9)

3)重要的模块或驱动程序版本太旧,需要升级或打补丁 (10)

4)SYS 卷的自由空间太小 (10)

5)在服务器端的Load Rspx模块 (10)

6)通讯方式的漂移引起CPU的利用率升高 (10)

7) Dos 内存设臵不合理 (10)

2、双CPU的问题 (SMP 对称多处理器) (11)

3、工作站登录问题 (11)

1)“255”用户问题 (11)

2)not logged in问题 (11)

3)行情服务器出现用户不能上网 (11)

4、开机后服务器不能启动的解决方法 (12)

二、Abend (abnormal end 服务器非正常结束) 问题 (12)

1、现象 (12)

2、查找原因 (12)

3、Abend 产生的原因及解决办法 (13)

4、有Abend现象,但不能产生Abend.log文件的原因 (14)

5、如何查看Abend信息 (14)

三、NDS (Novell Directory Service) 目录服务 (15)

1、检查NDS的是否健康 (15)

2、NDS 的修复 (15)

3、NDS 坏,但已做好备份而又无法用Dsrepair 修复时,要用删除、恢复的方法 . 15

4、NDS 坏又未作备份,Admin 口令也丢失情况下,可先删除再重建NDS (16)

5、NDS 打不开,并非是NDS坏的情况 (17)

5、备份NDS信息到文本文件 (18)

6、更换新服务器 (18)

7、控制台每隔2分钟显示?Synthetic time is issued on partition” (18)

四、Memory (内存)问题 (19)

1、在控制台上若报以下错误 (19)

2、Memory could not loaded (内存不能加载) (19)

五、Integrated Troubleshooting Guide (综合问题) (20)

1、卷Mount 失败 (20)

2、Standby Server应注意的问题 (20)

3、SMP(对称多处理器)问题 (21)

4、Name Space (命名空间) 问题 (21)

5、login /ns 和F4,F8,CTRL_C问题 (21)

6、Unicode (国家代码) 问题 (22)

7、在服务器上加载IDE 光驱的办法 (22)

8、检查系统门开小的方法:无盘站自拷贝 (22)

9、Admin 口令丢失,在不删除volume 和NDS或不重新安装Novell的情况下,创建一

新的Admin口令 (22)

10、当控制台屏幕上出现?CPU Hog Detected Timer?或?Initialization

process” (23)

11、Public symbol 问题 (23)

12、在控制台上切换成DOS 操作的方法 (23)

13、Netx和Vlm的区别 (23)

14、使用Monitor 的锁定键盘功能(Lock file server console),但再输入锁键盘

口令、ADMIN口令或口令遗忘掉,锁定的键盘不能解开 (24)

15、服务器在运行过程中重启,可能有以下原因 (24)

16、使用Auditcon 审计功能造成死机的问题 (24)

17、服务器备份网卡的设臵方法 (25)

18、在服务器上建立远程客户连接方法 (25)

六、常见维护实例 (25)

柜台系统篇 (33)

一、日常清算 (33)

1、客户在清算出错后,恢复到清算前,发现仍可查询到当天的成交帐务 (33)

2、清算有误,复到清算前状态,此时打印股民交割单或对帐单,当日清算数据都还

存在 (33)

3、试算平衡中差额一般如何产生 (33)

4、成交数据接收时,不能把成交数据插入到KHCJMX中,故未能清算 (33)

5、做完清算前备份欲补做资金的操作 (34)

6、初始化时提示非正常工作状态,及公司财务记帐表打不出来 (34)

7、清算汇总数据有,但客户成交明细没有 (34)

8、沪权益处理时先接收当天数据,再接收前一天数据,然后再处理,导致当天数据

没处理 (34)

9、当天做指定后又当天撤消,上交所均成功,但系统提示已指定 (34)

10、新股认购时一客户增加了信用资金,但清算后,做完历史数据备份,没有去掉

该信用资金 (34)

11、做系统初始化后,可不可以再做BCP备份 (34)

12、既有申购,又有还款的情况下是否按证券代码顺序清算 (34)

13、申购返款处理钱不能到帐给客户用 (35)

14、二级资金试算平衡表的试算差额不为零 (35)

15、最近无交收数据,B股的待交收全日期是2003年 (35)

16、怎样才能只接受在该营业部开户客户的红利数据 (35)

二、报盘及转换机 (35)

1、在两台转换机上(spx_comm和zhserver),报deadlock victim (35)

2、在九点半时,客户发现当天的深圳新股上市一直处于待申报状态 (35)

3、新股申购设臵为10:00有什么原因 (35)

4、场内报盘后,可用资金应如何处理 (36)

5、zhserver中的上海成交转换报错 (36)

6、在B股委托时,没有行情 (36)

7、深圳撤单全部不能返回 (36)

8、在前一天的委托库、委托回报库、成交库没有清空的情况下,启动了ZHSERVER,

使得前一天的回报转换进了系统 (36)

9、客户做委托后,Z_cj.dbf中有数据,但没有转进来,前端查不到成交数据 (36)

10、9:30左右时,出现?此证券代码不存在?--深圳 (36)

11、批量申购,配号不连续 (36)

12、spx_comm开不起来 (37)

13、当开市后,发现新股都处于待申报状态 (37)

14、委托取消后,系统将委托做为预埋委托处理,导致资金股票冻结 (37)

15、有股民的委托是待申报,zhserver重启后才能工作 (37)

三、柜台 (37)

1、某客户发现罚息结转后,并没有扣除股民的罚息 (37)

2.有一客户询问在当天做指定交易委托后是否可以马上卖股票 (37)

3.有一股民原来在营业部消户,现在又来开户做指定交易提示已做过指定 .. 37

4.怎么查询单个股民的市值(股票) (38)

5.资金明细查询中资金显示都为整数,但实际不是 (38)

6.某个客户的国债库存在一笔交易后,库存数变为零 (38)

7.修改ztuser的密码注意事项 (38)

8.所有win95工作站及服务器不能进入ZTV40,一执行ztmain就报错 (38)

9.一台工作站无法进入中天系统 (38)

10.系统中如何查看总利息 (38)

11.如何将停止交易的国债或配股权证从库中删除 (38)

12.调利率,系统中如何计算利息,调动后是否影响以前的利息 (39)

13.强开户,怎样销户取钱 (39)

14.欲查3月31号的集体结息的利息数 (39)

15.在批量开户后不能委托 (39)

16.前一日工作站接收过户资料有问题,服务器上做没问题 (39)

17.ZTMAIN运行不了,一直处于白屏幕状态 (39)

18.一股民当天未做股票买卖,但可用资金比资金余额少 (39)

19.做资金存取后,查询时资金余额不变 (39)

20.如何统计银行开户数 (39)

21.如何添加菜单 (40)

22.机构不能做基金 (40)

23.银证转帐某一客户最多可转10万元 (40)

24.sa密码更改后,自助交割和成交回报无法用 (40)

25.添加深圳帐号后,在自助委托中看不到深圳帐号(输客户号时) (40)

26.有一客户销户后认为资金余额不对,要查销户前的资金余额 (40)

27.对单个股民的利率如何单独设臵 (40)

28.有客户忘记自己的股东代码、客户号等,而有两个客户同名同姓,在查询

客户资料时,只查到另一个人的资料 (40)

29.如何查客户佣金、手续费的收费明细 (41)

30.回报冻结资金比冻结资金大 (41)

31.哪些操作在操作日志中能查询 (41)

32.手续费如何结转到营业部帐号上 (41)

33.信用资金、保证金转帐有何不同 (41)

34.没有国债现券的人要做回购 (41)

35.股民无买卖操作,也无手工冻结处理,但系统提示有委托买入资金冻结 (41)

36.资金柜轧帐,发现资金流水与真实变动不符 (41)

37.配号后系统有配号的库存 (41)

38.在自助委托上,无法做国债买卖,为何? (42)

39.配股能否使用批量委托进行操作 (42)

40.停牌股票的委托,无法撤单,但股民又要用钱买其它股票,怎么办 (42)

41.怎么判断中天系统是否已做‘系统初始化’ (42)

四、报表打印 (42)

1.新股配号公告字体太大,一张纸打不下 (42)

2.如何看客户是不是已经打印了交割单 (42)

3.有资金柜打不出回单,模板设臵中报表纵览为空 (42)

4.三联交割单不能打 (43)

5.打印交割单时,划卡打印,打出来的内容除姓名为该客户的,其余均为其

他客户的记录 (43)

6.资金试算表打出来全是空表,无数据,其它报表正常 (43)

五、SQL数据库 (43)

1.在NT打了pack5的补丁后,本系统出现大面积死机现象 (43)

2.ztv40his数据库空间不够 (43)

3.SQL EXECUTIVE启动不起来 (43)

4.SQL 10005错误的处理 (44)

5.如何拷贝表,删除表 (44)

6.关于SQLServer6.5中用户数据库不能正常启动的解决方法 (44)

7、关于数据库一致性检查 (44)

网络故障篇 (45)

1:对于INTEL千兆卡在NOVELL环境下做AFT时,AFT TEAM表现不是很稳定,现象为莫名其妙自动切换? (45)

2:在4006的GEC的调试中,两台交换机同时设臵set port channel on,但GEC的通道建立不起来? (45)

3:在NT下配臵AFT时,team建立时需注意? (45)

4:完成整个网络整体交换机的配臵后,机房的一些重要工作站接在中心交换机Catalyst4006上,但是,这些工作站上网比接在二级交换机上还要慢? (45)

5:外网两台行情服务器的千兆网卡连接在外网中心交换机的千兆端口上,服务器启动过程中,网卡和交换机的链路连接不上。表现在网卡和千兆端口的链路指示灯不亮,两台服务器情况一样? (45)

6:柜台的工作站,使用10/100M自适应网卡,连在1924上,运行柜台软件,连接服务器的登录时间很长? (46)

7:在4006GEC的调试中,如何使配臵生效? (46)

8:安装NOVELL NETWARE SERVER时COMPAQ自带的100M网卡加载不上? (46)

9:升级3COM交换机3300时,出现发生死机现象,如何? (46)

10:AFT配好后,发现PING服务器时,时断时续? (46)

11:安装网管软件CWSI时应注意什么? (46)

12:1924A的上联链路灯不正常,有的是只有一个灯亮,有的链路灯主从顺序颠倒,

有的两个绿灯? (47)

13:客户端有盘站上运行CLIENT32时找不着服务器,不出现CLLIENT32登录时的画面? (47)

14:用INTEL的百兆网卡登录服务器,一分钟后死机? (47)

15:开市时,一批百兆网卡的机器频繁掉网? (47)

16:百兆工作站的速度很慢,没有预期的效果? (47)

17:CISCO2948G升级时死机? (47)

18:无盘工作站上网后,大约15分钟后,自动掉网? (48)

19:营业部在星期一或放假结束时,重新开机上网,工作站不能找到服务器。 (48)

20:以太网交换机(Switch)与以太网集线器(Hub)工作方式有何区别? (48)

交易通道备份篇 (48)

拨号备份系统简介 (48)

1.上证单向卫星的备份 (48)

2.上证VSAT室内单元的自动拨号系统 (48)

3.拟新开通的?上证拨号接入系统? (49)

4、深圳地面拨号备份系统 (49)

报盘主要是出现报盘库意外损坏后如何紧急修复。 (49)

上海A股: (49)

深圳A股: (50)

上海B股: (50)

深圳B股: (50)

日凌现象 (50)

前言

要想成为一名优秀的故障排除人员,最重要的既不是知识,也不是经验,甚至不是聪明,而是决心。即最重要的是坚持不懈地试验各种方法指导找出问题的决心,或叫态度。要坚信任何一个曾正常工作的系统无论如何都可以让他重新工作。

本手册每一章节都涉及营业部信息系统最易出故障的一个部分,当然,具体情况会因系统不同而不同,但当一个人对管理的系统最易出现故障的部位逐渐熟悉以后,便能用几分钟仅检察少数部件来迅速修复系统。这样不仅可缩短急性子用户的等待时间,还可以使用户在老板面前显得像一个神手,留下一个好印象。

一、故障排除的正确方法

1、基本部件分解法

对于复杂系统最简单的方法是将复杂系统加以分解,将wan分解成lan,将lan分解成服务器、工作站和网络系统;将服务器或工作站分解成硬件、操作系统、应用系统;将物理网络分解成电缆、交换机。必要时将这些子系统进一步分解,直到可以确定每个基本部件是否故障的原因。

通常,有经验的故障检修人员对于问题似乎有一种?直觉?。其实,这种所谓的迅速排除故障部件的直觉来源于他们自己过去长期的痛苦经验。对于迅速发现故障并修复故障来说,经验是有用的,但并非必须。对大多数用户说。只要能遵循一种逻辑的和正确的方法,尽管不会像专家那样迅速,但总能把问题解决。

2、不同途径尝试法

想成为优秀故障排除人员的最好方法是自己动手。动手的过程中只要牢记一些基本原则以避免不可修复的改变,怎样试验都可以。实际工作中,尝试不同的办法直到故障修复,是常用的方法,连经验十分丰富的故障排除人员也不例外。经验丰富的检修人员只不过是对该试的地方---有可能出故障的故障点有更准确地感觉而已。

这里有一、两条基本的途径来确定先试什么后试什么,然后再怎么往下接着进行。先检查简单部件或原因是一条最基本的原则。工作站不能上网先核实网线连接是否正常,这笔拆开电脑检查网卡或检查交换机简单的多。

事实上,较常见的情况是网络连接接头松动。同样第二条基本途径是一次不能做一项以上的改变。例如更换工作站中的所有部件可能消除故障,但他并不能确定究竟是那个部件出故障。除了要求立即使工作站恢复工作,否则较有效的方法是一次更换一个部件,逐个试验,直到找出故障。

两个判断故障部位最好的工具是:a、认真地记录,b、能说明保证设备正常运行状态的一组原始参数。需要进行排除故障的所有系统不外乎以下两个类型:a、原来正常运行的系统出了故障停止运行;b、新建系统不能按原设计运行(包括原来正常系统添加新设备后不能达到预想效果)。以上两类虽有各自不同的基本方法,但他们的共同原则都是不断地找出可能引起问题的原因,直

到发现。

决大多故障排除的最大障碍是错误地认为把所有的办法都是过了,再就是认为问题过于复杂,自己永远没有能力解决。前一种障碍是由于检查系统时进行得过快,又是则是因为没有考察一些表面上与问题无关的部件。防止第二种障碍的办法是把问题分解成一些基本的部分。对于系统做怎样详细的文档都不会过分。花许多时间来收集信息详实在浪费时间,尤其对于系统管理员来说好像如此,但是如果网络出现了故障,则会在修复故障是节省许多时间,这是最便宜的保险。

NOVELL篇

一、服务器相关的问题

证券行业中NOVELL只能打6获6a的补丁,高或低都会有问题。NDS的版本应为 6.00,检查的方法为在控制台上键入:modules ds。

1、CPU高利用率的问题

现象:

在控制台的Monitor上,CPU利用率超过80%并且维持时间半小时以上时,就说明发生了CPU高利用率的问题,导致了在Monitor的General information 窗口中的以下参数:

Dirty Cache Buffers : > 2000(正在使用的高速缓冲数大于2000)

Current Disk Requests : > 500(当前磁盘请求数大于500)

Current Service processes: 接近50 (当前服务进程数接近50) 原因及处理办法:

1)系统参数设臵不合理,应进行调整

在Monitor 的Available options 窗口的Server Parameters 选项中修改以下参数值:

①Communications:(通讯参数)

a) Maximum Packet Receive Buffers :

最大信息包接收缓冲区数应设臵为4000

b) Minimum Packet Receive Buffers :

最小信息包接收缓冲区数应设臵为应为工作站数量*2(或3)

c) New Packet Receive Buffer Wait Time :

新的信息包接收缓冲区等待时间应为0.1Sec,不要太大。

d) Delay Before First Watchdog Packets:

第一个监视信息包间的延迟可设臵为5Min

e) Number Of Watchdog Packets :

监视器信息包的数量可设臵为10

f) Delay Between Watchdog Packets :

监视器信息包间的延迟可设臵为1 Min

d、e、f三项说明监视器在15分钟内没有收到工作站信息包,

则监视器认为此工作站不再被连接,并清除此工作站的连接。

②Directory Caching :(目录高速缓冲参数)

a) Maximum Directory Cache Buffers:

最大的目录高速缓冲参数应设臵为4000,不要太大。

b) Minimum Directory Cache Buffers:

最小的目录高速缓冲参数应设臵为应为600,此数需要足够大,目录区搜索才可快速完成,但不要太大。

③File Caching :(文件快速存取参数)

a)Maximum Concurrent Disk Cache Write :

最大的同时磁盘缓冲写入数应为500 ,不要太大,否则会影响操作系统正常工作。

b)Dirty Disk Cache Delay Time:

混浊的磁盘快速存取延迟时间应设臵为0.1 Sec 。

④Miscellaneous :(杂项参数)

a)Maximum Service Processes:

最大服务处理数应设臵为500

b) New Service Process Wait Time :

新的服务处理等待时间应设臵为0.3 Sec

以上Server 参数中除了Minimum Packet Receive Buffers 写入Startup.ncf 文件中,其它参数将写入Autoexec.ncf 中。

2)内存配臵不合理

打开Monitor 的Available options 窗口,当:

① Cache Utilization 选项(高速缓冲利用率)

LRU Sitting Time : xx:xx:xx 时间分值≤15

② Memory Utilization 选项(内存利用率)

Memory Blocks Free:≤1000

说明内存太小了,应该扩内存。

③ Resource Utilization 选项(资源利用率)

Cache Buffers:<60 % 说明Maximum Packet Receive Buffers 太小了,需要在Server Parameters 选项的Communications中将该

参数增大。

3)重要的模块或驱动程序版本太旧,需要升级或打补丁

例如:NDS 、LAN、DSK三个模块需要打IWSP5B补丁,有关Internet 的模块需要打IWSP6A 和NW4SP7 补丁,Compaq服务器Raid 5的

Cpqda386.dsk(96年)更换为 Cpqarray.ham(98年)

4)SYS 卷的自由空间太小

SYS 卷应保留10%-20%的自由空间,为了腾出更多的空间,将已删除的文件要用Purge命令彻底清除。

5)在服务器端的Load Rspx模块

在工作站上运行远程控制台程序Rconsole 可能会引起CPU的利用率提高,所以,在服务器繁忙时应尽量少用。

6)通讯方式的漂移引起CPU的利用率升高

服务器网卡和交换机端口的Duplex(双工)设臵不匹配或没有设臵死(引起通讯方式的漂移),将出现CPU的利用率升高。可以用下面语句定义

服务器网卡双工:.

load e100b slot =10001 frame =ethernet_802.3 forceduplex=0,1,2 (0—自识别,1—半双工,2—全双工)

交换机端口的双工可以通过超级终端或交换机的选择开关设臵。

7) Dos 内存设臵不合理

在服务器DOS端的autoexec.bat 和 config.sys中存有多余的命令和驱动程序,占用了过多的内存空间,造成CPU利用率升高。解决办法

是:清空autoexec.bat 中占用内存的命令, config.sys中只保留files 和buffers语句,其它语句全部清空。

2、双CPU的问题 (SMP 对称多处理器)

现象:在控制台的Monitor的General Information窗口上发现两个CPU利用率差别较大,一般是由于系统不识别双CPU。

解决:在硬件配臵中选择IntranetWare SMP,在Startup.ncf中加载双CPU的驱动程序,安装Novell 公司的补丁程序 Iwsp5b.exe.

3、工作站登录问题

1)?255?用户问题

现象:当行情服务器购买了500用户的Novell软件,但当在线用户数量达到255左右时,发现新打开的或重新登录的无盘站,便不能再登录。

原因:网卡自启动芯片地址位数是8位造成的。

解决办法:

方法1:把网卡自起芯片更换为16位地址芯片,或更换网卡。

方法2:增加一台登录服务器。当工作站数量达到255时,新上网的工作站可以通过该登录服务器,转登录到主服务器上。

2)not logged in问题

原因:在Monitor的active connection窗口中,有很多not logged in 的连接,容易造成无盘站不能登录。

解决办法:按F6键或Delete键清除所有的 not logged in 连接即可。

3)行情服务器出现用户不能上网

现象:CPU利用率达100%,屏幕上每60 秒出现如下信息:

Server-4.11-1616

An NLM has been loaded that dose not allow priority threads to be run.

Low priority threads are use for file compression,etc. Set ‘Upgrade low

Priority thread’s to ON or unload the NLM.

原因:NDS有问题引起的。

解决办法:

在服务器C:盘上,cd\nwserver,执行server –na (不运行autoexec.ncf中的命令),load dsrepair ,选择Full unattach repair …选项, 进行NDS修复,须多修复几次,直到屏幕右上角的Total

errors为0。然后Down 服务器重启,若CPU利用率正常,用户即可上网工作,否则重新修复。

4、开机后服务器不能启动的解决方法

有时服务器会无缘无故的启动不起来,主要原因有非正常关机、NDS存在隐患却没有及时发现、卷损坏、TTS损坏等。一般情况下可以用如下操作解决:

(1)、手工启动SERVER。

在控制台上NWSERVER目录下,键入SERVER –na –ns –ndb手工单步启动,依照提示分别键入服务器名和IPX Internal NET号,再加载磁盘驱动和卷即可。

(2)重新生成SERVER.EXE

备份原来的文件,用下列语句生成新的SERVER.EXE。

Lswap loader.exe server.exe

(3)如果怀疑是卷出了问题,再完成(1)中的加载磁盘驱动以后,不要启卷,先用下列语句修复卷 load vrepair(此操作用时较长,且会关闭所有卷,开市时千万不可操作),再加载卷即可。

二、Abend (abnormal end 服务器非正常结束) 问题

1、现象

1) 在控制台上敲键不起作用;

2) 在控制台屏幕上提示:

system halted

page fault

00 00 00 00 ………

y

n

以上现象会在sys:\system 目录下产生abend.log文件。

2、查找原因

方法:按左+左+右+ 进入debugger状态敲?查看是谁产生的abend

敲 rc 看CR2=00000000,若是8个零,说明Novell内部模块产生;

若不是8个零,说明是Novell外部模块产生的。

敲 .r 列出堆栈来,查看进程,显示上一进程和将要运行的进程

敲eip = CSleepUntilInterrupt 恢复server正常运行,提示register changed。

敲 g 返回控制台状态(敲 q退回dos 状态)

3、Abend 产生的原因及解决办法

1)IRQ 中断2,9,15 被外设占用;

查看中断号被占用的方法:

在Monitor 的Available options 窗口中,选择Processor Utilization项,按F3 键可以查到Interrupt (中断号) 的使用情况,其中2,9,15 为Novell内部缺省的中断号,不可以被外设使用。另外,在Available Processes And Interrupts窗口中按F3 键:

i) Ipxrtr NCP Work to do 项正常值为20%,若为0%说明服务器网

卡间内部路由错误。(Ipxrtr.nlm:网段间内部路由模块)

ii) Idle loop (CPU剩余空间大小)该值越大越好,Dos端autoexec.bat 和config.sys有占用内存的命令和其他驱动程序,清除即可;

3)Page Fault

一般是由于软件原因引起的,轻一点儿的控制台上出现尖括号提示,服务器和工作站连接基本正常,不影响业务;严重的会出现工作站全部断网,控制台上不能正常操作,象是已经死机。一旦服务器出现上述情况,首先不可轻易宕机,特别是开市时,其次要弄清楚原因,手工恢复。正确处理方法为:进入Debugger状态

同时按下++,进入Debugger状态。

Display your location

键入*?回车,出现当前状态。

Display the running procession

键入*R回车,出现当前进程状态,注意显示结果中Create by提示

Display the control registers

键入RC回车。注意显示结果中CR2值,?0?、?8?表示内部模块。

eip=CsleepUtilInterrupt 回车

此语句必须正确拼写,大小写不能错。

键入G回车

此时服务器应该恢复正常状态,退出Debugger状态。

闭市后根据记录的结果分析原因并排出隐患。

4)NMI(Nomaskable Interrupt)

一般是由于硬件原因引起的,现象多种多样,主要原因有阵列卡驱动不匹配、网卡驱动不匹配、底层支持模块驱动不匹配、设备驱动程序、网卡底层模块(msm.nlm 和 ethertsm.nlm)使用的版本太旧,需要升级等;上述驱动程序的详情可以通过控制台命令查看。服务器出现NMI问题的处理方法是:进入Debugger状态

同时按下++,进入Debugger状态。

Display your location

键入*?回车,出现当前状态。

Display the running procession

键入*R回车,出现当前进程状态,注意显示结果中Create by提示

键入T回车。注意显示结果。

键入G回车

此时服务器应该恢复正常状态,退出Debugger状态。

闭市后根据记录的结果分析原因并排出隐患。

5)Invalid Opcode

一般是由于第三方产品引起的,现象多种多样,主要原因有第三方产品本身缺陷引起的、第三方产品和NOVELL操作系统冲突等。服务器出现Invalid Opcode问题的处理方法是:

进入Debugger状态

同时按下++,进入Debugger状态。

Display your location

键入*?回车,出现当前状态。

Display the running procession

键入*R回车,出现当前进程状态,注意显示结果中Create by提示

键入M回车。注意显示结果。

键入G回车

此时服务器应该恢复正常状态,但第三方产品提供的功能不可用,退出Debugger状态。

闭市后根据记录的结果分析原因并排出隐患。

6)MSDOS 7.0 用在服务器DOS分区上,更换DOS版本;

7) Clib.nlm ( c语言库模块) 版本太低,可从Internet 网上下载

libupi.exe 升级c语言库版本。

4、有Abend现象,但不能产生Abend.log文件的原因

1)服务器C:盘或SYS:卷空间不够;

2)Multiple Abend (多重错误中断);

3)在控制台上执行了Remove dos 命令;

4)在SMP(对称多处理机)上不会产生Abend.log;

5)在DOS端的autoexec.bat 和config.sys有占用内存的命令或其它驱动序;

根据以上的情况,作适当处理。

5、如何查看Abend信息

(1)、通过查看Abend.log文件。该文件默认位臵在:sys:system下,多数情况下都能产生这个文件,下列情况不能产生这个文件:

No space on c: or sys:

Multiple Abend

Remove Dos

Disk Channel Controler Bad

Dos Memory loaded

(2)、通过查看config.txt文件。该文件默认位臵在:sys:system下,通过此文件可查看服务器阵列卡信息、磁盘中断信息、网卡信息、已加载模块信息、Abend信息和autoexec.ncf、startup.ncf文件及Dos下的autoexec.bat、config.sys文件。

三、NDS (Novell Directory Service) 目录服务

证券行业中NOVELL只能打6获6a的补丁,高或低都会有问题。NDS的版本应为6.00,检查的方法为在服控制台上键入:modules ds

(注:Bindery 库和NDS 库功能相同,只是登录方式不同,都是对Volume的管理。Bindery 用Netx登录;NDS 用Vlm 登录。)

1、检查NDS的是否健康

(在控制台上)

set dstrace =on (回车)

set dstrace =*h (回车)

然后按Alt+Esc键,切换界面至 Netware 4.11 Directory Dervices

若 All processed=YES 说明NDS是正常的;若为NO说明NDS不正常,需要load dsrepair修复NDS库。

set dstrace =off (回车)(关闭)

2、NDS 的修复

NDS不正常但没有坏时用Dsrepair 修复

修复方法:

Load dsrepair (回车)

在 Available Options 窗口

选择 Advanced options menu

选择 Repair local DS dadabase 按F10键

提示?Repair Directory? ?

选择?Yes?

当NDS 出错时,用上述方法多次修复,直到Total errors为0时为止。3、NDS 坏,但已做好备份而又无法用Dsrepair 修复时,要用删除、恢复的方法:

注:在日常的网络维护中,最重要的一项工作是做好NDS库的备份。

备份NDS方法如下:

Load install (回车)

选择 Directory Options (回车)

进入 Directory Service Options 窗口

选择 Directory Backup and Restore options (回车)

进入 DS Backup and Restore Options 窗口

选择Save local DS information prior to hardware upgrade (回车)

进入 Directory Services Login/Authentication窗口

输入Admin的口令 (回车) 备份完成。(产生ys:\system\BACKUP.NDS,同时关闭NDS库)

备份完成后要立即作NDS库的恢复工作(因为备份NDS库的同时会关闭NDS库,恢复方法见第②项)

①删除NDS :

Load install (回车)

选择 Directory Options (回车)

进入 Directory Service Options 窗口

选择Remove directory services from this server (回车)

进入 Remove Directory Service 窗口

选择?Yes? (回车)

输入Admin 的口令即可删除。

②恢复NDS :

Load install (回车)

选择 Directory Options (回车)

进入 Directory Service Options 窗口

选择Directory Backup and Restore options(回车)

进入 DS Backup and Restore Options 窗口

选择Restore local DS information prior to hardware upgrade (回车)

按 F3键

进入 Specify a directory path 窗口

输入备份路径 (回车)

即可完成恢复工作,并同时打开NDS库。

4、NDS 坏又未作备份,Admin 口令也丢失情况下,可先删除再重建NDS

①删除NDS

Load install -dsremove (回车)

选择 Directory Options (回车)

进入 Directory Service Options 窗口

选择Remove directory services from this server (回车) (回车) 进入 Remove Directory Service 窗口

选择?Yes? (回车)

进入Directory services login/authentication窗口

按 ESC 键

提示Remove the Directory without logging in (not recommended)?

选择?Yes? (回车)

提示 Remove Directory Services anyway?

选择?Yes? (回车)

选择?Yes? (回车)

即可在Admin 口令丢失情况下删除NDS.

②重建NDS

Load install (回车)

选择 Directory Options (回车)

进入 Directory Service Options 窗口

选择Install Directory services onto this server (回车)

提示Is this the first Netware 4 server?

选择?Yes? (回车)

提示Enter a name for this Directory tree:

Input : (Tree-name) (输入树名)

Choose a time zone:

Choose ?China ,China time?

进入Verify/Enter Time configuration Parameters窗口按F10 (存盘)

进入 Context for This Server窗口

提示Company or Organization: (SXT) (输入组织名)

提示Password : (输入口令)

提示Retype the password for verification: (重新输入口令)即可重建NDS

5、NDS 打不开,并非是NDS坏的情况

1) 是否改变了文件属性,如果把login \nls 下的文件属性改变为只读,

用dsrepair 修复时,报-497错(注: -4xx 错都是login 目录下的错误。Unicode 是国家代码)

处理方法:

i.安装cd-rom :

load cdrom

cd device list (找到cdrom 设备号和cdrom卷名)

cd mount 设备号

ii.将系统光盘中\login目录下的内容拷贝至sys:\login

load netbasic

shell (进入dos状态)

cd sys:\login

rendir nls nls1 (修改目录名)

cd nw411:\ (进入系统光盘)

ncopy \products\nw411\_\411\login sys:\login /s

2) 时间不同步问题,用dsrepair进行修复,当修复不了,报-6xx错

时,手工修复.

修复办法:

i. 关闭nds

unload dsrepair

unload ds

ii. 在控制台上

load netbasic

shell (进入dos状态)

cd sys:\_netware

copy *.nds *.mmm (*.NDS文件不能删除,只能改名)

copy *.old *.nds (恢复旧的NDS文件)

iii. 打开nds

load ds (打开NDS库)

5、备份NDS信息到文本文件

1)cx /a /t >a.txt :NDS树结构

2)nlist * /a /s >b.txt :用户信息

3) nlist * show “group membership” /s >c.txt :用户组信息

4)tbackup /s :当前卷下用户权限

6、更换新服务器

将原来服务器卷上的数据全部拷贝到新的服务器上并将原备份好的NDS 库恢复到新服务器中,省去了建立用户的步骤,但用户权限要重新设臵.

方法:

①拷贝数据:

②恢复 NDS:(将原来备份的NDS 库恢复到新服务器中)

Load install (回车)

选择 Directory Options (回车)

选择 Directory Backup and Restore options (回车)

选择Save local DS information prior to hardware upgrade(回车) (回车)

按 F3键

进入 Specify a directory path 窗口

输入备份路径 (回车)

即可完成恢复工作,并同时打开NDS库。

7、控制台每隔2分钟显示?Synthetic time is issued on partition?

说明 Dos 时间与NDS时间不同步。

处理方法:

Load dsrepair (回车) (注:打过补丁iswp6a .exe以后,执行Load dsrepair /a )

选择Advanced options menu (回车)

选择?Replica and partition operation? (回车)

出现?Replicas Stored On This Server?窗口 (回车)

选择?Repair time stamp and declare a new epoch? (回车)

进入?Log in as the admin?窗口

输入?admin.组织名? (回车)

输入口令 (回车)

出现?Repair Time Stamps has been scheduled?窗口,修复完毕。

四、Memory (内存)问题

为了防止服务器CPU利用率过高,建议清除DOS分区的autoexec.bat 和config.sys中占用内存的命令和其它驱动程序。

内存常见错误:

1、在控制台上若报以下错误

1) Cache memory is too low

2) Cache memory is out of sync

3) Cache memory is out of available

解决办法:

1)Down 服务器,重启。

2)升级Clib.nlm (C语言支持库)

2、Memory could not loaded (内存不能加载)

原因:内存设臵问题

解决办法:

1) 在Startup.ncf文件中加上语句:

set auto register memory above 16megs = off (不让机器自动默认,而作手工加载)

2)在Autoexec.ncf文件中加上语句:

register memory 1000000 X000000 (该语句加在第一条Load 语句之前)

X=(实际内存量MB-16MB)/16MB

例:实际内存 128MB 则 X=7

五、Integrated Troubleshooting Guide (综合问题)

1、卷Mount 失败

1) 现象:

卷还存在,但Mount 不起来,分区找不到。

2) 解决办法:

方法1:在控制台上 load c:\nwserver\Vrepair 进行卷的修复

方法2:若Vrepair 不成功,(在Novell 只有一个卷的情况下)但是hot fix 表(热修复表)存在的情况下,做如下操作:

①记录当前硬盘Hot Fix 表的步骤:

在控制台上load install (回车)

选择 disk options (回车)

选择Modify disk partition and Hot Fix (回车)

进入 Available Disk Drives 窗口

选择硬盘(回车)

选择Change Hot Fix (回车)

进入Disk Partition Information 窗口

记下分区信息:

如:Data Area 、Redirection Area….等的信息。

②找相同大小的硬盘,按记录下来的Disk Partition Information 的

信息逐项重建Novell分区。

③用 Norton 工具重建FAT(文件分配)表用 Norton 工具在新硬盘上

查找字符串?Netware?,把该字符串以下的内容复制到旧服务器的硬盘上,直到全为00 00 00 …’(即:非DOS分区)为止;再在新硬盘上查找第二个?Netware?字符串,并把该字符串以上的内容复制到旧服务器硬盘上,直到全为‘00 00 00 …’(即非DOS分区)为止。

方法3:当Novell分区和卷都丢失的情况下:

同Novell公司联系。

2、Standby Server应注意的问题

硬件参数:

1) 中断号2、9、15不要被外设占用。

2) 对Compaq Server 磁盘加速器默认50% Read;50% Write.

建议用Compaq服务器的配臵盘(Smartstart)重新设臵为0% Read;100% Write.

3) duplex(双工)的问题:心跳线网卡要设臵为半双工。

相关文档
最新文档