GoldenGate运维手册

GoldenGate运维手册
GoldenGate运维手册

GOLDENGATE运维手册

2014年4月

文档修改记录

目录

1OGG常用监控命令------------------------------------------------------------- 5

1.2启动GoldenGate进程 ----------------------------------------------------------------------- 5

1.3停止GoldenGate进程 ----------------------------------------------------------------------- 6 1.4查看整体运行情况---------------------------------------------------------------------------- 8 1.5查看参数设置 ---------------------------------------------------------------------------------- 9 1.6查看进程状态 ---------------------------------------------------------------------------------- 9 1.7查看延时--------------------------------------------------------------------------------------- 10 1.8查看统计信息 -------------------------------------------------------------------------------- 11 1.9查看运行报告 -------------------------------------------------------------------------------- 11

2OGG的常见运维任务指南------------------------------------------------------ 13 2.1配置自动删除队列-------------------------------------------------------------------------- 13 2.2配置启动MGR时自动启动Extract和Replicat进程----------------------------- 13 2.3配置MGR自动重新启动Extract和Replicat进程-------------------------------- 14 2.4长事务管理------------------------------------------------------------------------------------ 14 2.5表的重新再同步(需时间窗口) ------------------------------------------------------ 17 2.6表的重新再同步(无需时间窗口)--------------------------------------------------- 17

3数据结构变更和应用升级------------------------------------------------------ 19 3.1(仅复制DML时)源端和目标端数据库增减复制表 -------------------------- 19 3.2(仅复制DML时)修改表结构 -------------------------------------------------------- 21 3.3(仅复制DML时)客户应用的升级 ------------------------------------------------- 21

3.4配置DDL复制自动同步数据结构变更----------------------------------------------- 23

(一)是否打开DDL复制 ------------------------------------------------------------------------------------- 23

(二)打开DDL复制的步骤 ---------------------------------------------------------------------------------- 23

(三)DDL复制的典型配置----------------------------------------------------------------------------------- 25

4异常处理预案---------------------------------------------------------------- 26 4.1网络故障--------------------------------------------------------------------------------------- 26 4.2RAC环境下单节点失败 ------------------------------------------------------------------- 27 4.3Extract进程常见异常 ---------------------------------------------------------------------- 27 4.4Replicat进程常见异常--------------------------------------------------------------------- 28 4.5异常处理一般步骤-------------------------------------------------------------------------- 28

5附录------------------------------------------------------------------------ 30

5.1Oracle GoldenGate V11.1数据复制限制 --------------------------------------------- 30

(四)不支持文件等非结构化数据复制------------------------------------------------------------------ 30

(五)Oracle数据类型限制 ----------------------------------------------------------------------------------- 30

(七)Oracle DDL复制限制 ----------------------------------------------------------------------------------- 32

5.2Oracle 9i中如何为超过32列的无主键表添加附加日志 ----------------------- 33

1OGG常用监控命令

1.1说明

对GoldenGate实例进行监控,最简单的办法是通过GGSCI命令行的方式进行。通过在命令行输入一系列命令,并查看返回信息,来判断GoldenGate运行情况是否正常。命令行返回的信息包括整体概况、进程运行状态、检查点信息、参数文件配置、延时等。

除了直接通过主机登录GGSCI界面之外,也可以通过GoldenGate Director Web界面登录到每个GoldenGate实例,并运行GGSCI命令。假如客户部署了很多GoldenGate实例,如果单独登录到每个实例的GGSCI界面,会很不方便,此时建议通过GoldenGate Director Web 界面,登录到每个实例,并运行命令行命令。

1.2启动GoldenGate进程

1)首先以启动GoldenGate进程的系统用户(一般为oracle)登录源系统。

2)进入GoldenGate安装目录,执行./ggsci进入命令行模式。

3)启动源端管理进程GGSCI > start mgr

4)同样登陆到目标端GoldenGate安装目录,执行./ggsci,然后执行GGSCI > start

mgr启动管理进程。

5)在源端执行GGSCI > start er *启动所有进程

6)同样登录到备份端执行GGSCI > start er *启动所有进程

7)使用GGSCI > info er * 或者GGSCI > info <进程名>察看进程状态是否为Running

(表示已经启动)。注意有的进程需要几分钟起来,请重复命令观察其启动状态。

说明:无论源还是目标,启动各extract/replicat进程前需要启动mgr进程。

start命令的一般用法是:start <进程名称>

如:

GGSCI> start extdm 启动一个名叫extdm的进程

也可以使用通配符,如:

GGSCI> start er * 启动所有的extract和replicat进程

GGSCI> start extract *d* 启动所有的包含字符‘d’extract进程

GGSCI> start replicat rep* 启动所有以“rep“开头的replicat进程

1.3停止GoldenGate进程

依照以下步骤停止GoldenGate进程:

1)以启动GoldenGate进程的系统用户(一般为oracle)登录源主机,进入GoldenGate

安装目录执行./ggsci进入命令行管理界面

2)(本步骤仅针对抽取日志的主extract进程, data pump进程和replicat进程不

需要本步骤)验证GoldenGate的抽取进程重起所需的日志存在,对各个主extXX

进程,执行如下命令:

ggsci> info extXX, showch

…..

Read Checkpoint #1

….

Recovery Checkpoint (position of oldest unprocessed transaction in the data source):

Thread #: 1

Sequence #: 9671

RBA: 239077904

Timestamp: 2008-05-20 11:39:07.000000

SCN: 2195.1048654191

Redo File: Not available

Current Checkpoint (position of last record read in the data source):

Thread #: 1

Sequence #: 9671

RBA: 239377476

Timestamp: 2008-05-20 11:39:10.000000

SCN: 2195.1048654339

Redo File: Not Available

Read Checkpoint #2

…..

Recovery Checkpoint (position of oldest unprocessed transaction in the data source):

Thread #: 2

Sequence #: 5287

RBA: 131154160

Timestamp: 2008-05-20 11:37:42.000000

SCN: 2195.1048640151

Redo File: /dev/rredo07

Current Checkpoint (position of last record read in the data source):

Thread #: 2

Sequence #: 5287

RBA: 138594492

Timestamp: 2008-05-20 11:39:14.000000

SCN: 2195.1048654739

Redo File: /dev/rredo07

…..

首先察看Recovery Checkpoint所需要读取的最古老日志序列号,如举例中的实例1需要日志9671及其以后所有归档日志,实例2需要序列号为5287及以后所有归档日志,确认这些归档日志存在于归档日志目录后才可以执行下一步重起。如果这些日志已经被删除,则下次重新启动需要先恢复归档日志。

注意:对于OGG 11及以后版本新增了自动缓存长交易的功能,缺省每隔4小时自动对未提交交易缓存到本地硬盘,这样只需要最多8个小时归档日志即可。但是缓存长交易操作只在extract运行时有效,停止后不会再缓存,此时所需归档日志最少为8个小时加上停机

时间,一般为了保险起见建议确保重启时要保留有12个小时加上停机时间的归档日志。

3)执行GGSCI >stop er *停止所有源进程,或者分别对各个进程执行stop <进程名>

单独停止。

4)以oracle用户登录目标系统,进入安装目录/oraclelog1/goldengate,执

行./ggsci进入命令行。

5)在目标系统执行stop er *停止复制

6)在两端进程都已停止的情况下,如需要可通过stop mgr停止各系统内的管理进程。

类似的,stop命令具有跟start命令一样的用法。这里不再赘述。

注意,如果是只修改抽取或者复制进程参数,则不需要停止MGR。不要轻易停止MGR进程,并且慎重使用通配符er *,以免对其他复制进程造成不利影响。

1.4查看整体运行情况

进入到GoldenGate安装目录,运行GGSCI,然后使用info all命令查看整体运行情况。

如下图示:

Group表示进程的名称(MGR进程不显示名字);Lag表示进程的延时;Status表示进程的状态。有四种状态:

STARTING: 表示正在启动过程中

RUNNING:表示进程正常运行

STOPPED:表示进程被正常关闭

ABENDED:表示进程非正常关闭,需要进一步调查原因

正常情况下,所有进程的状态应该为RUNNING,且Lag应该在一个合理的范围内。

1.5查看参数设置

使用view params <进程名> 可以查看进程的参数设置。该命令同样支持通配符*。

1.6查看进程状态

使用info <进程名称>命令可以查看进程信息。可以查看到的信息包括进程状态、checkpoint信息、延时等。如:

还可以使用info <进程名称> detail 命令查看更详细的信息。包括所使用的trail

文件,参数文件、报告文件、警告日志的位置等。如:

使用info <进程名称> showch 命令可以查看到详细的关于checkpoint的信息,用于查看GoldenGate进程处理过的事务记录。其中比较重要的是extract进程的recovery

checkpoint,它表示源数据中最早的未被处理的事务;通过recovery checkpoint可以查看到该事务的redo log位于哪个日志文件以及该日志文件的序列号。所有序列号比它大的日志文件,均需要保留。

1.7查看延时

GGSCI> lag <进程名称>可以查看详细的延时信息。如:

此命令比用info命令查看到的延时信息更加精确。

注意,此命令只能够查看到最后一条处理过的记录的延时信息。

此命令支持通配符*。

1.8查看统计信息

GGSCI> stats <进程名称>,<时间频度>,table .

可以查看进程处理的记录数。该报告会详细的列出处理的类型和记录数。如:

GGSCI> stats edr, total列出自进程启动以来处理的所有记录数。

GGSCI> stats edr, daily, table gg.test列出当天以来处理的有关gg.test表的所有记录数。

1.9查看运行报告

GGSCI> view report <进程名称>可以查看运行报告。如:

也可以进入到/dirrpt/目录下,查看对应的报告文件。最新的报告总是以<进程名称>.rpt命名的。加后缀数字的报告是历史报告,数字越大对应的时间越久。如下图示:

如果进程运行时有错误,则报告文件中会包括错误代码和详细的错误诊断信息。通过查找错误代码,可以帮助定位错误原因,解决问题。

2OGG的常见运维任务指南

2.1配置自动删除队列

1)进入安装目录执行./ggsci;

2)执行edit param mgr编辑管理进程参数,加入或修改以下行

purgeoldextracts //dirdat/*, usecheckpoint, minkeepdays 7

其中,第一个参数为队列位置,*可匹配备份中心所有队列文件;

第二个参数表示是首先要保证满足检查点需要,不能删除未处理队列;

第三个参数表示最小保留多少天,后面的数字为天数。例如,如果希望只保留队列/ggs/dirdat/xm文件3天,可以配置如下:

purgeoldextracts /ggs/dirdat/xm, usecheckpoint, minkeepdays 3

3)停止MGR进程,修改好参数后重启该进程

GGSCI > stop mgr

输入y确认停止

GGSCI > start mgr

注:临时停止mgr进程并不影响数据复制。

2.2配置启动MGR时自动启动Extract和Replicat进程

1)进入安装目录执行./ggsci;

2)执行edit param mgr编辑管理进程参数,加入以下行

AUTOSTART ER *

3)停止MGR进程,修改好参数后重启该进程

GGSCI > stop mgr

GGSCI > start mgr

注意:一般建议不用自动启动,而是手工启动,便于观察状态验证启动是否成功,同时也便于手工修改参数。

2.3配置MGR自动重新启动Extract和Replicat进程

GoldenGate具有自动重起extract或者replicat进程的功能,能够自动恢复如网络中断、数据库临时挂起等引起的错误,在系统恢复后自动重起相关进程,无需人工介入。

1)进入安装目录执行ggsci进入命令行界面;

2)执行edit param mgr编辑管理进程参数,加入以下行

AUTORESTART ER *, RETRIES 3, WAITMINUTES 5, RESETMINUTES 60 以上参数表示每5分钟尝试重新启动所有进程,共尝试三次。以后每60分钟清零,再按照每5分钟尝试一次共试3次。

3)停止MGR进程,修改好参数后重启该进程,使修改后的参数文件生效

GGSCI > stop mgr

GGSCI > start mgr

2.4长事务管理

在停止抽取进程前需要通过命令检查是否存在长交易,以防止下次启动无法找到归档日志:

ggsci> info extXX, showch

…..

Read Checkpoint #1

….

Recovery Checkpoint (position of oldest unprocessed transaction in the data source):

Thread #: 1

Sequence #: 9671

RBA: 239077904

Timestamp: 2008-05-20 11:39:07.000000

SCN: 2195.1048654191

Redo File: Not available

Current Checkpoint (position of last record read in the data source):

Thread #: 1

Sequence #: 9671

RBA: 239377476

Timestamp: 2008-05-20 11:39:10.000000

SCN: 2195.1048654339

Redo File: Not Available

Read Checkpoint #2

…..

Recovery Checkpoint (position of oldest unprocessed transaction in the data source):

Thread #: 2

Sequence #: 5287

RBA: 131154160

Timestamp: 2008-05-20 11:37:42.000000

SCN: 2195.1048640151

Redo File: /dev/rredo07

Current Checkpoint (position of last record read in the data source):

Thread #: 2

Sequence #: 5287

RBA: 138594492

Timestamp: 2008-05-20 11:39:14.000000

SCN: 2195.1048654739

Redo File: /dev/rredo07

…..

为了方便长交易的管理,GoldenGate提供了一些命令来查看这些长交易,可以帮助客户和应用开发商查找到对应长交易,并在GoldenGate中予以提交或者回滚。

(一)查看长交易的方法

Ggsci> send extract <进程名> , showtrans [thread n] [count n]

其中,<进程名>为所要察看的进程名,如extsz/extxm/extjx等;

Thread n是可选的,表示只查看其中一个节点上的未提交交易;

Count n也是可选的,表示只显示n条记录。例如,查看extsz进程中节点1上最长的10个交易,可以通过下列命令:

Ggsci> send extract extsz , showtrans thread 1 count 10

输出结果是以时间降序排列的所有未提交交易列表,通过xid可以查找到对应的事务,请应用开发商和DBA帮助可以查找出未提交原因,通过数据库予以提交或者回滚后GoldenGate的checkpoint会自动向前滚动。

(二)使用GoldenGate命令跳过或接受长交易的方法

在GoldenGate中强制提交或者回滚指定事务,可以通过以下命令(<>中的为参数):Ggsci> SEND EXTRACT <进程名>, SKIPTRANS <5.17.27634> THREAD <2> //跳过交易Ggsci>SEND EXTRACT <进程名>, FORCETRANS <5.17.27634> THREAD <1> //强制认为该交易已经提交

说明:使用这些命令只会让GoldenGate进程跳过或者认为该交易已经提交,但并不改变数据库中的交易,他们依旧存在于数据库中。因此,强烈建议使用数据库中提交或者回滚交易而不是使用GoldenGate处理。

(三)配置长交易告警

可以在extract进程中配置长交易告警,参数如下所示:

extract extsz

……

warnlongtrans 12h, checkintervals 10m

exttrail /backup/goldengate/dirdat/sz

….

以上表示GoldenGate会每隔10分钟检查一下长交易,如果有超过12个小时的长交易,GoldenGate会在根目录下的ggserr.log里面加入一条告警信息。可以通过察看ggserr.log 或者在ggsci中执行view ggsevt命令查看这些告警信息。以上配置可以有助于及时发现长交易并予以处理。

说明:在OGG 11g中,extract提供了BR参数可以设置每隔一段时间(默认4小时)将长交易缓存到本地硬盘(默认dirtmp目录下),因此extract只要不停止一般需要的归档日志不超过8个小时(极限情况)。但是如果extract停掉后,便无法再自动缓存长交易,需要的归档日志就会依赖于停机时间变长。

2.5表的重新再同步(需时间窗口)

如果是某些表由于各种原因造成两边数据不一致,需要重新进行同步,可以参照以下步骤。

1)确认需要修改的表无数据变化(如果有条件建议停止应用系统并锁定除去sys和

goldengate以外的其它所有用户防止升级期间数据变化,或者锁定所要再同步的

表);

2)重启dpe进程(为了能够对统计信息清零);

3)停止目标端的rep进程;

注意:步骤4-6为将源端数据通过exp/imp导入到目标端,客户也可以选择其它初始化方式,比如在目标端为源端表建立dblink,然后通过create table as select from的方式初始化目标端表。

4)在源端使用exp导出该表或者几张表数据。例如:

exp goldengate/XXXX file=nanhai.dmp tables=ctais2.SB_ZSXX grants=y

5)通过ftp传输到目标端;

6)在目标端,使用imp导入数据;

nohup imp goldengate/XXXXX file=nanhai.dmp fromuser=ctais2 touser=ctais2 ignore=y &

7)如果这些表有外键,在目标端检查这些外键并禁止它们(记得维护dirsql下的禁

止和启用外键的脚本SQL);

8)启动目标端的rep进程;

9)使用stats mydpe命令观察data pump的统计信息,观察里面是否包含了本次重新

同步表的数据变化,如确认该时段内这些表无数据变化,则重新初始化成功;否则

中间可能产生重复数据,目标replicat会报错,将错误处理机制设置为reperror default,discard,等待replicat跟上后对discard中的记录进行再次验证,如果

全部一致则重新初始化也算成功完成,当然也可以另择时段对这些表重新执行初始

化。

2.6表的重新再同步(无需时间窗口)

如果是某些表由于各种原因造成两边数据不一致,需要重新进行同步,但实际业务始终24小时可用,不能提供时间窗口,则可以参照以下步骤。(因较为复杂,使用需谨慎!)

1)确认ext/dpe/rep进程均无较大延迟,否则等待追平再执行操作;

2)停止目标端的rep进程;

注意:步骤3-5为将源端数据通过exp/imp导入到目标端,客户也可以选择其它初始化方式,

比如expdp/impdp。

3)在源端获得当前的scn号。例如:

select dbms_flashback.get_system_change_number from dual;

以下以获得的scn号为1176681为例

4)在源端使用exp导出所需重新初始化的表或者几张表数据,并且指定到刚才记下的

scn号。例如:

exp / tables=ctais2.SB_ZSXX grants=n statistics=none triggers=n compress=n FLASHBACK_SCN=1176681

5)通过ftp传输到目标端;

6)在目标端,使用imp导入数据;

nohup imp goldengate/XXXXX file=nanhai.dmp fromuser=ctais2 touser=ctais2 ignore=y &

7)如果这些表有外键,在目标端检查这些外键并禁止它们(记得维护dirsql下的禁

止和启用外键的脚本SQL);

8)编辑目标端对应的rep参数文件,在其map里面加入一个过滤条件,只对这些重新

初始化的表应用指定scn号之后的记录(一定要注意不要修改本次初始化之外的其

它表,会造成数据丢失!):

map source.mytab, target target.mytab, filter ( @GETENV ("TRANSACTION", "CSN") > 1176681 ) ;

9)确认参数无误后,启动目标端的rep进程;

10)使用info repxx或者lag repxx直到该进程追上,停止该进程去掉filter即可进

入正常复制。

3数据结构变更和应用升级

3.1(仅复制DML时)源端和目标端数据库增减复制表

(一)增加复制表

在GoldenGate的进程参数中,如果通过*来匹配所有表,因此只要符合*所匹配的条件,那么只要在源端建立了表之后GoldenGate就能自动复制,无需修改配置文件,但是需要为新增的表添加附加日志。

步骤如下:

GGSCI 〉dblogin userid goldengate, password XXXXXXX

GGSCI > info trandata .

如果不是enable则需要手动加入:

GGSCI > add trandata .

注:(仅对Oracle 9i)如果该表有主键或者该表不超过32列,则显示enabled表示添加成功;如果无主键并且列超过32列,则可能出现错误显示无法添加则需要手工处理,此时请根据附录二中方法手工处理。

如果没有使用统配符,则需要在主Extract、Data Pump里面最后的table列表里加入新的复制表;在目标端replicat的map列表同样也加入该表的映射。

然后,新增表请首先在目标端建立表结构。

如果有外键和trigger,需要在目标表临时禁止该外键和trigger,并维护在dirsql下的禁止和启用这些对象的对应脚本文件。

对于修改了文件的所有源和目标进程,均需重启进程使新的参数生效。

(二)减少复制表

GoldenGate缺省复制所有符合通配符条件的表,如果有的表不再需要,可以在源端drop掉,然后到目标drop掉,无需对复制做任何修改。

如果其中几个表依然存在,只是无需GoldenGate复制,则可以通过以下步骤排除:1)在源端系统上首先验证所需归档日志存在后通过stop extXX停止对应的extXX进

程;

2)在目标端系统上ggsci中执行stop repXX停止目标端的复制进程;

3)在源端修改ext进程的参数文件排除所不复制的表:

Ggsci> edit param extXX

……

tableexclude ctais2.TMP_*;

tableexclude ctais2.BAK_*;

tableexclude ctais2.MLOG$_*;

tableexclude ctais2.RUPD$_*;

tableexclude ctais2.KJ_*;

tableexclude myschema.mytable;

table ctais2.*;

…….

在文件定义table的行前面加入一行“table exclude .;”注意写全schema和表的名称。

注:如果是没有使用通配符,则直接注释掉该表所在的table行即可。

4)在目标端修改rep进程参数,同样排除该表:

GGSCI>edit param repXX

在map前面加入一行:

--mapexclude CTAIS2.SHOULIXINXI

mapexclude myschema.mytable

MAP ctais2.* ,TARGET ctais2.*;

注:如果是没有使用通配符,则直接注释掉该表所在的map行即可。

IT运维管理系统使用手册

IT运维管理系统 用户使用手册 大庆和光电子科技开发有限公司 二〇一六年十月

目录 1、基础信息 (3) 1.1项目信息 (3) 1.2项目检查项 (4) 1.3设备基础信息 (6) 2、日常巡检 (8) 2.1软件日巡检 (8) 2.2软件周巡检 (9) 2.3服务器系统巡检 (10) 2.4服务器硬件巡检 (10) 3、巡检查询 (11) 3.1软件日常巡检检查 (11) 3.2服务器巡检报告 (11) 4、运维资料管理 (12) 4.1系统问题管理 (12) 4.2项目资料管理 (15)

1、基础信息 1.1项目信息 主要录入各运维组所维护的项目信息,各运维组各自录入各自的项目信息。如下图所示 【新增】按钮:点击“新增”按钮,按要求添加项目信息,点击“确认保存”按钮即可。如图所示: 注:状态字段:有两个状态,分别是“正常”和“停用”。当状态是“正常”,则在软件日/周巡检中显示;当状态是“停用”,则在软件日/周巡检中不显示。 项目路径:填写该项目发布的位置,例如:D:\Publish

【编辑】按钮:点击“编辑”按钮,编辑已添加的项目信息,点击“确认保存”按钮即可。如图所示: 【删除】按钮:选中要删除项目前的复选框,点击“删除”按钮,确定要删除,点击“确认”按钮即可。如图所示: 1.2项目检查项 主要是录入各运维组巡检项目的检查项,各运维组录入各自的项目检查项信息,如下图所示

【新增】按钮:点击“新增”按钮,按要求添加项目的检查项信息,点击“确认保存”按钮即可。如图所示: 【编辑】按钮:点击“编辑”按钮,编辑已添加的项目的检查项信息,点击“确认保存”按钮即可。如图所示:

数据库工程师数据库实施运行和维护、SQL数据库管理系统模拟题

[模拟] 数据库工程师数据库实施运行和维护、SQL数据库 管理系统 选择题 第1题: 数据库的实施是指根据数据库的逻辑结构设计和物理结构设计结果,在计算机系统上建立实际的数据库结构、导入数据并进行程序的调试。下列各项中,哪一项不是数据库实施的工作内容? A.定义数据库结构 B.数据装载 C.数据库的试运行 D.数据库运行 参考答案:D 第2题: 监控分析按照实现方法的不同分为两种:一种是由数据库建立自动监控机制;另一种是______。 A.空间管理 B.管理员手动实现监控 C.参数调整 D.查询优化 参考答案:B 第3题: 可以按照原数据库设计要求对数据库存储空间进行全面调整,重新安排存储位置、回收垃圾、减少指针链等,以提高系统性能的是______。 A.重组织 B.查询优化 C.重构造 D.监控分析 参考答案:A

第4题: 数据库运行一段时间后,由于记录不断增、删、改,会使数据库的物理存储情况变坏,降低了数据的存取效率,数据库的性能也下降。这时,数据库管理员就要对数据库进行______。 A.监控分析 B.空间管理 C.重组织和重构造 D.参数调整 参考答案:C 第5题: 可以通过部分修改数据库的模式和内模式,使数据库适应新的应用环境的是 ______。 A.重组织 B.重构造 C.参数调整 D.空间管理 参考答案:B 第6题: 避免或简化排序的目的是______。 A.查询优化 B.重构造 C.监控分析 D.重组织 参考答案:A 第7题: 下列关于数据库恢复的描述中,不正确的是______。 A.应定期将数据库做成档案文件 B.在进行事务处理过程时数据库更新的全部内容写入日志文件 C.数据库恢复,还可用最新的档案文件和日志文件的更新映像,将文件恢复到最新的检查点文件状态 D.发生故障时用当前的数据内容和档案文件更新前的映像,将文件恢复到最近的检查点文件状态

HP ProLiant DL系列PC服务器维护手册

HP PC服务器维护手册 (v 20110730)

目录 第1章硬件状态指示灯 (3) 1.1HP P RO L IANT DL580G7指示灯状态: (3) 1.2HP P RO L IANT DL380G7指示灯状态: (13) 1.3HP P RO L IANT DL980G7指示灯状态 (23) 第2章常见硬件部件故障处理 (34) 2.1硬盘故障的处理方法 (34) 2.2RAID卡故障的处理方法 (35)

第1章硬件状态指示灯 1.1 HP ProLiant DL580 G7指示灯状态: ? Item Description Status 1 UID 开关和指示灯蓝色= 活动状态 蓝色闪烁= 服务器在被远程控制 不亮= 处于非活动状态 2 建康指示灯绿色= 正常(系统在正常运行) 橙色闪烁= 系统降级 红色闪烁= 系统健康出现严重问题 不亮= 正常(系统关闭) 3 NIC 1 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 4 NIC 2 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状

态 不亮= 没有网络联接 5 NIC 3 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 6 NIC 4 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 7 加电/ 待机按钮以及指示灯橙色= 有交流电并且服务器处于待机 状态 绿色= 有交流电并处于开机状态 不亮= 没有交流电源

软件系统运维手册(完整资料).doc

【最新整理,下载后即可编辑】 系统运维手册 1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 (3) 3.2 数据库概述 (3) 4、系统服务程序的详细说明 (4) 4.1系统服务程序的构成 (4)

4.2 系统服务程序的启动、关闭及维护管理 (4) 4.2.1 dhcp主服务 (4) 4.2.2 dhcp从服务 (5) 4.2.3 web管理模块 (5) 5、服务器硬件维护(略) (6) 6、windows 2003系统的日常维护 (6) 6.1 定期检查磁盘空间 (6) 6.2 维护系统注册表 (7) 6.3 定期备份系统注册表 ..................................................................... 7 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8) 7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 (12) 1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服

务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展,sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 服务器数量:4台,基本信息如下: 3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成 DHCP主程序:

系统运维管理制度定稿

系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。

(2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。 第二条.平台信息和技术安全 (1)执行国家有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理基础研发平台信息技术安全方面存在的问题,确保平台安全、稳定、可靠运行。 (2)基础运营平台信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。 (3)在服务器和计算机之间设置硬件防火墙,在服务器及工作站上均安装防病毒软件,进行硬件和技术双保护,确保基础研发平台不受病毒和黑客攻击。 (4)负责基础运营平台信息技术安全应急处理预案制定和实施。 (5)建立多机备份基础平台信息服务系统机制,一旦主系统遇到故障或受到攻击导致不能正常运行,可以在最短的时间内替换主系统提供服务。 (6)建立基础平台系统集中式权限管理,按照岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设置共享数据库信息的访问权限,并设置密码。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏密码。

数据库运维管理规范

数据库运维管理规范 龙信思源(北京)科技有限公司 一、总则 为规范公司生产系统的数据库管理与配置方法,保障信息系统稳定安全地运行,特制订本办法。 二、适用范围 本规范中所定义的数据管理内容,特指存放在系统数据库中的数据,对于存放在其她介质的数据管理,参照相关管理办法执行。 三、数据库管理员主要职责 3、1、负责对数据库系统进行合理配置、测试、调整,最大限度地发挥设备资源优势。负责数据库的安全运行。 3、2、负责定期对所管辖的数据库系统的配置进行可用性,可靠性,性能以及安全检查。 3、3、负责定期对所管辖的数据库系统的可用性,可靠性,性能以及安全的配置方法进行修订与完善。

3、4、负责对所管辖的数据库系统运行过程中出现的问题及时处理解决。 3、5、负责对所管辖数据库系统的数据一致性与完整性,并协助应用开发人员、使用操作等相关人员做好相关的配置、检查等工作。 3、6、负责做好数据库系统及数据的备份与恢复工作。 四、数据库的日常管理工作 4、1、数据库管理的每日工作 (1)检查所有的数据库实例状态以及所有与数据库相关的后台进程。 (2)检查数据库网络的连通与否,比如查瞧监听器(listener)的状态、网络能否ping通其它的计算机、应用系统的客户端能否连通服务器等等。 (3)检查磁盘空间的使用情况。如果剩余的空间不足 20% ,需要删除不用的文件以释放空间或申请添加磁盘。 (4)查瞧告警文件有无异常。 (5)根据数据库系统的特点,检查其它的日志文件中的内容,发现异常要及时加以处理。 (6)检查cpu、内存及IO等的状态。 (7)检查备份日志文件的监控记录,确定自动备份有无成功完成。对于数据库的脱机备份,要确信备份就是在数据库关闭之后才开始的,备份内容就是否齐全。运行在归档模式下的数据库,既要注意归档日志文件的清除,以免磁盘空间被占满,也必须注意归档日志文件的保留,以备恢复时使用。

系统维护手册

系统维护手册 Revised as of 23 November 2020

密级:内部公开 文档编号:LANDUNTEC_SD_TEMP_08 版本号: 分册名称:第1册/共1册 系统维护手册 中国普天信息产业股份有限公司 中国普天信息产业股份有限公司对本文件资料享受着作权及其它专属权利,未经书面许可,不得将该等文件资料(其全部或任何部分)披露予任何第三方,或进行修改后使用。 文件更改摘要:

目录

1. 适用范围 该手册适用于系统管理员及系统维护人员适用。 2. 系统运行环境 3. 3.1. 数据库环境 3.2. 服务器信息: 安装软件:

数据库配置: Jdk及mysql软件是分别安装在22服务器和26 服务器上的。Mysql的数据库管理信息配置如下: 全局数据库名:cms 数据库别名:cms 数据库管理员用户:root密码: 3.3. Web环境 3.4. Web服务器为虚拟操作系统。 系统信息: 服务器网络配置: 4. 系统运维计划 4.1. 运维目标 集中监控平台管理系统运维管理的目标是保证系统平台的正常、可靠、高速运行,保证对突发事件、需求变更进行快速响应,保证规费管理系统的信息完整。

4.3. 系统平台维护: 保证操作系统、数据库系统、中间件、其他支撑系统应用的软件系统及网络协议等安全性、可靠性和可用性而实施的维护与管理;及时排除系统故障;每月对系统平台进行一次巡检,及时消除故障隐患,保障系统的安全、稳定、持续运行。 应用系统管理和维护: 在系统维护过程中采取各种技术手段及时排除系统故障,保证系统及相应接口的安全性、可靠性和可用性。及时消除系统可能存在的安全隐患和威胁、根据需求更新或变更系统功能。 数据储存设施管理和维护: 为保证数据存储设施、如服务器设备、集群系统、存储网络及支撑数据存储设施运行的软件平台的安全性、可靠性和可用性,保证存储数据的安全。定期对系统的性能,确认数据存储的安全,及时消除故障隐患,保障系统安全、稳定、持续运行。 数据管理和维护: 数据管理是系统应用的核心。为保证数据存储、数据访问、数据通信、数据交换的安全,每月对数据的完整性、安全性、可靠性进行检查。

运维手册文件

X X体检系统 维护手册 修订记录 版本号编写日期编制人审核人/ 批准人修改章节号 1.0 初始版本 XX软件股份有限公司

目录 1 概述 (3) 1.1 系统结构 (3) 1.2 数据库分布 (4) 2 运维环境介绍 (5) 2.1 服务器配置及端口互通关系 (5) 2.2 开发运行环境 (6) 2.2.1 数据库 (6) 2.2.2 插件(软件) (6) 2.2.3 系统运行所需JDK (7) 2.2.4 网络 (7) 3 基本维护 (8) 3.1 业务软件安装 (8) 3.2 新增功能页面 (8) 3.3 配置文件参数配置 (8) 3.4 数据库维护 (9) 4 账户信息 (10) 4.1 登录服务器 (10) 4.2 数据库 (10) 4.3 其他问题..................................................................................... 错误!未定义书签。

关键词: 摘要:本手册对系统运行环境、主要配置文件、系统新数据录入方法等进行了介绍,说 明了主要运维工作的处理,以及常见问题的处理。 1概述 1.1 系统结构 系统采用的结构描述 用户 预约网站、APP 体检系统检验系统影像系统 portal bs_tjxt bslis52 bs_tjxt_photo 业务平台结构图

1.2 数据库分布 Portal Bs_tjxt bslis52 bs_tjxt_photo 数据分布图 portal 为门户系统数据库 bs_tjxt 为体检系统数据库 bslis52 为检验数据库 bs_tjxt_photo 为影像数据库 1.3 数据接口 各系统之间的数据调用关系如下图所示: 影像系统 体检系统检验系统 体检 者信 息 结果 像 影检 验 项 目 、 检 检验 条 验结 果 码 bs_tjxt_photo bslis52 portal bs_tjxt 数据调用关系图 1、体检-检验接口:体检系统登记人员信息,产生检验项目信息与检验条码后,将 这些信息插入bslis52 数据库里的l_jytmxx 表。检验系统得到检验项目的结果后,生成结 果视图vi_tj_result ,体检系统的项目与该视图结果进行对照后获取检验结果。 2、体检-影像接口:

日常运维操作手册汇总

《日常运维操作手册》 ? 一、查看硬盘可用容量 双击“我的电脑”打开资源管理器,右击我们将要查看的盘符。例如:我们要查看D盘,只需要在相关的D盘上右击―属性即可看到如下图1-1所示

图1-1 从上图1-1中可以看出D盘的己用空间为9.66GB,而可用空间仅为109MB。 二、监视系统资源 根据运维报告指示,一般需要对服务器的处理器(CPU)、内存、网卡及IIS等在系统运行过程中表现的性能状况进行监测。 监测指标分析 I D 计数器名称说明 1 %Processor T ime 指处理器执行非闲置线程时间的百分比;通俗一点讲就是CPU使用率。计数器会自动记录当前所有进程的处理器时间。 2 Page/sec 指为解析硬页错误从磁盘读取或写入磁盘的页数(是P ages Input/sec和Pages Output/sec 的总和)。 3 Network Inter face Bytes To tal/sec为发送和接收字节的速率,包括帧字符在内。判定网络连接是否存在瓶颈。 4Current Co nnections 检测WEB服务的用户连接情况。 1.建立性能监测后台运行计数器 1)打开开始-程序-管理工具-性能,找到“性能日志和警报”下的“计数器日志”。

新建一个计数器,右击右边空白区域“新建”,如下图2-1所示. 图2-1 2)在新建计数器日志的名称输入容易理解的名称,如:新性能。下图2-2所示. 图2-2 3)输入计数器名称后,可进入如下图2-3所示图面。其中计数器的日志内容会 在默认情况下记录到“C:\PerfLogs\新性能_000001.blg”下(文件名称的定义后面有详细说明并且可定制)。

ORACLE数据库日常维护与管理手册

全球眼?(MEGAEYES)网络图像管理系统2.0 ORACLE日常维护与管理手册 北京互信互通信息技术有限公司 2004-08-08

目录 全球眼?(MEGAEYES)网络图像管理系统2.0 (1) 1引言 (3) 1.1 目的 (3) 1.2 范围 (3) 1.3 参考资料 (3) 2日常维护与管理说明 (3) 2.1 运行环境 (3) 2.1.1硬件环境 (3) 2.1.2软件环境 (3) 2.2 数据库日常维护 (4) 2.2.1数据库初始设置 (4) 2.2.2每日工作内容 (5) 2.2.3每周工作内容 (6) 2.2.4每月工作内容 (7)

1引言 1.1目的 对于重要的商业系统来说,数据库系统的正常运行是保证商业应用平稳运行的关键。但是数据库在运行过程中可能会因为种种原因发生问题。这时,数据库的管理与日常维护工作将变得尤为重要。 为了指导数据库管理员做好日常维护工作,保证数据库系统的正常运行,特制定本文档。当然,数据库的日常维护是复杂和繁琐的,本文仅涉及一些常见的数据库日常维护的内容,在实际工作中,数据库管理员还需要做更多的工作。 1.2范围 本文档使用的人员:数据库维护管理人员和相关人员。 本文档涉及内容:oracle数据库的日常维护与管理解决方案。 1.3参考资料 中国电信网络视频监控技术(暂行)规范 2日常维护与管理说明 2.1运行环境 程序的运行环境包括硬件运行环境和软件运行环境。 2.1.1硬件环境 ◆CPU类型:Intel及其兼容系列CPU ◆内存容量:剩余内存要达2G以上 ◆硬盘容量:剩余硬盘容量要达1G以上 ◆网卡类型:100M网卡 2.1.2软件环境 ◆操作系统:RedHat Linux AS 3.0 ◆数据库:Oracle9i Database Release 2 (9.2.0.4.0) for Linux x86

服务器日常维护及管理制度

编号:XMDMTQS220-2009 服务器日常维护及管理制度

1 目的 为保证所有服务器稳定、安全地运行,特制订本规定。 2 范围 本规定中所指的服务器包括:WEB服务器、TSM服务器、OA服务器、SCM服务器以及其他对外公布的服务器。 3 活动内容 3.1系统维护人员的权限管理 3.1.1系统支持部指定服务器系统管理员、网络设备管理员,记录于《服务器、网络设备管理员对照表》中。 3.1.2 服务器、网络设备默认超级用户帐号由系统管理员(或网络管理员)根据需要更建立、修改,并在填写《服务器、网络设备超级用户帐号对照表》的“修改日期”、“帐号”、“密码”、“修改人”栏后,由其上级主管在“确认人”栏签名确认。 3.1.3 《服务器、网络设备超级用户帐号对照表》由系统支持部统一存档。 3.1.4 系统管理员负责服务器的操作系统参数设置、系统安全维护、服务器应用软件系统设置、系统备份。网络管理员负责网络设备的系统参数设定、备份、网络设备安全维护,参数更改完必须马上更新该设备系统参数数据备份。 3.2 日常维护与备份 3.2.1系统管理员、网络管理员每天上班后必须马上检查服务器、网络设备的工作状态、查看服务器的运行日志并随时关注服务器运行状况,发现异常及时报告并处理。检查结果记录于《服务器、网络设备日检查表》中。 3.2.2 备份包括:系统备份、数据备份。 ——备份的存储介质应放于机房外。 ——原则上每年年底做一次系统备份;每日做一次数据备份。应至少保留最近7日的日数据备份;设备系统参数变化时应做系统参数数据备份,并保留最新的系统参数备份数据。 ——系统备份的媒体应异地存放。 原则上系统备份、日数据备份应在系统空闲时间进行,如:设置在每日晚上下班后开始备份。每日日常设备状态检查时应检查备份状态,并在《服务器、网络设备日检查表》填写备份记录。年备份可在备份媒体栏注明年备份,系统参数数据备份可在备份媒体栏注明系统参数备份。

公司IT运维管理制度

北京金则医学检验IT部运行维护 管理制度 撰写人:王永炳 审核人:王义平 批准人:王岩 启用日期:2018年7月1日 文件编号:BJJZLaB-IT运行维护 版本:第A版

目录 1 5 8 3

第一章总则 第1条为了加强IT运维通信网络的运行维护管理、保障通信网高效的发展和稳定可靠地运行,并具有可持续发展的能力,根据国家、信息产业部颁布的技术政策、技术体制、技术业务规程、法规、规定以及IT运维公司现行的管理体制,制定本运行维护基本管理制度。 第2条 IT运维通信网络运行维护管理的原则是: 1、坚持国家公众通信网的先进性、统一性和完整性的原则,加强全程全网的运行维护管理,实现全网协调、高效和快捷的发展,确保全网的安全和畅通。 2、完善运行维护管理体系,建立健全运行维护规范,提高运行维护管理效率,使全程全网的通信质量和技术指标始终保持在一个较好的水平,并不断提高网络质量和服务能力。 3、接轨采纳国际上先进的维护管理经验和机制,实施ISO9000系列质量管理体系。在较短的时间内,使IT 运维不仅在网络规模、用户数量、服务质量,还是在运行维护管理上都成为世界一流的通信企业。

4、在确保完成网络技术指标、功能指标和质量指标等的基础上,充分开发和综合利用网络资源,提高网络资源利用率,降低运行维护管理成本,提高网络的市场适应能力和服务能力。 第3条 IT运维通信网络运行维护管理的任务是: 1、建立和完善两个体系,即自上而下的指挥调度体系和自下而上的请示报告体系。运行维护管理要树立网络意识,深刻认识通信服务的全程全网的特点。凡是已投入运行的所有设备、线路、系统都是全程全网不可分割的一部分。 2、逐步建立运行与维护分离的管理机制。要确保网络内的所有设备完好无损,运行状态良好,各种电气指标,技术指标和服务质量指标均能满足或超过规定的水平。同时,能及时准确发现和迅速可靠地排除故障,杜绝人为事故和差错的发生,清除隐患,确保网络的畅通。 3、根据网络融合与业务融合的发展特点和专业化的分工趋势,充分利用社会化的维护能力,推广设备代维。加强对超出保修期设备的运行维护管理,探索实行设备供应商付费限时保修制。

运维手册_数据库_DataGuard日常运维手册

文档标识 文件状态:[] 草稿 [√] 正式发布 [ ] 正在修改 Oracle RAC+DataGuard 运维手册 版本:1.0.0 编制周光晖2015年01月20 审核 批准年月日 生效日期:年月日

修订历史记录 日期版本修订说明作者

目录 第一章引言 (3) **. 编写目的 (3) **. 定义、首字母缩写词和缩略语 (4) 第二章......................................................................................................... D ATA G UARD状态查询4 **. 检查主备库的D ATA G UARD状态信息 (4) **. 检查进程 (4) **. 检查归档状态 (4) **. 检查最后应用的日志S EQUENCE (5) **. 查看是否使用实时应用 (5) **. 检查GAP (5) **. 检查保护模式 (5) **. 相关视图 (6) 第三章................................................................................................................... SWITCHOVER 6 **. 确认主库状态是否支持切换操作 (6) **. 执行主库转换 (7) **. 关闭并MOUNT新备库 (7) **. 确认老备库状态 (7) **. 切换目标备库为主库 (7) **. 打开新主库 (8) **. 启动新备库的日志应用 (8) **. 开启新备库的ADG (8) 第一章引言 1.1. 编写目的 本文档描述了Oracle 11gR2 RAC+ADG操作手册。包含RAC DOWN机测试,日常查询状态,启停RAC等指令同时包含oracle 11g R2 ACTIVE DATAGUARD 的日常维护指令。

数据库日常维护

数据库日常维护(参考) 数据库日常维护工作是系统管理员的重要职责。其内容主要包括以下几个部分: 一、备份系统数据 SYBASE 系统的备份与恢复机制保证了在系统失败时重新获取数据的可能性。SQL Server 提供了两种不同类型的恢复机制:一类是系统自动完成的恢复,这种措施在每次系统启动时都自动进行,保证了在系统瘫痪前完成的事务都写到数据库设备上,而未完成的事务都被回退;另一类是人工完成的恢复,这是通过DUMP 和LOAD 命令来执行人工备份和恢复工作。因此定期备份事务日志和数据库是一项十分重要的日常维护工作。 1、备份数据库 每一个数据库都应在创建之后卸出,从而提供一个装入基点。在此之后按排定的时间周期表卸出。比如每周五卸出数据库。对一般数据库系统卸出数据库周期建议为每周一次。 除了按计划周期卸出数据库之外,还需在每次运行没有日志的操作后卸出数据库。例如: ·每次强制地运行了DUMP TRAN WITH NO_LOG (因为数据库的磁盘空溢出); ·每次用sp_dboption 允许select into/bulkcopy 做快速拷贝,或用SELECT INTO 命令创建一个永久性的表,或使用了WRITETEXT 命令。 卸出数据库的命令为: DUMP DATABASE database_name TO dump_device database_name 是要卸出的数据库名称,dump_device 是卸出设备的名称。用系统过程sp_helpdevice 可以获得设备的信息。 下面一条命令用来卸出数据库my_db : DUMP DATABASE my_db TO db_bk_dev 2、备份事务日志

服务器、网络设备以及安全设备日常维护管理制度

服务器、网络设备以及安全设备日常维护管理制度 第一条 服务器、网络设备及安全设备的安全、性能检查。每台服务器、网络设备及安全设备至少保证每周检查两次,每次检查的结果要求进行登记记录。 第二条 数据备份工作。定期对服务器、网络设备、安全设备的配置文件进行备份,每次更改配置、策略后,都要及时更新备份文件,保证当前为备份最新数据。 第三条 服务器、网络设备及安全设备的监控工作。每天正常工作期间必须保证监视所有服务器、网络设备及安全设备状态,一旦发现服务器、网络设备或安全设备异常,要及时采取相应措施。 第四条 服务器、网络设备及安全设备的相关日志操作。每台服务器、网络设备及安全设备保证每周或依据数据情况对相关日志进行整理,整理前对应的各项日志如应用程序日志、安全日志、系统日志等应进行保存。 第五条 要及时做好服务器的补丁升级和漏洞修复工作。对于新发布的漏洞补丁和应用程序方面的安全更新,要及时分发给每台服务器。 第六条 服务器、网络设备及安全设备的安全检查主要包括CPU利用率、运行状态、性能、网络流量等方面。安全管理员必须保证对服务器、网络设备及安全设备每月进行一次安全检查。每次的检查结果必须做好记录,并生成检查报告。 第七条 不定时的相关工作。每台服务器如有应用软件更改、需要安装新的应用程序或卸载应用程序等操作,应提前告知所有管理员。 第八条 密码定期更改工作。每台服务器、网络设备及安全设备保证至少每一个月更改一次密码,密码长度不少于8位,且要满足复杂度要求。

第九条 系统管理人员要定时对系统服务器进行病毒检查,发现病毒要及时处理。 第十条 未经许可,任何人不得在服务器上安装新软件,若确实需要安装,安装前应得到授权并进行病毒例行检查。 第十一条 经远程通信传送的程序或数据,必须经过检测确认无病毒后方可使用。 第十二条 定时对硬件进行检查、调试和修理,确保其运行完好。 第十三条 关键设备应指定专人保管,未经授权的人员不得进行单独操作。 第十四条 所有设备未经许可一律不得借用,特殊情况须经批准后办理借用手续,借用期间如有损坏应由借用部门或借用人负责赔偿。 第十五条 硬件设备发生损坏、丢失等事故,应及时上报,填写报告单并按有关规定处理。 第十六条 业务系统设备及其附属设备的管理(登记)与维修由系统、网络管理员负责。设备管理人员每半年要核对一次设备登记情况。 第十七条 系统服务器、网络设备及安全设备应由相关管理人员每周进行一次例行检查和维护,并详细记录检查过程及检查结果。 第十八条

IT运维人员工作手册通用版

企业运维(IT)人员工作手册通用版2012/05 企业运维(IT)人员工作手册 作者:职道 1.目地: 为了明确运维技术人员工作职责、规范运维人员工作行为、保证运维服务质量和做好运维服务管理工作。 2.范围: 适用范围:企业总部各中心各部门、分公司、子公司的运维部门 发布范围:企业总部各中心各部门、分公司、子公司、各门店的运维部门 3.运维人员工作职责: 3.1.电脑设备软、硬件维护和周边外设的维护; 3.1.1.新电脑的硬件安装须做到安全、整洁、规范 3.1.1.1.不带电安装操作,安装过程防止静电,安装完成后进行各种连接线的整理,设备、配件的摆放合理,如显 示器调整到最适合的高度等。 3.1.1.2.硬件安装完成后进行操作系统的安装和设置,如果安装的是WINDOWS视窗操作系统,硬盘分区应为NTF格式, 以利于将来的安全设置; 3.1.1.3.设置计算机名,如果是个人使用的电脑,可以人员姓名为计算机名,如果是多人共用的电脑,以部门名字 相关设置计算机名; 3.1.1. 4.分配网内已规划好的唯一固定的IP地址,分配计算机登录帐号,如果使用域控制器管理则建立与域服务器 的连接并分配域帐号。进行计算机的安全设置,如组策略设置等; 3.1.1.5.安装安全软件(杀毒软件\防火墙软件等); 3.1.1.6.安装办公软件、业务软件; 3.1.1.7.互联网上网配置,如浏览器的配置; 3.1.1.8.如果有需要,进行打印机等外围设备的安装与调试; 3.1.1.9.响应使用人的合理需要安装其它工作软件; 3.1.1.10.所有软件安装完成并调试正常后,进行系统备份,备份文件存于电脑的最后一个分区,在最后一个分区 内建立运维文件夹,并留下“不可删除”的提醒标志,将备份文件、已装软件的安装程序(通用超大文件除外)、相关设置信息存于此文件夹内。 3.1.2.日常维护工作 1 / 9

服务器日常维护及管理制度1.doc

服务器日常维护及管理制度1 编号:XMDMTQS220-2009 服务器日常维护及管理制度 1 目的 为保证所有服务器稳定、安全地运行,特制订本规定。 2 范围 本规定中所指的服务器包括:WEB服务器、TSM服务器、OA服务器、SCM服务器以及其他对外公布的服务器。 3 活动内容 3.1系统维护人员的权限管理 3.1.1系统支持部指定服务器系统管理员、网络设备管理员,记录于《服务器、网络设备管理员对照表》中。 3.1.2 服务器、网络设备默认超级用户帐号由系统管理员(或网络管理员)根据需要更建立、修改,并在填写《服务器、网络设备超级用户帐号对照表》的“修改日期”、“帐号”、“密码”、“修改人”栏后,由其上级主管在“确认人”栏签名确认。 3.1.3 《服务器、网络设备超级用户帐号对照表》由系统支持部统一存档。 3.1.4 系统管理员负责服务器的操作系统参数设置、系统安

全维护、服务器应用软件系统设置、系统备份。网络管理员负责网络设备的系统参数设定、备份、网络设备安全维护,参数更改完必须马上更新该设备系统参数数据备份。 3.2 日常维护与备份 3.2.1系统管理员、网络管理员每天上班后必须马上检查服务器、网络设备的工作状态、查看服务器的运行日志并随时关注服务器运行状况,发现异常及时报告并处理。检查结果记录于《服务器、网络设备日检查表》中。 3.2.2 备份包括:系统备份、数据备份。 ——备份的存储介质应放于机房外。 ——原则上每年年底做一次系统备份;每日做一次数据备份。应至少保留最近7日的日数据备份;设备系统参数变化时应做系统参数数据备份,并保留最新的系统参数备份数据。 ——系统备份的媒体应异地存放。 原则上系统备份、日数据备份应在系统空闲时间进行,如:设置在每日晚上下班后开始备份。每日日常设备状态检查时应检查备份状态,并在《服务器、网络设备日检查表》填写备份记录。年备份可在备份媒体栏注明年备份,系统参数数据备份可在备份媒体栏注明系统参数备份。 服务器、网络设备管理员对照表 服务器、网络设备超级用户帐号对照表单位:日期:

IT运维管理系统使用手册

IT运维管理系统使用手册

————————————————————————————————作者:————————————————————————————————日期:

IT运维管理系统 用户使用手册 大庆和光电子科技开发有限公司 二〇一六年十月

目录 1、基础信息 (3) 1.1项目信息 (3) 1.2项目检查项 (4) 1.3设备基础信息 (6) 2、日常巡检 (8) 2.1软件日巡检 (8) 2.2软件周巡检 (9) 2.3服务器系统巡检 (10) 2.4服务器硬件巡检 (10) 3、巡检查询 (11) 3.1软件日常巡检检查 (11) 3.2服务器巡检报告 (11) 4、运维资料管理 (12) 4.1系统问题管理 (12) 4.2项目资料管理 (15)

1、基础信息 1.1项目信息 主要录入各运维组所维护的项目信息,各运维组各自录入各自的项目信息。如下图所示 【新增】按钮:点击“新增”按钮,按要求添加项目信息,点击“确认保存”按钮即可。如图所示: 注:状态字段:有两个状态,分别是“正常”和“停用”。当状态是“正常”,则在软件日/周巡检中显示;当状态是“停用”,则在软件日/周巡检中不显示。 项目路径:填写该项目发布的位置,例如:D:\Publish

【编辑】按钮:点击“编辑”按钮,编辑已添加的项目信息,点击“确认保存”按钮即可。如图所示: 【删除】按钮:选中要删除项目前的复选框,点击“删除”按钮,确定要删除,点击“确认”按钮即可。如图所示: 1.2项目检查项 主要是录入各运维组巡检项目的检查项,各运维组录入各自的项目检查项信息,如下图所示

itop运维综合管理平台使用手册

xxxx运维综合管理平台 操作手册 xxxx(天津)科技有限公司

变更记录

目录 1.平台介绍 1.概述 xxxx运维综合管理平台是为了业务需要进行开发,适用于IT服务的日常运维管理。它基于ITSS最佳实践,适应符合ITSS最佳实践的流程,同时它又很灵活,可以适应一般的IT服务管理流程。 xxxx运维综合管理平台的功能包括: ?记录IT配置项(如服务器、应用程序、网络设备、虚拟机、联系人、位置、VLAN 等)及其各个配置项之间的关联关系; ?管理事件、用户请求和变更审批与执行等; ?归档IT服务及与外部供应商的合约,包括SLA(服务级别协议);

?手动或脚本方式导出所有信息; ?批量导入或同步/联调所有来自外部平台的数据; xxxx运维综合管理平台基于Apache/IIS、MySQL和PHP,它可以在任何支持这些程序的操作平台上运行,如Windows、Linux(Debian、Ubuntu和Redhat)、Solaris和MacOSX 等。此外,由于平台是基于B/S架构的应用程序,不需要在用户电脑上部署任何客户端,只需要一个简单的Web浏览器(IE8+、+、Chrome或Safari5+)即可使用。 2.平台架构 平台架构如下图所示: 图平台架构图 技术架构如下图: 图技术架构图 1.1展示层 平台展现层,即为用户提供了一个统一集中的访问平台,使得用户可以更关注于实际业务,方便企业决策。通过门户技术,每个用户都拥有自己独立的访问视图,方便用户在各个模块和流程之间快速切换,平台提供仪表盘,可以提供用户可以快速查看IT服务健康状况窗口; 图功能展示界面 平台提供五种访问视图,即服务台、自助服务中心、服务管理中心、管理控制台和移动客户端。 ?服务台: -服务目录; -用户咨询投诉; -客户个性化工作流程;

IT运维手册(故障及处理)(完整资料).doc

【最新整理,下载后即可编辑】 IT运维手册 第二篇硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD排线问题,可插入系统引导盘看有无反应,若无反应,则为硬件问题,建议售后处理;若有反应,则为软件问题,可重装系统。 ②硬盘灯不亮 I电源问题 需更换电源和电池,多为电源适配器或电池损坏造成的提供电压不稳。可更换同型号电源线,排查故障。 II内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS设置解决。 III灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方损坏都会造成硬盘无法通电,从而不能开机,建议去售后处理。 ⑵无法正常上网 ①网络设置问题 此原因较多出现于需手动指定IP、网关、DNS服务器联网方式下,及使用代理服务器上网的,应仔细检查计算机的网络设置。 ②DNS服务器的问题 I当IE无法浏览网页时,可先尝试用IP地址来访问,如果可

以访问,则为DNS的问题,造成DNS的问题可能是联网时获取DNS出错或DNS服务器本身问题,可手动指定DNS服务(地址可以是当地TSP提供的DNS服务器地址,也可用其它地方可正常使用DNS服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP协议-属性-使用下面的DNS服务器地址)。不用的ISP有不同的DNS地址。有时候则是路由器或网卡的问题,无法与ISP的DNS服务连接,这种情况可重启路由器或重新设置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns 来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。 2显示器 ⑴无图像显示 ①开机无反应 I检查电脑的外部接线是否接好,把各个连线重新插一遍,看故障是否排除。 II如果故障依旧,接着打开主机箱查看机箱内有无多余金属物,或主板变形造成的短路,闻一下机箱内有无烧焦的糊味,主板上有无烧毁的芯片,CPU周围的电容有无损坏等。 III如果没有,接着清理主板上的灰尘,检查显卡等硬件是否

itop运维综合管理平台使用手册

xxxx运维综合管理平台 操作手册V1.0 xxxx(天津)科技有限公司

变更记录

目录 1.平台介绍 (4) 1.概述 (4) 2.平台架构 (4) 2.1展示层 (5) 2.2功能层 (7) 2.3技术层 (8) 2.4外部接口层 (8) 1.xxxx运维综合管理平台软件功能 (9) 2.1服务台 (9) 2.2自助服务中心 (10) 2.3配置管理模块 (11) 2.4事件管理模块 (13) 2.5问题管理模块 (17) 2.6变更管理模块 (19) 2.7服务管理模块 (22)

1.平台介绍 1.概述 xxxx运维综合管理平台是为了业务需要进行开发,适用于IT服务的日常运维管理。它基于ITSS最佳实践,适应符合ITSS最佳实践的流程,同时它又很灵活,可以适应一般的IT服务管理流程。 xxxx运维综合管理平台的功能包括: ?记录IT配置项(如服务器、应用程序、网络设备、虚拟机、联系人、位置、VLAN 等)及其各个配置项之间的关联关系; ?管理事件、用户请求和变更审批与执行等; ?归档IT服务及与外部供应商的合约,包括SLA(服务级别协议); ?手动或脚本方式导出所有信息; ?批量导入或同步/联调所有来自外部平台的数据; xxxx运维综合管理平台基于Apache/IIS、MySQL和PHP,它可以在任何支持这些程序的操作平台上运行,如Windows、Linux(Debian、Ubuntu和Redhat)、Solaris和MacOS X等。此外,由于平台是基于B/S架构的应用程序,不需要在用户电脑上部署任何客户端,只需要一个简单的Web浏览器(IE 8+、Firefox 3.5+、Chrome或Safari 5+)即可使用。 2.平台架构 平台架构如下图所示:

相关文档
最新文档