GP日常维护手册-常用命令

GP日常维护手册-常用命令
GP日常维护手册-常用命令

Greenplum 日常维护手册

1.数据库启动:gpstart

常用可选参数:-a : 直接启动,不提示终端用户输入yes确认

-m:只启动master 实例,主要在故障处理时使用

2.数据库停止:gpstop:

常用可选参数:-a:直接停止,不提示终端用户输入确认

-m:只停止master 实例,与gpstart –m 对应使用

-M fast:停止数据库,中断所有数据库连接,回滚正在运

行的事务

-u:不停止数据库,只加载pg_hba.conf 和postgresql.conf中

运行时参数,当改动参数配置时候使用。

-f:强制停止数据库

-r:重启数据库

3.查看实例配置和状态

select * from gp_configuration order by 1 ;

select * from gp_configuration_history order by 1 ;

主要字段说明:

Content:该字段相等的两个实例,是一对P(primary instance)和M(mirror Instance)

Isprimary:实例是否作为primary instance 运行

Valid:实例是否有效,如处于false 状态,则说明该实例已经down 掉。

Port:实例运行的端口

Datadir:实例对应的数据目录

注 4.0后,实例配置的数据表:gp_segment_configuration 、pg_filespace_entry、gp_fault_strategy;

其它常用的系统表:pg_class,pg_attribute,pg_database,pg_tables……

可以用tab来匹配表名;

4.gpstate :显示Greenplum数据库运行状态,详细配置等信息

常用可选参数:-c:primary instance 和mirror instance 的对应关系

-m:只列出mirror 实例的状态和配置信息

-f:显示standby master 的详细信息

-s:查看详细状态,如在同步,可显示数据同步完成百分比

--version,查看数据库version

(也可使用pg_controldata查看数据库版本和postgresql版本)该命令默认列出数据库运行状态汇总信息,常用于日常巡检。

5.查看用户会话和提交的查询等信息

select * from pg_stat_activity该表能查看到当前数据库连接的IP 地址,用户

名,提交的查询等。另外也可以在master 主机上查看进程,对每个客户端连接,master 都会创建一个进程。ps -ef |grep -i postgres |grep -i con

pg_backend_pid();

pg_cancel_backend(integer)

6.查看数据库、表占用空间

select pg_size_pretty(pg_relation_size('schema.tablename'));(与pg_tables子查询查看所有表的占用空间)

select pg_size_pretty(pg_database_size('zctt'));

必须在数据库所对应的存储系统里,至少保留30%的自由空间,日常巡检,要检查存储空间的剩余容量。

7.收集统计信息,回收空间

定期使用Vacuum analyze tablename 回收垃圾和收集统计信息,尤其在大数据量删除,导入以后,非常重要、需要定期对数据字典做vacuum和reindex ,如

pg_class,pg_attribute等系统表。

可以gp_toolkit.gp_bloat_diag看膨胀很大的表;

8.查看数据分布情况

两种方式:

●Select gp_segment_id,count(*) from tablename group by 1 ;

●在命令运行:gpskew -t public.ate -a postgres

如数据分布不均匀,将发挥不了并行计算的优势,严重影响性能。

9.登录每一个实例数据库的方法

PGOPTIONS='-c gp_session_role=utility' psql dbname –p xxxx

可以通过这个命令登录实例,一般用于检测单个实例是否运行正常,还有就是用于在集群发生不一致时(只有在非常特殊的情况下才有可能发生,如表不一致等),进行表维护

10.实例恢复:gprecoverseg

通过gpstate 或gp_configuration 发现有实例down 掉以后,使用该命令进行回复。

gprecoverseg -F强制恢复

11.查看锁信息:

注:在Greenplum里(截至到4.0版本),INSERT 和COPY都是行级锁,

UPDATE/DELETE都是表级锁;

SELECT locktype, database, c.relname, l.relation,

l.transactionid, l.transaction, l.pid, l.mode, l.granted,

a.current_query

FROM pg_locks l, pg_class c, pg_stat_activity a

WHERE l.relation=c.oid AND l.pid=a.procpid ORDER BY c.relname;

主要字段说明:

relname: 表名

locktype、mode 标识了锁的类型

注:也可以通过pgadminIII的工具->服务器状态查看当前运行的SQL及锁等待情况。

发生Deadlock时,系统自动让其中一个SQL失败,并提示deadlock信息。

12.explain:在提交大的查询之前,使用explain分析执行计划、发现

潜在优化机会,避免将系统资源熬尽。

explain analyze sql,将执行一次SQL,并行将过程中的具体cost和运行情况记录下来

也可以用pgadminIII进行explain的图形化显示,进而来优化执行路径,如表关联策略等。

注:可以在Master的postgresql.conf中修改

log_min_duration_statement=5000s,SQL运行耗时超过这个值得都在pg_log纪录SQL的实际耗时,用来监控耗时的SQL。

13.数据库并行备份

gp_dump:

常用参数:-s: 只导出对象定义(表结构,函数等)

-n: 只导出某个schema

gp_dump 默认在master 的data 目录上产生这些文件:

gp_catalog_1__ :关于数据库系统配置的备份文件

gp_cdatabase_1__:数据库创建语句的备份文件

gp_dump_1__:数据库对象ddl语句

gp_dump_status_1__:备份操作的日志

在每个segment instance 上的data目录上产生的文件:

gp_dump_0__:用户数据备份文件

gp_dump_status_0__:备份日志

gpcorndump:

可以用于备份数据库配置文件和全局数据(如角色、资源队列等)

Example:gpcrondump -x mydatabase –u /xxx/ -c -g –G –a –q >>$DATE.log

-g 备份postgresql.conf、pg_hba.conf、pg_ident.conf

-G 备份全局对象

-u 备份到的目录(如果没有-u,则数据备份到每个数据目录里面)

gpcrondump的文件可以用gp_restore恢复

gp_restore --gp-c --gp-d=/data/backup/db_dumps/20110423/ --gp-k=20110423103328 -d gpadmin

也可以用gpdbresotre恢复:(需要数据在一个Host上)

gpdbrestoree -R master=/data/backup/db_dumps/20110423

14.数据库恢复gp_restore

必选参数:--gp-k=key :key 为gp_dump 导出来的文件的后缀时间戳

-d dbname :将备份文件恢复到dbname

15.串行备份

pg_dump/pg_dumpall

一般用于环境迁移和DDL、FUNCTION等备份;

如:pg_dump -s -n public demodb –f demodb.sql ,将只备份demodb数据库中的public 下的所有DDL和FUNCTION,-s表示不备份数据;

恢复时,使用psql -d demodb –f demodb.sql

16.数据库僵尸进程处理

首先使用kill -15 去停止进程,kill -15 不响应,再用kill -11;一般情况下,不要用kill -9,否则可能导致数据库宕机且状态不一致,严重的导致数据库不能重新启动,可能需要用pg_resetxlog去重置日志,有可能导致数据丢失;

17.参数更改

通过gpconfig配置Master和所有Segment的postgresql.conf中参数。

EXAMPLES

gpconfig -c work_mem -v 120MB –masteronly

修改master上的work_mem =120MB

gpconfig -c max_connections -v 100 -m 10

修改Master上max_connections=10,Segment上修改成100

gpconfig -r default_statistics_target

注释参数,使用缺省参数

gpconfig –l

列出所有的参数

gpconfig -s max_connections

显示某个参数

最大连接数:show max_connections;

最大事务数:show max_prepared_transactions;

18.Greenplum其它常用命令

gpssh -f all_hosts—通过SSH同时访问多个节点,并可同时执行shell

gpcheckperf --检查网络和硬盘性能

checkos -f all_hosts –检查OS内核和参数

如:

检查Disk性能:

gpcheckperf -d /data/gpdb_p1 -d /data/gpdb_p2 -d /data/gpdb_p3 -d /data/gpdb_p4 -d /data/gpdb_p5 -d /data/gpdb_p6 -d /data/gpdb_p7 -d /data/gpdb_p8 -S 64GB -r ds -D -v -f hosts-setup

检查网络性能:

gpcheckperf -d /data/gpdb_p1 -r N -f hosts-net0

gpcheckperf -d /data/gpdb_p1 -r N -f hosts-net1

gpcheckperf -d /data/gpdb_p1 -r N -f hosts-net2

gpcheckperf -d /data/gpdb_p1 -r N -f hosts-net3

gpssh –h sdw1 –v –e ‘mkdir /data/test’

gpssh –h sdw1 –v –e ‘mkdir /data/test’

gpssh -h sdw1 -v -e 'mkdir /data/test'

19 copy导出、导入数据文件:

COPY public.ods_data_msg TO '/zte/gpdata/ocs_data_msg.txt' delimiter'|';

COPY public.ods_data_msg from '/zte/gpdata/ocs_data_msg.txt' WITH delimiter'|';

20 进程监控:

select * from pg_stat_activity where waiting ='t' ORDER BY current_query;

select * from pg_stat_activity where waiting ='t' ORDER BY sess_id;

select * from pg_stat_activity where waiting ='f' ORDER BY current_query;

select * from pg_stat_activity where waiting ='f' ORDER BY sess_id;

21 添加默认分区

ALTER TABLE INF.EVENT_TGPS_201307 ADD default PARTITION PDEFAULT ;

22 杀进程

登录数据库后先使用

select pg_cancel_backend(客户端进程ID);

如果无法杀掉则使用

select pg_terminate_backend(客户端进程ID);

23.导出对象

pg_dump -h 136.6.160.196 -p 5432 -U dsj -n dsj -s -T dsj.hot_contents_user_20130710 -T dsj.tbd_bwt_evt_pd_lo_evt_20130709 --gp-syntax cqdsj > db.sql

pg_dump -h 136.6.160.196 -p 5432 -U gpadmin -n public -s --gp-syntax xdcx > xdcx_public.sql pg_dump -h 136.6.160.196 -p 5432 -U gpadmin -n inf -s --gp-syntax xdcx > xdcx_inf.sql

pg_dump -h 136.6.160.196 -p 5432 -U gpadmin -n mid -s --gp-syntax xdcx > xdcx_mid.sql

pg_dump -h 136.6.160.196 -p 5432 -U inf -n public -s --gp-syntax xdcx > xdcx_public.sql

24.表的字段:

SELECT * FROM PG_ATTRIBUTE WHERE ATTRELID IN(SELECT RELFILENODE FROM PG_CLASS WHERE UPPER(RELNAME)=UPPER('DS_EVT_CALL_AREA_201312'))

and attstattarget='-1' order by attnum;

25.新建登陆用户

CREATE ROLE cqcis LOGIN

ENCRYPTED PASSWORD 'md5265eb7390afca3acc1f251fe55e63c00'

NOSUPERUSER INHERIT NOCREATEDB NOCREATEROLE RESOURCE QUEUE pg_default;

GRANT USAGE ON SCHEMA inf TO cqcis;

GRANT USAGE ON SCHEMA mid TO cqcis;

GRANT USAGE ON SCHEMA public TO cqcis;

26.模式管理(命令行)

查询当前可以直接访问的模式:SHOW search_path;

当前可以直接访问的模式:1、SET search_path TO temp,cqdmkt,public;---session级

2、alter database cqdmkt_new SET search_path TO temp,cqdmkt,public;---database级

---第一个模式为默认模式,即在新建表或者函数式,不加模式名的情况,都默认到第一个模式下。

27. 表的字段名称及注释的系统表查询

SELECT

a.nspname AS schemaname

,b.relname AS tablename

,d.attnum AS columnid

,d.attname AS columnname

,FORMAT_TYPE(d.atttypid,d.atttypmod) AS columntype

,e.description

FROM pg_catalog.pg_namespace a

JOIN pg_catalog.pg_class b ON a.oid=b.relnamespace AND b.relkind='r'

JOIN pg_catalog.pg_attribute d ON b.oid=d.attrelid AND d.attnum>=0

LEFT JOIN pg_catalog.pg_description e ON b.oid=e.objoid

AND b.tableoid=e.classoid

AND d.attnum=e.objsubid

where a.nspname= 'cqdmkt' --write your schema_name

and b.relname= 'wid_chn_prd_serv_mkt_day' --write your table_name

;

28.

sap日常维护管理手册

SAP系统日常管理 1 系统监视 1.1 进程监视 §SM66/SM50 进程查看 管理员需全天监看系统的进程。长时间运行的后台工作,有缺陷的报表程序,若不进行控制都将消耗掉大量的系统资源。管理员用这个事务码检查他们的环境。当然,在杀掉这些进程前,需要与最终用户协商。 1.2 服务器监视 §SM51 R/3服务器的列表可用SM51显示,管理员用它来监视不同服务器之间的工作进程。想要显示某一服务器的进程,鼠标指针点中服务器的名称,然后选Processes。 §RZ20 CCMS监控 双击要查看的菜单项,检查系统收集的监控信息,遇到报警和错误信息要查清原因,找出解决办法。 1.3 用户监视 §SM04 用户监视 管理员应该考虑全天监视用户仅他们的活动。是否有非法用户?是否有用户试图或正在用他们不该用的事务码,等等。 1.4 性能监视 §ST03 工作量分析 世上没有经验的替代品。当需要调R/3系统的性能的时候是很痛苦的事情。管理员应该保留尽可能多的工作量分析数据,特别是系统没用性能问题时候的数据。拥有一副系统工作正常时的清晰的系统图,将使你具有对你的系统的不可估量的感觉,这种感觉将使你能预见到将要发生的问题,并且很多时候可以避免问题的发生。 §ST02 缓存分析 R/3的缓存存储经常用到的数据,以使本地应用服务器的实例能取得这些数据。这样就可以减少数据库的访问,数据库的负载,网络的流量,从而提高系统的性能。数据缓存中包括了ABAP/4程序,屏幕,ABAP/4字典数据和公司的数据,这些数据在系统操作过程中是不会改变的。我们应该经常的监视缓存、点击率、剩余空间、交换区。此进程可以帮助管理员作性能调整。 §SP12 TemSe管理 管理员要检查文件系统和数据库空间的增长,尤其是批量打印大量数据时。TemSe的一致性检查(RSPO0043)需要计划每天在打印池重新整理(RSPO0041)之前执行。 1.5 更新记录 §SM13更新记录 此事务码显示失败的更新动作。失败的更新动作在生产系统中是决不允许发生的,一旦发生,开发人员应马上修改。 1.6 锁定对象 §SM12 锁定对象 用户总是会时不时的因为某种原因(如断线,程序出错等等)而锁定一个对象。所有被锁定的老的对象均要被分析,更正。 1.7 出错分析 §ST22出错分析

泛微项目-ecology系统日常维护手册

泛微项目新OA系统日常维护方案SUBMITED BY WEAVER 上海泛微网络科技股份有限公司北京分公司 地址:北京市朝阳区霄云路36号国航大厦1606 邮政编码:200127

文档版本历史 变更序号日期版本 文件变更 申请编号 变更说明修改人 1 2014-1-6 V1.0 无新文件周晓明

目录 一、前言 (4) 1.1编写目的 (4) 1.2相关工具介绍 (4) 二、系统安装 (5) 2.1 数据库安装部署 (5) 2.2 应用系统安装部署 (5) 三、服务启动 (7) 3.1 数据库服务启动 (7) 3.2 应用服务启动 (8) 3.3 手机版启动 (9) 四、系统备份、还原 (10) 4.1 数据库备份 (10) 4.2 应用程序备份 (10) 4.3 数据库还原 (11) 4.4 应用程序还原 (11) 五、系统升级 (12) 5.1 系统升级说明 (12) 5.2 系统升级流程 (12) 六、系统问题排查 (13) 6.1 数据库问题排查 (13) 6.2 应用服务器问题排查 (13) 6.3 手机服务器问题排查 (14)

一、前言 1.1编写目的 本文的目的,是为了指导系统维护人员进行新OA系统的日常维护操作。以保障新OA系统的正常运行和出现问题后的应急处理。 1.2相关工具介绍 1、SSH连接工具: 本文所附连接工具,是用来远程访问linux内核的各种操作系统的工具。可以对linux服务器进行命令行的命令执行以及文件的上传下载和编辑等操作。非必须使用工具,在系统维护时,也可以使用其他的远程工具代替。 2、PL/SQL Developer连接工具: PL/SQL Developer是一个集成开发环境,专门面向Oracle数据库存储程序单元的开发工具。如今,有越来越多的商业逻辑和应用逻辑转向了Oracle Server,因此,PL/SQL编程也成了整个开发过程的一个重要组成部分。非必须使用工具,在系统维护时,也可以使用其他的工具代替。

电力系统维护操作手册

电力系统维护操作手册 一.高压开关柜运行和投运前的检查: 1.固定式开关柜投运前应检查下列内容: ●检查漆膜有无剥落,柜内是否清洁。 ●操动机构是否灵活,不应有卡住或操作力过大现象。 ●断路器、隔离开关等设备通断是否可靠正确。 ●仪表与互感器的接线、极性是否正确,计量是否准确。 ●母线连接是否良好,其支持绝缘子等是否安装牢固可靠。 ●继电保护整定值是否符合要求,自动装置动作是否正确可靠,表计及继 电器动作是否正确无误。 ●辅助触点的使用是否符合电气原理图的要求。 ●带电部分的相间距离、对地距离是否符合要求。 ●“五防”装置是否齐全、可靠。 ●保护接地系统是否符合要求。 ●二次回路选用的熔断器的熔丝规格是否正确。 ●机械闭锁应准确,柜内照明装置应齐全、完好,以便于巡视检查设备运 行状态。 2.固定式开关柜运行巡视项目: ●每天定时巡视检查。 ●遇有恶劣天气或配电装置异常时,进行特殊巡视。 ●内设备有无异常。 ●属颜色变化或观察示温蜡片有无受热融化,来判断母线和各种触点有无 过热现象。 ●检查注油设备有无渗油,油位、油色是否正确。 ●仪表、信号、指示灯等指示是否正确。 ●接地装置的连接线有无松脱和断线。 ●继电器及直流设备运行是否正常。 ●开关室内有无异常气味和声响。 ●通风、照明及安全防火装置是否正常。 ●断路器操作次数或跳闸次数是否达到了应检修的次数。 ●防误操作装置、机械闭锁装置有无异常。 3.手车式开关柜投运前检查内容: ●柜上装置的元件、零部件均应完好无损。 ●接地开关操作灵活,合、分位置正确无误。 ●各连接部分应紧固,螺丝连接部分应无脱牙及松动。 ●柜体可靠接地,门的开启与关闭应灵活。 ●二次插头完好无损,插接可靠。 ●柜顶主、支母线装配完好,母线之间的连接紧密可靠,接触良好。

软件系统运维手册(完整资料).doc

【最新整理,下载后即可编辑】 系统运维手册 1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 (3) 3.2 数据库概述 (3) 4、系统服务程序的详细说明 (4) 4.1系统服务程序的构成 (4)

4.2 系统服务程序的启动、关闭及维护管理 (4) 4.2.1 dhcp主服务 (4) 4.2.2 dhcp从服务 (5) 4.2.3 web管理模块 (5) 5、服务器硬件维护(略) (6) 6、windows 2003系统的日常维护 (6) 6.1 定期检查磁盘空间 (6) 6.2 维护系统注册表 (7) 6.3 定期备份系统注册表 ..................................................................... 7 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8) 7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 (12) 1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服

务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展,sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 服务器数量:4台,基本信息如下: 3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成 DHCP主程序:

ORACLE数据库日常维护与管理手册

全球眼?(MEGAEYES)网络图像管理系统2.0 ORACLE日常维护与管理手册 北京互信互通信息技术有限公司 2004-08-08

目录 全球眼?(MEGAEYES)网络图像管理系统2.0 (1) 1引言 (3) 1.1 目的 (3) 1.2 范围 (3) 1.3 参考资料 (3) 2日常维护与管理说明 (3) 2.1 运行环境 (3) 2.1.1硬件环境 (3) 2.1.2软件环境 (3) 2.2 数据库日常维护 (4) 2.2.1数据库初始设置 (4) 2.2.2每日工作内容 (5) 2.2.3每周工作内容 (6) 2.2.4每月工作内容 (7)

1引言 1.1目的 对于重要的商业系统来说,数据库系统的正常运行是保证商业应用平稳运行的关键。但是数据库在运行过程中可能会因为种种原因发生问题。这时,数据库的管理与日常维护工作将变得尤为重要。 为了指导数据库管理员做好日常维护工作,保证数据库系统的正常运行,特制定本文档。当然,数据库的日常维护是复杂和繁琐的,本文仅涉及一些常见的数据库日常维护的内容,在实际工作中,数据库管理员还需要做更多的工作。 1.2范围 本文档使用的人员:数据库维护管理人员和相关人员。 本文档涉及内容:oracle数据库的日常维护与管理解决方案。 1.3参考资料 中国电信网络视频监控技术(暂行)规范 2日常维护与管理说明 2.1运行环境 程序的运行环境包括硬件运行环境和软件运行环境。 2.1.1硬件环境 ◆CPU类型:Intel及其兼容系列CPU ◆内存容量:剩余内存要达2G以上 ◆硬盘容量:剩余硬盘容量要达1G以上 ◆网卡类型:100M网卡 2.1.2软件环境 ◆操作系统:RedHat Linux AS 3.0 ◆数据库:Oracle9i Database Release 2 (9.2.0.4.0) for Linux x86

tuxedo基本操作atmi介绍

系统自带authsvr服务进程,和两个子例程,tpsvrinit(),tpsvrdone。 authsvr:客户端调用tpinit进行认证时,由交易TPAPPAUTH回应。 服务端自动调用tpsvrinit,可以在函数中进行数据库连接和处理命令行参数。 结束时tpsvrdone也被自动调用,可以在函数中断开数据库连接。 这两个例程分别在进程开始时和进程将要结束时,被自动调用。 服务端编程指导: 交易内一次只能接收一个请求,发送一个响应。 交易必须以tpretrurn, tpforward结束。 或交易内使用了tpacall,在返回或转发前,要么等待回应,要么使用tpcancel。 tpreturn一旦被调用,控制权就转移到main函数,未进行显示收取的响应会被丢弃,此时客户端会收到错误。 客户端调用tpcall后,若服务端此时对应的tpreturn成功返回,客户端tpcall才能返回。 客户端调用tpacall后,若服务端此时对应的tpreturn成功返回,客户端tpgetrply才能返回。返回的数据,可由客户端从指针*data处取得。 tpforward调用时,程序逻辑应保证之前的处理都正确,响应被收到。被调用后,交易不再等待响应。main函数取得控制权。被请求的另一个交易负责响应原来的请求。不能将请求转发到自身。 tpreturn 的参数: rval: 表明交易是否成功执行。 rcode:是应用自定义的返回值。客户端可通过tpurcode获得tpreturn的rcode值,而不论交易是否成功。 data: 该缓冲区由客户端传递,服务端可以将回应数据写至此地址。也可以进行tprealloc.而不能tpfree. 服务端也可以自行tpalloc一个缓冲区,并返回给缓冲区,但需要自行若管理。如果发送的数据长度大于已分配的,tuxedo会自动扩大缓冲。 len: 用来指示响应缓冲的长。客户端可据此得知数据是否有变化。 如果客户端需要收到一个响应,而tpreturn自身处理时出错,这时tpcall或tpgetrply会失败,客户端应检查tperrno. 此时客户端的data缓冲区没有变化。若交易返回的消息不符客户端要求,则无法判断应用状态,此时原来的缓冲区保持不变。如果交易超时,响应数据不会被发送。 发布与取消交易名: 当一个服务进程被启动后,它会根据配置文件来向公告板上广告自己有交易名。这通常由buildserver命令执行时完成。 tpcall:

在线监测系统维护手册

在线监测系统维护手册

在线监测系统维护手册公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]

公用产品质量在线监测系统项目 系 统 维 护 手 册 山东煌通数码科技有限公司 版本:0.8 编制人:审核人:审批人: 日期:日期:日期: 版本修订历史记录: 目录 1. 引言.................................................... 1.1 编写目的: ............................................ 1.2 项目背景: ............................................ 1.3 定义: ................................................

1.4 参考资料: ............................................ 2. 任务概述................................................ 2.1 目标 .................................................. 2.2 用户类型 .............................................. 2.3 条件与限制 ............................................ 3. 总体部署结构描述........................................ 3.1 系统运行方法 .......................................... 3.2 日常检查项目 .......................................... 3.3 数据库维护 ............................................ 3.3.1 添加新的终端(非OPC的)............................. 3.3.2 添加新的OPC终端..................................... 3.4 数据核对 .............................................. 3.4.1 检查终端连接状态..................................... 3.4.2 检查实时数据......................................... 3.5 环境温度接入 .......................................... 3.5.1 修改配置文件接入数据................................. 3.5.2 环境温度通道连接状态检查............................. 3.5.3 环境温度实时数据检查................................. 4. 附录一 .....................................................

Oracle数据库日常维护手册

Oracle数据库日常维护手册 在Oracle数据库运行期间,DBA应该对数据库的运行日志及表空间的使用情况进行监控,及早发现数据库中存在的问题。 一、Oracle警告日志文件监控 Oracle在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行情况: ●数据库的启动、关闭,启动时的非缺省参数; ●数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因; ●对数据库进行的某些操作,如创建或删除表空间、增加数据文件; ●数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600) DBA应该定期检查日志文件,根据日志中发现的问题及时进行处理 问题处理 启动参数不对检查初始化参数文件 因为检查点操作或归档操作没有完成造成重做日志不能切换如果经常发生这样的情况,可以考虑增加重做日志文件组;想办法提高检查点或归档操作的效率; 有人未经授权删除了表空间检查数据库的安全问题,是否密码太简单;如有必要,撤消某些用户的系统权限 出现坏块检查是否是硬件问题(如磁盘本生有坏块),如果不是,检查是那个数据库对象出现了坏块,对这个对象进行重建 表空间不够增加数据文件到相应的表空间 出现ORA-600根据日志文件的内容查看相应的TRC文件,如果是Oracle的bug,要及时打上相应的补丁 二、数据库表空间使用情况监控(字典管理表空间)

数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间情况,以决定是否要对碎片进行整理或为表空间增加数据文件。 select tablespace_name, count(*) chunks , max(bytes/1024/1024) max_chunk from dba_free_space group by tablespace_name; 个人收集整理 上面的SQL列出了数据库中每个表空间的空闲块情况,如下所示: TABLESPACE_NAME CHUNKS MAX_CHUNK -------------------- ---------- ---------- INDX 1 57.9921875 RBS 3 490.992188 RMAN_TS 1 16.515625 SYSTEM 1 207.296875 TEMP 20 70.8046875 TOOLS 1 11.8359375 USERS 67 71.3671875个人收集整理 其中,CHUNKS列表示表空间中有多少可用的空闲块(每个空闲块是由一些连续的Oracle 数据块组成),如果这样的空闲块过多,比如平均到每个数据文件上超过了100个,那么该表空间的碎片状况就比较严重了,可以尝试用以下的SQL命令进行表空间相邻碎片的接合: alter tablespace 表空间名 coalesce; 然后再执行查看表空间碎片的SQL语句,看表空间的碎片有没有减少。如果没有效果,并且表空间的碎片已经严重影响到了数据库的运行,则考虑对该表空间进行重建。 MAX_CHUNK列的结果是表空间上最大的可用块大小,如果该表空间上的对象所需分配的空间(NEXT值)大于可用块的大小的话,就会提示ORA-1652、ORA-1653、ORA-1654的错误信息,DBA应该及时对表空间的空间进行扩充,以避免这些错误发生。 对表空间的扩充对表空间的数据文件大小进行扩展,或向表空间增加数据文件,具体操作见“存储管理”部份。 三、查看数据库的连接情况

监控系统维护和检修手册

监控系统维护和检修手册.概要 一.数字监控系统是一个软、硬件结合的复杂系统,系统的正常运行依赖于诸多因素,其中运行过程中的日常保养和维护是非常重要的,因此制定本技术支持手册,请迈兰德信息技术有限公司的技术支持人员、代理商、工程商以及用户遵照执行。 二.参考资料 1.用户使用说明书 2.系统安装说明书 3.产品检验标准 4.产品组装工艺守则 5.民用闭路监控电视系统工程技术规范 GB50198-94 6.涉外建设项目安保电视系统设计规范 DBJ08-16-99 三.常用工具 在技术支持过程中,应常备如下设备或工具: 1.万用表,用于检查工程及设备电气状况 2.十字螺丝刀 3.光驱或USB启动设备 4. Windows 2000 Professional安装盘、监控系统安装盘 5.电线 四.日常维护要点 应定期对系统进行常规检查,以保持系统正常运行的条件,尽早排除事故隐患。主要检查事项有: 1. 系统运行环境是否正常,包括电磁、温度、湿度、振动、灰尘等情况; 2. 系统硬件的运行情况,各机械运动部件的运转情况,包括电源风扇、CPU 风扇、硬盘等,系统各部分散热情况是否良好; 3. 系统设备的安装情况是否发生变动;

4. 积灰情况,主要检查过滤网是否积灰严重,如果允许应检查机器内部的积灰情况尤其是CPU风扇的积灰。应定期清洗过滤网; 5. 系统供电情况,计算机及外围设备供电电压是否正常、稳定,系统接地是否良好; 6. 外围线路是否可靠、信号电压是否正常; 7. 系统附件(如键盘、鼠标等)是否正常工作; 8. 软件的运行表现,是否有运行缓慢或其它异常表现,包括监视图像质量和录像质量; 9. Windows临时目录及各硬盘的使用情况; 10. 监控系统的运行日志中是否有重复出现的错误; 11. Windows的系统日志中是否有异常; 12. 对于有权限进入Windows操作系统的用户,应检查是否安装了新的软件,系统设置是否改变。 五.故障检修准则 1.在发生系统故障时,现场支持人员首先应按照日常维护要点进行检查,对异常情况予以记录,不能急于更换配件; 2.当发生故障(尤其是硬件故障)时,按照电气线路中的输入到输出关系,应从接近故障表现位置开始从后端向前端检查; 3.检修过程中,除非常必要,尽量避免带电操作。如确需带电操作,也应尽量减少上电范围; 4.当需要变动系统硬件组成或电气线路时,必须保证系统已经断电以防检修过程中的意外损坏,断电应按照先主机后外围的顺序; 5.故障点确定以后,应根据故障的不同和用户合同条款,可采取如下措施 △ 替换,主要是那些无法维修或无法现场维修的故障,例如板卡等,替换配件时应根据系统配置选择适当的配件; △ 现场维修,主要是那些可以现场维修的故障问题,例如线路问题、配件安装不当等 △ 带回维修,主要是那些无法维修或无法现场维修的故障,例如板卡等;

软件维护手册

软件维护手册 主要包括软件系统说明、程序模块说明、操作环境、支持软件的说明、维护过程的说明,便于软件的维护。 1 引言 1.1 编写目的 阐明编写手册的目的并指明读者对象。 1.2 项目背景 说明项目的提出者、开发者、用户和使用场所。 1.3 定义 列出报告中所用到的专门术语的定义和缩写词的原意。 1.4 参考资料 列出有关资料的作者、标题、编号、发表日期、出版单位或资料来源,及保密级别,可包括:用户操作手册;与本项目有关的其他文档。

2 系统说明 2.1 系统用途 说明系统具备的功能,输入和输出。 2.2 安全保密 说明系统安全保密方面的考虑。 2.3 总体说明 说明系统的总体功能,对系统、子系统和作业做出综合性的介绍,并用图表的方式给出系统主要部分的内部关系。 2.4 程序说明 说明系统中每一程序、分程序的细节和特性。 2.4.1 程序 1 的说明 ? 功能:说明程序的功能。 ? 方法:说明实现方法。 ? 输入:说明程序的输入、媒体、运行数据记录、运行开始时使用的输入数据的类型和存放单元、与程序初始化有关的入口要求。 ? 处理:处理特点和目的,如:用图表说明程序的运行的逻辑流程;程序主要转移条件;对程序的约束条件;程序结束时的出口要求;与下一个程序的通信与联结(运行、控制);由该程序产生并茶馆处理程序段使用的输出数据类型和存放单元;程序运行存储量、类型及存储位置等。 ? 输出:程序的输出。 ? 接口:本程序与本系统其他部分的接口。 ?表格:说明程序内部的各种表、项的细节和特性。对每张表的说明至少包括:表的

标识符;使用目的;使用此表的其他程序;逻辑划分,如块或部,不包括表项;表的基本结构;设计安排,包括表的控制信息。表目结构细节、使用中的特有性质及各表项的标识、位置、用途、类型、编码表示。 ? 特有的运行性质:说明在用户操作手册中没有提到的运行性质。 2.4.2 程序 2 的说明 与程序1 的说明相同。以后的其他各程序的说明相同。

小型机日常维护手册

IBM P750小型机 日常维护手册 一、服务器硬件运行状态检查 1.当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各硬盘的状态灯 (一排小灯,与各硬盘位置一一对应)应显示为绿色。 2.当服务器的状态灯出现橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘等。 如果有硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。 3.当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读 写操作,则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以1~3秒的频率有规律地、不停地闪烁。 如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。 二、HMC(硬件管理平台)管理与操作 HMC的两种访问途径: 1、在机房直接通过显示器和键盘进行管理维护等相关操作 2、通过web远程访问,登录HMC web管理界面,访问地址为: 1、登录HMC 浏览器访问连接HMC后,首页界面如下图所示。 点击下图所示链接,进入HMC验证登录界面。 输入用户名与口令,登录HMC。 用户名:hscroot 口令: 成功登录到HMC管理界面如下图所示。 2、注销HMC 在HMC console右上角有(hscroot | help | log off)链接,单击log off,会出现如下图所示注销界面:选择Log off,系统返回到HMC初始登录界面状态。

3、重启HMC 左边导航栏中选择HMC Management shut down or Restart,如下图所示,对HMC进行正常重启及关机操作。 请谨慎对HMC进行关机和重启操作! 4、状态栏功能 状态栏位于HMC左下角位置,如下图所示,负责监控并反映管理系统资源状态和HMC状态。单击每个图标状态可以列出详细状态,你可以查到更详细的帮助信息: :非法操作,如果任何被管理的主机执行了非法操作,这个图标将会变亮。 :黄灯警告, 如果任何被管理的主机有错误并有黄灯被点亮,这个图标也将会变亮 :报错日志:日志中有报错信息,这个图标将会变亮,此项与 :摘要,摘要中会将有用信息做统计并显示在工作栏中。 5、Service Management 导航栏中Service Management强大的管理功能给用户日常维护提供了更简单直观的界面,如下图所示, 但日平时最常用的子项是Manage Serviceable Events,如下图步骤可以对HMC所管理的设备进行日常错误及时直观的观察,以确保IBM小型机能正常工作,下图就是基本的操作方法图示: Service ManagementManage Serviceable Events 6、Service Plans-分区管理与操作 如何查看小型机资源配置: 如上图红色标注所示,选中所需查看主机(备注:请不要同时选中多台主机及多个分区),在下拉菜单中选中“Properties”,打开参数窗口,通过“Properties”可以查看主机运行状态,CPU,内存,I/0等重要硬件系统参数,如下图所示。 同理,在分区区域中先中每分区后的Properties选项,便可以直观方便的掌握分区状态和资源配置信息。 如何开关机及激活分区: 关机。 开机。

软件系统运维手册范本

系统运维手册

1、目的 (3) 2、适用围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 (3) 3.2 数据库概述 (3) 4、系统服务程序的详细说明 (3) 4.1系统服务程序的构成 (3) 4.2 系统服务程序的启动、关闭及维护管理 (4) 4.2.1 dhcp主服务 (4) 4.2.2 dhcp从服务 (5) 4.2.3 web管理模块 (5) 5、服务器硬件维护(略) (6) 6、windows 2003系统的日常维护 (6) 6.1 定期检查磁盘空间 (6) 6.2 维护系统注册表 (7) 6.3 定期备份系统注册表 (7) 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8) 7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 (12)

1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展, sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成

叱咤风云tuxedo企业级运维实战如何用好全局事务

第9章如何用好全局事务 9.1 什么是全局事务 全局事务是由资源管理器管理和协调的事务,可以跨越多个数据库和进程。事务管理器一般使用XA二阶段提交协议与“企业信息系统(EIS)”或数据库进行交互。 也就是当一个事务需要跨越多个数据库时,需要使用全局事务。例如,一个事务中可能更新几个不同的数据库。对数据库的操作发生在系统的各处,但必须全部被提交或回滚。此时,一个数据库对自己内部所做操作的提交不仅依赖本身操作是否成功,还要依赖与全局事务相关的其他数据库的操作是否成功,如果任一数据库的任一操作失败,则参与此事务的所有数据库所做的所有操作都必须回滚。 在一个涉及多个数据库的全局事务中,为保证全局事务的完整性,由交易中间件控制数据库做两阶段提交是必要的。但典型的两阶段提交,对数据库来说事务从开始到结束(提交或回滚)时间相对较长,在事务处理期间数据库使用的资源(如逻辑日志、各种锁),直到事务结束时才会释放。因此,使用典型的两阶段提交相对来说会占用更多的资源,如果网络条件不好,如低速网、网络颠簸频繁,情况会更为严重。 9.2 本地事务的优缺点 本地事务容易使用,但也有明显的缺点:它们不能用于多个事务性资源。例如,使用JDBC连接事务管理的代码不能用于全局的JTA事务中。另一个缺点是局部事务趋向于侵入式的编程模型。 9.3 Tuxedo对事务的控制与管理 当客户端连接到Tuxedo并创建一个全局事务时,TM(Transaction Manager,事务管理器)就会在公告板(BB)里面创建一个事务,由TMS向GTT(Global Transaction Table,全局事务表,里面包含当前事务的状态信息)中插入一个条目,然后分配一个GTRID(Global Transaction Identifier,全局事务标识符)来对该事务进行跟踪。 Tuxedo的事务管理由TMS完成,TMS把各种RM接入到Tuxedo中的分布式计算中来,并对RM中执行的事务进行跟踪和两阶段提交。 Tuxedo对事务的管理工作主要包括创建TMS、创建TLOG、运行时事务的监控和迁

系统管理员日常维护操作手册

系统管理员日常维护操作手册一、日常维护

一、服务器日常开关机器规定 (一)、开机步骤 1、开启服务器电源,系统将自动启动server2008操作系统,注意操作系统 启动过程中的系统提示信息,如果有异常的提示必须作好数据库操作启动的日志记录,并联系硬件维护人员。 2、待服务器操作系统正常启动后,使用administrator身份登陆到服务器, 启动自动过费程序。 3、服务器的任何异常提示,请及时联系硬件公司检查,个人及其他非专业人 员勿进行操作,以免造成数据丢失; 4、一般服务器至少20天左右要进行一次系统的关机动作。对于专用服务器 则不需要进行此操作。 (二)、系统运行过程中的数据库维护操作 5、每天必须做好数据库的日常备份工作,同时必须进行数据库至少存放在服 务器的2个地方,或者备份到U盘或其他电脑上,同时保存好备份数据。 6、拷贝数据库备份文件的U盘或其他存储工具,必须先在其他电脑杀毒后,在 到服务器使用,禁止其他未杀毒U盘在服务器使用,避免服务器中毒! (三)、服务器的关机操作步骤

7、点击开始菜单中关机按钮,进行正常关机,关机前先关闭应用程序,禁止 强制关机! 二、数据库备份原则说明 1、以上操作的意义为: 每天在服务器上执行数据备份以保证数据的安全性。防止硬件故障等突发原因引起的系统崩溃。 系统安全稳定性依赖于规范的操作。非正常操作(如:未正常关机,直接关电。强制关机)都会给系统带来损害。 2、建议备份方案: 每月盘点后:数据库备份并且将备份保存一年。 3、注意事项: 在使用过程中如果发生断电或硬件故障等意外情况而造成前后台死机,应先尝试开启服务器,如服务器不能开机,需及时联系硬件公司与蓝崎公司售后人员,大面积的死机可能由服务器故障引起,也可能由于网络(网线、HUB)等故障引起,出现问题时要注意区分,以便迅速有效的解决问题。

LINUX系统日常维护手册.doc

SUSE操作系统日常维护课程目标: ●掌握SUSE操作系统的日常维护 参考资料: ●用服专题光盘 i文档来源为:从网络收集整理.word版本可编辑.

目录 第1章基本操作.............................................................................................................. 错误!未定义书签。 1.1 系统登录 ............................................................................................................. 错误!未定义书签。 1.1.1 定义登录方法 ........................................................................................... 错误!未定义书签。 1.1.2 使用命令行进行登录 ............................................................................... 错误!未定义书签。 1.1.3 在命令行下退出登录状态 ....................................................................... 错误!未定义书签。 1.1.4 使用GUI(图形化用户界面)进行登录 ................................................ 错误!未定义书签。 1.1.5 虚拟终端 ................................................................................................... 错误!未定义书签。 1.1.6 关闭系统 ................................................................................................... 错误!未定义书签。 1.2 账户管理 ............................................................................................................. 错误!未定义书签。 1.2.1 创建和更改用户账户(useradd,passwd) ........................................... 错误!未定义书签。 1.2.2 删除用户账户 ........................................................................................... 错误!未定义书签。 1.2.3 切换用户(su)........................................................................................ 错误!未定义书签。 1.3 关闭系统 ............................................................................................................. 错误!未定义书签。 1.4 文件与目录 ......................................................................................................... 错误!未定义书签。 1.4.1 基本概念 ................................................................................................... 错误!未定义书签。 1.4.2 列出文件和目录(ls)............................................................................. 错误!未定义书签。 1.4.3 切换工作目录(cd)................................................................................ 错误!未定义书签。 1.4.4 查看当前目录(pwd) ............................................................................ 错误!未定义书签。 1.4.5 拷贝文件和目录(cp)............................................................................ 错误!未定义书签。 1.4.6 移动文件(mv) ...................................................................................... 错误!未定义书签。 1.4.7 文件改名(mv) ...................................................................................... 错误!未定义书签。 1.4.8 创建目录(mkdir).................................................................................. 错误!未定义书签。 1.4.9 删除文件和目录(rm,rmdir) .............................................................. 错误!未定义书签。 1.4.10 查看文本文件(cat,less,more)....................................................... 错误!未定义书签。 1.4.11 查找文件(find)................................................................................... 错误!未定义书签。 1.4.12 搜索字符串(grep) .............................................................................. 错误!未定义书签。 1.4.13 压缩和解压缩文件(gzip) .................................................................. 错误!未定义书签。 1.4.14 创建和提取归档文件(tar) ................................................................. 错误!未定义书签。 文档来源为:从网络收集整理.word版本可编辑.

第四章:TUXEDO应用系统的管理

第四章:TUXEDO应用系统的管理 4.1 TUXEDO提供的系统管理工具 当一个TUXEDO应用系统投入运行时,TUXEDO系统管理员要对它进行监控,管理,根据系统的运行情况做相应的参数调整。有时候还要动态修改配置,发布新的服务等等,TUXEDO提供了很丰富的管理工具和管理编程接口。可以很方便的完成这些管理任务。下面对管理工具和管理编程接口分别进行介绍。 TUXEDO提供以下管理工具 1.基于WEB的图形化管理工具:用普通的WEB 浏览器比如Netscape或Microsoft 的Explorer可以从Internet/Intranet 的任意一个节点来运行该图形界面管理工具。对 系统进行管理配置。 2. 基于字符界面的管理工具:TUXEDO提供TMADMIN,DMADMIN等命令行管理工具。 TUXEDO提供以下管理编程接口 1.MIB编程接口:TUXEDO 提供C 语言的管理API ,用户能够用此编写出适合自己特殊需 求的管理工具 2.通过SNMP与其他管理工具(HP OpenView 等)互联, TUXEDO 的关联产品 BEA MANAGER 通过网络管理协议 SNMP和TUXEDO 的管理信息库 MIB 可以把TUXEDO 对应用程序的管理集成到一般的网络、数据库系统管理工具中,比如 OpenView, NetView 等。 TUXEDO应用系统的管理任务 通过以上的管理工具,TUXEDO可以有效地管理消息流程和服务请求,启动和停止服务进程,根据变化的负荷复制服务进程,动态地广播、撤消服务进程中的服务。并且可以在客户不用退出执行的情况下,动态的增加新的服务器、服务器组、服务器以及服务。利用命令行或图形管理界面TUXEDO还可以动态的进行负载平衡,数据依赖路由、网络用户的管理、队列的管理、存取资源管理器以及系统的启动、重启和恢复。

相关文档
最新文档