运维手册_数据库_DataGuard日常运维手册
数据库日常运维手册

神州数码信息系统有限公司数据库日常运维手册神州数码信息系统有限公司2015/9/5日常运维操作手册主要针对ORACLE数据库管理员对数据库系统做定期监控:(1). 每天对ORACLE数据库的运行状态、日志文件、备份情况、数据库的空间使用情况、系统资源的使用情况进行检查,发现并解决问题。
并要有相关的人员负责每天查看,发现问题及时上报分析。
检查每天的数据库备份完成情况。
(2). 每周对数据库对象的空间扩展情况、数据的增长情况进行监控、对数据库做健康检查、对数据库对象的状态做检查。
(3). 每月对表和索引等进行Analyze、检查表空间碎片、寻找数据库性能调整的机会、进行数据库性能调整、提出下一步空间管理计划。
对ORACLE数据库状态进行一次全面检查(4)根据公司数据库的安全策略对ORACLE DB进行加固一.日维护过程1.1、确认所有的INSTANCE状态正常登陆到所有数据库或例程,检测ORACLE后台进程:$ps –ef|grep ora1.2、检查文件系统的使用(剩余空间)如果文件系统的剩余空间小于20%,需删除不用的文件以释放空间。
#df –k1.3、检查日志文件和trace文件记录检查相关的日志文件和trace文件中是否存在错误。
A、连接到每个需管理的系统使用’telnet’命令B、对每个数据库,进入到数据库的bdump目录,unix系统中BDUMP目录通常是$ORACLE_BASE/<SID>/bdump#$ORACLE_BASE/<SID>/bdumpC、使用 Unix ‘tail’命令来查看alert_<SID>.log文件#tail $ORACLE_BASE/<SID>/bdump/alert_<SID>.logD、如果发现任何新的ORA- 错误,记录并解决1.4、检查数据库当日备份的有效性。
对RMAN备份方式:1.5、检查数据文件的状态检查所有数据文件并记录状态不是“online”的数据文件,并做恢复。
(完整word版)数据仓库系统运维操作手册

数据仓库生产环境操作手册一.运维概述“数据仓库生产系统”的运行维护责任在于保障系统运行,运维方式主要是操作员通过工作机远程登陆到系统中的相关主机,对主机进行操作,包括automation调度系统、数据库、磁盘、软件环境、数据情况等,查看批出理的运行情况,一旦运行出现问题作相应的记录并通知相关的技术人员,作出相应的处理。
所有运维项目成员严格按照《数据仓库系统运维守则.doc》文档来进行运维检查工作,否则出现事故由值班人员和当日值班负责人承担事故责任。
二.运维内容1.每日维护1.1数据检查每日批处理运行前运行完成后都需要对源头的数据和生产出的数据进行检查,确保当日批处理程序正常从事生产。
检查工作在每日9:00-9:30之间完成,且必须在启动程序(批处理程序)前执行。
具体规定如下:1.1.1 转定长数据的检查每天上午9:00--9:45之间,运维值班人员进行这项工作具体执行步骤如下:1.在本地工作机上使用telnet远程登录工具登录到168.7.6.163服务器上,输入用户名sjtq,密码:cib2009edw,2.输入命令cd EDW/sh/log3.输入命令more yyyymmdd当天的日志,是否有错误信息,最后数据是否都上传结束。
4.以下错误属于正常情况:03:00:03 : 1.检查20091031标志文件失败~~~~~~~~~03:00:03 : 1.数据标志检查失败,等待5分钟(06001/dta_varied)正常等待情况5.检查点如下:1)每个大任务开始的初始化操作03:00:00 : ================ 0.环境变量设置完毕================2)数据装载,卸载,上传,整个模块处理结束的情况。
05:41:50 : ================ 2.装载Unl数据完毕================05:41:50 : ---------------- 2.开始装载BAK数据----------------05:41:50 : ================ 2.装载BAK数据完毕================05:41:50 : ---------------- 3.开始卸载fix数据----------------06:26:11 : ================ 3.卸载fix数据完毕================06:26:11 : ---------------- 4.开始向批量数据交换平台送fix数据----------------06001 send ok06001 send ok06002 send ok06002 send ok07002 send ok07002 send ok06027 send ok06027 send ok06:28:56 : ================ 4.向批量数据交换平台送fix数据完毕================06:28:58 : END6.查找是否存在“错误“,”出错“字样。
数据库运维说明书

数据库运维说明书数据库运维说明书1、概述1.1 目的1.2 范围1.3 定义2、数据库环境2.1 硬件要求2.2 软件要求2.3 网络要求3、数据库部署3.1 安装数据库软件3.2 配置数据库参数3.3 创建数据库实例3.4 设置访问权限3.5 数据库初始化3.6 数据库备份与恢复4、数据库运维4.1 监控数据库性能4.2 处理数据库故障4.3 数据库优化4.4 数据库迁移与升级 4.5 实施数据库安全策略4.6 数据库定期维护5、数据库备份与恢复策略 5.1 定义备份策略5.2 备份类型5.3 备份工具5.4 恢复数据库6、数据库性能优化6.1 监控数据库性能指标 6.2 优化查询语句6.3 索引优化6.4 内存与磁盘优化6.5 锁和并发控制7、数据库安全策略7.1 设定访问权限7.2 加密数据传输7.3 数据库审计7.4 定期更新和升级数据库软件7.5 数据备份与灾备8、数据库维护8.1 清理数据库日志8.2 数据库碎片整理8.3 统计信息收集8.4 数据库定期备份与归档8.5 监控和修复数据库文件法律名词及注释:1、数据库:指在计算机中存储、管理和维护电子数据的软件系统。
2、备份:将数据库中的数据和结构复制到另一个存储设备或位置,以防止数据丢失。
3、恢复:从备份中恢复数据库的过程,使数据库回到崩溃或故障之前的状态。
4、性能优化:通过改进数据库设计和调整参数来提高数据库性能。
5、安全策略:制定和实施保护数据库安全的策略和规定。
6、维护:定期检查和保养数据库以确保其正常运行和高效性能。
数据库维护工作手册

数据库维护工作手册(总21页) -本页仅作为预览文档封面,使用时请删除本页-数据库维护工作手册文档编号:文档名称:编写:审核:批准:批准日期:目录1概述.................................................................................................. 错误!未定义书签。
2数据库监控....................................................................................... 错误!未定义书签。
数据库监控工作内容....................................................................... 错误!未定义书签。
数据库监控工作步骤....................................................................... 错误!未定义书签。
查看数据库日志....................................................................... 错误!未定义书签。
检查是否有失效的数据库对象............................................... 错误!未定义书签。
查看数据库剩余空间............................................................... 错误!未定义书签。
重点表检查............................................................................... 错误!未定义书签。
查看数据库是否正常............................................................... 错误!未定义书签。
数据库日常运维操作手册

数据库日常运维操作手册日常运维操作手册主要针对ORACLE数据库管理员对数据库系统做定期监控:(1). 每天对ORACLE数据库的运行状态、日志文件、备份情况、数据库的空间使用情况、系统资源的使用情况进行检查,发现并解决问题。
并要有相关的人员负责每天查看,发现问题及时上报分析。
检查每天的数据库备份完成情况。
(2). 每周对数据库对象的空间扩展情况、数据的增长情况进行监控、对数据库做健康检查、对数据库对象的状态做检查。
(3). 每月对表和索引等进行Analyze、检查表空间碎片、寻找数据库性能调整的机会、进行数据库性能调整、提出下一步空间管理计划。
对ORACLE数据库状态进行一次全面检查(4)根据贵公司数据库的安全策略对ORACLE DB进行加固一.日维护过程1.1、确认所有的INSTANCE状态正常登陆到所有数据库或例程,检测ORACLE后台进程:$ps –ef|grep ora1.2、检查文件系统的使用(剩余空间)如果文件系统的剩余空间小于20%,需删除不用的文件以释放空间。
#df –k1.3、检查日志文件和trace文件记录检查相关的日志文件和trace文件中是否存在错误。
A、连接到每个需管理的系统使用’telnet’命令B、对每个数据库,进入到数据库的bdump目录,unix系统中BDUMP目录通常是$ORACLE_BASE/<SID>/bdump#$ORACLE_BASE/<SID>/bdumpC、使用Unix ‘tail’命令来查看alert_<SID>.log文件#tail $ORACLE_BASE/<SID>/bdump/alert_<SID>.logD、如果发现任何新的ORA- 错误,记录并解决1.4、检查数据库当日备份的有效性。
对RMAN备份方式:1.5、检查数据文件的状态检查所有数据文件并记录状态不是“online”的数据文件,并做恢复。
数据中心机房运行维护手册

数据中心机房运行维护手册一、前言数据中心机房是企业信息化建设的核心基础设施,承担着数据存储、处理、传输等重要任务。
为了确保机房的稳定运行,提高设备的可靠性和可用性,延长设备的使用寿命,保障业务的连续性,特编写本运行维护手册。
二、机房环境要求(一)温度与湿度机房内应保持适宜的温度和湿度。
理想的温度范围通常在 20℃至25℃之间,相对湿度应控制在 40%至 60%之间。
温度过高或过低,湿度过大或过小,都可能影响设备的正常运行。
(二)洁净度机房内应保持清洁,减少灰尘的积聚。
定期清洁地面、机柜、设备表面等,防止灰尘进入设备内部,影响散热和电气性能。
(三)通风与空调系统确保通风系统正常运行,保证机房内空气流通。
空调系统应具备制冷、制热、除湿等功能,并定期进行维护和保养。
三、电力系统维护定期检查 UPS(不间断电源)的工作状态,包括电池电量、充电情况、输出电压等。
按照规定的时间间隔对电池进行充放电测试,及时更换老化的电池。
(二)配电柜检查配电柜内的开关、刀闸、接触器等设备的连接是否紧固,有无发热、打火等异常现象。
定期对配电柜进行清洁,防止灰尘积聚导致短路。
(三)电力线路检查电力线路的绝缘情况,有无破损、老化等问题。
确保线路的敷设符合规范,避免受到外力的破坏。
四、服务器与网络设备维护(一)服务器定期检查服务器的硬件状态,如 CPU、内存、硬盘等的工作情况。
安装系统补丁和更新软件,进行病毒查杀和防火墙设置,保障服务器的安全性。
(二)网络设备对路由器、交换机等网络设备进行配置备份,检查端口状态、流量情况。
及时清理设备的缓存,升级设备的固件。
五、存储设备维护定期检查磁带库的机械部件,如磁带驱动器、机械手等的工作情况。
对磁带进行定期的读写测试,确保数据的可恢复性。
(二)磁盘阵列监控磁盘阵列的磁盘状态,及时发现并更换故障磁盘。
优化阵列的配置,提高存储性能和数据安全性。
六、安全管理(一)门禁系统确保门禁系统正常运行,只有授权人员能够进入机房。
运行维护手册

文档类型:系统运行维护手册XXXX局XXXX平台项目运行维护手册第1页/总11页1.手册说明本手册为XXXXXXXX平台运行维护手册,目前维护方式为当前实际硬件环境。
系统地址(截止目前)为:XXXXXX2.维护操作XXXXXXXX平台在试运行阶段因断电、网络中断等不可预测原因情况下出现系统停止、甚至崩溃的情况;总集方数据环境出现异常,无法获取实时数据导致等原因出现无法查看相应产品的情况,可如下处理。
主要处理原则如下:(1)如出现系统无法访问,请参照“网络访问异常的处理”一节进行处理(2)如出现产品缺失,请先参照“XXXXX数据环境异常造成缺图的处理”进行处理;如仍未解决,请先按照“定常产品调用子系统异常的处理”和“定时出图服务出现异常的处理”进行处理,再按照“XXXXX数据环境异常造成缺图的处理”进行补图。
2.1.XXXXX数据环境异常或其他原因造成的处理先打开IE浏览器,输入地址:XXXXXXXXXX若能成功打开如下图所示:则说明后台服务正常运行。
请按下面方式进行补图;若不能正常打开,请参考“XXXX子系统异常的处理”重新启动后台服务。
图2-1后台定时出图管理界面能够正常打开之后,按照以下步骤进行处理:第2页/总11页(1)登陆BS系统打开后台XXXXXXXXX如下图:图2-2补图处理界面(2)本窗口共分为“默认时间规则”,“自定义时间段规则”和“补数据”三个模块。
(3)XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXx2.2.XXXXXX子系统异常的处理定常产品调用子系统异常多由于网络异常、操作系统异常等原因,主要恢复操作方式如下:步骤1:在桌面上打开XSehll软件(),界面如下图所示。
选择daopian,点击Connect。
如提示输入密码:输入super即可。
(或关掉sessions窗口,直接输入ssh ***********.31.107,回车后输入密码super 来替代第一步)。
数据仓库系统运维操作手册

数据仓库生产环境操作手册一.运维概述“数据仓库生产系统”的运行维护责任在于保障系统运行,运维方式主要是操作员通过工作机远程登陆到系统中的相关主机,对主机进行操作,包括automation调度系统、数据库、磁盘、软件环境、数据情况等,查看批出理的运行情况,一旦运行出现问题作相应的记录并通知相关的技术人员,作出相应的处理。
所有运维项目成员严格按照《数据仓库系统运维守则.doc》文档来进行运维检查工作,否则出现事故由值班人员和当日值班负责人承担事故责任。
二.运维内容1.每日维护1.1数据检查每日批处理运行前运行完成后都需要对源头的数据和生产出的数据进行检查,确保当日批处理程序正常从事生产。
检查工作在每日9:00-9:30之间完成,且必须在启动程序(批处理程序)前执行。
具体规定如下:1.1.1 转定长数据的检查每天上午9:00--9:45之间,运维值班人员进行这项工作具体执行步骤如下:1.在本地工作机上使用telnet远程登录工具登录到168.7.6.163服务器上,输入用户名sjtq,密码:cib2009edw,2.输入命令 cd EDW/sh/log3.输入命令 more yyyymmdd当天的日志,是否有错误信息,最后数据是否都上传结束。
4.以下错误属于正常情况:03:00:03 : 1.检查20091031标志文件失败~~~~~~~~~03:00:03 : 1.数据标志检查失败,等待5分钟(06001/dta_varied)正常等待情况5.检查点如下:1)每个大任务开始的初始化操作03:00:00 : ================ 0.环境变量设置完毕 ================ 2)数据装载,卸载,上传,整个模块处理结束的情况。
05:41:50 : ================ 2.装载Unl数据完毕 ================05:41:50 : ---------------- 2.开始装载BAK数据----------------05:41:50 : ================ 2.装载BAK数据完毕 ================05:41:50 : ---------------- 3.开始卸载fix数据----------------06:26:11 : ================ 3.卸载fix数据完毕================06:26:11 : ---------------- 4.开始向批量数据交换平台送fix数据----------------06001 send ok06001 send ok06002 send ok06002 send ok07002 send ok07002 send ok06027 send ok06027 send ok06:28:56 : ================ 4.向批量数据交换平台送fix数据完毕================06:28:58 : END6.查找是否存在“错误“,”出错“字样。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文档标识文件状态:[] 草稿[√] 正式发布[ ] 正在修改Oracle RAC+DataGuard运维手册版本:1.0.0编制周光晖2015年01月20审核批准年月日生效日期:年月日修订历史记录日期版本修订说明作者目录第一章引言 (3)**. 编写目的 (3)**. 定义、首字母缩写词和缩略语 (4)第二章......................................................................................................... D ATA G UARD状态查询4**. 检查主备库的D ATA G UARD状态信息 (4)**. 检查进程 (4)**. 检查归档状态 (4)**. 检查最后应用的日志S EQUENCE (5)**. 查看是否使用实时应用 (5)**. 检查GAP (5)**. 检查保护模式 (5)**. 相关视图 (6)第三章................................................................................................................... SWITCHOVER 6**. 确认主库状态是否支持切换操作 (6)**. 执行主库转换 (7)**. 关闭并MOUNT新备库 (7)**. 确认老备库状态 (7)**. 切换目标备库为主库 (7)**. 打开新主库 (8)**. 启动新备库的日志应用 (8)**. 开启新备库的ADG (8)第一章引言1.1. 编写目的本文档描述了Oracle 11gR2 RAC+ADG操作手册。
包含RAC DOWN机测试,日常查询状态,启停RAC等指令同时包含oracle 11g R2 ACTIVE DATAGUARD 的日常维护指令。
1.2. 定义、首字母缩写词和缩略语第二章DataGuard状态查询2.1. 检查主备库的DataGuard状态信息SQL> Alter session set nls_date_format ='‘YYYY-MM-DD HH24:MISS';SQL> SELECT MESSAGE FROM V$DATAGUARD_STATUS;使用V$DATAGUARD_STATUS结合alert日志信息,判断DataGuard使用过程中的错误信息,查看当前日志应用的状态。
可以用ls -lt|more命令来查看主库最新归档日志文件的序号,对比备库当前归档日志应用状态了解备库目前和主库日志文件之间的差异情况。
2.2. 检查进程在主库:SELECT PROCESS, CLIENT_PROCESS, SEQUENCE#, STATUS FROM V$MANAGED_STANDBY;在备库:SELECT PROCESS, CLIENT_PROCESS, SEQUENCE#, STATUS FROM V$MANAGED_STANDBY; PROCESS CLIENT_P SEQUENCE# STATUS--------- -------- ---------- ------------ARCH ARCH 0 CONNECTEDARCH ARCH 0 CONNECTEDARCH ARCH 38 CLOSINGARCH ARCH 8 CLOSINGRFS ARCH 0 IDLEMRP0 N/A 39 APPLYING_LOGRFS LGWR 39 IDLERFS UNKNOWN0 IDLERFS UNKNOWN0 IDLEMRP是应用日志,ARCH是归档进程,RFS是接收重做日志的进程。
主库进程需要确认有ARCH进程,备库需要确认存在MRP、ARCH、RFS进程,如果不存在则表示dataguard工作不正常,查询V$DATAGUARD_STATUS视图和alert日志需找具体的错误信息。
2.3. 检查归档状态在主库运行查询:SELECT DEST_ID,DEST_NAME,STATUS from V$ARCHIVE_DEST_STATUS;判断primary库的两个归档路径是否为valid状态在备库执行查询:set linesize 1000col NAMEfor a60col CREATOR for a10col SEQUENCE# for a10col APPLIED for a10col COMPLETION_TIME for a15SELECT NAME, CREATOR,SEQUENCE#, APPLIED, COMPLETION_TIME FROMV$ARCHIVED_LOG;判断当前有哪些未APPLY,可通过操作系统命令ls查看对应目录下未APPLY的日志是否已经传输到standby端2.4. 检查最后应用的日志SequenceSQL> SELECT THREAD#, MAX(SEQUENCE#) FROM V$LOG_HISTORY GROUP BY THREAD#;2.5. 查看是否使用实时应用在备库执行如下查询:SQL>select recovery_mode from v$archive_dest_status where recovery_mode !='IDLE'; RECOVERY_MODE-----------------------MANAGED REAL TIME APPLY2.6. 检查GAP在备库运行:SQL> SELECT * FROM V$ARCHIVE_GAP;2.7. 检查保护模式set linesize 1000;col DATABASE_ROLE for a25;col INSTANCEfor a25;col OPEN_MODE for a25;col PROTECTION_MODE for a25;col PROTECTION_LEVEL for a25;col SWITCHOVER_STATUS for a25;SELECT DATABASE_ROLE, DB_UNIQUE_NAME INSTANCE, OPEN_MODE,PROTECTION_MODE,PROTECTION_LEVEL,SWITCHOVER_STATUS FROM V$DATABASE;确认主库状态为to standby或者为sessions active、保护模式应该MAXIMUM AVAILABILITY、角色为PRIMARY,如果状态异常,请按《检查DataGauard状态》章节操作检查DataGuard信息--在备库查询时通常为not allowed 或者sessions active,角色为PHYSICAL STANDBY;当primary 主库改为standby角色后,那么其中的任意一个standby库都可能被切换为primary角色,这时需要确认standby库的状态为to primary2.8. 相关视图V$ARCHIVE_DESTV$ARCHIVE_DEST_STATUSV$ARCHIVE_GAPV$ARCHIVED_LOGV$DATABASEV$DATAFILEV$DATAGUARD_STATUSV$LOGV$LOGFILEV$LOG_HISTORYV$MANAGED_STANDBY (Physical Standby Databases Only)V$STANDBY_LOGSWITCHOVER第三章DataGuard启动关闭3.1. 启动(for 10g)在主库端:#su - oracle$lsnrctl start$sqlplus / as sysdbaSQL>startup在备库端:#su - oracle$sqlplus / as sysdbaSQL>startup mountSQL>ALTER DATABASE RECOVER MANAGED STANDBY DATABASE NODELAY PARALLEL 2 USING CURRENT LOGFILE DISCONNECT FROM SESSION;SQL> select process,status from v$managed_standby;PROCESS STATUS--------- ------------ARCH CLOSINGARCH CONNECTEDRFS IDLERFS IDLEMRP0 APPLYING_LOG3.2. 关闭(for 10g)在主库端:#su - oracle$sqlplus / as sysdbaSQL>shutdown immediate在备库端#su - oracle$sqlplus / as sysdbaSQL>ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;SQL>shutdown immediate3.3. 启动(for 11g)在主库端:#su - oracle$lsnrctl start$sqlplus / as sysdbaSQL>startup在备库端:#su - oracle$sqlplus / as sysdbaSQL>startupSQL>ALTER DATABASE RECOVER MANAGED STANDBY DATABASE NODELAY PARALLEL 2 USING CURRENT LOGFILE DISCONNECT FROM SESSION;SQL> select process,status from v$managed_standby;PROCESS STATUS--------- ------------ARCH CLOSINGARCH CONNECTEDRFS IDLERFS IDLEMRP0 APPLYING_LOG3.4. 关闭(for 11g)在主库端:#su - oracle$sqlplus / as sysdbaSQL>shutdown immediate在备库端#su - oracle$sqlplus / as sysdbaSQL>ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;SQL>shutdown immediate第四章SWITCHOVER4.1. 主库4.1.1.如果主库是RAC,先做4.1.2。
如果是单机,直接做4.1.34.1.2.停掉节点2实例ssh 节点2#su - oracle$sqlplus / as sysdbashutdown immediate4.1.3.在节点1操作:#su - oracle$sqlplus / as sysdbaselect SWITCHOVER_STATUS,DATABASE_ROLE,PROTECTION_MODE FROM v$database;alter **mit to switchover to physical standby with session shutdown;shutdown immediatesqlplus / as sysdbastartup nomountalter database mount standby database;alter system set log_archive_dest_state_2=defer;alter system set aq_tm_processes=0 scope=memory;alter database recover managed standby database disconnect;4.2. 备库#su - oracle$sqlplus / as sysdbaselect SWITCHOVER_STATUS,DATABASE_ROLE,PROTECTION_MODE FROM v$database;如果SWITCHOVER_STATUS的值为TO Primary或SESSIONS ACTIVE ,执行脚本ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL; alter **mit to switchover to primary with session shutdown;shutdown immediatesqlplus / as sysdbastartup mountalter system set log_archive_dest_state_2=enable;alter system set aq_tm_processes=0 scope=memory;alter database open;alter database tempfile '/u01/app/oracle/oradata/jygdb/temp01.dbf' resize 1000M; ---第一次主切备要做,以后切换不用4.3. 新备库#su - oracle$sqlplus / as sysdbaALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL; ALTER DATABASE RECOVER MANAGED STANDBY DATABASE NODELAY PARALLEL 2 USING CURRENT LOGFILE DISCONNECT FROM SESSION;第五章FAILOVER紧急状态下直接做5.3步骤5.1. 确认主库状态A、通常,只要主库所在主机可用,则数据库一直在运行,不必要进行主备切换。