数据库巡检方案
数据库巡检报告

数据库巡检报告1. 引言数据库是一个关键的组件,用于存储和管理数据,因此对数据库进行定期巡检是保持系统正常运行和提高性能的重要措施。
本文档旨在提供一份数据库巡检报告,以便评估数据库的健康状态,并提出相应的建议和改进建议。
2. 巡检概要在进行数据库巡检之前,首先需要明确巡检的目标和范围。
以下是对数据库巡检的基本要求和目标:•确保数据库的可用性和可靠性•评估数据库的性能和效率•检测和预防潜在的安全隐患•确保数据库的合规性和数据质量3. 巡检内容根据巡检的目标和范围,以下是对数据库进行巡检的主要内容:3.1 数据库配置在巡检过程中,需要检查数据库的配置是否符合最佳实践。
主要检查项包括但不限于:•数据库参数设置是否合理•缓冲池和日志文件的配置情况•内存和磁盘空间的分配情况3.2 数据库性能性能是评估数据库健康状态的重要指标之一。
在巡检期间,将通过以下方式来评估数据库的性能:•监控和分析数据库的负载情况•检查数据库的响应时间•分析数据库的查询语句性能3.3 数据库安全数据库安全是数据库巡检不可忽视的重要方面。
在巡检过程中,将评估以下数据库的安全性:•用户权限和访问控制•加密和脱敏技术的使用情况•审计和日志记录的设置3.4 数据库备份和恢复数据库备份和恢复是确保数据可用性和可靠性的关键措施。
在巡检期间,将评估以下备份和恢复策略的情况:•备份策略和计划•备份文件的完整性和可恢复性•恢复过程和测试情况4. 巡检结果基于对数据库的巡检,以下是针对巡检内容的主要问题和建议:4.1 数据库配置•参数设置建议进行优化,以提高性能和效率•增加缓冲池的大小,以减少磁盘IO•考虑对磁盘空间进行重新分配,以避免磁盘溢出4.2 数据库性能•查询语句的性能需要优化,可以考虑使用索引和优化查询语句•监控和分析负载情况,在需要时进行硬件升级4.3 数据库安全•用户权限和访问控制需要进行审查和调整,以确保最小权限原则•加密和脱敏技术需要进一步应用,保护敏感数据•审计和日志记录的设置需要增强,以便追踪和调查安全事件4.4 数据库备份和恢复•备份策略和计划需要进行优化,以确保数据可靠性•定期测试备份的可恢复性,并修复发现的问题•考虑进行灾难恢复演练,以验证备份和恢复过程5. 改进建议基于巡检结果,以下是改进建议的主要方案:•定期进行数据库的巡检和优化,以保持数据库的健康状态•更新和应用数据库最新的安全补丁和升级•与开发团队合作,优化查询语句和数据库设计•建立监控和警报系统,及时发现和解决问题•定期培训和提高数据库管理员的技术水平6. 结论数据库巡检是确保数据库正常运行和性能优化的关键步骤。
数据库巡检报告

数据库巡检报告一、概述根据公司的安全政策要求,对于公司的数据库进行了定期的巡检。
本次巡检是为了保障数据库的可用性、稳定性和安全性。
本次巡检主要是从数据库的基础设施、性能优化、安全合规等方面进行了评估和检查。
二、巡检目的1. 评估和检查数据库的性能,并发现潜在问题和风险。
2. 发现数据库基础设施存在的问题,为下一步的改进提供建议。
3. 检查数据库的安全合规问题,确保数据库不受到未知攻击和安全威胁。
三、巡检内容1. 基础设施评估对数据库服务器的硬件、软件环境进行评估和检查,包括服务器的操作系统、数据库软件版本、网络设置、存储设备等内容。
针对存在的问题,提出修复建议和改进方案,以保障数据库的稳定性和可用性。
2. 性能评估针对数据库的读写能力、响应时间、吞吐量等方面进行评估和检查。
通过对数据库的性能指标进行分析和识别,找出性能不足的区域,给出性能优化的建议。
3. 安全评估对数据库的安全合规性进行评估和检查,包括访问权限、备份和容灾策略、加密设施等方面。
本次巡检发现存在一些潜在的安全风险,建议加强数据库的访问控制、密钥管理等安全措施,以提高数据库的安全性。
四、建议和总结1. 加强数据库的备份和容灾策略,确保数据库数据的安全性和可靠性。
2. 建议实施数据库的定期维护和备份工作,保障数据库的稳定性和可用性。
3. 建议采用数据加密技术,保护用户的敏感数据,防止数据泄露和黑客攻击。
4. 建议加强访问控制管理,限制非授权用户的操作权限,保护数据库的安全性。
五、结论本次巡检对公司的数据库进行了综合评估和检查,发现存在一些问题和潜在风险。
建议公司采取相应的措施,实施数据库的维护和优化工作,以提高数据库的性能和安全性。
数据库巡检

1 日常巡检1.1 数据库巡检为了保证oracle数据库稳定,高效的运行,每个季度初需要对oracle数据库进行健康检查。
以确定数据库是否存在故障及性能问题。
对于异常状况,上报,进一步诊断、分析,及时解决。
巡检工作包括以下细则:●ALERT文件(alertSID.log)是否出现错误信息●top10等待事件●数据库大小●表空间使用情况●内存配置●三个Top10 SQL●内存命中率●归档方式及备份情况1.1.1 巡检脚本1.1.1.1 AlertSID.log文件位置:1.1.1.2 归档方式及备份情况(1)查看是否为归档方式:(2)说明该数据库备份情况,是否有备份策略。
1.1.1.3 top10等待事件:◆不同的版本,事件的多少不同✧Oracle9iOracle10g1.1.1.4 数据库大小:1.1.1.5 表空间使用情况:1.1.2 Top10segment◆查找系统数据量最大的10个段1.1.2.1 内存配置✧oracle9i:✧Oracle10g:1.1.2.2 三个Top10 SQL1.1.2.3 命中率1.1.2.4 死锁死锁查询:SELECT /*+ rule */ername,decode(l.type, 'TM', 'TABLE LOCK', 'TX', 'ROW LOCK', NULL) LOCK_LEVEL, o.owner,o.object_name,o.object_type,s.sid,s.serial#,s.terminal,s.machine,s.program,s.osuserFROM v$session s, v$lock l, dba_objects oWHERE l.sid = s.sidAND l.id1 = o.object_id(+)AND ername is NOT NULL解锁:杀死该session:alter system kill session 'sid,serial#'。
数据库巡检报告(二)(2024)

引言概述:正文内容:一、性能监控1.定期检查数据库性能指标,如CPU使用率、内存使用率、磁盘空间等。
2.对数据库进行统计分析,发现潜在的性能问题。
3.根据巡检结果,优化数据库的配置参数,提高系统性能。
4.检查慢查询日志,发现慢查询语句,并进行性能优化。
5.监控数据库的并发连接数,防止因连接数过高导致系统瘫痪。
二、安全漏洞1.检查数据库的开放端口,确保只开放必需的端口,并限制访问权限。
2.检查数据库登录账号的安全设置,如密码复杂度、登录失败锁定策略等。
3.对数据库进行漏洞扫描,发现可能的安全隐患,并及时修复。
4.定期进行数据库安全策略的审查和更新。
5.优化数据库的权限管理,确保不同用户只能访问其需要的数据。
三、备份和恢复1.检查数据库备份策略的设置,包括全量备份、增量备份等。
2.定期验证数据库备份的完整性,以确保备份可用。
3.检查备份恢复策略的设置,包括恢复时间目标和恢复点目标。
4.对备份和恢复过程进行测试,以保证恢复的可行性。
5.对数据库的冷备份和热备份进行备选和选择。
四、空间管理1.检查数据库的空间使用情况,包括数据文件、日志文件等。
2.优化数据库的表结构,减少空间的使用。
3.定期清理无用的表或数据,释放空间。
4.对数据库进行分区管理,提高数据库的查询效率。
5.监控数据库文件的增长情况,及时调整数据库的空间大小。
五、版本更新1.定期检查数据库的版本,及时进行升级和补丁的安装。
2.了解数据库版本更新的特性和改进,以决定是否进行升级。
3.对数据库升级进行测试,以确保升级的稳定性和兼容性。
4.优化升级过程,减少系统的停机时间。
5.监控数据库升级后的运行情况,及时解决可能出现的问题。
总结:通过对数据库的性能监控、安全漏洞、备份和恢复、空间管理以及版本更新的巡检,可以保证数据库的高效稳定运行。
巡检应该定期进行,以及时发现和解决潜在的问题,并根据巡检结果进行调整和优化。
同时,数据库管理员应该定期更新维护手册,记录巡检的详细过程和结果,以便未来参考和分析。
MySQL数据库巡检系统的设计与应用 - 技术团队

对接先知平台
通过对接先知平台,积极推动RD治理隐患数量超过5000个 DBA上报的隐患风险得 到RD的认可
提升准确率
严格测试和校验每一个巡检上线前 DBA上报隐患在准确率、反馈率、转化率指标 上处于较高水平 用户反馈准确且需要处理的风险事件得到关注
未来规划
提高自动化能力,完善CI和审计 加强运营能力,细化隐患的重要程度,辅助治理决策 探索隐患自动修复
数据库巡检与治理
目录
一、MySQL数据库巡检系统 二、MySQL数据库巡检系统架构
MySQL数据库巡检系统
一、背景 为了保障数据库的稳定运行 核心功能组件必不可少
数据库巡检的重要性
数据库巡检是运维保障体系的关键环节 帮助发现数据库隐患,提前治理
巡检系统的问题
老巡检方案存在的问题: - 巡检定时任务依赖中控机,存在单点问题 - 巡检结果分散在不同的库表,无法进行统计 - 巡检脚本缺乏统一开发标准,成功率有限 - 每个巡检项需要独立编写接口和前端展示 - 隐患处理速度较慢,需要DBA主动干预
二、设计原则
巡检系统的设计原则包括: - 稳定性:巡检工具本身必须稳定 - 高效性:降低用户成本,提L数据库巡检系统架构
执行层
巡检执行环境由多台执行机组成,部署巡检任务脚本 任务调度使用Crane分布式定时任务系统,解决单点问题 巡检目标包括生产数据库、高可用组件、中间件等周边产品
存储层
巡检数据库用于保存巡检相关数据,支持入库功能 巡检脚本Git仓库用于管理巡检脚本
应用层 - 集成到数据库运维平台
提供隐患明细展示页面,标注隐患出现的天数 配置巡检展示需制定隐患解决方案
应用层 - 隐患运营后台
运营报表帮助管理者掌握隐患治理进展 催办功能用于督促DBA处理隐患
数据库服务巡检操作说明

数据库服务巡检操作说明一、检查cpu使用率1、Cpu正常范围<=70%2、Cpu的检查1,分析关键应用程序的性能2,定位问题的根源是在客户端、服务器、应用程序还是网络3,哪些应用程序占用大量带宽3、是Windows任务管理器,可以通过同时按Ctrl+Alt+Delete三个按键调出如图二、检查数据库开启情况1、数据库服务为已启动2、数据库服务的检查主要是确定服务正常启动,分析数据库无法连接等问题3、操作1.我的电脑--右键—管理如图:2.服务和应用程序---服务打开找到oraclesevice如图:查看OoracleService的状态是否是已启动状态三、用hostmonitor监控RMA进程和hostmonitor日志的查看1、Rma进程为正常运行,日志查看无异常2、数据库服务的检查主要是确定服务正常运行,时时监控进行的开关状态,报错日志的分析3、操作详细操作看《Hostmonitor操作手册》四、检查系统时间1、系统时间为当前时间2、数据库服务的检查主要是确定系统的时间匹配3、操作1.系统开始----运行-----cmd2.在命令输入框输入date3.在命令输入框输入time五、查看表空间使用情况1、数据库表空间的剩余空间是否足够2、数据库服务的检查主要是确定数据库空间足够3、操作1.系统开始----运行----cmd2.在命令输入框sqlplus username/password@oraclename 连接数据库如图:3.再在命令输入框输入select A.tablespace_name as "tablespace name",A.total_size as "total size",round(B.total_free_size,1) as "total free size",round((A.total_size - B.total_free_size),2) as "used size",to_char(100*B.total_free_size/A.total_size,'99.99')||'%' as "percent free" from (select tablespace_name,sum(bytes)/1024/1024 as total_size from dba_data_files group by tablespace_name) A,(select tablespace_name,sum(bytes/1024/1024) as total_free_size from dba_free_space group by tablespace_name) B where A.tablespace_name = B.tablespace_name;结果如图:六、查看表空间的状态1、数据库表空间状态为ONLINE是正常2、数据库服务的检查主要是确定数据库表空间的状态3、操作1.系统开始----运行----cmd2.在命令输入框sqlplus username/password@oraclename 连接数据库如图‘五‘一样3.再在命令输入框输入select tablespace_name,status from dba_tablespaces; 查询结果如图:七、查看日志切换间隔1、数据库日志切换间隔在3-5分钟为最好2、数据库服务的检查主要是确定数据库表空间的状态3、操作1.系统开始----运行----cmd2.在命令输入框sqlplus username/password@oraclename 连接数据库如图‘五‘一样3.再在命令输入框输入SELECTB.RECID,B.FIRST_TIME,A.FIRST_TIME,ROUND((A.FIRST_TIME-B.FIRST_TIME)*24*60,2) MINATESFROM V$LOG_HISTORY A,V$LOG_HISTORY BWHERE A.RECID=B.RECID +1 AND A.FIRST_TIME>SYSDATE - 20 ANDROUND((A.FIRST_TIME-B.FIRST_TIME)*24*60,2)<30ORDER BY A.FIRST_TIME DESC;查询结果如图:八、数据库缓冲区命中率1、正常值是大于或等于95%,如果发现该值低于90%就是不正常的2、数据库服务的检查数据字典缓冲区是Oracle特地为数据字典准备的一块缓冲池,供Oracle内部使用3、操作1.系统开始----运行----cmd2.在命令输入框sqlplus username/password@oraclename 连接数据库如图‘五‘一样3.再在命令输入框输入SELECT(1 - (SUM(DECODE(NAME, 'physical reads', VALUE, 0)) /(SUM(DECODE(NAME, 'db block gets', VALUE, 0))+SUM(DECODE(NAME, 'consistent gets', VALUE, 0))))) * 100 "缓冲区命中率"FROM V$SYSSTAT;查询结果如图:九、检查数据库定时作业的完成情况1、FAILURES列是一个大于0的数的话,说明JOB运行失败2、数据库服务的检查主要是用来完成一些定时作业3、再在命令输入框输入select job,log_user,last_date,failures from dba_jobs;查询结果:十、查看数据库的报警日志文件1、看有没有错误记录2、报警日志文件的检查主要是记录数据库后台进程和报警错误的信息3、操作1、打开路径:数据库所在盘符/数据库文件夹/admin/orcl2、第一个文件是后台进程的跟踪文件,同时也是存放警告日志所在的文件夹、第二个文件夹是用户进程的跟踪文件。
数据库巡检方案

Oracle 数据库日常检查A.查看所有的实例及其后台进程是否正常确认所有的instance 工作正常,登陆到所有的数据库或instance 上,检测oracle后台进程$env I grep SIDORACLE_S ID=UWNMS 3B・检查文件系统的使用情况如果文件系统的剩余空间小于10 %,则需要删除不必要的文件以释放空间。
$df-hFile system size used avail capacity Mounted on/dev/md/dsk/dO 20G 17G 3.1G 85% //proc OK OK OK 0% /procmnttab OK OK OK 0% /etc/mnttabfd OK OK OK 0% /dev/fdswap 85G 192K 85G 1% /var/rundmpfs 85G OK 85G 0% /dev/vx/dmpdmpfs 85G OK 85G 0% /dev/vx/rdmpswap 85G 213M 85G 1% /tmp/dev/vx/dsk/data 10dg/Ora_F ile_Vol01394G 292G 98G 75% /data 05/d ev/vx/dsk/data ldg/vola0131443G 156G 283G 36% /archiveAIX:$df -g or df -kHP-UX$bdf or df - k or df -h注意:需要特别关注根目录,数据库软件和数据库备份所在目录的剩余空间情况!备注:数据库运行日志的及时清除下的相关Fl志1).可清除bdump,cdump,udump $ cd$ORACLE_BASE/admin/db_name/bdump$ Is -1total 174-rwxrwxrwx 1 oracle dba 59047 Jul30 22:02 alert_UWNMSl.log-rwxrwxrwx 1 oracle dba 1000 Jul 14 22:00 uwnms l_j000_l8128.trc -rw-r ---- 1 oracle dba 1000 Jul 22 22:00 uwnms 1JOO1_5369.trc -rwxrwxrwx 1 oracle dba 695 Jul 14 19:12 uwnms l_lgwr_18100.trc -rwxrwxrwx 1 oracle dba 2668 Jul 30 22:02 uwnmsl_lgwr_ 1966l.trc -rwxrwxrwx 1 oracle dba 983 Jul 14 17:36 uwnms l_lgwr_7816.trc -rwxrwxrwx 1 oracle dba 955 Jul 14 19:11 uwnms l_lgwr_7883.trc -rwxrwxrwx 1 oracle dba 803 Jul 14 17:3 1 uwnms l_p000_7714.trc -rwxrwxrwx 1 oracledba801 Jul 14 17:3 1 uwnms l_p001_7716.trc$ cd ../cdump$ Is -1total 4drwxr-x —2 oracle dba 512 Jul25 14:12 core_18095 drwxr-x …2 oracledba512 Jul25 19:17 core_25934505 Jul 16 16:33 uwnms l_ora_1477 l.trc 4516169 Jul 25 14:12 uwnms l_ora_18095.trc 644 Jul 14 19:12 uwnms l_ora_l8119.trc 505 Jul 30 15:11 uwnms l_ora_18820.trc 774 Jul 15 10:23 uwnms l_ora_19573.trc 587 Jul 15 10:23 uwnmsl_ora_19645.trc 644 Jul 15 10:23 uwnms l_ora_19680.trc 720942 Jul 15 16:28 uwnms l_ora_24759.trc 4951562 Jul 25 19:17 uwnms l_ora_25934.trc 505 Jul 15 17:21 uwnms l_ora_27326.trc 503 Jul 30 16:54 uwnms l_ora_6612.trc 585 Jul 14 17:12 uwnms l_ora_7523.trc 767 Jul 14 17:30 uwnms l_ora_7566.trc$ cd $ORACLE_HOME/network/log $ Is -1272507851 Jul 31 11:28 listener .log257876 Jul 31 08:48 sqlnet.log$ cd ../udump $ Is -1total 20042-rw-r ---- 1 oracle dba -rw-r ----1 oracledba-rwxrwxrwx1 oracle dba -rw-r ---- 1 oracledba-rwxrwxrwx1 oracle dba -rwxrwxrwx1 oracledba -rwxrwxrwx1 oracle dba -rw-r ---- 1 oracle dba -rw-r ---- 1 oracle dba -rw-r ---- 1 oracle dba -rw-r ----1 oracledba-rwxrwxrwx1 oracledba -rwxrwxrwx1 oracle dba2).可清除 oracle 的监听日志total 533072 -rwxrwxrwx 1 oracle dba -rw~r 一r■■1 oracledba$ cp /dev/null listener .logc.查找警告日志文件1.联接毎一个操作管理系统2.使用'TELNET或'是可比较程序3.对每一个管理实例,经常的执行$ORACLE_BASE/<SID>/bdump操作,并使其能回退到控制数据库的SID o4.在提示下,使用UNIX中的'TAIL命令'查看alert_<SID>.log ,或是用其他方式检查文件屮最近时期的警告日志5.如果发现任何ORA_ERRORS (ORA-XXX)的错误,将它记录并且仔细的研究它们,或反馈给DB组如何确定警告日志文件的路径?通过参看起始参数文件init<SID>.ora ,而起始参数文件一般存储在$ORACLE_HOME/dbs下D.检查数据库备份是否成功※对RMAN 备份方式:检查第三方备份工具的备份日志以确定备份是否成功如果具备恢复目录的,可直接登陆到rman环境下,发命令Ust backup查看具体备份集合的情况;$rman target / nocatalogRecovery Manager: Release 10.2.0.3.0 ・ Production on Thu Jul 31 1 1:39:37 2008Copyright (c) 1982, 2005, Oracle. All rights reserved, connectedto target database: UWNMS3 (DBID=2229785441) connected torecovery catalog databaseRMAN> list backup;List of Backup SetsBS Key Type LV Size Device Type Elapsed Time Completion Time422624 IncrO12.59M DISK 00:00:07 2008-07-28 03:15:21 BP Key: 422631 Status: AVAILABLE Compressed: YES Tag: BK0Piece Name: /export/home/oracle/rman3/bk0_UWNMS3_20080728_2393List of Datafiles in backup set 422624File LV Type Ckp SCN Ckp Time Name2 0 Incr 35321096 2008-07-28 03:15:14 /archive log/oradata/UWNMS 3/undo01 .dbf5 0 Incr 35321096 2008-07-28 03:15:14 /a rc h ive log/orada ta /UWNMS 3/system2.dbf※对EXPORT , EXPDP逻辑备份方式:检查exp , expdp 日志文件以确定备份是否成功※对其他备份方式:检查相应的日志文件E.检查表空间的使用情况1. 检查在表空间中有没有剩余空间。
服务器、存储、数据库巡检

服务器、存储、数据库巡检1:硬件信息巡检1.1 服务器型号和制造商1.2 CPU型号和数量1.3 内存容量和类型1.4 磁盘容量和类型1.5 网卡信息1.6 电源状态检查2:操作系统巡检2.1 操作系统版本和补丁2.2 是否存在漏洞2.3 确保系统安全性3:网络连接巡检3.1 确认网络接口是否正常工作3.2 检查网络速度和延迟3.3 确保网络连接的稳定性4:服务巡检4.1 确认所有关键服务是否正在运行 4.2 检查服务的运行状态和性能4.3 检查服务的日志文件是否正常5:安全性巡检5.1 确认防火墙配置是否正确5.2 检查是否存在异常登录行为5.3 检查是否存在未授权的访问1:存储设备信息巡检1.1 存储类型和制造商1.2 存储容量和可用空间1.3 确认存储设备是否正常工作2:存储配置巡检2.1 确认存储配置是否满足业务需求 2.2 检查存储性能是否正常2.3 确认存储回收机制是否有效3:存储备份和恢复巡检3.1 确认备份计划是否正常执行3.2 检查备份数据的完整性和可恢复性 3.3 确认存储备份和恢复的流程是否规范1:数据库信息巡检1.1 数据库类型和版本1.2 数据库大小和表数量1.3 确认数据库是否正常工作2:数据库配置巡检2.1 确认数据库配置是否合理2.2 检查数据库性能和索引状态2.3 检查数据库备份和恢复机制3:数据库安全性巡检3.1 确认数据库访问权限是否控制合理 3.2 检查敏感数据的保护措施3.3 检查数据库审计日志附件:本文档涉及的附件包括服务器设备清单、操作系统版本信息、网络配置文件、服务日志文件、存储设备配置信息、数据库配置文件等。
法律名词及注释:1:数据保护条例:指针对个人数据的收集和处理所制定的法律条例。
2:版权法:保护创作作品的法律法规。
3:信息安全法:保护信息系统的安全和数据的保密性、完整性和可用性的法律法规。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Oracle数据库日常检查A. 查看所有的实例及其后台进程是否正常确认所有的instance工作正常,登陆到所有的数据库或instance上,检测oracle后台进程$env | grep SIDORACLE_SID=UWNMS3B.检查文件系统的使用情况如果文件系统的剩余空间小于10%,则需要删除不必要的文件以释放空间。
$df -hFilesystem size used avail capacity Mounted on/dev/md/dsk/d0 20G 17G 3.1G 85% //proc 0K 0K 0K 0% /procmnttab 0K 0K 0K 0% /etc/mnttabfd 0K 0K 0K 0% /dev/fdswap 85G 192K 85G 1% /var/rundmpfs 85G 0K 85G 0% /dev/vx/dmpdmpfs 85G 0K 85G 0% /dev/vx/rdmpswap 85G 213M 85G 1% /tmp/dev/vx/dsk/data10dg/Ora_File_Vol01394G 292G 98G 75% /data05/dev/vx/dsk/data1dg/vola0131443G 156G 283G 36% /archivelogAIX:$df –g or df –kHP-UX$bdf or df –k or df -h注意:需要特别关注根目录,数据库软件和数据库备份所在目录的剩余空间情况!备注:数据库运行日志的及时清除1). 可清除bdump,cdump,udump下的相关日志$ cd $ORACLE_BASE/admin/db_name/bdump$ ls -ltotal 174-rwxrwxrwx 1 oracle dba 59047 Jul 30 22:02 alert_UWNMS1.log-rwxrwxrwx 1 oracle dba 1000 Jul 14 22:00 uwnms1_j000_18128.trc -rw-r----- 1 oracle dba 1000 Jul 22 22:00 uwnms1_j001_5369.trc -rwxrwxrwx 1 oracle dba 695 Jul 14 19:12 uwnms1_lgwr_18100.trc -rwxrwxrwx 1 oracle dba 2668 Jul 30 22:02 uwnms1_lgwr_19661.trc -rwxrwxrwx 1 oracle dba 983 Jul 14 17:36 uwnms1_lgwr_7816.trc -rwxrwxrwx 1 oracle dba 955 Jul 14 19:11 uwnms1_lgwr_7883.trc -rwxrwxrwx 1 oracle dba 803 Jul 14 17:31 uwnms1_p000_7714.trc -rwxrwxrwx 1 oracle dba 801 Jul 14 17:31 uwnms1_p001_7716.trc $ cd ../cdump$ ls -ltotal 4drwxr-x--- 2 oracle dba 512 Jul 25 14:12 core_18095drwxr-x--- 2 oracle dba 512 Jul 25 19:17 core_25934$ cd ../udump$ ls -ltotal 20042-rw-r----- 1 oracle dba 505 Jul 16 16:33 uwnms1_ora_14771.trc-rw-r----- 1 oracle dba 4516169 Jul 25 14:12 uwnms1_ora_18095.trc-rwxrwxrwx 1 oracle dba 644 Jul 14 19:12 uwnms1_ora_18119.trc -rw-r----- 1 oracle dba 505 Jul 30 15:11 uwnms1_ora_18820.trc-rwxrwxrwx 1 oracle dba 774 Jul 15 10:23 uwnms1_ora_19573.trc -rwxrwxrwx 1 oracle dba 587 Jul 15 10:23 uwnms1_ora_19645.trc -rwxrwxrwx 1 oracle dba 644 Jul 15 10:23 uwnms1_ora_19680.trc -rw-r----- 1 oracle dba 720942 Jul 15 16:28 uwnms1_ora_24759.trc-rw-r----- 1 oracle dba 4951562 Jul 25 19:17 uwnms1_ora_25934.trc-rw-r----- 1 oracle dba 505 Jul 15 17:21 uwnms1_ora_27326.trc-rw-r----- 1 oracle dba 503 Jul 30 16:54 uwnms1_ora_6612.trc-rwxrwxrwx 1 oracle dba 585 Jul 14 17:12 uwnms1_ora_7523.trc-rwxrwxrwx 1 oracle dba 767 Jul 14 17:30 uwnms1_ora_7566.trc 2). 可清除oracle的监听日志$ cd $ORACLE_HOME/network/log$ ls -ltotal 533072-rwxrwxrwx 1 oracle dba 272507851 Jul 31 11:28 listener.log-rw-r--r-- 1 oracle dba 257876 Jul 31 08:48 sqlnet.log$ cp /dev/null listener.logC.查找警告日志文件1. 联接每一个操作管理系统2. 使用‘TELNET’或是可比较程序3. 对每一个管理实例,经常的执行$ORACLE_BASE/<SID>/bdump 操作,并使其能回退到控制数据库的SID。
4. 在提示下,使用UNIX 中的‘TAIL’命令查看alert_<SID>.log,或是用其他方式检查文件中最近时期的警告日志5. 如果发现任何ORA_ERRORS (ORA-XXX) 的错误,将它记录并且仔细的研究它们,或反馈给DB组如何确定警告日志文件的路径?通过参看起始参数文件init<SID>.ora,而起始参数文件一般存储在$ORACLE_HOME/dbs下D.检查数据库备份是否成功※对RMAN备份方式:检查第三方备份工具的备份日志以确定备份是否成功如果具备恢复目录的,可直接登陆到rman环境下,发命令list backup查看具体备份集合的情况;$rman target / nocatalogRecovery Manager: Release 10.2.0.3.0 - Production on Thu Jul 31 11:39:37 2008 Copyright (c) 1982, 2005, Oracle. All rights reserved.connected to target database: UWNMS3 (DBID=2229785441)connected to recovery catalog databaseRMAN> list backup;List of Backup Sets===================BS Key Type LV Size Device Type Elapsed Time Completion Time------- ---- -- ---------- ----------- ------------ -------------------422624 Incr 0 12.59M DISK 00:00:07 2008-07-28 03:15:21 BP Key: 422631 Status: AVAILABLE Compressed: YES T ag: BK0Piece Name: /export/home/oracle/rman3/bk0_UWNMS3_20080728_2393 List of Datafiles in backup set 422624File LV Type Ckp SCN Ckp Time Name---- -- ---- ---------- ------------------- ----2 0 Incr 35321096 2008-07-28 03:15:14 /archivelog/oradata/UWNMS3/undo01.dbf5 0 Incr 35321096 2008-07-28 03:15:14 /archivelog/oradata/UWNMS3/system2.dbf※对EXPORT,EXPDP逻辑备份方式:检查exp,expdp日志文件以确定备份是否成功※对其他备份方式:检查相应的日志文件E.检查表空间的使用情况1. 检查在表空间中有没有剩余空间。
对每一个实例来说,检查在表空间中是否存在有剩余空间来满足当天的预期的需要。
当数据库中已有的数据是稳定的,数据日增长的平均数也是可以计算出来,最小的剩余空间至少要能满足每天数据的增长。
脚本:select t.tablespace_name, total, free, round(100*(1-(free/total)),3)||'%' as已使用的空间比例from (select tablespace_name, sum(bytes)/1024/1024 total from dba_data_files group by tablespace_name) t,(select tablespace_name, sum(bytes)/1024/1024 free from dba_free_space group by tablespace_name) fwhere t.tablespace_name=f.tablespace_name(+)and t.tablespace_name not in ('DRSYS','ORDIM','SPATIAL','USERS','TOOLS','XDB')order by round(100*(1-(free/total)),3) desc;2. 检查失效索引/* -- 以下脚本用于检查失效的索引select * from dba_indexes where status not in ('VALID','N/A')SELECT index_name,PARTITION_NAME,TABLESPACE_NAME FROM USER_IND_PARTITIONSWHERE status = 'UNUSABLE' ORDER BY PARTITION_NAME;*/-- 发现失效索引提出建议,如:alter index NPMDB.UQ_TPA_SAE_SUM rebuild tablespace idxdbs online nologging parallel 4 ; alter index NPMDB.UQ_TPA_SAE_SUM noparallel;3. 表空间管理-- 检查表空间数据文件状态SQL>select file_name,status,tablespace_name from dba_data_files where status=’AVAILABLE’;注:如果查询出记录,说明有数据文件不正常,必须及时提出建议.-- 查看数据文件自动扩展属性SQL>select file_name,status,tablespace_name from dba_data_files where AUTOEXTENSIBLE=’YES’;注:查出记录后,并且数据文件在”/dev/”目录下,说明是裸设备,则建议ALTER DATABASE DATAFILE '/dev/vx/rdsk/data2dg/volb0082' AUTOEXTEND OFF; F.查看数据库版本及组件数据库RDBMS版本:SQL>select * from v$version;查看数据库组件版本:SQL>col comp_name format a35;SQL>col status format a15;SQL>col version format a15;SQL>select comp_name,status,version from dba_registry;G.查看crs状态如果是10g RAC数据库运行以下命令查看CRS相关信息:1 查询并检查OCR设备ocrcheck2 查询并检查Voting Disk设备crsctl query css votedisk3 查询并检查网络接口oifcfg –getif –global4 检查ocr备份情况查找备份存放目录ocrconfig –showbackupcd 到上面的目录,检查文件应列出下面文件3份每四小时备份2份每天备份2份每周备份5 检查各个数据库节点系统时间,如果存在差距大于15分钟,建议修改。