数据中心一体化综合运维解决方案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据库监控
集中管理各种数据库(Oracle、Sybase、
Informix、DB2、SQL Server等) 管理数据库可用性。 支持双机模式 预警式监控 内置专家经验 配置简单,自动发现数据库架构 监控重要参数

数据库状态 实例状态 表空间/数据库利用率 性能参数(缓冲池,Buffer命 中率等等)
网络
物理/虚拟系统
数据库
应用
用户
中间件
4
解决方案目录 集中监控解决方案

系统监控 网络监控 应用监控 集中事件平台 业务影响分析 动态基线和智能阈值
流程管理和CMDB解决方案 统一展示门户Portal解决方案
5
基础架构监控——范围
服务器 数据库 应用 中间件 网络 其它
Unix
备量和数据负载量相对较小的用户,也可以采用单机 部署,减少硬件投入。
分布式部署适用情况及硬件需求:
部署方式 机群协作部署方式 ( 采集分析程序 部署于多台服务器) 适用条件 采集设备 >300 台,或者存在 跨区域的设备 硬件环境 WEB应用服务器 2路CPU,双核2.0GHZ 内存:8G RAID 1-5/硬盘:500G 1000M网卡*2 数据库服务器 2路CPU,双核2.0GHZ 内存:32G RAID 1-5/硬盘:1T*3 1000M网卡*3 数量巨大时可以考虑采用磁盘阵列 采集机及分析服务器 CPU双核2.0GHZ(分析服务器>2路) 内存:8G RAID 1-5/硬盘:500G 1000M网卡 单台采集机(采集设备限制<=200台)。
发布管理
流程管理平台
知识管理
服务目录 服务水平
服务请求 运行管理
集中监控平台
业务影响管理 统一性能平台 中 间 件 监 控 网 络 监 控 数 据 库 监 控 主 机 监 控 统一事件平台 虚 拟 监 控 应 用 监 控 业 务 模 型
自动化管理平台 CMDB
服 务 目 录 自 动 发 现 调 和 联 邦 作 业 调 度 补 丁 管 理 自动化操作平台 操作权限管理 人 工 巡 检 配 置 操 作 操作任务管理 系 统 装 载 版 本 规 范 合 规 审 计
定义告警状态
主机监控-日志监控
日志监控配置属性界面
ຫໍສະໝຸດ Baidu
日志监控-Advance
日志没更新 告警设置
监控日志 大小
日志权限改变监控
日志更新时间监控
Web Application监控
支持Weblogic\Websphere\Tomcat\MQ 通过JMX、PMI、Byte-Code Instrumentation 、JVM Profile等接口实现 JVM的性能状况 垃圾回收的情况 吞吐量 管理任务 执行队列监控 日志监控与管理 EJB的监控 Servlet、JSP、WebApp的调用信息 JDBC JCA JMS的监控与管理 JTA的监控与管理 JMX日志的注册与通知机制 Cluster环境下服务器属性的监控 “Top N”的WebApp、EJB、Servlet和JSP以及SQL JVM操作系统进程资源的使用信息和服务器的网络活动信息
通过Patrol的PSL语言开发知识模块实现。
Windows服务器使用命令:w32tm /stripchart /computer:10.8.28.62 Linux服务器使用命令:ntpdate -d 10.8.28.62
16
系统部署
支持分布式部署,便于适应用户不同的网络环境采用多探针的方式,
穿透防火墙对不同的网络维护区域执行巡检作业。针对管理设
主机监控 -服务监控(Windows)
服务停止的时候产生告警 事件 服务停止的时候自动重启 该服务
监控该服务消耗的资源
主机监控-进程监控(Unix)
定义进程名字(标识符)
在出现的界面上配置要监控的进程属性
定义进程关键字符串,该字符 串必须是可以通过ps –ef 命令 检索得到的
定义该进程数目的最小最大值 ,如果该进程名字是唯一的, 都设为1
Informix DB2 UDB CA-Ingres Progress
Siebel Baan Exchange JD Edwards
Weblogic Tuxedo TXSeries Websphere Tomcat
RDB
6 Mysql
Apache/IIS
主机监控
支持平台广泛 CPU Filesystem Disk Swap Log Process Network NFS AD Services HA Errpt(AIX) 集成Windows性能计数器
监 控 工 具 发 现 异 常
告 警 恢 复 事件处理完成
1、工单关闭 2、生成知识库
问 题 管 理
变 更 管 理
其 他 流 程
生 成 工 单
基础架构、 业务和应用
自动化 工具
流程运转
事件管理流程
BSM一业务服务管理
报表分析 关键IT指标 业务系统运行状况 业务影响
统一展现平台
事件管理 问题管理
变更管理 配置管理
Oracle
SAP R/3
MQSeries
Firewall
存储 其它可基于SNMP管理 的设备
Linux
Sybase
PeopleSoft
MSMQ
Router
WinNT/2000/2003/2008
SQL Server
Oracle Apps
MQSI
Switch 其它可基于 SNMP管理的网 络设备
Netware OpenVMS AS400 Tru64 OS Hardware Mointor
基础架构监控——存储和硬件
设备硬件和存储备份的监控。与硬件和存储备份的管理软件做集成接口。
14
基础架构监控——虚拟机管理
对虚拟环境的监控。Vmware\Power-vm\hyper-v等
15
基础架构监控——开发扩展
类shell的PSL语言,方便扩展,技术门槛不高。
示例一:时间同步需求开发
需求
所有业务机器都要定时与时间服务器进行时间同步,如果时间差距超出阀值则告警 实现
数据中心一体化综合运维解决方案
1
内容提要
一体化综合运维解决方案介绍
一体化运维案例和演示中心
现场答疑
财务
2
一体化运维中的故障处理闭环场景
大屏实时展示系统健康状况 告警统计分析报表 工单统计分析报表
短信通知
集中监控 平台
邮件通知
告警生成 告警清单 告警面板
监控平台与流程平台的集成
运维流程 平台
告警分析
相关文档
最新文档