XXIT运维监控管理平台建设方案

合集下载

IT监控运维管理平台建设方案

IT监控运维管理平台建设方案

IT监控运维管理平台建设方案一、项目背景随着信息技术的发展和广泛应用,企业的IT系统已成为企业运营的重要支撑和保障。

为了确保IT系统的正常运行和故障处理,需要建设一个完善的IT监控运维管理平台。

本文将提出一个IT监控运维管理平台建设方案,旨在提高IT系统的稳定性和运维效率。

二、目标与要求1.提高系统稳定性:通过监控系统实时收集和分析数据,及时发现和解决故障,减少系统宕机和异常情况的发生。

2.提高运维效率:通过自动化的监控和运维工具,减少人工干预,提高运维效能,降低成本。

3.加强安全性:建立完善的权限管理体系,确保系统的安全运行和数据的保密性。

4.提供完善的报表和分析功能:对IT系统的性能和运行情况进行实时监控和分析,通过清晰的报表和图表呈现,提供决策参考。

三、平台架构1.网络基础设施层:包括网络设备(交换机、路由器等)、服务器、存储设备等,通过网络监控工具实时采集设备状态和性能数据。

2.系统应用层:包括操作系统、数据库、应用软件等,通过代理方式或API接口接入监控平台,实时传输数据。

3.监控与分析层:通过监控工具对各个系统和设备进行实时监控,并通过数据分析算法进行异常识别和故障预测。

4.运维管理层:包括故障处理、巡检、容灾等运维管理功能,通过工单系统进行运维任务的派发和跟踪。

5.安全与权限管理层:建立完善的权限管理体系,确保系统的安全运行和数据的保密性。

四、具体实施步骤1.现状分析:对企业IT系统的现状进行全面的调研和分析,包括系统结构、设备情况、运维流程等,确定建设需求和目标。

2.系统设计:根据需求和目标,设计IT监控运维管理平台的架构和功能模块,制定详细的设计方案。

3.系统采购与部署:根据设计方案,采购所需的硬件和软件设备,并进行系统的部署和配置。

4.数据采集与接入:通过网络监控和API接口等方式,实现对各个系统和设备的数据采集和接入。

5.数据分析与告警:通过数据分析算法,对采集到的数据进行实时分析,发现异常情况并及时发送告警。

IT部门运维管理综合解决方案

IT部门运维管理综合解决方案
Cluster(s) Linux z/OS
SAP MySAP New .NET
Oracle SQL Sybase Informix
CICS WebSphere New (Z & Distributed) Web Services IIS IMS iPlanet Apache WebLogic
Lotus Domino
服务和部署自动化管理 虚拟化管理
系统监控
机房监控
网络监控 安全监控
应用监控 环境监控
事件管理
问题管理 配置管理
配置管理数据库
变更管理
服务器服务(优化和标准化) 存储服务(优化和标准化) 网络服务(优化和标准化)
监控数据
配置数据
资源使用数据
应用
系统
网络
小型机
存储
语音
安全
运输
产品
设施
分销
信息
人员
5
© 2011上海XX信息科技有限公司
Top Ten Lock Timeout
Top Ten Lock Deadlock Database Bottom Ten Buffer Pool Hit Ratio Top Ten Connection
Top Ten Failed SQL Statement %
Top Ten Lock Timeout Top Ten Deadlock System Overview Server Key Events Server Connection Database – Bottom Ten BufferPool Hit Ratio Applications-Top Ten Sql Statement Server Status

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案在当今信息技术高速发展的时代,IT运维监控管理平台的建设变得越来越重要。

一个高效的IT运维监控管理平台可以帮助企业提高IT系统的稳定性和安全性,提升IT运维管理的效率。

以下是一个IT运维监控管理平台建设方案。

一、概述1.1目标本方案的目标是建设一个全面、高效且易于维护的IT运维监控管理平台,实现对企业IT系统的全面监控与管理,提升运维效率,确保系统的稳定运行。

1.2范围本方案主要包括硬件设备、软件系统、网络通信和人员培训等方面内容。

二、硬件设备2.1服务器建议采用高可用性的服务器集群,确保系统的稳定性和可靠性。

2.2网络设备需要配备高性能的网络设备,确保监控数据的高速传输和稳定性。

2.3存储设备建议采用高性能、高可靠性的存储设备,用于存储监控数据和日志文件。

三、软件系统3.1操作系统建议采用稳定、安全的操作系统,如Linux、Windows Server等。

3.2数据库选用高性能、高可靠性的数据库系统,如MySQL、Oracle等,用于存储监控数据和配置信息。

3.3监控软件选择功能强大、易于使用的监控软件,如Zabbix、Nagios等,用于对各类硬件设备、应用系统和网络进行监控。

3.4日志管理软件选用综合、灵活的日志管理软件,如ELK(Elasticsearch、Logstash、Kibana)等,用于收集、分析和查询系统日志。

3.5报警系统建立报警系统,可以及时捕捉系统异常状况,并及时发送报警信息。

四、网络通信4.1网络架构设计合理的网络架构,确保监控数据的高效传输和安全性。

4.2防火墙配置合适的防火墙规则,确保系统的安全性和可靠性。

4.3VPN建立VPN通道,保障监控数据的传输安全和隐私性。

五、人员培训5.1运维人员培训提供定期的运维人员培训,确保其能够熟练掌握监控管理平台的操作和维护方法。

5.2管理人员培训提供管理人员培训,使其了解系统的功能和运行情况,能够根据监控数据做出正确的决策。

《数智化城运维系统项目建设实施方案》(仅用于个人学习和研究)(参考模板)

《数智化城运维系统项目建设实施方案》(仅用于个人学习和研究)(参考模板)

1)运营运维大数据管理系统实施方案1.1目标XXXX项目总体建设目标是要建设综合性XX管理台。

XX管理台提供流程管理、专项采集、集中监控、故障定位、隐患预警、业务管理、统一展现等管理功能,完成IT基础环境运行管理的全面收集、统一维护、快速处理、持续优化,形成一体化的管理模式。

及时、准确、全面反映与掌握IT环境的运行状态,保障XXXX各业务系统的正常运行。

进一步提高信息化服务的响应速度和效率,实现XX质量、效率和服务水的持续提升。

通过综合XX管理台的建设实现以下建设目标:(1)建立服务体系,强化标准流程通过管理人员、台技术和流程的有机结合,实现ITXX管理的标准化和规范化。

参照目前国际先进的XXXXXX管理标准,引进成熟的XX管理思路和自动化技术手段,将目前各系统维护人员集中起来,以专业化、规范化、流程化方式运作,并结合现有维护业务,制订一整套符合国际XXXX标准的XX管理和考核体系。

(2)保障设备稳定,支撑业务连续保障业务连续稳定运行是XX管理的主要目标,业务应用的连续运行与IT基础设施的稳定运行密不可分。

通过对各业务关联的服务器、网络设备、存储、数据库、中间件等IT基础设施的精细化、关联化的统一管理,由点到面的保障设备稳定运行,为业务连续运行提供基础支撑。

(3)实现集中管理,合理利用资源以IT资源可用性监控为主线,构建统一集成的IT资源及应用服务监控台,实时了解全部IT资源的负载与使用情况,能够主动、及时地发现问题,从整体角度考虑资源的使用并调度资源解决问题。

(4)快速定位故障,积累XX知识通过完善的告警分析、故障定位展现功能,提供灵活、自动化的事件处理能力。

当故障产生时,可以进行故障根原因的快速定位,为一线XX人员缩小排查范围,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。

支持把XX过程中产生的丰富经验进行积累和总结,形成有效的知识库。

(5)加强隐患预警,减少故障频率辅助应用XX人员排查IT环境中潜在的隐患,定位可能导致设备、业务应用故障和运行性能瓶颈的问题。

XXXIT运维监控管理平台建设方案

XXXIT运维监控管理平台建设方案

XXXIT运维监控管理平台建设方案一、项目背景随着信息化建设的不断发展,企业对IT系统的依赖程度也逐渐增加。

为了有效管理和监控企业IT系统的运行状态,及时发现和解决问题,保障系统的稳定性和可靠性,建设一套完善的IT运维监控管理平台变得尤为重要。

本文将提出一套XXX公司IT运维监控管理平台建设方案,以帮助企业提高运维效率,降低故障率,保障业务连续稳定运行。

二、系统架构1.硬件设施:采用虚拟化技术部署监控平台,搭建监控服务器、数据库服务器、存储服务器等硬件设施。

2. 软件系统:选择稳定、可靠的监控软件,如Zabbix、Nagios、SolarWinds等,搭建监控系统,实现对服务器、网络设备、数据库、应用程序等方面的监控。

3. 数据库支持:选择高性能、高可用的数据库系统,如MySQL、Oracle,存储监控数据,并支持监控数据的查询、统计和报表功能。

4.报警通知:配置报警规则,当监控系统检测到异常时,及时发送报警通知给相关人员,采取措施解决问题。

5.可视化展示:采用图表、报表等形式展示监控数据,让用户更直观地了解系统运行状态。

6.用户管理:设置不同权限的用户角色,确保不同级别的用户可以访问适当的监控数据。

三、功能模块1.网络监控:监控网络设备的运行状态、带宽利用率、流量分析等,保障网络运行的畅通。

2.服务器监控:监控服务器的CPU利用率、内存使用率、磁盘空间等,确保服务器正常运行。

3.数据库监控:监控数据库的连接数、查询响应时间、索引性能等,保障数据库的稳定性和可靠性。

4.应用程序监控:监控业务应用的响应时间、错误率、并发用户数等,及时发现并解决问题。

5.日志管理:对系统日志进行收集、分析、备份,帮助排查故障和改进系统性能。

6.性能优化:根据监控数据,优化系统配置、调整资源分配,提高系统性能。

7.报表统计:提供各种监控数据的报表,帮助管理层了解系统运行状态,做出决策。

四、实施步骤1.立项:确定项目范围、目标和时间表,制定项目计划。

运维监控管理平台建设方案

运维监控管理平台建设方案

运维监控管理平台建设方案一、项目背景随着互联网技术和应用的不断发展,各种企业和组织都越来越依赖于信息技术系统的正常运行。

为了保障信息技术系统的稳定运行和高效管理,运维监控管理平台成为当务之急。

本文将提出一个运维监控管理平台建设方案。

二、建设目标1.提高运维效率:通过监控、报警和自动化管理等手段,提高运维人员的工作效率,减少人为操作的错误和不必要的工作。

2.提升系统稳定性:通过实时监控、预警和及时处理等手段,提升信息技术系统的稳定性,避免系统故障对业务的影响。

3.加强资源管理:通过统一的运维监控管理平台,实现对各类资源的全面管理,包括硬件设备、网络设备、软件系统等。

4.改善用户体验:通过实时监控和预测性维护等手段,提高用户的体验,减少服务中断和延迟。

三、建设方案1.建立统一的监控平台:选取适合企业需求的监控平台,完成对各类资源的监控。

监控范围包括硬件设备的健康状态、网络设备的运行状况、软件系统的性能指标等。

3.引入自动化管理工具:通过引入自动化管理工具,对常见的运维工作进行自动化处理,减少人为操作的错误和不必要的工作。

例如,通过自动化脚本进行常规巡检、备份和配置管理等工作。

4.进行系统性能优化:通过监控和分析系统的性能指标,发现系统性能问题并进行优化。

例如,识别性能瓶颈,对系统进行调整和优化,提升系统的性能和吞吐量。

5.开展故障预测和预防工作:通过分析历史数据和运维经验,开展故障预测和预防工作。

例如,利用机器学习算法分析历史故障数据,预测出潜在的故障风险,并采取相应的预防措施,避免系统故障对业务的影响。

6.加强安全监控:建立安全监控体系,对系统中的异常行为进行监控和及时发现。

例如,对系统的登录日志、操作日志进行实时监控,发现可能的安全漏洞和风险。

7.设立绩效评估机制:建立绩效评估机制,对运维人员的工作进行评估和奖励。

绩效评估可以基于监控数据、工作量和用户反馈等多个维度进行评估,确保运维人员的工作质量和效率。

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案一、项目背景及目标随着信息技术的快速发展和普及,现代企业对IT系统的依赖程度越来越高,因此有必要建立一个IT运维监控管理平台,以实时监控、管理和维护企业的IT系统,确保其稳定运行。

该平台的目标是提高IT系统的可用性、减少故障发生和恢复时间、提高管理效率和降低运维成本。

二、功能需求1.实时监控:监控服务器、网络设备、数据库、应用程序等的性能指标和运行状态,提供实时的监控数据和报警功能。

2.故障诊断:当故障发生时,能够快速定位问题,提供实时告警信息和故障诊断报告。

3.自动化运维:能根据设定的规则进行自动化巡检和维护,提高运维效率和减少人工操作的错误。

4.资源管理:管理企业的IT资源,包括服务器、存储设备、网络设备等,并提供即时的资源利用情况和统计报表。

5.SLA管理:监控和管理IT系统的服务级别协议(SLA),确保服务水平符合承诺。

6.日志管理:对系统的日志进行收集、分析和存储,以帮助故障定位和问题解决。

7.报表和统计:提供各种报表和统计功能,如性能报表、故障统计、资源利用率报表等,以帮助管理者了解系统运行情况。

三、技术方案1. 选择合适的监控工具:根据需求选择一款成熟可靠的监控工具,如Zabbix、Nagios等,它们能够提供丰富的监控功能和报警机制。

2.构建监控体系:根据企业的IT系统架构,合理划分监控区域和节点,建立监控服务器和代理节点,确保全面监控。

3.设定监控项和阈值:根据实际情况,设定监控项和阈值,确保监控的准确性和稳定性。

4.配置告警机制:根据监控项和阈值设定告警规则,及时发送告警信息给相关人员,确保处理及时有效。

5.配置自动化运维规则:根据运维经验和规范,设定自动化巡检和维护规则,减少人工操作和提高运维效率。

6.配置存储和备份策略:对系统的监控数据和日志进行存储和备份,以保证数据的安全性和完整性。

7.配置权限和审计机制:设定不同的权限和角色,限制用户对系统的访问和操作,同时开启审计功能,记录用户的操作和变更。

IT运维管理平台建设方案(监控+运维流程)

IT运维管理平台建设方案(监控+运维流程)

IT运维管理平台建设方案(监控+运维流程)IT运维管理平台建设方案2018-3目录1.APEX解决方案概述 (5)2.系统架构及实现原理 (9)2.1.系统架构 (9)2.1.1.管理实体 (10)2.1.2.数据层 (10)2.1.3.功能层 (10)2.1.4.接入展现层 (11)2.2.系统集成 (12)2.2.1.第三方集成 (12)2.2.2.短信猫集成 (13)2.2.3.短信网关集成 (13)2.2.4.门户/界面集成 (13)2.3.开发工具及技术介绍 (13)2.3.1.标准的通信协议 (14)2.3.2.TWaver拓扑图组件 (16)2.3.3.JBPM流程引擎 (16)2.3.4.成熟的J2EE开发标准技术 (17)2.3.5.分布式任务调度 (17)2.3.6.Lucene搜索引擎 (18)2.3.7.JBOSS应用服务器 (18)3.APEX运维管理平台功能详细介绍 (19)3.1.IT综合监控系统 (19)3.1.1.网络管理 (19)3.1.1.1设备管理 (19)3.1.1.2网络可用性监控 (22)3.1.1.3网络拓扑监控 (24) 3.1.1.3网络性能监控 (31) 3.1.2.服务器管理 (32)3.1.2.1 Windows监控 (32) 3.1.2.2 Linux监控 (35)3.1.2.3 AIX监控 (40)3.1.2.4 UNIX监控 (43)3.1.3.应用服务器监视 (47) 3.1.3.1 Tomcat监视 (47)3.1.3.2 JBoss监视 (51)3.1.3.3Weblogic监视 (54) 3.1.3.4 WebSphere监视 (56) 3.1.3.5 IBM MQ监视 (60) 3.1.3.6自定义脚本监视 (62) 3.1.4.应用系统及日志监视 (64) 3.1.5.数据库监控 (67)3.1.5.1 Oracle监控 (68)3.1.5.2 SQL Server监控 (72) 3.1.5.3 MYSQL监控 (76)3.1.5.4 DB2监控 (78)3.1.5.5 Sybase监视 (81)3.1.5.6 Informix监视 (83) 3.1.6.WEB监控 (85)3.1.6.1 Apache监控 (86)3.1.6.2 IIS监视 (88)3.1.6.3 URL网页监视 (90) 3.1.7.虚拟化监控 (91)3.1.8.存储监控 (95)3.1.9.告警管理 (97)3.1.10.资源与配置管理 (106)3.1.10.1资源管理 (106)3.1.10.2网络配置管理 (109)3.1.11.自动巡检管理 (112)3.1.12.机房环境监控 (114)3.1.13.业务服务管理 (115)3.1.14.报表管理 (118)3.1.15.安全管理 (124)3.1.16.自身监控管理 (128)3.1.17.大屏展示 (129)3.1.18.系统部署方案 (130)3.2.IT服务管理流程系统 (131)3.2.1.自助式服务台 (132)3.2.2.服务台 (133)3.2.3.个人工作台 (135)3.2.4.值班管理 (137)3.2.5.事件管理 (143)3.2.6.问题管理 (145)3.2.7.变更管理 (149)3.2.8.发布管理 (150)3.2.9.知识库管理 (152)3.2.10.配置管理 (156)3.2.11.配置管理库建设建议 (162)3.2.12.服务级别管理 (163)3.2.13.自定义工作流 (168)3.2.14.通告管理 (174)3.2.15.项目管理 (175)3.2.16.资产管理 (181)3.2.17.运维报表统计 (187)3.2.18.运维系统内的角色/权限管理 (191) 3.2.19.通知提醒功能 (193)3.2.20.数据安全和备份 (193)3.2.21.统一运维门户 (193)4.ITIL咨询方案 (199)4.1.专业培训及理念导入 (199)4.2.结合理论与实际进行专业化服务管理现状评估 (201)4.2.1.IT业务战略模式的四种模式 (201)4.2.2.ITIL流程成熟度测评 (202)4.2.3.IT服务管理成熟度评估分析模型 (205)5.实施的相关案例介绍 (211)5.1.新疆公安厅 (211)5.2.包商银行 (218)5.3.青牛软件-联通呼叫中心基地项目 (221)5.4.上海政务网 (235)5.5.河北移动 (239)1.APEX解决方案概述APEX IT运维和服务管理系统是在分析了中国IT管理现状和需求后,基于ITIL理念自主研发而成。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

XXIT运维监控管理平台建设方案IT运维监控管理平台建设方案XXXXXXX 目录第1章概述3 1.1 建设背景3 1.2 建设目标3 1.3 建设思路 4 第2章系统总体设计5 2.1 总体架构 5 2.2 设计原则6 2.3 运维管理体系架构设计7 2.3.1 系统总体架构设计7 2.3.2 监控采集层8 2.3.3 数据处理层8 2.3.4 运行展现层8 2.4 系统技术路线9 2.4.1 采用Java语言开发9 2.4.2 采用J2EE框架10 2.4.3 采用WebService进行数据互连互通10 2.4.4 数据库技术12 2.4.5 性能控制13 2.4.6 开发、运行环境13 2.5 应用接口总体设计13 2.5.1 系统内部集成接口13 2.5.2 与基础运维管理工具的集成接口14 2.5.3 与ITSM系统的集成接口14 2.5.4 与相关外部系统的统一身份认证与单点登录接口14 2.6 系统安全设计及部署15 2.6.1 输入检验15 2.6.2 GET请求和Cookie中的敏感数据15 2.6.3 防通过嵌入标记实现的攻击15 2.6.4 防口令猜测功能16 2.6.5 页面和字段级的权限控制16 2.6.6 系统安全架构16 第3章系统功能设计17 3.1 动环监控17 3.1.1 配电柜监测17 3.1.2 配电开关及电流监控17 3.1.3 发电机监控18 3.1.4 ATS监测18 3.1.5 STS监测18 3.1.6 UPS监控子系统19 3.2 统一门户子系统19 3.2.1 信息主管领导内容展示20 3.2.2 运维人员内容展现20 3.2.3 一般用户内容展现21 3.3 IT运行监控子系统21 3.3.1 基础平台功能21 3.3.2 网络设备管理23 3.3.3 服务器监控管理26 3.3.4 存储监控管理29 3.3.5 数据库监控管理29 3.3.6 中间件监控管理30 3.3.7 web与应用监控管理31 3.3.8 虚拟化监控管理32 3.3.9 IP地址管理管理33 3.3.10 信息点管理34 3.3.11 告警监控管理与转发处理35 3.3.12 综合监控管理36 3.3.13 综合报表管理37 3.4 IT服务管理子系统38 3.4.1 功能特点38 3.4.2 服务台管理41 3.4.3 服务目录管理42 3.4.4 服务请求管理42 3.4.5 事件管理43 3.4.6 问题管理43 3.4.7 变更管理44 3.4.8 值班管理44 3.4.9 公告管理45 3.4.10 IT运维报告45 3.4.11 用户管理46 第4章培训方案46 第5章系统价值47 第6章售后服务47第1章概述1.1 建设背景随着近年来经济的进一步迅速发展,企事业机关单位IT运行环境日趋复杂,运行监控工作难度加大,尤其是随着信息化建设的不断深入,信息系统越来越多,各类系统越来越复杂,系统的关联度也越来越高。

数据处理量成倍增长,而随着互联网应用的发展,网上应用系统也越来越多,使IT 系统运行环境变得更加复杂,造成了机房管理、系统监控、运行维护工作十分困难的局面。

虽然信息中心各科室对已经有各的监控管理手段,但缺乏一个集中、统一的监控平台,及时发现与解决网络、硬件、安全设备、操作系统、数据库、中间件、应用系统、机房空调、UPS 等突然出现的问题。

因服务对象的不同,使用产品混杂。

怎样很好地解决以上问题,把各种类型的监控对象进行统一集中监控,并将其格式统一规范,并对其有效处理、分析,以直观的界面展现给各科室管理员、领导,成为目前面临最大的挑战。

1.2 建设目标加强信息资源的维护平台建设,提高信息资源的运行管理水平,通过运维体系的建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,及时、准确、全面反映与掌握信息系统的运行状态,保障各业务系统的正常运行,应达成如下目标:(1) 强化主动监控,实现集中管理。

以IT资源可用性监控为主线,构建统一集成的IT资源及应用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成IT运维管理主动服务的新局面。

(2) 帮助定位故障,快速恢复系统运行。

建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。

当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。

(3) 掌握运行质量与效率,合理利用资源。

建立IT运维平台后,可以实时了解全部IT资源的负载与使用情况,根据需要从整体角度考虑资源的使用,同时可以根据业务高峰期的不同来调剂业务系统对资源的使用。

(4) 规范运行管理,有序开展维护。

参照ITIL规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。

根据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。

(5) 共享运维经验,完善知识库。

把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制,提供信息共享和交流的平台,提高运维人员的工作效率。

1.3 建设思路IT运维管理理论、方法和标准,结合中心实际和建设需要,遵循立足需求、统一规划、保障重点、分步实施、务求实效的原则,建立一套融合组织、制度、流程、人员、技术的IT运维管理体系,建立组织机构,制定规章制度,规范管理流程,明确职责分工,强化技术支撑,实现对网络及信息系统的综合管理监控和日常技术支持,快速响应和及时解决信息系统运行过程中出现的各种问题和故障,确保所维护网络及信息系统正常、稳定、高效运行。

第2章系统总体设计2.1 总体架构依据对IT运维管理体系的建设经验,以及对用户信息系统现状、需求的分析,我们提出三位一体综合运维管理平台框架图如下:IT运维管理平台包括:“IT运行集中监控、IT运维流程服务、统一运维门户”三个部分。

底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统提供基础数据;IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;IT运维流程服务主要根据IT服务管理的国际标准ISO2000,并结合ITIL最佳实践,梳理出了事件管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规划范管理,提升IT服务的质量。

统一门户主要实现对监控信息、运维流程信息进行集中展示。

平台三个子系统关系如下:(1) 以IT运行监控为“基础” 这部分的功能主要是对被管对象运行的状态以及其配置资产信息进行统一监控、管理、分析,实现对各种故障和性能异常的及时报警,对系统运行性能进行实时监控,对系统运行的各种状态信息进行汇总、分析以及预测。

另外,还包括对IT系统的全部配置资产情况进行统一管理,对配置信息的异动提供检查及告警。

IT监控管理除了实现网管的告警、性能、配置几大基本功能以外,还从运维的角度提供丰富的数据综合分析和运维工具,例如综合报表、综合监控、信息点管理等。

(2) 以IT服务管理为“导向” 这部分功能主要依据ITIL架构进行建设,为IT系统的维护服务提供电子化的控制手段。

系统通过事件管理、问题管理、变更管理、配置管理等功能,为IT维护人员提供以流程为基础的服务管理方式,规范管理模式,达到快速消除IT系统故障、解决潜在问题,减少不规范的系统变更引发的系统故障率和故障隐患等目的,实现对IT系统的主动式服务,提高服务水平。

(3) 以统一运维门户为“体现” 即是整个系统的对外界面,通过统一的权限管理和统一风格的B/S展现,为系统的操作使用人员提供统一的系统接口,做到一点接入,通观全局,能够以灵活的组织数据的展现方式,定义用户、角色、组织机构,并为每个不同角色提供不同的功能模块,为每个用户分配不同的展现内容,方便用户进行企业整体的运行维护管理。

2.2 设计原则IT运维平台作为信息中心未来运维工作的核心支撑系统,需要系统本身具有高可靠、易扩展、易维护等特点,并且在系统功能应用上要具备一定的技术先进性和实用性。

所以,本次项目的方案设计遵循以下设计原则:先进实用平台注重先进性和实用性的统一,以实用为目的,合理选用各类成熟、先进技术。

在体系结构、功能算法等诸多方面都采用先进计算机技术和理论,应用功能体现实用性。

可靠性在系统结构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能够7*24安全无故障运行,系统有很好的容错功能;对IT资源的监测应保证不影响相关设备和系统的正常良好运行,并实现最好的响应效率及最小的资源占用。

安全性注重安全方面的设计,确保IT运维监控管理平台的稳定、安全运行。

系统要保证数据的安全,不会增加现有应用系统的复杂性,更不会降低现有应用系统的稳定性。

开放性采用符合国际国内标准的通用协议,为实现与其他系统监控软硬件互联或接入本系统进行监控提供接口,支持各种主流计算机平台、操作系统以及数据库厂商的各类软硬件产品。

可扩展、易集成系统需具备很好的扩展性,能适应不断发展的业务需求。

随着IT资源种类和数量的扩大,系统也应能适应新的系统的对IT运维管理的需求。

系统具备高度集成性,可以和第三方产品进行集成,进行功能扩展。

系统提供开发工具和接口,方便其他监控系统集成和统一管理。

2.3 运维管理体系架构设计与运维综合监控相关的运维管理体系架构主要包括以下内容:1)资源监控与操作管理体系:面向资源,以统一资源配置库为基础,建设面向被管理资源的监控管理与操作自动化管理体系。

2)数据综合分析体系:面向管理者,以统一资源配置库为基础,对资源监控与操作管理体系数据进行分析挖掘,建设辅助运营决策的数据综合分析体系。

运维管理体系架构是一个完整的IT系统运维管理架构,是IT综合运维管理的较高目标。

2.3.1 系统总体架构设计系统由监控采集层、数据处理层、服务管理层、运行展现层组成。

2.3.2 监控采集层监控采集层主要由网络监控模块、应用监控模块组成,实现对IT基础支撑系统的监控,包括:网络设备、业务服务器、存储设备、数据库系统、中间件系统、安全设备、业务应用系统、网络流量等。

同时,从第三方系统抽取数据,实现对IT资源的全面监控。

2.3.3 数据处理层数据处理层由统一事件平台、数据指标抽取模块、监控指标库、可视化展现视图等模块组成。

监控指标库存放了所有监控对象的当前运行状况、重要告警、重要KPI性能指标等数据,实现性能基线管理,并为监控对象的可视化展现提供数据支持。

CMDB与RDB数据库的记录通过资源唯一标识ID实现一一对应,并能够自动维护其相互关联关系。

相关文档
最新文档