企业级IT运维可视化监控管理平台技术方案

合集下载

企业IT监控运维管理平台解决方案

企业IT监控运维管理平台解决方案

企业IT监控运维管理平台解决方案随着企业规模的不断扩大和IT系统的复杂性增加,企业对IT监控和运维管理的需求也越来越迫切。

一套全面高效的企业IT监控运维管理平台是解决这一问题的重要途径。

本文将介绍企业IT监控运维管理平台的解决方案,包括其功能特点、技术原理以及具体应用于实践中的效果。

一、功能特点1.统一监控:企业IT监控运维管理平台能够实现对整个IT基础架构的统一监控,包括硬件设备、网络设备、服务器、应用系统等。

通过集成各种监控工具和传感器,平台可以实现对各种监控指标的采集、存储、分析和展示。

2.实时告警:平台可以自动监测各项指标,并及时发出告警通知,帮助企业提前发现和解决潜在问题。

同时,平台还可以根据告警类型和严重程度进行智能分类和分级处理,以降低误报率和减少工作负担。

3.性能分析:平台可以对各种监控指标进行实时和历史性能分析,帮助企业了解系统的运行状态和性能瓶颈,并提供优化建议。

通过数据可视化和报表生成功能,平台可以直观地展示各项指标的变化趋势和潜在问题,帮助企业实现故障预警和性能优化。

4.自动化运维:平台还可以实现自动化运维管理,包括自动化巡检、设备配置管理、故障自愈、性能调优等。

通过自动化运维,可以提高IT系统的稳定性和可用性,减少人为错误和故障的发生。

二、技术原理1. 数据采集:平台需要通过各种监控工具和传感器对IT系统进行数据采集。

采集的数据包括系统日志、性能指标、运行状态等。

采集方式可以包括Agent采集、SNMP采集、流量匹配采集等。

2. 数据存储:采集的数据需要进行存储和管理,以便后续的查询和分析。

一般采用大数据存储技术,如Hadoop、HBase等,以支持大规模和高并发的数据访问。

3.数据分析:存储的数据需要进行实时和历史性能分析,以发现潜在问题和提供优化建议。

数据分析可以包括数据挖掘、机器学习、统计分析等。

同时,还需要支持数据可视化和报表生成,以提供直观的监控展示。

4.告警管理:平台需要实现告警的生成、发送和处理。

IT监控运维管理平台建设方案

IT监控运维管理平台建设方案

IT监控运维管理平台建设方案一、项目背景随着信息技术的发展和广泛应用,企业的IT系统已成为企业运营的重要支撑和保障。

为了确保IT系统的正常运行和故障处理,需要建设一个完善的IT监控运维管理平台。

本文将提出一个IT监控运维管理平台建设方案,旨在提高IT系统的稳定性和运维效率。

二、目标与要求1.提高系统稳定性:通过监控系统实时收集和分析数据,及时发现和解决故障,减少系统宕机和异常情况的发生。

2.提高运维效率:通过自动化的监控和运维工具,减少人工干预,提高运维效能,降低成本。

3.加强安全性:建立完善的权限管理体系,确保系统的安全运行和数据的保密性。

4.提供完善的报表和分析功能:对IT系统的性能和运行情况进行实时监控和分析,通过清晰的报表和图表呈现,提供决策参考。

三、平台架构1.网络基础设施层:包括网络设备(交换机、路由器等)、服务器、存储设备等,通过网络监控工具实时采集设备状态和性能数据。

2.系统应用层:包括操作系统、数据库、应用软件等,通过代理方式或API接口接入监控平台,实时传输数据。

3.监控与分析层:通过监控工具对各个系统和设备进行实时监控,并通过数据分析算法进行异常识别和故障预测。

4.运维管理层:包括故障处理、巡检、容灾等运维管理功能,通过工单系统进行运维任务的派发和跟踪。

5.安全与权限管理层:建立完善的权限管理体系,确保系统的安全运行和数据的保密性。

四、具体实施步骤1.现状分析:对企业IT系统的现状进行全面的调研和分析,包括系统结构、设备情况、运维流程等,确定建设需求和目标。

2.系统设计:根据需求和目标,设计IT监控运维管理平台的架构和功能模块,制定详细的设计方案。

3.系统采购与部署:根据设计方案,采购所需的硬件和软件设备,并进行系统的部署和配置。

4.数据采集与接入:通过网络监控和API接口等方式,实现对各个系统和设备的数据采集和接入。

5.数据分析与告警:通过数据分析算法,对采集到的数据进行实时分析,发现异常情况并及时发送告警。

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案在当今信息技术高速发展的时代,IT运维监控管理平台的建设变得越来越重要。

一个高效的IT运维监控管理平台可以帮助企业提高IT系统的稳定性和安全性,提升IT运维管理的效率。

以下是一个IT运维监控管理平台建设方案。

一、概述1.1目标本方案的目标是建设一个全面、高效且易于维护的IT运维监控管理平台,实现对企业IT系统的全面监控与管理,提升运维效率,确保系统的稳定运行。

1.2范围本方案主要包括硬件设备、软件系统、网络通信和人员培训等方面内容。

二、硬件设备2.1服务器建议采用高可用性的服务器集群,确保系统的稳定性和可靠性。

2.2网络设备需要配备高性能的网络设备,确保监控数据的高速传输和稳定性。

2.3存储设备建议采用高性能、高可靠性的存储设备,用于存储监控数据和日志文件。

三、软件系统3.1操作系统建议采用稳定、安全的操作系统,如Linux、Windows Server等。

3.2数据库选用高性能、高可靠性的数据库系统,如MySQL、Oracle等,用于存储监控数据和配置信息。

3.3监控软件选择功能强大、易于使用的监控软件,如Zabbix、Nagios等,用于对各类硬件设备、应用系统和网络进行监控。

3.4日志管理软件选用综合、灵活的日志管理软件,如ELK(Elasticsearch、Logstash、Kibana)等,用于收集、分析和查询系统日志。

3.5报警系统建立报警系统,可以及时捕捉系统异常状况,并及时发送报警信息。

四、网络通信4.1网络架构设计合理的网络架构,确保监控数据的高效传输和安全性。

4.2防火墙配置合适的防火墙规则,确保系统的安全性和可靠性。

4.3VPN建立VPN通道,保障监控数据的传输安全和隐私性。

五、人员培训5.1运维人员培训提供定期的运维人员培训,确保其能够熟练掌握监控管理平台的操作和维护方法。

5.2管理人员培训提供管理人员培训,使其了解系统的功能和运行情况,能够根据监控数据做出正确的决策。

企业IT监控运维平台建设方案

企业IT监控运维平台建设方案

企业IT监控运维平台建设方案一、项目背景和目标:随着信息化水平的提高,企业IT系统正扮演着越来越重要的角色,对于企业的正常运营和业务扩展起到关键作用。

为了确保企业IT系统的稳定性和高效性,建设一个全面的IT监控运维平台是非常必要的。

本方案旨在为企业提供一套完整的企业IT监控运维平台,包括监控系统的架构设计、功能模块的定义、数据采集和处理方法、报警机制建设以及平台运维等。

二、平台架构设计:1.系统架构:整体架构采用分布式架构,包括监控服务器和被监控主机两个部分。

监控服务器用于接收、存储和处理监控数据,提供监控、报表和告警服务。

被监控主机通过安装相关的代理软件,将主机的监控数据传输给监控服务器。

2.功能模块划分:平台功能模块包括:主机监控、网络监控、数据库监控、应用服务监控、日志监控、性能监控、配置管理和事件管理等。

每个功能模块都有相应的指标和告警规则设置,以及相应的监控报表和可视化界面。

三、数据采集和处理方法:1.数据采集:通过监控代理软件,实时采集被监控主机的相关信息,包括服务器状态、网络流量、数据库连接、应用服务状态等,并将数据传输给监控服务器。

2.数据处理:监控服务器收到的数据进行实时处理和存储,生成各种监控报表和指标图表。

同时,对采集到的数据进行定期的清理和归档,保证系统的稳定性和性能。

四、报警机制建设:1.报警规则设置:2.报警处理:当触发报警条件时,系统自动发送相应的报警通知给相关人员,并记录报警日志。

同时,可以设置自动化的故障诊断和修复处理,提高故障响应和处理效率。

五、平台运维:1.平台监控:建立专门的平台监控系统,对整个IT监控运维平台进行实时监控,包括服务器状态、存储容量、网络流量等。

及时发现和解决潜在的问题,保证平台的稳定性和可用性。

2.平台升级和维护:定期对平台进行升级和维护,包括安全补丁更新、数据库维护、性能优化等。

同时,建立完善的备份和恢复机制,确保平台的数据安全和可靠性。

企业IT监控管理平台解决方案

企业IT监控管理平台解决方案

企业IT监控管理平台解决方案一、引言随着企业信息化程度的不断提高,企业IT基础设施的复杂性和规模也在迅速增长。

为了确保企业的IT系统能够稳定运行并提供高质量的服务,企业需要建立一个全面的、集中化的IT监控管理平台。

本文将介绍一个完整的企业IT监控管理平台解决方案,包括其基本功能、系统架构、实施步骤等。

二、问题陈述企业在运营过程中面临的主要问题包括:系统故障频发、运维工作效率低下、对IT资源的管控难度大等。

这些问题的解决需要一个全面的、集中化的IT监控管理平台。

三、解决方案1.基本功能(1)设备监控功能:对企业IT系统所涉及的各种设备进行实时的状态监控,包括服务器、网络设备、存储设备等。

(2)性能监控功能:监控企业IT系统的性能指标,包括网络带宽、服务器负载、响应时间等,以便及时发现并解决系统性能问题。

(3)事件告警功能:设置各种告警规则,一旦发生故障或异常情况,即时向管理员发出告警通知,以便及时采取相应的措施。

(4)日志管理功能:对企业IT系统的日志进行收集和分析,以便及时发现异常行为或安全事件。

(5)配置管理功能:对企业IT系统的配置信息进行管理,保证系统的一致性和稳定性。

(6)绩效分析功能:对企业IT系统的运行情况进行全面的分析,为系统优化和决策提供有力支持。

2.系统架构(1)数据采集组件:用于采集各种设备和系统的状态参数、性能指标等数据,并将其发送到监控服务器。

(2)监控服务器:负责接收数据、进行数据存储、处理告警、配置管理和绩效分析等核心功能。

(3)用户界面:提供用户登录认证、数据展示和操作控制等功能,用户可以通过web页面或移动客户端访问。

(4)数据库:用于存储各种数据,包括配置信息、状态数据、告警数据、日志数据等。

(6)数据分析组件:对存储在数据库中的数据进行离线分析,生成报表、趋势图等,为系统优化和决策提供支持。

3.实施步骤(1)需求分析:明确企业的监控管理需求,包括需要监控的设备和系统、关注的性能指标、告警通知方式等。

XXXIT运维监控管理平台建设方案范文(参考)

XXXIT运维监控管理平台建设方案范文(参考)

XXXIT运维监控管理平台建设方案范文(参考)IT运维监控管理平台建设方案某某某某某某某IT系统监控管理平台项目——技术方案(运维综合监控管理)目录第1章概述 (4)1.1建设背景....................................................41.2建设目标....................................................41.3建设思路....................................................5第2章系统总体设计. (6)2.1总体架构....................................................62.2设计原则....................................................72.3运维管理体系架构设计. (8)2.3.1系统总体架构设计.......................................82.3.2监控采集层.............................................92.3.3数据处理层.............................................92.3.4运行展现层.............................................92.4系统技术路线.. (10)2.4.1采用Java语言开发.....................................102.4.2采用J2EE框架.........................................112.4.3采用WebService进行数据互连互通.......................112.4.4数据库技术............................................132.4.5性能控制..............................................142.4.6开发、运行环境........................................142.5应用接口总体设计. (14)2.5.1系统内部集成接口......................................142.5.2与基础运维管理工具的集成接口..........................152.5.3与ITSM系统的集成接口.................................152.5.4与相关外部系统的统一身份认证与单点登录接口............152.6系统安全设计及部署.. (16)2.6.1输入检验..............................................162.6.2GET请求和Cookie中的敏感数据. (16)IT系统监控管理平台项目——技术方案(运维综合监控管理)2.6.3防通过嵌入标记实现的攻击..............................162.6.4防口令猜测功能........................................172.6.5页面和字段级的权限控制................................172.6.6系统安全架构 (17)第3章系统功能设计 (18)3.1动环监控 (18)3.1.1配电柜监测............................................183.1.2配电开关及电流监控....................................183.1.3发电机监控............................................193.1.4ATS监测..............................................193.1.5STS监测..............................................193.1.6UPS监控子系统........................................203.2统一门户子系统 (20)3.2.1信息主管领导内容展示..................................213.2.2运维人员内容展现......................................213.2.3一般用户内容展现......................................223.3IT运行监控子系统. (22)3.3.1基础平台功能..........................................223.3.2网络设备管理..........................................243.3.3服务器监控管理........................................273.3.4存储监控管理..........................................303.3.5数据库监控管理........................................303.3.6中间件监控管理........................................313.3.7web与应用监控管理....................................323.3.8虚拟化监控管理........................................333.3.9IP地址管理管理.......................................343.3.10信息点管理...........................................353.3.11告警监控管理与转发处理...............................363.3.12综合监控管理.. (37)IT系统监控管理平台项目——技术方案(运维综合监控管理)3.3.13综合报表管理.........................................383.4IT服务管理子系统. (39)3.4.1功能特点..............................................393.4.2服务台管理............................................423.4.3服务目录管理..........................................433.4.4服务请求管理..........................................433.4.5事件管理..............................................443.4.6问题管理..............................................443.4.7变更管理..............................................453.4.8值班管理..............................................453.4.9公告管理..............................................463.4.10IT运维报告..........................................463.4.11用户管理 (47)第4章培训方案....................................................47第5章系统价值 (48)第6章售后服务 (48)IT系统监控管理平台项目——技术方案(运维综合监控管理)第1章概述1.1建设背景随着近年来经济的进一步迅速发展,企事业机关单位IT运行环境日趋复杂,运行监控工作难度加大,尤其是随着信息化建设的不断深入,信息系统越来越多,各类系统越来越复杂,系统的关联度也越来越高。

XXXIT运维监控管理平台建设方案

XXXIT运维监控管理平台建设方案

XXXIT运维监控管理平台建设方案一、项目背景随着信息化建设的不断发展,企业对IT系统的依赖程度也逐渐增加。

为了有效管理和监控企业IT系统的运行状态,及时发现和解决问题,保障系统的稳定性和可靠性,建设一套完善的IT运维监控管理平台变得尤为重要。

本文将提出一套XXX公司IT运维监控管理平台建设方案,以帮助企业提高运维效率,降低故障率,保障业务连续稳定运行。

二、系统架构1.硬件设施:采用虚拟化技术部署监控平台,搭建监控服务器、数据库服务器、存储服务器等硬件设施。

2. 软件系统:选择稳定、可靠的监控软件,如Zabbix、Nagios、SolarWinds等,搭建监控系统,实现对服务器、网络设备、数据库、应用程序等方面的监控。

3. 数据库支持:选择高性能、高可用的数据库系统,如MySQL、Oracle,存储监控数据,并支持监控数据的查询、统计和报表功能。

4.报警通知:配置报警规则,当监控系统检测到异常时,及时发送报警通知给相关人员,采取措施解决问题。

5.可视化展示:采用图表、报表等形式展示监控数据,让用户更直观地了解系统运行状态。

6.用户管理:设置不同权限的用户角色,确保不同级别的用户可以访问适当的监控数据。

三、功能模块1.网络监控:监控网络设备的运行状态、带宽利用率、流量分析等,保障网络运行的畅通。

2.服务器监控:监控服务器的CPU利用率、内存使用率、磁盘空间等,确保服务器正常运行。

3.数据库监控:监控数据库的连接数、查询响应时间、索引性能等,保障数据库的稳定性和可靠性。

4.应用程序监控:监控业务应用的响应时间、错误率、并发用户数等,及时发现并解决问题。

5.日志管理:对系统日志进行收集、分析、备份,帮助排查故障和改进系统性能。

6.性能优化:根据监控数据,优化系统配置、调整资源分配,提高系统性能。

7.报表统计:提供各种监控数据的报表,帮助管理层了解系统运行状态,做出决策。

四、实施步骤1.立项:确定项目范围、目标和时间表,制定项目计划。

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案

IT运维监控管理平台建设方案一、项目背景及目标随着信息技术的快速发展和普及,现代企业对IT系统的依赖程度越来越高,因此有必要建立一个IT运维监控管理平台,以实时监控、管理和维护企业的IT系统,确保其稳定运行。

该平台的目标是提高IT系统的可用性、减少故障发生和恢复时间、提高管理效率和降低运维成本。

二、功能需求1.实时监控:监控服务器、网络设备、数据库、应用程序等的性能指标和运行状态,提供实时的监控数据和报警功能。

2.故障诊断:当故障发生时,能够快速定位问题,提供实时告警信息和故障诊断报告。

3.自动化运维:能根据设定的规则进行自动化巡检和维护,提高运维效率和减少人工操作的错误。

4.资源管理:管理企业的IT资源,包括服务器、存储设备、网络设备等,并提供即时的资源利用情况和统计报表。

5.SLA管理:监控和管理IT系统的服务级别协议(SLA),确保服务水平符合承诺。

6.日志管理:对系统的日志进行收集、分析和存储,以帮助故障定位和问题解决。

7.报表和统计:提供各种报表和统计功能,如性能报表、故障统计、资源利用率报表等,以帮助管理者了解系统运行情况。

三、技术方案1. 选择合适的监控工具:根据需求选择一款成熟可靠的监控工具,如Zabbix、Nagios等,它们能够提供丰富的监控功能和报警机制。

2.构建监控体系:根据企业的IT系统架构,合理划分监控区域和节点,建立监控服务器和代理节点,确保全面监控。

3.设定监控项和阈值:根据实际情况,设定监控项和阈值,确保监控的准确性和稳定性。

4.配置告警机制:根据监控项和阈值设定告警规则,及时发送告警信息给相关人员,确保处理及时有效。

5.配置自动化运维规则:根据运维经验和规范,设定自动化巡检和维护规则,减少人工操作和提高运维效率。

6.配置存储和备份策略:对系统的监控数据和日志进行存储和备份,以保证数据的安全性和完整性。

7.配置权限和审计机制:设定不同的权限和角色,限制用户对系统的访问和操作,同时开启审计功能,记录用户的操作和变更。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

IT运维可视化监控管理平台技术方案2018年目录第1章概述 (1)1.1 建设背景 (1)1.2 建设目标 (1)1.3 建设思路 (2)第2章系统总体设计 (3)2.1 总体架构 (3)2.2 设计原则 (4)2.3 运维管理体系架构设计 (5)2.3.1 系统总体架构设计 (5)2.3.2 监控采集层 (6)2.3.3 数据处理层 (6)2.3.4 运行展现层 (6)2.4 系统技术路线 (7)2.4.1 采用Java语言开发 (7)2.4.2 采用J2EE框架 (8)2.4.3 采用WebService进行数据互连互通 (8)2.4.4 数据库技术 (10)2.4.5 性能控制 (11)2.4.6 开发、运行环境 (11)2.5 应用接口总体设计 (11)2.5.1 系统内部集成接口 (11)2.5.2 与基础运维管理工具的集成接口 (12)2.5.3 与ITSM系统的集成接口 (12)2.5.4 与相关外部系统的统一身份认证与单点登录接口 (12)2.6 系统安全设计及部署 (13)2.6.1 输入检验 (13)2.6.2 GET请求和Cookie中的敏感数据 (13)2.6.3 防通过嵌入标记实现的攻击 (13)2.6.4 防口令猜测功能 (14)2.6.5 页面和字段级的权限控制 (14)2.6.6 系统安全架构 (14)第3章系统功能设计 (15)3.1 动环监控 (15)3.1.1 配电柜监测 (15)3.1.2 配电开关及电流监控 (15)3.1.3 发电机监控 (16)3.1.4 ATS监测 (16)3.1.5 STS监测 (16)3.1.6 UPS监控子系统 (17)3.2 统一门户子系统 (17)3.2.1 信息主管领导内容展示 (18)3.2.2 运维人员内容展现 (18)3.2.3 一般用户内容展现 (19)3.3 IT运行监控子系统 (19)3.3.1 基础平台功能 (19)3.3.2 网络设备管理 (21)3.3.3 服务器监控管理 (24)3.3.4 存储监控管理 (27)3.3.5 数据库监控管理 (27)3.3.6 中间件监控管理 (28)3.3.7 web与应用监控管理 (29)3.3.8 虚拟化监控管理 (30)3.3.9 IP地址管理管理 (31)3.3.10 信息点管理 (32)3.3.11 告警监控管理与转发处理 (33)3.3.12 综合监控管理 (34)3.3.13 综合报表管理 (35)3.4 IT服务管理子系统 (36)3.4.1 功能特点 (36)3.4.2 服务台管理 (39)3.4.3 服务目录管理 (40)3.4.4 服务请求管理 (40)3.4.5 事件管理 (41)3.4.6 问题管理 (41)3.4.7 变更管理 (42)3.4.8 值班管理 (42)3.4.9 公告管理 (43)3.4.10 IT运维报告 (43)3.4.11 用户管理 (44)第4章培训方案 (44)第5章系统价值 (45)第6章售后服务 (45)第1章概述1.1 建设背景随着近年来经济的进一步迅速发展,企事业机关单位IT运行环境日趋复杂,运行监控工作难度加大,尤其是随着信息化建设的不断深入,信息系统越来越多,各类系统越来越复杂,系统的关联度也越来越高。

数据处理量成倍增长,而随着互联网应用的发展,网上应用系统也越来越多,使IT 系统运行环境变得更加复杂,造成了机房管理、系统监控、运行维护工作十分困难的局面。

虽然信息中心各科室对已经有各的监控管理手段,但缺乏一个集中、统一的监控平台,及时发现与解决网络、硬件、安全设备、操作系统、数据库、中间件、应用系统、机房空调、UPS 等突然出现的问题。

因服务对象的不同,使用产品混杂。

怎样很好地解决以上问题,把各种类型的监控对象进行统一集中监控,并将其格式统一规范,并对其有效处理、分析,以直观的界面展现给各科室管理员、领导,成为目前面临最大的挑战。

1.2 建设目标加强信息资源的维护平台建设,提高信息资源的运行管理水平,通过运维体系的建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,及时、准确、全面反映与掌握信息系统的运行状态,保障各业务系统的正常运行,应达成如下目标:(1)强化主动监控,实现集中管理。

以IT资源可用性监控为主线,构建统一集成的IT资源及应用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成IT运维管理主动服务的新局面。

(2)帮助定位故障,快速恢复系统运行。

建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。

当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。

(3)掌握运行质量与效率,合理利用资源。

建立IT运维平台后,可以实时了解全部IT资源的负载与使用情况,根据需要从整体角度考虑资源的使用,同时可以根据业务高峰期的不同来调剂业务系统对资源的使用。

(4)规范运行管理,有序开展维护。

参照ITIL规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。

根据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。

(5)共享运维经验,完善知识库。

把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制,提供信息共享和交流的平台,提高运维人员的工作效率。

1.3 建设思路IT运维管理理论、方法和标准,结合中心实际和建设需要,遵循立足需求、统一规划、保障重点、分步实施、务求实效的原则,建立一套融合组织、制度、流程、人员、技术的IT运维管理体系,建立组织机构,制定规章制度,规范管理流程,明确职责分工,强化技术支撑,实现对网络及信息系统的综合管理监控和日常技术支持,快速响应和及时解决信息系统运行过程中出现的各种问题和故障,确保所维护网络及信息系统正常、稳定、高效运行。

第2章系统总体设计2.1 总体架构依据对IT运维管理体系的建设经验,以及对用户信息系统现状、需求的分析,我们提出三位一体综合运维管理平台框架图如下:IT运维管理平台包括:“IT运行集中监控、IT运维流程服务、统一运维门户”三个部分。

底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统提供基础数据;IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;IT运维流程服务主要根据IT服务管理的国际标准ISO2000,并结合ITIL最佳实践,梳理出了事件管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规划范管理,提升IT服务的质量。

统一门户主要实现对监控信息、运维流程信息进行集中展示。

平台三个子系统关系如下:(1)以IT运行监控为“基础”这部分的功能主要是对被管对象运行的状态以及其配置资产信息进行统一监控、管理、分析,实现对各种故障和性能异常的及时报警,对系统运行性能进行实时监控,对系统运行的各种状态信息进行汇总、分析以及预测。

另外,还包括对IT系统的全部配置资产情况进行统一管理,对配置信息的异动提供检查及告警。

IT监控管理除了实现网管的告警、性能、配置几大基本功能以外,还从运维的角度提供丰富的数据综合分析和运维工具,例如综合报表、综合监控、信息点管理等。

(2)以IT服务管理为“导向”这部分功能主要依据ITIL架构进行建设,为IT系统的维护服务提供电子化的控制手段。

系统通过事件管理、问题管理、变更管理、配置管理等功能,为IT维护人员提供以流程为基础的服务管理方式,规范管理模式,达到快速消除IT系统故障、解决潜在问题,减少不规范的系统变更引发的系统故障率和故障隐患等目的,实现对IT系统的主动式服务,提高服务水平。

(3)以统一运维门户为“体现”即是整个系统的对外界面,通过统一的权限管理和统一风格的B/S展现,为系统的操作使用人员提供统一的系统接口,做到一点接入,通观全局,能够以灵活的组织数据的展现方式,定义用户、角色、组织机构,并为每个不同角色提供不同的功能模块,为每个用户分配不同的展现内容,方便用户进行企业整体的运行维护管理。

2.2 设计原则IT运维平台作为信息中心未来运维工作的核心支撑系统,需要系统本身具有高可靠、易扩展、易维护等特点,并且在系统功能应用上要具备一定的技术先进性和实用性。

所以,本次项目的方案设计遵循以下设计原则:(1)先进实用平台注重先进性和实用性的统一,以实用为目的,合理选用各类成熟、先进技术。

在体系结构、功能算法等诸多方面都采用先进计算机技术和理论,应用功能体现实用性。

(2)可靠性在系统结构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能够7*24安全无故障运行,系统有很好的容错功能;对IT资源的监测应保证不影响相关设备和系统的正常良好运行,并实现最好的响应效率及最小的资源占用。

(3)安全性注重安全方面的设计,确保IT运维监控管理平台的稳定、安全运行。

系统要保证数据的安全,不会增加现有应用系统的复杂性,更不会降低现有应用系统的稳定性。

(4)开放性采用符合国际国内标准的通用协议,为实现与其他系统监控软硬件互联或接入本系统进行监控提供接口,支持各种主流计算机平台、操作系统以及数据库厂商的各类软硬件产品。

(5)可扩展、易集成系统需具备很好的扩展性,能适应不断发展的业务需求。

随着IT资源种类和数量的扩大,系统也应能适应新的系统的对IT运维管理的需求。

系统具备高度集成性,可以和第三方产品进行集成,进行功能扩展。

系统提供开发工具和接口,方便其他监控系统集成和统一管理。

2.3 运维管理体系架构设计与运维综合监控相关的运维管理体系架构主要包括以下内容:1)资源监控与操作管理体系:面向资源,以统一资源配置库(资产与配置、监控数据库)为基础,建设面向被管理资源的监控管理与操作自动化管理体系。

2)数据综合分析体系:面向管理者,以统一资源配置库为基础,对资源监控与操作管理体系数据进行分析挖掘,建设辅助运营决策的数据综合分析体系。

运维管理体系架构是一个完整的IT系统运维管理架构,是IT综合运维管理的较高目标。

2.3.1 系统总体架构设计系统由监控采集层、数据处理层、服务管理层、运行展现层组成。

2.3.2 监控采集层监控采集层主要由网络监控模块(NCC)、应用监控模块(BCC)组成,实现对IT基础支撑系统的监控,包括:网络设备、业务服务器、存储设备、数据库系统、中间件系统、安全设备、业务应用系统、网络流量等。

同时,从第三方系统(如机房环境监控和视频监控系统等)抽取数据(包括资产配置数据、故障告警数据),实现对IT资源的全面监控。

相关文档
最新文档