智慧IT运维管理体系总体设计
智慧IT运维管理解决方案

自动化测试:自动 执行测试任务,提 高测试覆盖率和准
确性
自动化安全防护: 实时监控和防护系 统安全,降低安全
风险
智能监控技术
实时监控:对IT基 础设施、应用和服 务进行实时监控, 及时发现问题
故障定位:通过关 联分析,快速定位 故障原因,缩短故 障恢复时间
自动告警:根据预 设的阈值和规则, 自动触发告警,通 知相关人员
03
提高服务质量:通过快速响应、 故障诊断和修复,提高服务质量, 提升用户体验。
02
降低运维风险:通过实时监控、 预警和报警机制,降低运维风险, 保障系统稳定运行。
04
降低运维成本:通过优化资源配 置、减少浪费,降低运维成本, 提高企业效益。
部署与实施
部署方式
云部署:通过云平台进 行部署,方便快捷,节 省成本
03
建立应急处理 知识库,积累 经验,持续改 进应急预案
05
02
制定应急处理流 程,包括报告、 响应、调查、解 决、总结等环节
04
定期进行应急 演练,提高应 急处理能力和 效率
应急响应流程
1
监测预警:实时监 控系统运行状态, 及时发现异常情况
4
制定方案:根据故 障情况,制定相应
的应急处置方案
2
快速响应:接到报 警后,立即启动应 急响应机制,组织 相关人员进行处置
02
降低运维成本
04
增强IT运维的灵活性和可扩展性
智慧IT运维管理解决方案的优势
01 提高运维效率:通过自 02 降低运维成本:通过集
动化、智能化的运维手
中管理、资源共享等方
段,降低人工操作成本, 提高运维效率。
式,降低运维成本,提 高企业效益。
智慧IT运维管理体系总体方案

智慧IT运维管理体系总体方案目录1项目需求分析 (5)1.1项目预期与目标 (5)1.2对项目的解读与理解 (6)1.2.1强化主动监控,实现集中管理 (7)1.2.2快速定位故障,减少维护成本 (7)1.2.3提升主动管理、辅助分析决策 (7)1.2.4直观运行展现,快速指挥调度 (8)1.2.5规范日常流程,有序高效协作 (8)1.3主要问题、重点及难点的阐述 (8)1.3.1实现统一监控、处置及展现 (8)1.3.2完整、有效、统一的配置管理库 (9)1.3.3符合ITIL规范的基础服务流程 (10)1.3.4可灵活定制的运维流程引擎 (11)1.3.5通过服务目录、服务级别管理提升运维服务质量 (11)1.3.6简单易用的报表设计器 (12)1.3.7统一的运维服务门户 (12)1.3.8面向不同运维视角的个人工作台 (13)1.3.9完善、严格的权限和认证管理 (13)1.3.10标准、灵活的开放接口和扩展需求 (14)2体系及制度建设 (16)2.1参考标准与方法论 (16)2.1.1运维体系参考标准规范 (16)2.1.2IT运维管理成熟度分析 (17)2.1.3运维体系建设方法论 (20)2.2运维管理体系规划 (23)2.2.1运维管理规划目标 (23)2.2.2运维管理总体规划 (24)2.3运维管理管理制度建设 (25)2.3.1运维流程管理规范 (26)2.3.2IT运维操作管理规范 (26)2.3.3进行运维服务提升评估 (26)3技术方案 (28)3.1总体设计方案 (28)3.1.1总体设计技术路线 (28)3.1.2系统总体功能架构 (29)4合理化建议 (32)4.1配套流程规范制度是IT服务平台有效运转的基石 (32)4.2面向最终用户的对外运维门户实现IT服务能力的延伸及自助服务模式的培养 (33)4.3基于知识库实现运维工作的自助化与智能化 (35)1项目需求分析1.1项目预期与目标通过本次项目建设,将实现以下建设目标与成果:(1)体系及制度建设协助用户建立公司信息化建设的运维管理体系,基于云南财政信息化的具体情况,结合国家的相关标准,制定行之有效的管理规范和制度,并与运维管理系统相结合,落实IT运维管理的信息化系统建设,实现运维管理工作的规范化、体系化。
智慧运维管理系统的研发设计方案

智慧运维管理系统的研发设计方案智慧运维管理系统是基于互联网、物联网、人工智能等最新技术的一种新型管理系统,主要用于企业设备和设施的管理与维护,能够实现设备状态监测、故障预测、故障处理、运维人员调度管理等功能。
下面是智慧运维管理系统的研发设计方案:一、需求分析:1. 基于现有的运维管理需求,确定系统的核心功能,包括设备监控、故障管理、运维人员调度等。
2. 分析运维业务的特点,明确系统的技术要求,包括数据采集能力、大数据处理能力、人工智能算法、数据安全性等。
3. 调研市场上已有的类似系统,了解行业发展趋势,找出差距和创新点。
二、系统架构设计:1. 前端界面设计:采用响应式设计,适配不同设备的屏幕尺寸;通过数据可视化展示设备的监控数据、故障统计等信息。
2. 后端架构设计:采用微服务架构,将系统拆分成多个独立的服务模块,提高系统的可扩展性和灵活性。
3. 数据库设计:设计适应大数据存储的数据库架构,采用分布式数据库、数据分片等技术,保证系统对海量数据的高效存储和快速查询。
4. 数据采集与处理:引入物联网技术,通过传感器等设备采集设备的状态数据,并利用大数据技术进行实时处理和分析,实现故障预测和性能优化。
5. 人工智能算法:通过机器学习和深度学习算法,对设备的故障模式进行分析和建模,并通过模型和规则库来预测故障和生成维护建议。
三、系统功能设计:1. 设备监控功能:实时监控设备状态,包括温度、湿度、电压等参数,通过数据可视化展示设备的实时数据。
2. 故障管理功能:自动识别设备故障,并生成故障报告,包括故障类型、故障原因、故障处理流程等。
3. 运维人员调度功能:根据设备的故障情况和运维人员的技能,自动派发任务给运维人员,并对任务执行情况进行监控和统计。
4. 统计分析功能:对设备的运行数据进行统计和分析,生成报表和可视化图表,帮助决策者了解设备的运行状况和维护情况。
5. 用户权限管理功能:对不同角色的用户进行权限管理,保证系统数据的安全性和合规性。
IT综合运维管理系统技术方案

IT综合运维管理系统技术方案一、系统架构1.总体架构IT综合运维管理系统采用三层架构,包括用户界面层、业务逻辑层和数据访问层。
用户界面层提供用户界面,用户可以通过浏览器访问系统;业务逻辑层处理用户请求,调用相应的逻辑处理代码;数据访问层负责数据的读取和存储。
2.技术选型用户界面层使用HTML、CSS和JavaScript编写,前端框架选择AngularJS;业务逻辑层使用Java编程语言,并采用Spring Boot框架进行开发;数据访问层使用MyBatis作为ORM框架,访问数据库。
系统采用MySQL作为数据库管理系统。
二、系统功能模块1.用户管理模块该模块用于对系统的用户进行管理,包括用户的新增、删除和修改,以及用户的权限控制。
系统管理员可以管理用户的权限和角色,提供灵活的权限分配方式。
2.设备管理模块该模块用于对企业的IT设备进行综合管理,包括设备的新增、删除和修改,以及设备的监控和维护。
系统可以实时监控设备的状态和性能指标,同时提供预警机制,及时发现和解决设备问题。
3.故障管理模块该模块用于对设备故障进行管理,包括故障的报告、分析和解决。
系统可以自动收集设备的故障信息,并提供故障分析报告和解决方案。
同时,系统还可以对故障进行统计和分析,提供故障管理决策支持。
4.变更管理模块该模块用于对IT资源的变更进行管理,包括变更的申请、审批和执行。
系统可以提供变更管理流程和控制机制,确保变更的有效性和可靠性。
同时,系统还可以记录和跟踪变更的历史,方便后续的审计和追溯。
5.性能管理模块该模块用于对设备的性能指标进行监控和管理,包括设备的CPU、内存、网络等指标。
系统可以实时采集和展示设备的性能数据,同时提供性能报表和趋势分析。
6.日志管理模块该模块用于对系统的操作日志进行管理,包括日志的记录、查询和分析。
系统可以将用户的操作日志进行记录和存储,并提供查询和分析功能。
同时,系统还可以对日志进行报表和统计,方便管理者进行管理和决策。
智慧运维it运维管理平台建设方案

数据分析与决策支持
03
通过对数据的分析和挖掘,为决策提供支持。
04
智慧运维IT运维管理平台 功能模块设计
监控管理模块
设备状态监控
实时监测IT设备的运行状态,包括服务器、网络设备、存储设备 等。
性能监控
对IT设备的性能指标进行监控,如CPU使用率、内存占用率、网 络带宽等。
故障报警
设定阈值,当设备状态或性能指标超过设定阈值时,触发报警机 制。
03
实施计划
制定详细的实施计划,包括改 进措施的具体内容、时间表和 责任人,确保改进工作的顺利
进行。
04
监控与调整
对改进过程进行实时监控,根 据实际情况调整改进计划和目 标,确保持续改进工作的有效
性和针对性。
THANKS
培训风险
针对使用人员培训不足的问题,制 定详细的培训计划和考核机制。
06
智慧运维IT运维管理平台 效果评估与持续改进计划
效果评估方法与指标体系设计
关键绩效指标(KPI)
设定与运维管理平台相关的关键绩效指标, 如故障处理时间、系统稳定性、资源利用率 等,用于评估平台运行效果。
用户满意度调查
定期开展用户满意度调查,了解用户对运维管理平 台的评价和意见,以便及时改进。
维护计划制定
根据设备的预测性维护结果,制定合理的维护计 划。
3
维护任务管理
对维护任务进行跟踪和管理,确保维护工作的顺 利进行。
智能调度模块
资源调度
根据设备的负载情况,动态调整资源的分配,确保系统的稳定运 行。
任务调度
将运维任务按照优先级进行排序,自动分配给运维人员进行处理。
运维人员管理
对运维人员进行管理和调度,确保运维工作的顺利进行。
智慧运维系统设计设计方案

智慧运维系统设计设计方案智慧运维系统设计方案一、需求分析随着公司业务规模的不断扩大,传统的运维方式已经无法满足需求,因此需要设计一个智慧运维系统来提高运维效率和质量。
通过对公司运维需求的分析,我总结了以下几个主要的需求:1. 故障监测与预警:能够实时监测各个关键设备的状态,及时发现并预警潜在故障,以便及时解决避免损失。
2. 设备管理:能够对设备进行统一管理,包括设备的基本信息、运行状态、维修历史等,为设备维修和更换提供依据。
3. 工单管理:能够对维修工单进行统一管理和分配,提高维修效率和工单处理质量。
4. 统计与分析:能够对设备故障、维修情况进行统计和分析,为决策提供依据。
二、系统设计1. 总体架构智慧运维系统基于云计算和大数据技术构建,采用分布式架构,能够处理大规模数据和并发请求。
主要分为以下几个模块:- 故障监测与预警模块:负责监测各个关键设备的运行状态,通过设备传感器采集数据,并实时分析判断是否出现故障,并通过消息推送通知相关人员。
- 设备管理模块:负责设备信息的录入、查询、修改和删除等操作,管理设备的基本信息、运行状态以及维修历史等。
- 工单管理模块:负责工单信息的录入、查询、修改和删除等操作,将维修工单分配给相应的维修人员处理,同时能够跟踪工单的处理进度。
- 统计与分析模块:负责对设备故障、维修情况等数据进行统计和分析,生成相关的报表和图表,以便决策人员进行决策。
2. 数据管理为了支持系统的高性能和大规模数据处理,采用数据库分布式存储和缓存技术。
主要使用关系数据库存储设备和工单的基本信息,包括设备ID、名称、型号、维修历史等。
同时,为了提高系统的读写性能,采用缓存技术将一些常用的数据缓存在内存中,减少数据库的访问。
3. 技术选型- 后端:使用Java语言开发,采用Spring框架提供基础支持,使用SpringMVC提供Web接口,使用Spring Boot简化配置,使用MyBatis作为数据库访问框架。
智慧IT运维管理体系总体方案

智慧IT运维管理体系总体方案目录1项目需求分析 (5)1.1项目预期与目标 (5)1.2对项目的解读与理解 (6)1.2.1强化主动监控,实现集中管理 (7)1.2.2快速定位故障,减少维护成本 (7)1.2.3提升主动管理、辅助分析决策 (7)1.2.4直观运行展现,快速指挥调度 (8)1.2.5规范日常流程,有序高效协作 (8)1.3主要问题、重点及难点的阐述 (8)1.3.1实现统一监控、处置及展现 (8)1.3.2完整、有效、统一的配置管理库 (9)1.3.3符合ITIL规范的基础服务流程 (10)1.3.4可灵活定制的运维流程引擎 (11)1.3.5通过服务目录、服务级别管理提升运维服务质量 (11)1.3.6简单易用的报表设计器 (12)1.3.7统一的运维服务门户 (12)1.3.8面向不同运维视角的个人工作台 (13)1.3.9完善、严格的权限和认证管理 (13)1.3.10标准、灵活的开放接口和扩展需求 (14)2体系及制度建设 (16)2.1参考标准与方法论 (16)2.1.1运维体系参考标准规范 (16)2.1.2IT运维管理成熟度分析 (17)2.1.3运维体系建设方法论 (20)2.2运维管理体系规划 (23)2.2.1运维管理规划目标 (23)2.2.2运维管理总体规划 (24)2.3运维管理管理制度建设 (25)2.3.1运维流程管理规范 (26)2.3.2IT运维操作管理规范 (26)2.3.3进行运维服务提升评估 (26)3技术方案 (28)3.1总体设计方案 (28)3.1.1总体设计技术路线 (28)3.1.2系统总体功能架构 (29)4合理化建议 (32)4.1配套流程规范制度是IT服务平台有效运转的基石 (32)4.2面向最终用户的对外运维门户实现IT服务能力的延伸及自助服务模式的培养 (33)4.3基于知识库实现运维工作的自助化与智能化 (35)1项目需求分析1.1项目预期与目标通过本次项目建设,将实现以下建设目标与成果:(1)体系及制度建设协助用户建立公司信息化建设的运维管理体系,基于云南财政信息化的具体情况,结合国家的相关标准,制定行之有效的管理规范和制度,并与运维管理系统相结合,落实IT运维管理的信息化系统建设,实现运维管理工作的规范化、体系化。
IT运维管理系统解决方案设计

IT运维管理系统解决方案设计1.需求分析:首先,需要与相关部门和用户进行沟通,了解他们的需求和痛点,明确系统的功能和特点。
需求分析包括对IT运维流程、设备管理、故障处理、变更管理、配置管理、报表统计等方面进行详细的调研和分析。
2.系统架构设计:根据需求分析的结果,确定系统的架构和模块划分。
一般可以采用B/S架构,将系统分为前端用户界面、中间业务逻辑层和后端数据存储层。
同时,还需要考虑系统的扩展性和可维护性,确保系统可以满足未来的发展需求。
3.数据库设计:根据需求分析,设计和优化数据库结构,确保数据的安全和高效。
需要考虑数据的一致性和完整性,避免冗余和重复,合理划分数据表和字段,并建立索引和关联关系,提高数据的检索和查询效率。
4.功能模块设计:根据需求,设计和实现各个功能模块,如设备管理、故障处理、变更管理、配置管理等。
每个功能模块应具备相应的功能和操作界面,同时需要考虑模块之间的关联和交互,确保系统的整体一致性和流畅性。
5.用户权限管理:设计合理的用户权限管理机制,确保不同用户只能访问和操作其具备权限的内容。
可以设计不同的用户角色和权限组,通过角色和权限的分配,控制用户的操作范围和权限级别,提高系统的安全性和可控性。
6.报表统计和数据分析:设计和开发统计报表和数据分析功能,通过对系统中的数据进行分析和汇总,生成各种报表和图表,帮助管理人员和决策者进行业务分析和决策。
7.系统集成和对接:考虑系统与其他相关系统的集成和对接,如与CMDB系统、工单系统、监控系统等的对接,通过接口和数据交换,实现信息的共享和互通。
8.用户培训和支持:设计培训计划,对系统的相关用户进行培训和指导,以确保用户能熟练掌握系统的使用方法和操作技巧。
同时,提供及时的技术支持和维护服务,解决用户在使用系统过程中遇到的问题和困难。
9.系统测试和优化:在系统开发完成后,进行全面的测试,包括功能测试、性能测试、安全测试等,并根据测试结果进行系统优化和调整,提高系统的稳定性和性能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
智慧IT运维管理体系总体方案目录1项目需求分析 (5)1.1项目预期与目标 (5)1.2对项目的解读与理解 (6)1.2.1强化主动监控,实现集中管理 (7)1.2.2快速定位故障,减少维护成本 (7)1.2.3提升主动管理、辅助分析决策 (7)1.2.4直观运行展现,快速指挥调度 (8)1.2.5规范日常流程,有序高效协作 (8)1.3主要问题、重点及难点的阐述 (8)1.3.1实现统一监控、处置及展现 (8)1.3.2完整、有效、统一的配置管理库 (9)1.3.3符合ITIL规范的基础服务流程 (10)1.3.4可灵活定制的运维流程引擎 (11)1.3.5通过服务目录、服务级别管理提升运维服务质量 (11)1.3.6简单易用的报表设计器 (12)1.3.7统一的运维服务门户 (12)1.3.8面向不同运维视角的个人工作台 (13)1.3.9完善、严格的权限和认证管理 (13)1.3.10标准、灵活的开放接口和扩展需求 (14)2体系及制度建设 (16)2.1参考标准与方法论 (16)2.1.1运维体系参考标准规范 (16)2.1.2IT运维管理成熟度分析 (17)2.1.3运维体系建设方法论 (20)2.2运维管理体系规划 (23)2.2.1运维管理规划目标 (23)2.2.2运维管理总体规划 (24)2.3运维管理管理制度建设 (25)2.3.1运维流程管理规范 (26)2.3.2IT运维操作管理规范 (26)2.3.3进行运维服务提升评估 (26)3技术方案 (28)3.1总体设计方案 (28)3.1.1总体设计技术路线 (28)3.1.2系统总体功能架构 (29)4合理化建议 (32)4.1配套流程规范制度是IT服务平台有效运转的基石 (32)4.2面向最终用户的对外运维门户实现IT服务能力的延伸及自助服务模式的培养 (33)4.3基于知识库实现运维工作的自助化与智能化 (35)1项目需求分析1.1项目预期与目标通过本次项目建设,将实现以下建设目标与成果:(1)体系及制度建设协助用户建立公司信息化建设的运维管理体系,基于云南财政信息化的具体情况,结合国家的相关标准,制定行之有效的管理规范和制度,并与运维管理系统相结合,落实IT运维管理的信息化系统建设,实现运维管理工作的规范化、体系化。
(2)设备及网络监控确保公司数据中心IT基础设施和应用系统正常、安全、高效运行,方便科技信息处随时了解各个系统的运行情况,从应用角度实现对各个关键系统的实时监测,在系统发生故障时能够迅速反应,相关人员能够及时获取相关的预警信息,定位异常发生的位置和可能的原因,以便快速响应和处置;(3)业务系统监控实现公司业务系统运维管理的主动化和体系化,以预防为主,通过实时的监测和分析发现系统潜在的问题和风险,实现主动式运维管理,最大程度减少事故的发生,为实现运维管理的流程化奠定基础;通过定制化接口开发,实现对系统稳定性、性能、数据准确性的实时监控,并将运维管理的监控数据、流程数据导出到财政数据仓库;基于堡垒机完成运维审计;(4)标准化运维服务为保障公司一体化系统对财政业务的支撑,需要建立标准的系统运维的日常管理流程,借助运维服务系统,提升一体化系统运维管理的有效性、及时性、可跟踪性,满足财政、预算单位、银行等一体化系统用户的日常服务要求,并满足未来扩展到其他业务系统的管理要求;通过集成方式,实现客户端机器的远程托管服务,通过在线分析客户端系统环境与操作表现,快速定位、解决用户提交的问题;(5)厅内信息化事务管理科技信息处人员编制偏少,需要通过实现部分日常服务工作信息化建设,提升工作质量与工作效率,最急迫的工作事项包括电子设备资产管理以及信息化建设项目的全流程管理。
(6)呼叫中心建设针对当前固定客服电话呼损率比较高的情况,需建立标准化的呼叫中心,在前端完成对用户日常服务请求呼入的响应、记录、处理及转发工作。
呼叫中心暂时仅需支持一体化系统的服务请求,需要满足未来的扩展要求。
1.2对项目的解读与理解结合信息化建设现状,借鉴科学的运维体系建设方法论,通过建立基本符合ITIL规范的事件管理流程和问题管理流程提升运维过程的故障申告、处理的质量和效率,增强故障处理的透明性和可控性,实现运维过程中的事件管理和问题管理的流程化、可视化,提高整体运行维护水平。
树立面向业务服务的IT服务管理理念,实行集中统一的IT服务管理模式,由分散管理向集中管理转变;建立统一高效灵敏的综合运维管理平台,由无序服务向有序服务转变;建立规范标准的IT服务管理流程,由职能管理向流程管理转变;应用先进、实用、高效的IT服务管理工具,由被动管理向主动管理转变;建立科学合理的绩效考核指标,由粗放管理向精细管理转变。
因此项目的核心需求包括:1.2.1强化主动监控,实现集中管理将根据现状和需求进行统筹规划,本着“从实际需要出发,保护已有投资”的原则,将目前已有的、针对网络、服务器、安全、数据库、中间件的分散式监控管理系统,以及数据处理中心的动力与设备环境监控系统、视频监控系统整合、集中到一个统一的监控系统平台进行监控、告警、性能、展现管理,实现网络、业务资源、业务应用的全面集中监控,构建统一集成的系统资源监控平台,主动、及时地发现问题,解决被动服务的局面。
1.2.2快速定位故障,减少维护成本通过统一事件处理平台,收集全部的监控和状态信息,建立集中的告警分析处理机制和故障预警机制,提供自动化的事件处理能力,当故障产生时,可以快速定位故障,很快发现问题根源并找到相应的解决方案,从而缩短故障解决时间,减少维护成本。
另外,通过可灵活设置各事件的关联和互动关系,按照应用系统进行划分处理,建立“五位一体”的综合监控平台。
1.2.3提升主动管理、辅助分析决策利用IT系统集中监控管理平台综合监控管理系统全面主动反映信息系统的运行健康情况,通过多种分析手段为合理有效地分配各运维人员和值班人员的人员调度,利用各类性能分析报表、资源统计报表和运维分析报表,从各个侧面、各个角度反映系统的运行情况、性能情况和人员工作情况,为系统升级、改造、扩容提供科学依据;也为员工的绩效考核提供电子依据。
1.2.4直观运行展现,快速指挥调度通过IT系统集中监控管理平台展示系统对业务核心数据进行分析和实时监控,丰富、科学、美观的展示IT 资源运行情况、性能状况、服务工单情况等,使领导、管理者、技术人员能迅速了解自己关心的问题。
对于IT运行的故障处理过程中,能够通过直观的运行展现,进行快速指挥调度。
1.2.5规范日常流程,有序高效协作参照ITIL规范,树立面向业务服务的IT服务理念,进一步理顺信息战信息中心内部各组关系,明确职责分工。
梳理当前的服务目录和服务级别协议,规范提供服务的内容。
建立集中的服务台,统一管理IT服务资源。
建立服务台、事件管理、问题管理、变更管理、配置管理等IT服务管理流程,初步实现面向流程的运维和服务管理模式,使运维人员具备更高的工作效率。
1.3主要问题、重点及难点的阐述根据对本项目的需求的理解,项目建设的主要问题、重点及难点主要包括:1.3.1实现统一监控、处置及展现面向网络及数据中心的各类IT资源实现统一监控,以资源配置信息、监控指标信息、告警信息等相关运维管理信息的全面采集、整合、抽取,并按照特定规则进行格式和内容等方面的处理,并按照特定规则进行格式和内容方面的整合处理,以便形成统一的监控信息、预/告警信息、展示信息。
在监控信息的展现方面,采用统一门户来规划展示的框架、风格及内容,通过灵活的可定制界面,实现各种监控和分析的需求,进一步提高监控工作的有效性和一致性;通过引入先进的技术分析手段,建立监控有效性分析评估机制,进一步保障应用系统安全、高效、持续、稳定的运行。
1.3.2完整、有效、统一的配置管理库在资源层面,将系统、网络、基础设施以及其他IT环境中存在的实体和虚拟资源进行统一、集中的管理,是实现统一运维的基础,在权限控制框架内,运维人员可以快速查询和调取资源的信息,能够快速实现事件、问题和变更的处理工作,极大的增加运维效率,并降低风险。
该需求关键要解决配置库管理中所管理的配置项及其关联关系的信息完整性、及时性及正确性,以为运维管理相关工作提供可靠有效的信息依据。
为了收集管理各配置项,真实地反映应用项目和IT资源的关联关系,首先要全面详细地了解应用系统和IT 基础设施的安装部署和配置情况。
在此基础上,通过配置发现工具,有必要时结合人工审核确认,并辅以配置审计等工具,对基础设施、网络线路和设备、主机、存储、数据库系统、应用中间件、业务应用系统等IT 资源和应用系统运维配置信息的采集、维护和管理,并使该模块与其他功能模块保持良好的集成接口关系。
同时,配置管理库应支持图形化的配置项、配置关系展现。
支持基于配置项之间的关联和影响关系,自动快速地确定、分析并展示告警事件、变更对其他IT资源或业务系统的影响范围和程度,从而将技术和业务有效的结合起来,转变传统的IT监控手段,不仅能及时发现故障,更能够快速分析故障的影响范围和程度,保障重要业务稳定运行。
1.3.3符合ITIL规范的基础服务流程符合ITIL的运维流程建设是本次项目的重点之一,通过建立标准、规范且灵活的管理历程,并在省厅层面进行部署应用,将能够在省厅这一层面实现运维工作的流程化化,通过流程的合理设置,真正实现省厅层面的各部门联动运维模式,各部门将依托省厅作为一个整体集中对外提供IT服务、对服务进行监督和改进、提升服务质量和水平。
此需求的实现,首先需要对省厅各部门现有管理流程进行重新梳理,我们了解到运行省厅下各部门已经建设并实施了事件管理、变更管理、问题管理、配置管理等流程。
经过多年的宣贯及应用,这些流程的应用已经成为省厅各部门运维工作中非常重要的一部分。
因此,需要结合当前管理需要,结合本次项目的建设目标,在现有流程的基础上,进行优化、完善。
在实现事件、问题、变更等管理流程的基础上,还需建立各流程之间的联动,实现相关流程之间的有机结合,为故障分析、变更评估等提供有效方法及可靠依据。
此外,还需要增加服务目录、服务级别和服务请求管理等流程的建设,进一步完善和优化流程体系,使省厅整个IT服务过程,包括服务请求、服务接受、服务处理、服务交付、服务质量控制整个过程均具备良好的流程化处理和控制手段,从而保障服务质量并持续提升。
1.3.4可灵活定制的运维流程引擎运维管理流程的建设除咨询设计外,还需要将设计好的流程落到实处,通过一个敏捷、可灵活定义的运维流程引擎进行运维流程的快速落地和电子化,是保障流程得以成功实施的重要手段。
该需求要求运维工作流程可采用客户化定制方式,按照用户的实际工作需要,方便的进行定制生成。