运维控制中心白皮书

合集下载

IT数据中心运维服务白皮书

IT数据中心运维服务白皮书

IT数据中心运维服务白皮书IT数据中心运维服务白皮书1、简介1.1 背景1.2 目的1.3 范围2、数据中心运维概述2.1 定义2.2 目标2.3 重要性3、数据中心运维流程3.1 设备监控3.1.1 监控工具3.1.2 告警处理3.2 设备维护3.2.1 定期维护3.2.2 预防性维护3.3 容量规划与增长3.3.1 现有资源评估 3.3.2 容量规划策略 3.4 安全措施3.4.1 物理安全3.4.2 逻辑安全3.5 数据备份与恢复3.5.1 备份策略3.5.2 恢复测试4、运维服务级别协议4.1 定义4.2 协议内容4.2.1 运维响应时间 4.2.2 故障处理时间 4.2.3 售后支持4.3 违约责任和违约处理5、数据中心运维团队5.1 团队组成5.2 人员角色与职责5.3 培训与发展计划6、数据中心运维最佳实践6.1 设备标准化6.2 问题管理6.3 自动化工具和流程6.4 文档管理和知识库6.5 持续改进7、附件附件二、数据中心设备监控工具推荐注释:法律名词及注释:1、运维:维护与运营的合称,是指对设备、系统或网络等进行管理、维护和保养,以确保其正常运行和可靠性。

2、数据中心:指用于集中托管大量计算机服务器、存储系统和网络设备的设施,用于处理、存储和传输大量数据和信息。

3、服务级别协议:是提供给客户和运维服务提供商之间的协议,明确了双方对于服务响应时间、故障处理、售后支持等方面的约定。

4、违约责任和违约处理:指当一方违反了服务级别协议中的约定时,另一方可以要求违约方承担相应责任,并对违约行为进行处理。

5、自动化工具和流程:指使用自动化软件和流程来提高运维效率,减少人为操作错误的发生。

6、持续改进:指持续对运维流程和实践进行审查和改进,以提高运维效率和质量。

IT运维监控系统白皮书

IT运维监控系统白皮书

IT运维监控系统白皮书哎呀,要说这IT 运维监控系统,那可真是个让人又爱又恨的家伙!先给您讲讲我之前碰到的一个事儿。

有一次,我们公司的网络突然变得奇慢无比,大家都急得像热锅上的蚂蚁。

我这个负责运维的,那压力山大呀!后来一查,原来是服务器负载过高,可之前居然没发现任何预警。

从那时候起,我就深刻意识到一个强大的 IT 运维监控系统有多么重要。

那到底啥是 IT 运维监控系统呢?简单来说,它就像是一个 24 小时不眨眼的超级保安,时刻盯着咱们的 IT 设备和系统,一旦有啥风吹草动,立马发出警报。

比如说,它能监控服务器的运行状态。

像 CPU 使用率、内存占用率、硬盘读写速度等等,这些数据它都能实时掌握。

一旦某个指标超过了设定的阈值,它就会“大声嚷嚷”,提醒我们赶紧采取措施,免得服务器崩溃,造成大麻烦。

再比如说网络设备,它能监控路由器、交换机的工作情况。

哪个端口出问题啦,网络流量突然异常啦,它都能第一时间发现,让我们能够迅速定位并解决问题,保障网络的畅通无阻。

还有应用程序,不管是网站、数据库还是各种软件,它都能监控它们的运行情况。

如果某个应用程序突然卡顿或者停止响应,它也能及时通知我们,避免影响业务的正常开展。

而且啊,这 IT 运维监控系统可不只是会报警,它还能帮我们收集和分析数据。

通过长期的数据积累,我们可以发现一些潜在的问题和趋势,提前做好预防和优化,就像给机器提前打预防针一样。

比如说,通过分析服务器的性能数据,我们可能会发现某个时间段服务器的负载总是特别高,那我们就可以提前增加资源或者优化程序,避免在这个时间段出现问题。

另外,一个好的IT 运维监控系统还得操作简单、界面友好。

毕竟,咱们运维人员可不想整天对着一堆复杂难懂的界面和参数发愁。

它得能让我们一目了然地看到关键信息,快速找到问题所在。

还有哦,它得有强大的扩展性。

随着公司业务的发展,IT 设备和系统会越来越多,如果监控系统不能方便地扩展,那可就跟不上节奏啦。

数据中心基础设施智能运维白皮书

数据中心基础设施智能运维白皮书

L2 成熟运维
运维流程趋于成熟,运维质量有较好的保障,但运维效率不高,重视运维团队的建设,团队能力通 常有较好的延续性,但无法自主优化;辅助系统较为完备,部分核心子系统具备自动化能力
L3 数字运维
在 L2 的能力基础上,通过信息技术数字化运维活动,管理和驱动运维流程的执行,且基于大数据 分析能持续优化,运维质量可以准确评估,运维效率大幅提升;关键子系统如,配电和制冷实现自 动运维,基础设施资源能够感知 IT 及云业务需求变化并完成闭环管理,AI 等机器智能在节能、故 障预测等特定领域取代人类智能
阶段,以及演进和优化的目标。另一方面,对于 处在传统运维阶段的团队,本白皮书介绍了数据 中心基础设施可用性管理全景及对应的数字化, 智能化措施,利用这些信息,运维团队能更好地 规范运维管理,制定智能化运维升级的计划,并 能指导运维团队从传统运维向智能运维转型,在 智能化运维工具的帮助下,实现运维更高效、更 安全并可持续的业务目标。
运 维 流 程
传统运维
智能运维
运维演进 图1
智能化程度
2
数据中心基础设施智能运维白皮书
五大运维阶段
为了定义清楚传统运维、智能运维的变化和演进,这里划分了 L0~L5 阶段,并详细定义了每个 Level 的典型特征:
人工运维
规范运维
规范运维
数字运维
自动运维
完全自动运维
L0
L1
L2
L3
L4
L5
• 无标准化流程 • 无培训体系 • 个人承担职责 • 运维质量无法
数据中心基础设施智能运维 白皮书
数据中心基础设施智能运维白皮书
简IN介TRODUCTION
当前大部分数据中心的运维安全依赖于富有经 验、训练有素的运维团队,部分成熟的数据中心 已经开发出完善的运维流程和培训体系,并用以 减小偶发事件及人员变动对运维安全的冲击,少 数先进的数据中心已经在寻求通过数字化、智能 化手段来保障数据中心运维安全的可持续性。本 白皮书划分了从传统运维到智能化运维的 5 个阶 段,以及每个阶段的典型特征,一 方面,数据中 心的管理人员可以根据这些信息明确当前所处的

数据中心运维管理技术白皮书

数据中心运维管理技术白皮书

数据中心运维管理技术白皮书一、引言随着信息技术的快速发展,数据中心已经成为各行各业的重要信息基础设施。

数据中心的运维管理不仅关乎企业的业务连续性,也是企业降本增效的关键环节。

然而,数据中心的运维管理面临着诸如设备多样性、高能耗、安全隐患等问题。

本白皮书旨在探讨如何通过先进的运维管理技术,提高数据中心的运营效率,降低成本,保障数据安全。

二、数据中心运维管理现状与挑战目前,数据中心的运维管理存在以下主要问题:1.设备多样性:不同的设备可能使用不同的操作系统、软件版本和配置,给统一管理和维护带来困难。

2.高能耗:数据中心设备众多,能耗大,如何降低能耗,提高能源利用效率,是当前面临的重要问题。

3.安全隐患:数据中心的设备可能遭受各种安全威胁,如病毒攻击、黑客入侵等,如何保障数据安全是一大挑战。

4.运维效率低:传统的运维方式效率低下,无法满足现代数据中心对高效、实时的要求。

三、数据中心运维管理技术的发展趋势为了应对以上挑战,数据中心运维管理技术出现了许多新的发展趋势:1.智能化运维:利用人工智能、大数据等技术,实现数据中心的自动化、智能化运维。

2.绿色能源利用:应用新的能源技术,如储能电池、太阳能等,降低数据中心的能源消耗。

3.安全防护技术:采用更先进的安全防护技术,如区块链、加密算法等,保障数据安全。

4.云端运维:通过云端平台,实现数据中心的远程监控和管理。

四、结论与建议数据中心运维管理技术的发展趋势为我们的数据中心运营提供了新的思路和方向。

为了应对未来的挑战,我们建议采取以下措施:1.加大对智能化运维的投入,提高运维的自动化和智能化水平。

2.积极探索和应用新的绿色能源技术,降低数据中心的能源消耗。

3.提高安全防护技术水平,建立完善的安全防护体系。

4.推广云端运维模式,实现远程监控和管理,提高运维效率。

总之,只有不断跟进和掌握最新的数据中心运维管理技术,才能更好地应对未来的挑战和满足不断变化的市场需求。

中国信通院 企业it运维发展白皮书

中国信通院 企业it运维发展白皮书

我国信通院企业IT运维发展白皮书一、概述近年来,随着信息技术的不断发展和应用,企业的IT系统运维工作越来越重要。

作为企业信息化建设的基础和支撑,IT运维对企业的稳定运行和发展起着至关重要的作用。

我国信通院作为国内领先的通信和信息技术研究机构,对企业IT运维的发展进行了深入研究,并撰写了本白皮书,以期为企业提供参考和指导。

二、企业IT运维的发展现状1. 企业IT运维的重要性IT运维是企业信息化建设的重要环节,它关系到企业整体运行的稳定性和高效性。

合理的IT运维工作能够确保企业的业务系统正常运行、数据安全可靠、故障能够及时处理,从而为企业的发展提供有力支持。

2. 企业IT运维存在的问题虽然企业对IT运维的重视程度不断提高,但在实际运行过程中,仍然存在一些问题。

人员技术能力不足、工作流程不够规范、设备和系统管理混乱等。

这些问题严重影响了企业IT运维的效率和质量。

三、我国信通院对企业IT运维的建议1. 提高人员技术能力我国信通院建议企业加大对IT运维人员的培训和学习力度,提高他们的技术能力和服务意识。

只有拥有一支高素质的IT运维团队,企业的IT系统才能得到有效保障。

2. 规范IT运维流程规范的运维流程是确保IT系统正常运行的基础。

我国信通院提倡企业建立完善的IT运维管理制度,明确各项工作的责任和流程,保障运维工作的有序进行。

3. 部署先进的运维工具在IT运维过程中,合适的工具和系统对提高工作效率和质量至关重要。

我国信通院建议企业积极引进和使用先进的运维工具,提高系统监控、故障分析和处理的能力。

4. 加强设备和系统管理设备和系统是IT运维的基础,对其进行有效的管理能够提高IT系统的稳定性和可靠性。

我国信通院建议企业加强对设备和系统的管理,定期检查和维护,保证其正常运行。

四、结语企业IT运维的发展是一个系统工程,需要全面的考虑和有效的措施。

我国信通院将继续深入研究和探讨企业IT运维的相关问题,为企业提供更多的指导和支持。

IT运维监控系统白皮书(2024)

IT运维监控系统白皮书(2024)

引言概述:IT运维监控系统是公司或组织中至关重要的一部分,它能够实时监测、管理和维护IT系统的性能和稳定性。

本白皮书将详细阐述IT运维监控系统的重要性,以及其中包括的五个主要方面:监控需求分析、监控策略定义、监控系统实施、监控系统集成和监控系统运维,以帮助读者更好地理解和应用IT运维监控系统。

正文内容:1.监控需求分析a.确定监控目标:了解业务需求,确定监控对象、监控级别和关键性能指标。

b.确定监控范围:评估现有系统及网络基础设施,并确定需要监控的硬件、软件和网络设备。

c.确定监控频率:根据业务需求和系统重要性,确定监控频率,平衡监控精度与系统开销。

d.确定告警机制:制定告警策略,包括告警级别、告警通知方式和告警处理流程。

2.监控策略定义a.数据采集与分析:选择合适的监控工具,采集关键性能指标,并通过数据分析找出潜在问题。

b.健康状态指标定义:定义合适的健康状态指标,用于判断系统和网络设备的工作状态。

c.容量规划与性能优化:通过监控系统,收集系统负载和性能数据,为容量规划和性能优化提供依据。

d.日志记录和归档:建立日志记录机制,保存关键事件与操作,以助于系统故障的排查和整改。

3.监控系统实施a.系统选型:通过评估不同监控系统的功能和性能,选择最适合企业需求的监控系统。

b.设备部署:根据监控需求分析结果,合理布置监控设备,确保全面覆盖和高效运行。

c.数据接口配置:与现有系统进行集成和接口配置,确保数据的准确性和实时性。

d.用户权限管理:建立合理的权限管理机制,限制用户访问和操作的范围,保护系统安全性。

4.监控系统集成a.与运维管理系统集成:将监控系统与运维管理系统集成,实现故障自动报修和工单处理。

b.与服务管理系统集成:将监控系统与服务管理系统集成,建立自动化的服务交付和运维流程。

c.与安全管理系统集成:将监控系统与安全管理系统集成,实现实时威胁检测和漏洞管理。

d.与设备管理系统集成:将监控系统与设备管理系统集成,实现设备信息的自动采集和管理。

安全运维服务白皮书

红科网安安全运维服务白皮书目录1.前言 (4)2.运维目标 (5)3.运维服务内容 (6)3.1日常检查维护 (6)3.2安全通告服务 (6)3.3安全评估服务 (8)3.4安全风险评估 (13)3.5渗透测试 (17)3.6补丁分发 (18)3.7安全配置与加固 (20)3.8安全保障 (21)3.9安全监控服务 (23)3.10安全产品实施服务 (24)3.11安全应急响应 (24)3.12安全培训服务 (29)4.运维体系组织架构 (33)5.运维服务流程 (35)5.1日常检查流程 (36)5.2安全评估服务流程 (38)5.3安全监控服务流程 (40)5.4安全事件处理流程 (45)5.5安全培训服务流程 (48)5.6渗透测试的流程 (50)6.安全事件处理与应急响应 (53)6.1安全事件分类 (53)6.2安全事件处理与上报流程 (54)6.3安全事件现场处理 (56)6.4安全事件的事后处理 (59)1.前言经过多年的信息化建设,大多数企业已经建立起了比较完整的信息系统。

但是,在安全运维及应急响应方面缺少一套完整的运维和应急体系来保证各类紧急事件的处理。

因此,客户通过引入专业的信息安全服务团队,来保障自身信息系统的稳定安全运行,同时通过专业的安全咨询和服务,逐步构建动态、完整、高效的客户信息安全整体,形成能持续完善、自我优化的安全运维体系和安全管理体系,提高客户信息系统的整体安全等级,为保证业务的健康发展和提升核心竞争力提供坚实的基础保障。

2.运维目标红科网安(简称:M-Sec)是国内专业的信息安全服务及咨询公司,同时,拥有国内一流的安全服务团队M-Sec Team。

我们可以为用户提供全面的、专业的、客户化的安全服务及其相关信息安全管理咨询,从而保障用户的安全系统的正常运行和持续优化。

我们以客户信息安全服务的总体框架为基础、以安全策略为指导,通过统一的安全综合管理平台,提供全面的安全服务内容,覆盖从物理通信到网络、系统平台直至数据和应用平台的各个层面的安全需求,保障信息平台的稳定持续运行。

运维 白皮书

运维白皮书运维白皮书是一份详细说明了运维相关信息和策略的文档,旨在帮助组织或企业实施高效的运维管理和支持。

以下是关于运维白皮书的一些重要内容:1. 简介:在这一部分,我们会介绍运维管理的定义和目标。

我们会解释为什么运维对于保持业务运转的连续性和稳定性是如此重要,并列举一些运维优化可以带来的好处。

2. 团队和责任:这一部分会涵盖团队结构和组织,明确各个角色的职责和责任。

我们会详细描述不同级别的运维团队成员,从管理员到工程师,及其所承担的任务。

3. 流程和策略:在这一部分,我们会描述运维团队所需遵循的流程和策略。

我们会提及一些常用的ITIL(信息技术基础架构库)流程,例如变更管理、问题管理、发布管理等等。

我们还会介绍紧急响应计划和备份恢复策略等关键策略。

4. 工具和技术:这一部分将涵盖运维所需的工具和技术。

我们会介绍监控工具、自动化工具、故障诊断工具等等,以及这些工具如何帮助运维团队更好地管理和支持系统和应用。

5. 安全和合规:安全和合规性对于运维至关重要。

在这一部分,我们会讨论运维团队应遵循的安全最佳实践和合规性标准。

我们会提及访问控制、身份验证、数据保护等关键方面。

6. 持续改进:运维团队需要不断改进和创新,以适应新的技术和业务需求。

在这一部分,我们会描述一些持续改进方法和工具,例如Kaizen、PDCA(计划-执行-检查-行动)循环等等。

7. 成果和度量:最后,我们会介绍如何衡量和评估运维团队的绩效。

我们会讨论关键绩效指标(KPIs)和报告机制。

通过运维白皮书的指导,组织和企业可以建立健全的运维管理框架,并提高效率、降低风险、提供更稳定的服务。

这样的白皮书不仅可以帮助运维团队更好地组织和管理工作,也可以为其他团队和利益相关者提供清晰的指导和了解。

SAP运维服务白皮书

SAP运维服务白皮书2017版(试行)SAP 一体化服务部合作伙伴管理中心SAP一体化服务部 -专家中心 (COE)SAP AMS服务部2016年12月SAP运维服务白皮书2017版(试行)目录TABLE OF CONTENTS1. SAP运维服务简介 (3)1.1 SAP运维方法论主要术语及其历史 (3)1.2 SAP企业级支持服务(ES = Enterprise Support) (4)1.3 SAP 一体化服务(ONE Service) (4)2. SAP公司运维服务相关部门 (4)2.1 产品维保部门 (4)2.2 SAP 一体化服务部运维团队 (5)2.3 SAP 一体化服务部合作伙伴管理中心 (5)3. SAP运维控制中心方法论(OCC = OPERATION CONTROL CENTER) (6)3.1 SAP 运维控制中心方法论 (OCC) 概述 (6)3.2 指标体系及价值实现 (KPI & Value Realization) (7)3.3 组织结构 (Organization) (7)3.4 管控机制 (Governance) (8)4. 基础运维服务 (9)5. 应用系统运维服务 (AO = APPLICATION OPERATION) (9)5.1 技术管控和向导程序 (Technical Administration) (10)5.2系统自动监控及报警 (Technical Monitoring and Alerting) (10)5.3 数据量管理 (Data Volume Management) (11)5.4 终端用户体验监控 (End-user Experience Monitoring) (11)6. 业务流程运维服务(BPO = BUSINESS PROCESS OPERATION) (12)6.1 业务流程监控 (Business Process Monitoring) (12)6.2 后台作业管理 (Job Scheduling Management) (13)6.3数据一致性管理 (Data Consistency Management) (14)6.4业务流程改进 (Business Process Improvement) (14)7. 软件生命周期管理 (ALM = APPLICATION LIFECYCLE MANAGEMENT) (15)7.1 解决方案文档管理 (Solution Documentation) (15)7.2 服务台及事件管理 (IT Service Management) (16)7.3 变更管理 (Change Request Management) (17)7.4测试管理及自动化 (Test Management) (18)7.5客制化代码管理 (Custom Code Management) (18)7.6升级优化/零停机 (Zero Downtime Maintenance) (19)附录一:参考链接及文档 (20)附录二:SAP运维服务项汇总表 (21)1. SAP运维服务简介1.1 SAP运维方法论主要术语及其历史∙工厂化运行SAP (RSLaF = Run SAP Like a Factory 简称 Run SAP)“工厂化运行SAP”是由前SAP AGS部门(现整合为SAP DBS部门)提出的运维方法论。

IT运维监控系统白皮书

一、系统概述系统背景近年来随着信息技术的迅速发展,IT网络的建设以高于30%的速度逐年递增。

通讯、金融、教育、交通、政府、企业等各个行业的迅猛发展都越来越密切的依赖于现代化的IT 信息网络平台。

但是高速发展的同时,各行业巨大的IT维护和管理成本也在与日俱增,IT 基础建设的健康性和可管理性越来越让人担忧。

企业现在普遍缺乏一个有效实用的综合监控系统来实现完整的IT架构监控和管理,即便现有各行业已经采用的IT管理工具也大都是从传统的IT网元监测出发,基于各自独立的管理模式,各管各的事:设备管理系统,不同的应用管理系统,各自只能维护自己的产品;系统间信息没有充分的交互,无法分析故障的根源;对IT网络的核心资源不能进行统一有效的管理;IT维护和系统的建设没有提升到面向服务和面向业务的层次。

企业缺乏统一集中综合监控系统的局面,使得企业IT运营人员不得不面临许多挑战:学习各种领域知识、学习各种管理系统、熟悉各种操作系统、熟悉各种设备仪器、处理故障时在各种工具间切换等。

产品概述ForceView IT运维监控系统是东华软件经过多年经验积累、维护实践、自主研发和技术创新的结晶。

该系统基于Web的集中管理模式,遵循面向对象的设计结构,具有高度集成化和先进性、安全性、开放性、可扩展性、高效性、高可靠性等系统特点;该系统融合了网络管理、主机系统管理、应用服务管理、业务管理等各种IT因素的统一监控管理平台,并从业务视角出发,实现上述各项管理数据的共享集中、互通互融,从而能够综合量化企业IT基础和企业业务的总体服务品质。

使用该系统,企业运维人员能实现对网络设备、服务器、数据库、应用软件、web服务等进行集中统一的管理,使得对企业IT基础架构管理从被动分散的维护转变为主动集中的控制和管理;使用该系统,企业运维人员能实现从业务角度来管理IT基础架构,使IT基础架构真正成为保障业务服务水平的、可管理、可控制的业务平台,从而构建业务人员和IT 管理人员的共同语言,搭建业务管理与IT运营的沟通桥梁。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

运维控制中心白皮书2013年9月1日目录运维控制中心 (1)运维控制中心——概况 (3)什么是OCC? (3)OCC由什么构成? (11)为什么客户需要OCC? (13)提高业务连续性 (13)提高业务满意度 (14)提高IT支持效率 (14)降低运营成本 (14)OCC是如何工作的? (15)提供透明化 (15)解决警报 (18)持续改进 (20)OCC前提条件 (21)SAP在客户端OCC中的作用 (21)OCC中的关键角色 (22)OCC 团队负责人 (22)IT运维人员 (技术 /功能) (22)负责业务连续性的质量经理 (23)负责业务流程优化的质量经理 (23)运维控制中心——概况运维控制中心(OCC)是“工厂化运行SAP”的具体体现。

OCC能够确保高度自动化及主动的操作,此举能够在降低运营成本的同时提高IT服务质量,从而提高企业满意度。

此外,OCC 能够不断推动业务流程的改进和IT支持。

运营控制中心与创新控制中心 (ICC) 和SAP任务控制中心 (MCC) 的紧密联系旨在支持这些目标的实现。

图1: OCC,ICC及MCCICC旨在助力SAP客户实现“工厂化建立SAP”。

ICC能够最大程度地使用SAP标准功能,通过端到端的集成验证保护和优化投资,并能够保证上线后平稳无中断的运行。

MCC基于SAP在全球各地的办事处,随时准备为客户提供关键支持。

图1展示了上述三个控制中心。

在OCC,一组IT运营人员负责SAP生产环境的维护。

根据环境和业务流程复杂性的差异,两个运营人员一班制(全职雇员)能够理想地进行环境的维护,通过SLA(服务等级协议)达到4小时内解决业务问题的目标。

什么是OCC?OCC是位于客户现场的IT支持团队,能够积极主动地监控SAP的生产环境(及重要的非SAP应用)。

我们建议客户在IT支持部门内设立OCC办公室。

图2显示了OCC的外观和整体布局。

图 2: OCC布局业务流程状态,IT架构部分组分,所有的关键业务,IT异常事件及警报都会显示在大屏幕上。

当问题出现时,合作伙伴和SAP可以通过视频会议进行沟通。

其他IT支持团队同样可以包含在OCC办公室。

例如,部分服务台团队能够提高跨团队沟通的效率。

OCC办公室是在SAP AGS的帮助下由客户方建立的,由客户方主导,技术团队和IT功能操作人员密切提供帮助。

图3展示了OCC的几个基本概念:∙OCC收集IT构架组件及业务流程在技术层(“应用系统运维”)和功能层(“业务流程运维”)上的监控信息(此模型由第三个基础设施层进行扩展,见图7)。

∙数据存储于SAP解决方案管理器中,并通过“集中监控”(例如OCC办公室的电视屏幕)、报表或仪表盘进行显示。

∙基于上述数据,事件管理流程将生成警报并经过预先处理。

∙持续优化流程意在改善业务及IT难题。

集中监控提供的数据(如趋势数据)对此过程予以了支持。

,有几个过程标准(如“PDCA”,“DMAIC”)可用。

对IT服务管理(ITSM)具有强大的集成和依赖性,即事件管理,问题管理和变更管理。

图3:OCC概念展示OCC能够交付的成果和带来的收益:更高的业务可用性及商业用户满意度OCC的基础架构能够全天候不间断收集和评估所有生产组件的信息。

技术和业务流程异常事件会引发SAP解决方案管理器中央警报收件箱的警报。

IT运营商(技术和功能)能够在第一时间获悉,并立即进行分析和纠正。

根据初始设置,在业务受到影响之前就可以将问题检测出来并予以解决。

至少IT支持有更多的时间来分析形势,并且在收到用户电话前已经开始对问题进行修复。

此外,报警系统可以与SAP解决方案管理器的IT服务管理模块(ITSM)进行集成,并与第三方IT服务管理工具进行同步。

与重新激活的操作方法(即IT支持等待业务用户将问题上报的做法)相比,这种积极主动的做法将带来更高的业务可用性,更佳的IT服务质量,从而提高商业用户满意度。

SAP运营工厂化能够带来更高的IT效率管理和监视活动通常是手动执行(如:“每天早上,检查事务XYZ”)。

这些活动通常可以通过设置SAP解决方案服务器警报进行自动监测替换:监控基础架构主动报告问题和异常事件(警报)。

没有警报表明不需要手动检查,所有一切运行正常。

“事件管理”这一术语描述了从警报创建至关闭的过程,见图4。

在OCC,事件管理是高度结构化的:o IT运营人员一般从SAP解决方案管理器的中央警报收件箱开始工作。

o需要做的工作(例如特定KPI的历史数据)显示在警报环境及知识数据库中。

o“操作指导”会提供详细说明,对运维人员首先要采取的分析步骤进行指导(“操作指导”是SAP解决方案管理器的向导式应用)o如果问题不能得到解决,IT运营人员可以轻松通过点击鼠标创建一个事件,并将其传递给下一级支持人员。

与ITSM的集成可作为服务台水平的双向接口的技术基础。

图 4: 事件管理流程IT运营人员能够解决不需要专业知识的简单问题,以便第二级支持能够腾出更多宝贵资源,专注于项目及持续改进。

SAP解决方案运营状态的整体透明化整体透明化:OCC能够时时报告生产环境状态,包括关键业务流程。

这可通过多种方式进行:o运行SAP的企业希望了解其核心业务流程和技术组件的状态。

SAP解决方案管理器能够提供多种方式来监测“可用性”(技术以及相关的业务流程)。

此外,未来趋势信息等关键性能数据能够在OCC显示器内接近实时地收集并显示。

o除了常见的监控器,客户可能基于其特殊的设置和配置,需要额外的监测数据。

此类需求可能是为了获取关于某关键业务接口的报错细节,或有关业务数据一致性的信息。

这些监控需求可以通过激活额外数据源,或通过使用SAP解决方案管理器提供的严格定义的扩展选项来满足。

o数据需要根据不同的接收人进行相应处理并报告方案。

与CIO相比,IT支持专家需要不同的数据和聚合水平。

为了满足所有的需求,SAP解决方案管理器提供了丰富的报告技术,从静态的PDF文件、高度聚合及互动的仪表盘、直至各级监测数据(技术以及相关的业务流程)。

很多提供的报表已经通过SAP 最佳实践的方式进行了预配置。

∙组件集成的整体透明化在当今IT世界,SAP和非SAP组件相互紧密协同的情况极为常见。

核心生产部件之间的接口成为关键业务,比如接口的可用性,数据的一致性,生产量等等。

关键是要不断监控SAP和非SAP接口和组件的集成。

OCC的的中央显示器能够从多个角度提供状态和性能整合的完整的画面。

具体例子如下:o最终用户体验监控(EEM)展示终端用户视角o PI监测展示跨系统信息流o BI监测展示报表层面o接口通道 (IC) 监测展示接口层面值得一提的是,SAP与非SAP组件都能够纳入这一画面。

例如,CA Wily Introscope 完整版,及SAP IT基础架构管理能够作为关键业务处理的一部分,为非SAP组件提供相应的集成能力。

∙持续改进业务及IT作为OCC的第二个核心流程,SAP建议设立一个不断完善的过程。

一旦启动,持续改进会对问题的根本原因进行结构性的分析及归档。

收集、优先化、测试并实施改进建议。

不断测量改善活动的成功度。

持续的改进能够帮助解决主要运行难题及面临的挑战。

根据改善项目,建议的修改可能影响业务流程或IT支持流程的设置。

这可能会带来新的“工厂化运行SAP”项目的实施。

在瞬息万变的商业世界,IT不能始终处于被动状态。

商业在不断改变业务应用,业务流程及流程配置。

这些变化会引入新的关键业务流程和相应的潜在的异常情况,因此需要OCC的检测控制。

换句话说,对当前业务的分析并不是需求变化的唯一来源。

为避免上述风险,也许除显示器之外,IT支持流程及业务流程也需进行变更。

持续改进是一个结构化的多步骤过程,市场上现已有几个改进流程定义。

比如由戴明博士推广的PDCA循环,共包括4个步骤:计划(Plan),执行(Do),检查(Check)和执行(Act):图 5: PDCA 循环流程o计划:规划改善先后次序o执行:将第一时间的想法在现实中进行验证o检查:检查结果,并定义新标准o执行:实施新标准流程步骤的数目和背后的改进理论并不重要。

例如DMAIC改进理论或许能提供类似的结果。

然而,重要的方面是建立持续改进IT的理念。

此外,改进过程本身需要得到高级管理层的关注,从而真正解决、纠正新发现的业务挑战及难题。

在建立OCC时,SAP需要考虑将持续改进无缝集成到现有的IT支持环境上。

集成通常是基于两个层面:IT支持工具,和IT支持流程,例如:o数据取自现有的IT支持工具,以推动这一进程。

例如第三方服务台工具的事件管理数据能够帮助识别最终用户经常体验到的痛苦。

不断改进过程中所引发的变更由现有变更请求管理工具进行管理和跟踪。

o根据成熟水平,持续改进现有的事件、问题管理流程可以重复利用概念、角色、流程和程序。

因此,SAP运维作为一个整体将变得更具创新性。

通过提高效率,不但可以释放出在运维环境中需要的资源,同时也可以使IT运维团队在更短的时间段内处理更多的问题。

OCC与ICC和MCC深度集成。

ICC与OCC进行双重集成一方面,不断改进的过程可能带来新的改进项目,这一项目将由ICC进行管理。

另一方面,ICC需要考虑客户需求,以保证当新的应用进入生产环境后的顺利运维。

o在开发过程中,ICC负责执行共同开发标准(例如:编程过程中,描述该做什么和不该做什么)。

产品相关的开发标准可能会定义性能方面的额外要求。

o通过用户测试 (UAT),ICC需要向OCC递交运维文档,描述包括新发展、系统架构、预期的数据量、重要的新批次处理作业、额外的性能要求在内的业务流程和接口。

一旦启动传输至生产系统这一流程,通常一个由项目和生产支持环境专家组成的联合小组将努力确保顺利运维。

这是通过ICC“集成验证”(IV) 的方法来实现的。

新引进的应用程序通常包括:o技术监控涉及所有的IT环境组件。

技术监测覆盖技术组件的可用性、性能、技术异常和配置。

o对关键业务流程和业务流程步骤的监测——包括关键业务交易、接口、业务异常事件和后台作业。

o根据新应用程序的类型,基本监测业务数据的一致性十分重要(例如:由于相同的业务数据存储在多个系统,新推出的ERP-CRM方案需要监测业务数据的一致性)o估计数据量、增长率、以及它们对硬件设备配置和技术能力的影响o对特殊组成部分的监测,如SAP PI/BI(包括SAP HANA场景)o通知所有IT运营人员及负责人注意警报所有上述列出的项目需要记录到适当的文档。

例如,IT架构和业务流程需要记录。

必须有文档记述IT运营人员在警报的情况下或在一个异常的情况下需做什么。

如前所述,ICC负责提供基本的文档。

这一基本文档由运维方面进行完善,并存储在SAP解决方案管理器中。

然而,为了提高工作效率,文档应该尽可能存储在相关的行动中。

相关文档
最新文档