自动化运维管理解决方案 白皮书

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自动化运维管理解决方案

目录

1IT运维管理面临挑战 (3)

2应运而生的自动化解决方案 (5)

3自动化应用场景 (7)

3.1灾备切换自动化 (7)

3.2故障现场快照 (8)

3.3批量设备操作处理 (8)

3.4周期性作业调度 (9)

3.5应急处理流程 (9)

3.6重要配置备份、基线比对 (10)

4产品简介 (12)

4.1运维脚本集中管理 (12)

4.2可视化流程配置引擎 (12)

4.3作业流程人工干预 (13)

4.4作业执行验证/持续监控 (13)

4.5作业操作手册自动生成 (13)

4.6作业执行结果展现 (14)

4.7配置备份/基线库管理 (14)

5产品优势 (16)

6运行环境 (17)

1 IT 运维管理面临挑战 24%

31%45%

IT 运营费用比例

新系统开发维护开发运维管理

⏹ 分散于各服务器上的运维脚本,存在管理风险,且耗费大量管理成本;

⏹ 日常操作消耗大量人力资源,误操作风险较大,操作执行效率低;

➢操作过程可控度低,运维风险大:

⏹操作与执行方案匹配度无法保证,实际操作过程可控度较低;

⏹日常操作对人员水平要求高,人力资源风险大;

➢运维操作透明度低:

⏹实际操作不便于监督,存在“黑盒”操作风险;

⏹日常工作与实际操作无法有效关联,不利于日后审计;

2应运而生的自动化解决方案

面对IT运维管理中的诸多问题,单靠人工已经无法满足在技术、业务等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。其中,IT运维自动化是指将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次,也是未来的发展趋势。

IT运维自动化从诞生发展至今,其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。自动化对IT运维的影响,已经不仅仅是人与设备之间的关系,已经发展到了面向客户服务驱动IT运维决策的层面。

融海咨询借鉴IT运维自动化发展趋势,结合多年IT服务经验中对用户需求的把控,自行研发自动化解决方案。

自动化方案概述:

通过自动化手段,实现IT运维管理操作的自动化调度、“一键式”处理;通过异常处理的支持,对操作的结果进行验证,并持续监控作业执行结果;通过时间约束条件,对按照时间计划执行的运维作业进行管理;通过复杂的关系运算条件,处理复杂的作业流程的关系;通过UserTasks人工接口,方便运维人员对作业调度流程的参与;通过图形化的工作流定制平台,实现对业务活动进行整体规划;通过与其它平台的集成,实现了与报警、监控等运维系统的一体化管理。从而实现功能强大、简单易用、安全可靠的作业调度自动化。

通过自动化解决方案,推动了企业IT运维管理操作的指令化、标准化、流程化进程。

自动化建设目标:

3自动化应用场景

3.1灾备切换自动化

随着IT设备数量持续增加,IT系统日益复杂,依靠手动方式进行系统灾备切换的传统模式遇到了一定瓶颈,主要表现:

➢操作效率低:RTO (Recovery Time Objective,复原时间目标)无法保证;

➢操作风险大:系统复杂度日益增高,操作复杂度也随之增强,操作失误的几率也随之增高;

➢过分依赖个人水平:在尽短的时间内完成整个切换流程,对操作员本人的技能水平、操作规程熟悉程度、环境熟悉程度有着非常高的要求。

➢操作过程不透明:灾备切换有相应的操作规程,但是切换过程中,每个环节执行状态、当前执行环节情况只有操作员本人了解,旁人无从知晓。

通过对灾备切换流程进行标准化配置,实现灾备切换管理的配置可视化、执行可视化、过程可视化、规程可视化。

➢配置可视化:提供类似Visio配置方式,每个操作环节配置成为一个节点,然后通过拖拽、连线的方式配置整个切换流程,避免了代码编写工

作,降低了系统使用门槛,增加了系统易用性;

➢执行可视化:提供图形界面方式,灾备切换流程无需通过繁琐命令行方式执行,管理员仅需在图形界面中选择相应流程并点击执行即可,执行前还

可以在界面进行多人确认;

➢过程可视化:提供操作流程视图,所有人员在流程图中可以清晰了解灾备切换整体流程情况、当前执行环节,以及每个节点执行状态,为保证不同

使用习惯,执行过程提供流程视图、树状视图两种展现形态;

➢规程可视化:提供自动生成操作规程文档功能,管理员配置完某自动化流程时,系统能够自动生成该流程的操作规程文档,系统使用人员可以根据

文档清晰了解到本自动化流程完整信息。

3.2故障现场快照

传统IT监控系统在故障发生时能及时告警,但是运维人员、厂商、开发商仅仅获得一条告警信息,无法从监控平台获取更多的信息完成故障分析及预防。

通过监控/监控集成、作业调度双重技术手段,在故障发生时,对故障现场的本机环境、跨服务器/跨设备环境进行全方位捕捉,对故障现场进行最大程度的保留,协助管理员、厂商、开发商进行事故后的详细分析,并设定相应预案。

通过故障现场快照,可以完成:

1、故障现场全方位场景获取,获取内容可以根据不同角色需求灵活定制;

2、故障发生时系统自行完成场景捕获、保存,并将其分发给不同的角色进行联合“会诊”;

3、根据预案内,通过定制化纳入到中,实现故障发生前的预警,并且提供及时处理,避免故障再次发生。

3.3批量设备操作处理

随着IT规模不断扩大,IT设备数量不断增多,原有简单的运维操作,也随之成倍增长,即增加了运维工作量,又使重复性操作过程中,由于人员注意力降低导致的操作失误次数成倍增长。

例如:对设备批量程序更新、批量巡检等、批量密码修改等大批量、重复性操作。

提供批量作业并行处理平台,实现多设备同时批处理操作。通过自动化流程把,将简单的操作在大批量设备上操作,并对作业执行过程进行监控对执行结果进行检查。

通过部署批量设备操作流程:

1、批量设备并发执行,缩短批量操作执行时间,提高执行效率,并且提高系统升级一致性;

相关文档
最新文档