运维服务管理体系可行性方案

运维服务管理体系可行性方案
运维服务管理体系可行性方案

第1章项目概况

1.1 项目背景

近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括采购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯…)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。

XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT服务质量,XX 企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。

1.2 项目目标

结合XX企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。

1.3 需求分析

本次项目XX企业需求主要包括两个部分,

1、运维管理体系建设要求;

2、信息系统正常运行保障服务。

其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。

信息系统正常运行保障涵盖了

1、一般信息化设备及软件的运维管理;

2、、防病毒服务;

3、办公区域内设备及软件巡检普查;

4、提供符合XX企业实际的服务响应水平及质量保障;

5、信息化资产管理

第2章运维服务管理体系建设

2.1 IT服务管理概述

现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。

从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言:

如何把有限的IT资源最有效的作用于核心业务的发展

如何最快地获取专业的支持能力

如何实现对系统的完善管理,提高系统的可靠性和可用性

如何提高用户的工作效率,增加最终用户满意度

如何跟上IT技术的发展,及时更新相关技术

如何提高对IT系统利用的灵活性

如何更好地管理IT运营成本

以提高服务能力,将会是单位可能面临的问题。

IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论。ITIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开来,目前已成为IT服务管理事实上的标准。

通过参考这些标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。

ITIL框架图

ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。

ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL 的指导建立和拓展自己的IT服务流程。

2.2 运维服务管理流程体系

运维务管理最核心的是“服务支持”(ServiceSupport)和“服务提供”(ServiceDelivery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。如下图所示:

2.2.1服务支持

服务支持的内容描述了一个客户如何访问适当的服务,以支持其业务。服务支持包含以下内容:

2.2.1.1 服务台

我们为企业建设服务台,提供统一报障电话,统一报障、统一维修接口,越秀工商可以通过统一的报障电话申请服务、查询服务处理进程,监控服务质量。

服务台(ServiceDesk)是IT服务组织和用户相互联系的接入点。服务台曾经被称为帮助台(HelpDesk)。HelpDesk的主要任务是记录,分解和监控提出的问题。一个服务台可以具备更宽范的角色,如接收变更请求(RFC),并且可以支撑多种流程中的操作。

服务台是服务提供者和用户之间的日常工作的单一联系点。它也是报告突发事件和提交服务请求的焦点。正因为如此,服务台的职责是保持将服务相关信息,行为和契机通知用户,并追踪了解用户每日的行为。例如,服务台可能扮演用户提交变更请求的联系点,基于变更管理流程传达变更实施计划,并保持将变更实施进程通知用户。变更管理应该确保服务台随时保持对变更行为情况的掌握。

在任何对SLA产生影响的事件面前,服务台处于第一线,并维护高速的信息流通道。

围绕突发事件,服务台有可能在其权限范围被授权实施变更。此类变更的范围可能被预先定义。当所有相关变更发生时,变更管理流程将被告知。基本上,当对任何CI的规范做出修改之前,变更流程都需要对其进行预先审批。

2.2.1.2 突发事件管理

突发事件管理流程致力于解决突发事件,并快速恢复服务供应。突发事件被记录下来,并且事件记录的质量决定了相关的其它流程的效力。

服务台接近于突发事件管理流程和问题管理流程,并处于它们之间。如果没有适当的控制,变更有可能引入新的突发事件。因此需要建立有效途径对变更进行跟踪。这是为什么建议持续不断地将突发事件记录在同一个CMDB中,并分类为“问题”,“已知错误”,“变更记录”等信息,以促进服务台界面的信息沟通能力,简化事件调查和报告。

突发事件的优先权及其升级需要作为服务级别管理流程中的一部分进行协商,并在SLA中备案。

突发事件管理的目标:

突发事件管理的目标是尽可能迅速地根据SLA中定义的普通服务级别作出反应,使产生问题后对业务行为及组织和用户的影响最小。突发事件管理也应该保留对事件的有效记录,以便于衡量和改进流程,并向其它流程汇报。

突发事件流程如下图所示:

2.2.1.3 问题管理

对于突发事件有两种处理方法,一种是对其做出服务快速响应,尽快恢复其正常运行,另一种是鉴别和解决问题根源。这两种方法之间存在微妙的区别,而且经常被互相混淆。对其做好区分具有重要意义。

如果问题被怀疑存在于IT架构内部,问题管理流程将会瞄准其潜在的根源。一个问题可能是被突发事件暴露出来的,但是显然,问题管理的目标是解决问题根源,预防其可能产生的干扰,而不是迅速恢复系统运行。

当问题被识别后(被识别的问题通常称之为已知错误),通常需要进行一个业务决策,决定是否采取永久性措施改进系统架构,以预防再次发生新的突发事件。如果需要,提交一个变更请求来实现改进。

为了有效和高效地识别突发事件背后的问题根源及其发展趋势,问题管理流

程需要准确全面的突发事件的记录。问题管理流程同样需要和可用性管理流程密切联络,以确定这些趋势并明确补救措施的重要性。

流程:

2.2.1.4 配置管理

配置管理致力于控制一个变化中的IT架构(标准化和状态监控),鉴别配置项目(清册,相互关联,审核与注册),收集和管理有关IT架构的文档,为所有其它流程提供IT架构的相关信息。

配置管理是所有其它服务管理流程不可分割的一部分。拥有当前架构中所有部件的最新的,准确的,全面的和详细的信息,并管理其变更,使这些信息有效而高效地支持其它流程运行。变更管理可以与配置管理集成。至少,建议在配置管理系统中控制变更的登录和实施,并自在配置管理系统的帮助下对变更影响做出评估。因此所有变更请求应该被输入配置管理数据库(CMDB),并随着变更请求的进展随时更新记录,直至其实施。

配置管理系统识别一个变更项目和架构中其它部件的关系,将这些部件的所有人召集到影响评估流程中来。不管一个变更是否在架构中实施,相互关联的配置管理记录应该在CMDB中得到更新。最好在变更发生时,使用集成工具自动地更新记录。

CMDB应该开放给整个服务支持组,使所有人理解部件失效可能的原因,

从而使突发事件和问题可以被更容易地解决。CMDB还应当被用来把突发事件及问题记录和其它记录联系起来,比如失效的配置项目(ConfigurationItem-CI)和用户之间的联系。如果缺少了配置管理流程的集成,发布管理将难以实现,并可能错误连连。

服务交付流程同样依赖于CMDB中的数据。例如:

服务级别管理需要识别相互结合在一起的部件,并在此基础上设置支持协议,交付服务。

IT财务管理需要知道每个业务部门使用的IT架构部件,尤其是对于收费的项目。

IT服务持续性和可用性管理需要识别部件,用于问题风险分析和部件失效影响分析。

下图显示了配置管理和其它服务管理流程之间的关系:

图:能力管理,变更管理,配置管理和发布管理之间的关系

2.2.1.5 变更管理

变更管理专注于对IT架构实施可控的变更。此流程的目标是确定所需的变更,并决定这些变更如何在对IT服务产生最小的不利影响的范围内得以实施。同时确保其变更是可追溯的,而且是经过整个组织内部有效地磋商和协调的。在客户组织提交变更请求后,由配置管理流程监控其状态,与问题管理和若干其它

流程进行协调。变更实施履行一特定的路径,包括定义,计划,建立,测试,接受,实施,和评估。

变更管理流程依赖于配置数据的准确性,以确保获知所有实行

变更造成的影响。因此变更管理与配置管理之间有密切的联系。

变更流程的详细内容应在SLA中存档,确保用户知道提交变更申请的程序,项目目标及时间,以及实施变更造成的影响。

变更的详细内容需要通知服务台。即使变更经过了全面测试,仍然很有可能存在实施变更的过程中发生各种困难,这些困难可能缘于变更没有按需求或预期运行,或者对变更对功能造成的影响产生质疑。

变更咨询会议(ChangeAdvisoryBoard-CAB)由可向变更管理小组提供专家意见的人员组成。这个会议很可能由来自于所有领域的IT及业务单位的人参与。

2.2.1.6 发布管理

发布是指一组配置项目(ConfigurationItems–CI)经过测试被引入处于活动状态的环境中。发布管理的主要目标是确保发布信息被成功地公布,包括归纳综合,测试与存档。

发布管理确保只有经过测试和正确授权的软硬件版本才能提供给IT运行环境。发布管理与配置管理和变更管理的行为密切相关。真实的变更实施经常通过

发布管理行为得以贯彻。

变更的结果可能经常来自于新硬件,新版本软件,以及新的文档(自行建立,或购买而来)等。对它们进行控制,并打包和颁发。有关存档安全和公布程序应该和变更管理和配置管理流程紧密集成。发布的程序也可能作为突发事件管理和问题管理流程中不可分割的一部分,同时还和CMDB密切相连,以维护及时更新的记录。

2.2.2服务提供

服务提供主要包括:服务级别管理、IT服务财务管理、能力管理、持续持续管理、可用性管理等。

2.2.2.1 服务级别管理

服务级别管理的目标是缕清与客户之间有关IT服务的协议,并付诸实施。因此,服务级别管理需要收集客户需求,IT服务组织可提供的设施,以及可用的财务资源。服务级别管理针对提供给客户的服务(聚焦客户的)。因此是基于客户需求建立服务(需求拉动),而非单纯基于现有技术所及(供应驱动),从而使IT服务组织提高客户满意度。服务级别管理阐述的内容有:

●如何在服务级别协议(Service Level Agreement – SLA)中清楚地定

义条款,使其可优化IT服务成本,并为用户所接受。

●如何监控和讨论所提供的服务。

●如何管理IT服务组织的供应商及其下包合同。

服务级别管理(Service Level Management -SLM)流程是用来确保服务级别协议,并支持运行级别协议及其它合同,保证所有对服务质量的影响减少到最小。此流程在服务质量和SLA基础上评估各种变更造成的影响,包含预期变更前的影响,也包含评估实施变更后的影响。SLA中某些最重要的目标和服务可用性、以及在容许周期内对突发事件形成决策有关。

SLM是服务支持和服务交付的关键。由于它依赖于其它流程的存在性,有效性及运行效率,它不可孤立存在。一个缺乏基础支持流程的SLA是没有意义的,缺乏支持的SLA就失去了承认其内容的基础。

2.2.2.2 IT服务的财务管理

财务管理针对于IT服务的谨慎从事。例如,当所提供的IT服务在进行中时,财务管理将提供其导致的成本信息。这样使考虑IT架构或IT服务的改变时,能够合理地考虑成本和利益(价格和性能)之间的关系。财务管理中对成本的鉴别、分配、预测和监控使成本成为可知因素,减少成本和预算的差距。重点结合IT 服务组织的赢利,IT服务的财务管理描述了多种支付方法,包括设立支付和定价的目标,以及预算计划。

财务管理负责对成本及IT服务投资回报的会计核算,并管理任何来自于客户的成本。财务管理需要与能力管理(Capacity Management),配置管理(Configuration Management,包含资产数据),以及SLM的良好接口,来确定服务的真实成本。在IT组织预算谈判阶段和客户的IT耗费核算阶段,财务管理很可能与业务关系管理(Business Relationship Management)及IT 组织密切相关。

2.2.2.3 能力管理

能力管理是优化成本,获得时间,以及开发IT资源的流程,来支持与客户签订的服务条款。能力管理针对资源管理,性能管理,需求管理,建模,能力计划,负载管理,以及应用软件能力推测。能力管理强调用计划来确保所签订的服务级别可以被履行和成长。

能力管理负责确保在所有时间具备足够的可用能力,以满足业务需求。能力管理不是简单地与系统部件的性能相关,而是直接与业务需求相关。在那些与能力问题相关的困难面前,能力管理在突发事件决策和问题鉴别过程中被引入。

能力管理提交变更请求以确保得到适当的可用能力。这些RFC被提交给变更管理流程,其实施可能影响若干CI,包括硬件,软件和文档,并需要提供有效的版本管理。

能力管理应该在评估所有变更时被引入,用来确定变更导致的在能力和性能上的影响。这种影响在变更实施前后都有可能出现。能力管理应该特别关注变更在一定周期后引起的累积性变化。容易被忽略的单个的变更往往在经过累积后,引起响应时间衰减,文件存储问题,和对处理能力的过度需求。

2.2.2.4 IT服务持续性管理

此流程在业务中断时对IT服务进行灾难恢复措施的准备和计划。业务持续性管理为客户组织遇到灾难时准备好紧急预案,根据此预案采取与IT服务相关

的预防灾难发生的措施。IT服务持续性管理流程对技术,财务和管理资源需求做好计划和协调,确保灾难发生后可持续提供服务,并就其内容达成客户同意。

IT服务持续性管理与一个组织在业务中断后在某个可允许范围内继续运作的能力密切相关。至少要保证最基本的业务运行所需要的IT服务,预先对其服务级别作出规定,并和客户达成一致。有效的IT服务持续性需要一个平衡的风险缩减措施,例如有弹性的系统和备份恢复设施。配置管理流程中的数据被用来辅助其计划和预防措施。需要对架构和业务变更对持续性计划造成的潜在影响进行评估。有关IT和业务的计划应该提交变更管理程序。在持续性管理流程中,服务台承担着重要角色。

2.2.2.5 可用性管理

可用性管理是确保资源,方法和技术得以适当拓展的流程,以支持与客户签订的IT服务条款。可用性管理针对所遇到的问题,如优化维护等,并且设计测量指标,最大程度减少意外突发事件的数量。

可用性管理与IT服务的设计,实施,测量和管理相关,确保规定的业务需求中有关可用性的内容被贯彻。可用性管理需要理解IT服务失效发生的原因和恢复服务所需的事件。突发事件管理和问题管理提供了关键输入

SLA中描述的可用性的目标在可用性管理流程中被监控,并包含在其报表中。此外,在支持服务核查制度所提供的测量和报表中,可用性管理对服务级别管理(SLM)流程提供了支持。

2.3 运维服务管理规划

2.3.1第一阶段:服务磨合阶段

第一阶段,又称为运维服务磨合阶段,工作目标主要是通过服务管理,将客户现有的无序救火式突发事件服务有序化,实现突发事件管理,所有的突发事件将运用技术、管理与流程相结合的方式,做到统一管理,统一任务分发,安排合适的人员处理合适的事件。所有的突发事件全过程可控制、跟踪、即时回馈,让每一个客户能够随时查询到事件处理过程,不会出现焦虑、服务要求长时间无人响应或服务要求根本无人响应的情况,从而提高客户满意度,提高运行维护效率,提高客户使用业务信息系统的效率,从而做到提高总体生产力。

现今客户大都没有真正意义上的配置管理系统。配置管理系统,顾名思义,含有业务信息系统及终端设备详细清单,配置情况,针对于业务信息系统的操作

网络安全管理与运维服务

网络安全管理与运维服务 近年来,随着我国信息化建设的不断推进及信息技术的广泛应用,在促进经济发展、社会进步、科技创新的同时,也带来了十分突出的安全问题。根据中国国家信息安全漏洞库(CNNVD)、国家互联网应急中心(CNCERT)的实时抽样监测数据,2013年3月份,新增信息安全漏洞数量比上个月增加了33.9%;境内被挂马网站数量比上月增加17.9%;境内被黑网站数量为7909个,境内被篡改网站数量为9215个,境内被木马或僵尸程序控制主机数量为129万台。面对我国网络信息安全问题日益严重的现状,国家层面在陆续出台相关专门网络信息安全保护法律法规。在各行各业根据不同时代威胁对象及方法的不同,在不断完善自己的安全建设。随着网络系统规模的扩大,各种应用系统不断完善,对各类业务数据的安全提出了新的要求——如何加强网络安全管理?如何使运维服务行之有效? 一、网络管理体系化、平台化 网络安全管理不是管理一台防火墙、路由器、交换机那么简单,需要从以体系化的设计思路进行通盘考虑,需要统一和规范网络安全管理的内容和流程,提升风险运行维护的自动化程度,实现风险可视化、风险可管理、风险可处置、风险可量化。使日常的风险管理由被动管理向主动的流程化管理转变,最终真正实现网络安全管理理念上质的飞跃,初步建立起真正实用并且合规的网络安全管理运维体系。 网络安全管理平台作为管理的工具其核心理念是管理,网络安全管理平台围绕此开展设计,最终形成安全工作的工作规范,通过不断完善的工作规范,通过安全

工作能力的不断提升,通过对工作内容及结果的工作考核,形成安全建设螺旋上升的建设效果。在网络安全管理平台建设上重点考虑如下几个方面的内容: 1)安全资源的统一管理 安全策略是企业安全建设的指导性纲领。信息安全管理产品应能在安全策略的指导下,对与信息安全密切相关的各种资产进行全面的管理,包括网络安全设备(产品)、重要的网络资源设备(服务器或网络设备),以及操作系统和应用系统等。要实现关键防护设备的健壮性检查工作。 2)安全管理可视化 实现安全运维管理服务流程的可视化、结果可跟踪、过程可管理,支持完善的拓扑表达方式,支持可视化的设备管理、策略管理和部署,支持安全事件在网络逻辑拓扑图中显示。信息安全全景关联可视化展示方法和技术,从信息展示逻辑和操作方式上提高可视化的视觉效果,增强系统的易用性和信息的直观性。采用了众多图形化分析算法技术从大量图表数据中揭示更深层次的关联信息和线索。 3)信息安全全景关联模型及方法 各种类型、不同厂家的安全设备得以大规模使用,产生难以手工处理的海量安全信息,如何统一监控、处理这些不同类型的安全信息,如何从这些海量的安全信息中整理、分析出真正对用户有价值的安全事件。通过设计一个基于关联的信息安全事件管理框架,实现安全信息的关联及关联后事件表示,实现安全信息精简、降低误报率和漏报率以及改进报警语义描述,达到增强安全系统间的联系、建立安全信

浅谈规范化信息系统运维体系建设

浅谈规范化信息系统运维体系建设 -------------------------------------------------------------------------------- 日期:2008-03-11 来源:刘泽强乔伟吴莉敏【选择字号:大中小】 内容提要: 随着信息化进程的加快和深入,网络平台速度不断提升,信息系统应用范围逐步拓宽,如何最大限度保障其安全准确高效运行——这一课题摆在了我们面前。在当前税收数据大集中形势下,规范系统的信息系统运维日益显示出其重要性、迫切性。笔者认为国税信息系统运维主要任务是保障广域网络高速畅通,信息系统正常运行,既满足内部行政办公需要又实现对外向纳税人提供优质高效的办税服务,从而提高税务工作信息化程度,更好的促进税收工作。 本文从介绍湖北省综合征管软件运维体系实际出发,详细分析其运维工作内容、管理组织结构和职责划分以及运维体系建设情况,站在基层单位角度剖析综合征管软件运维体系中存在的问题,对国税信息系统运维体系的建设提出了构想。 关键字:信息系统运维体系 湖北省国税系统从1996开始着手信息化建设,从数据区县分散到省级集中走过了十几年的历程。随着信息化进程的加快和深入,网络平台速度不断提升,信息系统应用范围逐步拓宽,如何最大限度保障其安全准确高效运行——这一课题摆在了我们面前,具体的运维概念应运而生。在数据分散基层时期,基层信息中心承担了运维任务,由于没有规范、系统的体系,大多运维变成了应急故障排除、“救火”处理。在当前税收数据大集中形势下,规范系统的信息系统运维日益显示出其重要性、迫切性。笔者认为国税信息系统运维主要任务是保障广域网络高速畅通,信息系统正常运行,既满足内部行政办公需要又实现对外向纳税人提供优质高效的办税服务,从而提高税务工作信息化程度,更好的促进税收工作。 笔者所在地区,已初步建立起数据集中模式下的征管软件运维体系,本文将从介绍综合征管软件运维体系实际出发,浅谈国税信息系统运维平台的现状、问题和展望。 一、本地综合征管软件运维现状 (一)系统应用情况 我省非常重视信息系统的建设和应用。现正在使用的信息系统有综合征管软件、办公自动化软件、防伪税控系统、车辆购置税软件、出口退税预警系统、其它外挂系统等软件。其中,征管软件的变迁最能显示我省信息化建设步伐。2000年以前我们使用的是我省自主开发的TMIS系统,初步实现使用微机办理税收业务,取消了手工开票。2001年为适应新形势下信息化建设和应用的需要,我省逐步启用全国统一的征管软件CTAIS系统,2006年顺利升级到V2.0版,打造了统一规范的办税业务平台。 (二)运维机制

运维服务管理体系可行性方案

第1章项目概况 1.1 项目背景 近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括采购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯…)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。 XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT服务质量,XX 企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。 1.2 项目目标 结合XX企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。 1.3 需求分析 本次项目XX企业需求主要包括两个部分, 1、运维管理体系建设要求; 2、信息系统正常运行保障服务。

其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。 信息系统正常运行保障涵盖了 1、一般信息化设备及软件的运维管理; 2、、防病毒服务; 3、办公区域内设备及软件巡检普查; 4、提供符合XX企业实际的服务响应水平及质量保障; 5、信息化资产管理

运行维护管理体系和制度规范

运行维护管理体系和制度规范

目录 1、总则3 2、编制方法3 3、运维工作职责3 4、运维服务管理体系5 4.1运维服务管理对象6 4.2运维系统功能框架6 4.3运维管理组织结构7 4.3.1工程负责人8 4.3.2工程经理8 4.3.3技术主管9 4.3.4服务台9 4.3.5网络管理员10 4.3.5应用、数据库管理员10 4.3.7终端管理员11 4.4运维服务流程11 4.4.1工程运维服务工作流程图12 4.4.2服务台- 12 - 3.4.3事件管理- 13 - 4.4.4工单管理- 13 - 4.4.5问题管理- 14 - 4.4.6变更管理- 14 -

4.4.7配置管理- 15 - 4.4.8知识库管理- 15 - 4.4.9统计及工作报告- 15 - 5、运维服务内容- 16 -預頌圣鉉儐歲龈讶骅籴。 5.1服务目标-16- 5.2资产统计服务-16- 5.3网络、安全系统运维服务-17-5.4主机、存储系统运维服务-18-5.5数据库系统运维服务-20- 5.6中间件运维服务-21- 5.7终端、外设运维服务-22- 6、应急服务响应措施- 28 - 6.1应急预案实施基本流程20 6.2突发事件应急策略20 7、服务管理制度规范21 7.1服务时间21 7.2行为规范22

1、总则 第一条为保障实验室系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。 运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。 第三条运维管理制度的适用范围:运维人员。 2、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以ITIL/ISO20000为基础,以信息化工程的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。

IT运维管理体系建设案例

IT运维管理体系建设案例

————————————————————————————————作者:————————————————————————————————日期:

某部IT运维管理体系建设案例 摘要: 某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营的使命,致力于提供安全、高效、快捷的IT服务。近年来,随着信息化建设的深入,网上运行的业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务的用户(包括应用使用单位、人民银行、税务、海关、各代理银行等)越来越多,如何维护好日益增多的网络和系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好的服务,及时解决出现的问题和故障,做到网络和用户之所及,管理和服务之所及,是政务业务能否可靠运行的关键所在。 1.案例背景 某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营的使命,致力于提供安全、高效、快捷的IT服务。近年来,随着信息化建设的深入,网上运行的业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务的用户(包括应用使用单位、人民银行、税务、海关、各代理银行等)越来越多,如何维护好日益增多的网络和系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好的服务,及时解决出现的问题和故障,做到网络和用户之所及,管理和服务之所及,是政务业务能否可靠运行的关键所在。 中心目前还处于初级的IT服务管理状态,在组织结构、管理规范、管理流程和技术支撑方面,还没有构建一个综合的IT服务管理体系。对网络、设备、系统、用户等的管理和服务是分散的、不关联的,没有实现数据、信息和知识库的共享,没有实现规范化和流程化,因此,管理和服务是粗粒度、低效率的,这种管理模式将越来越难以适应政务信息化的发展要求。 因此,需要梳理服务管理需求、规范服务管理流程,开发和建设一套科学有效的,融合组织、制度、流程、技术的IT服务管理体系,从粗放和分散型管理,逐步过渡到规范化、精细化和主动式IT服务管理,使IT服务管理体系成为中心日常工作的重要组成部分,这不仅对政务核心应用系统顺利运行和应用有重要意义,也将为支持和推进政务改革提供管理和服务保障。 中心决定启动运维系统建设项目系统化地解决以上难题,构建IT服务管理体系。在经过对众多国际知名及国内咨询公司的考察和比较后,最终选定ITGov专家和信诚致远?( )作为咨询合作伙伴,承担运维管理体系总体规划。

运维服务方案

1概述 1.服务目标 ●保障软硬件的稳定性和可靠性; ●保障软硬件的安全性和可恢复性; ●故障的及时响应与修复; ●硬件设备的维修服务; ●可额外信息化建设规划、方案制定等咨询服务。 2服务方案 2.1系统日常维护 系统首要维护工作是信息化系统的日常维护,主要包括以下4个方面: 2.1.1系统支撑软硬件的日常维护 系统支撑软硬件主要包括服务器、存储、网络设备、安全设备及数据库软件、中间件等基础软硬件巡检。 2.1.1.3网络、安全设备维护 网络、安全平台维护的目标是:通过网络、安全系统管理服务,降低网络设备故障率,提高网络设备的运行性能。提高市民卡机房网络运行的稳定性、可靠性,以专业化运作模式解决市民卡机房各类信息系统信息化发展的需求。需要提供故障诊断、远程支持、现场支持、软件升级、设备搬迁、网络优化、网络巡检、现场培训、技术交流、网络安全、网络建设建议等服务。具体服务内容如下:(1)网络故障排查 (2)网络设备硬件状态检查 (3)网络流量监测 (4)安全策略配置及配置优化

(5)网络设备配置管理服务 (6)网络设备资料整理,配置参数整理 (7)网络使用状况趋势分析及建议 2.1.4维护制度建设 制度是一种必须共同遵守的行为规范,是保证工作有序开展和任务圆满完成的基础。建立和健全市民卡机房信息化设施运行维护的各项管理制度,对于维护工作的顺利完成是必需的。 要求运维团队依据以下标准,协助客户建立规范、科学、实用的维护制度。 (1)《电子信息系统机房设计规范》(GB50174-2008) (2)《综合布线设计规范》GB50311-2007 (3)《中华人民共和国消防法》 (4)《电力供电标准与内部控制管理制度全集》 (5)《成都市电子政务外网使用管理规定》 (6)ISO/IEC 9001:2008质量管理体系 (7)ISO/IEC 20000: 2005 IT服务管理体系 (8)ITIL(Information Technology Infrastructure Library) 2.0 IT基础架构库终端设备的日常维护 (9)ITSS(Information Technology Service Standards)信息技术服务标准 2.2信息系统安全服务 风险评估和安全加固工作贯穿于信息系统的整个生命周期的各阶段中。在运行维护阶段,要不断地实施风险评估以识别系统面临的不断变化的风险和脆弱性,并通过安全加固进行有效的安全措施干预,确保安全目标得以实现。

IT运维服务管理体系

IT运维服务管理体系

目录 1 总则 (4) 2 参考标准 (4) 3 术语、定义和缩略语 (4) 3.1 术语和定义 (4) 3.1.1 IT运维服务 (4) 3.1.2 IT运维服务管理流程 (5) 3.1.3 IT运维服务管理体系 (5) 3.2 缩略语 (5) 4 编制原则和方法 (5) 5 IT运维服务模型与模式 (6) 6 IT运维服务管理体系 (9) 6.1 IT运维服务管理对象 (11) 6.2 IT运维活动角色及IT运维管理组织结构 (11) 6.3 IT运维服务管理流程 (13) 6.3.1 服务台 (13) 6.3.2 事件管理 (13) 6.3.3 问题管理 (13) 6.3.4 配置管理 (13) 6.3.5 变更管理 (13) 6.3.6 发布管理 (13) 6.3.7 服务级别管理 (14) 6.3.8 财务管理 (14) 6.3.9 能力管理 (14) 6.3.10 可用性管理 (14) 6.3.11 服务持续性管理 (14) 6.3.12 知识管理 (14) 6.3.13 供应商管理 (14) 6.4 IT运维服务 (15) 6.4.1 IT运维服务分类 (15) 6.4.1.1 IT 基础设施运维服务 (15) 6.4.1.2 IT 应用系统运维服务 (15) 6.4.1.3 安全管理服务 (15) 6.4.1.4 网络接入服务 (15) 6.4.1.5 内容信息服务 (15) 6.4.1.6 综合管理服务 (15) 6.4.2 IT运维服务的质量指标 (15) 6.5 IT运维服务管理和支撑能力要求 (16) 6.5.1 IT运维服务管理和支撑能力分类 (16) 6.5.2 IT运维服务管理和支撑能力等级划分 (18) 6.5.3 IT运维服务管理和支撑能力组合 (21) 7 IT运维服务支撑系统要求 (22) 7.1 资产管理 (22)

运维服务体系

运维服务体系 整理编辑: 、运维服务体系建设原则 运维服务体系建设的原则有以下几个方面。 一是以完善的运维服务制度、流程为基础。为保障运行维护工作的质量和效率,应制定相对完善、切实可行的运行维护管理制度和规范,确定各项运维活动的标准流程和相关岗位设置等,使运维人员在制度和流程的规范和约束下协同操作。 二是以先进、成熟的运维管理平台为手段。通过建立统一、集成、开放并可扩展的运维管理平台,实现对各类运维事件的全面采集、及时处理与合理分析,实现运行维护工作的智能化和高效率。 三是以高素质的运维服务队伍为保障。运维服务的顺利实施离不开高素质的运维服务人员,因此必须不断提高运维服务队伍的专业化水平,才能有效利用技术手段和工具,做好各项运维工作二、运维服务体系的总体架构 运维服务体系由运维服务制度、运维服务流程、运 维服务组织、运维服务 队伍、运维技术服务平台以及运行维护对象六部分组成,涉及制度、 人、技术、对象四类因素。制度是规范运维管理工作的基本保障,也是流程建立的基础。运维服务组织中的相关人员遵照制度要求和标准化的流程,采用先进的运维管理平台对各类运维对象进行规范化的运行管理和技术操作。 三、运维服务体系建设内容 1.运维管理制度建设 总结现有的运维管理经验,相关运维标准,结合目前的实际情况,统一制定运维管理制度和规范。通过定期和不定期的检查,促进各项制度规范在数据中心的贯彻落实,从而建立起全辖统一、规范的运行维护管理工作方式。同时,随着信息化建设的不断发展,也要确保各项制度的及时更新。制度体系内容要涵盖机房管理、网络管理、资产管理、主机和应用管理、存储和备份管理、技术服务管理、安全管理、文档管理以及人员管理等类别。各类制度具体内容因需要而定,如网络管理制度需覆盖网络的接入管理、用户管理、配置管理及网

系统运维管理制度定稿

系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。

(2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。 第二条.平台信息和技术安全 (1)执行国家有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理基础研发平台信息技术安全方面存在的问题,确保平台安全、稳定、可靠运行。 (2)基础运营平台信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。 (3)在服务器和计算机之间设置硬件防火墙,在服务器及工作站上均安装防病毒软件,进行硬件和技术双保护,确保基础研发平台不受病毒和黑客攻击。 (4)负责基础运营平台信息技术安全应急处理预案制定和实施。 (5)建立多机备份基础平台信息服务系统机制,一旦主系统遇到故障或受到攻击导致不能正常运行,可以在最短的时间内替换主系统提供服务。 (6)建立基础平台系统集中式权限管理,按照岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设置共享数据库信息的访问权限,并设置密码。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏密码。

运维服务完整方案

第1章项目概况 1.1项目背景 近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括米购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯…)的可用性要求日益提高,系统运行保障和维护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。 XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT 服务质量,XX企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。 1.2项目目标 结合XX企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。 1.3需求分析 本次项目XX企业需求主要包括两个部分, 1、运维管理体系建设要求; 2、信息系统正常运行保障服务。

其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX 企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。 信息系统正常运行保障涵盖了 1、一般信息化设备及软件的运维管理; 2、、防病毒服务; 3、办公区域内设备及软件巡检普查; 4、提供符合XX企业实际的服务响应水平及质量保障; 5、信息化资产管理 第2章运维服务管理体系建设 2.1 IT服务管理概述 现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言: 如何把有限的IT资源最有效的作用于核心业务的发展 如何最快地获取专业的支持能力 如何实现对系统的完善管理,提高系统的可靠性和可用性

浅析构建信息安全运维体系

浅析构建信息安全运维体系 周晓梅-201071037 2018年11月20日 摘要:交通运输行业经过大规模信息化建设,信息系统数量成倍增加,业务依赖性增强,系统复杂度提高,系统安全问题变得更加突出、严重。建设系统信息安全运维管理体系,对保证交通运输行业信息系统的有效运行具有重要意义。 关键词:信息系统安全运维体系构建 安全不仅仅是一个技术问题,更是一个管理问题。实际上,在整个IT产品的生命周期中,运营阶段占了整个时间和成本的70% - 80% 左右,剩下的时间和成本才是花费在产品开发(或采购)上面。以往我们听说"三分技术、七分管理"是突出管理的重要性,而这个"管理"则是大部分的精力花费在"运营"方面。随着信息安全管理体系和技术体系在政府或企业领域的信息安全建设中不断推进,占信息系统生命周期70% - 80%的信息安全运维体系的建设已经越来越被广大用户重视。尤其是随着信息系统建设工作从大规模建设阶段逐步转型到“建设和运维”并举的发展阶段,政府或企业运维人员需要管理越来越庞大的IT系统这样的情况下,信息安全运维体系建设已经被提到了一个空前的高度上。 任何为了信息安全所采取的任何安全措施,不管是技术方面的还是管理方面的,都是为了保障整个信息资产的安全,安全运维体系就是以全面保障信息资产安全为目的,以信息资产的风险管理为核心,建立起全网统一的安全事件监视和响应体系,以及保障这一体系正确运作的管理体系。 一、面临的问题 “十一五”以来,我国交通运输行业和部级信息化建设工作发展迅猛,取得了长足的进步,而部级信息化建设和管理工作中存在的一些问题和矛盾也日益凸显。当前部级信息化项目来源较多、资金筹措渠道复杂、建设和运行维护单位众多,而信息化标准规范体系不完善,由于缺乏有效的技术管理规范,非基本建设项目的建设实施还存在管控盲区,现有标准规范贯彻执行不足,系统建设实施过程中存在安全和质量风险,并对系统运行维护形成障碍,整体运行安全存在隐

运维体系建设方案

运维体系建设方案 一、体系建设目标 查阅了大量资料,也没有找到对“运维体系”的明确定义,大多数资料对运维体系的解读及建设方案都是基于ITIL认证体系与Google SRE,通过一系列的制度、标准、规范及流程,辅以高效的IT管理系统,向用户提供高质量的运维服务,保证系统的可靠运行。 基于对ITIL及Google SRE的理解,部门的运维体系建设目标可以确定为:以积极、负责、严谨的工作态度,正确、高效、规范的工作方法,保证系统7*24小时正常服务,全心全意为客户服务,让客户满意。 二、运维现状分析 随着部门研发的产品日趋成熟,系统的复杂度日益提升,主要体现在业务功能增多、业务流程复杂、业务组件多且依赖关系复杂、系统硬件数量多等,导致整个系统运维的工作量及难度均大幅度增加。运维做了很多的工作,却依然保证不了系统的可靠服务能力,并不能完全满足来自公司内外部“客户”的运维服务要求。通过运维团队内部的讨论与分析,发现运维工作提升困难的主要原因与其所处现状息息相关,主要存在如下亟待解决的痛点: 1)运维人员的技能参差不齐,深度不够,专业化不足; 2)运维人员分工及职责不明确,要求全栈运维,工作上出现相互推诿、拖延; 3)运维操作随意性强,容易出现疏忽与失误,导致系统事故; 4)运维服务接入点不单一,任何运维人员都可以接入服务; 5)运维工作范围繁杂琐碎,出了问题就有责任,有失公平,影响团队成员的积极性; 6)运维对问题的复盘分析不够深入,运维质量改进缓慢; 7)大量的硬件资产缺乏全面细致的管理,不能做到全生命周期管理; 8)大量的业务系统,全手工运维与巡检,耗时耗力;

9)缺乏全面的系统监控手段/系统,不能及时发现系统中的问题; 10)业务系统复杂度高,运维还没有完全了解业务系统的功能及依赖关系; 11)业务系统质量低、可靠性差,导致升级变更的工作量超大。 以上并不是全部的问题,这些问题均不是一天两天形成的,有很多历史原因,在此就不再详述了。但是如果不解决这些问题,运维团队将会继续维持低下的工作效率,运维工作质量也得不到改善。为此,我们需要对症下药,借鉴他人的优秀实践,结合我们自己的实际情况,建立科学、高效地运维体系,以解决所有上述的运维工作中的痛点,提升运维工作效率及服务质量。 三、体系建设规划 通过调研大量的资料,并根据运维现状、资源投入等实际情况,提出了“五化一库”的体系建设规划,即“分工专业化、工作精细化、服务流程化、操作规范化、运维自动化、运维知识库”,逐步提升运维工作的效率与质量。 3.1分工专业化 目前,运维人员就像是 “全能骑士”,即要懂业务,也要懂硬件、网络、安全、架构等多方面的知识与技能,人人都需要是全栈运维工程师。的确存在这样的能人,但是毕竟是少数,大多数的结果是“广而不精”,各方面都知道皮毛,遇到问题了找不到根本原因,对运维工作的质量及效率均有影响。因此,在本运维体系中,计划将运维人员按运维工作内容进行专业分组,分为基础设施组、网络组、平台组、业务组及安全组,如图 1所示。 图1 运维团队分工及职责

系统运维服务计划方案

第1章运维服务计划方案 1.1 运维服务准备 做好运维服务项目的准备工作是项目顺利完成的前提条件。在运维服务项目开始前,越维将积极做好前期准备工作,在这个阶段,有三个主要步骤: 1.1.1签定必要的协议和约定 我们将配合XX企业,考虑服务外包可能产生的信息安全风险,并签署信息保密协议;同时对项目中涉及的各类软硬件资产、工具的知识产权做出明确规定与声明。 1.1.2人员准备 越维依据服务方案,培训相应数量、具备相应技术资质的专业服务人员,并向越秀工商提供这些服务人员的: ●身份证明; ●健康证明; ●劳动关系证明; ●保险证明; ●学历和技术专业资质证明; 1.1.3工具准备 依据服务方案,针对企业的IT资产类别、数量等为服务外包项目准备相应的备机、备件以及工具。 服务工具包括软性工具和硬性工具,软性工具包括服务商开发的各类服务管理软件系统、知识库系统、针对客户方IT资产的文档和驱动程序库等;硬件工

具指维修、保养、检测工具及调测仪器等。 1.2 项目人员组织 1.2.1人员结构 根据越秀工商的信息系统运维要求,越维派出长期驻场服务人员2人,项目驻场服务组按工作类型分为服务台人员(由硬件维护人员兼任),硬件维护人员。 服务台人员:负责项目服务中客户服务申请受理,已知故障/问题快速解决,客户回访,客户情绪安抚,资产标签制作,数据统计整理,运维项目文档管理以及运维场地整理工作。 硬件软件维护人员日常工作包括硬件设备维护及软件维护。 硬件维护管理日常任务: 1)运维服务中的定期硬件巡检、日常维护与保养、定期输入设备消毒除尘、 资产标签张贴、硬件维修、终端网络维护、第三方设备维修管理,备品 备件管理工作。 2)对越秀工商终端用户的设备进行病毒查杀工作,且按照越秀工商要求每 月末提交病毒处理服务统计分析报告。 3)对越秀工商不同处室部门终端人员使用的终端设备,以及各业务系统数 据库形成基线,并进行基线管理以及配置管理,并对基线的调整以及配 置的改变在每月底对XX企业进行报告。 软件维护管理日常任务: 4)操作系统的安装、调试及升级; 5)外设(打印机、扫描仪等设备)的相关驱动程序及软件的安装调试; 6)经XX企业授权进行软件安装、升级并排除软件使用过程中的故障; 7)解决软件冲突造成的系统故障;对计算机进行病毒检测和清除,防止病 毒扩散;

IT运维管理体系建设案例

某部IT运维管理体系建设案例 摘要: 某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营得使命,致力于提供安全、高效、快捷得IT服务。近年来,随着信息化建设得深入,网上运行得业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务得用户(包括应用使用单位、人民银行、税务、海关、各代理银行等)越来越多,如何维护好日益增多得网络与系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好得服务,及时解决出现得问题与故障,做到网络与用户之所及,管理与服务之所及,就是政务业务能否可靠运行得关键所在。 1、案例背景 某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营得使命,致力于提供安全、高效、快捷得IT服务。近年来,随着信息化建设得深入,网上运行得业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务得用户(包括应用使用单位、人民银行、税务、海关、各代理银行等)越来越多,如何维护好日益增多得网络与系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好得服务,及时解决出现得问题与故障,做到网络与用户之所及,管理与服务之所及,就是政务业务能否可靠运行得关键所在。 中心目前还处于初级得IT服务管理状态,在组织结构、管理规范、管理流程与技术支撑方面,还没有构建一个综合得IT服务管理体系。对网络、设备、系统、用户等得管理与服务就是分散得、不关联得,没有实现数据、信息与知识库得共享,没有实现规范化与流程化,因此,管理与服务就是粗粒度、低效率得,这种管理模式将越来越难以适应政务信息化得发展要求。 因此,需要梳理服务管理需求、规范服务管理流程,开发与建设一套科学有效得,融合组织、制度、流程、技术得IT服务管理体系,从粗放与分散型管理,逐步过渡到规范化、精细化与主动式IT服务管理,使IT服务管理体系成为中心日常工作得重要组成部分,这不仅对政务核心应用系统顺利运行与应用有重要意义,也将为支持与推进政务改革提供管理与服务保障。 中心决定启动运维系统建设项目系统化地解决以上难题,构建IT服务管理体系。在经过对众多国际知名及国内咨询公司得考察与比较后,最终选定ITGov专家与信诚致远?( )作为咨询合作伙伴,承担运维管理体系总体规划。

运维服务管理体系建设方案全案本科论文

第1章运维服务管理体系建设 1.1 IT服务管理概述 现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。 从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言: 如何把有限的IT资源最有效的作用于核心业务的发展 如何最快地获取专业的支持能力 如何实现对系统的完善管理,提高系统的可靠性和可用性 如何提高用户的工作效率,增加最终用户满意度 如何跟上IT技术的发展,及时更新相关技术 如何提高对IT系统利用的灵活性 如何更好地管理IT运营成本 以提高服务能力,将会是单位可能面临的问题。 IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论。ITIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开来,目前已成为IT服务管理事实上的标准。 通过参考这些标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,

使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。 ITIL框架图 ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。 ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL 的指导建立和拓展自己的IT服务流程。 1.2 运维服务管理流程体系 运维务管理最核心的是“服务支持”(ServiceSupport)和“服务提供”(ServiceDelivery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。如下图所示:

云平台下的运维体系建设工作内容87904

云平台下的运维体系建设工作内容 一、系统运维 系统运维负责IDC、网络、CDN和基础服务的建设(LVS、NTP、DNS);负责资产管理,服务器选型、交付和维修。详细的工作职责如下: IDC数据中心建设 收集业务需求,预估未来数据中心的发展规模,从骨干网的分布,数据中心建筑,以及Internet接入、网络攻击防御能力、扩容能力、空间预留、外接专线能力、现场服务支撑能力等方面评估选型数据中心。负责数据中心的建设、现场维护工作。

网络建设 设计及规划生产网络架构,这里面包括:数据中心网络架构、传输网架构、CDN网络架构等,以及网络调优等日常运维工作。 LVS负载均衡和SNAT建设 LVS是整个站点架构中的流量入口,根据网络规模和业务需求,构建负载均衡集群;完成网络与业务服务器的衔接,提供高性能、高可用的负载调度能力,以及统一的网络层防攻击 能力;SNAT集中提供数据中心的公网访问服务,通过集群化部署,保证出网服务的高性能与高可用。 CDN规划和建设 CDN工作划分为第三方和自建两部分。建立第三方CDN的选型和调度控制;根据业务发展趋势,规划CDN新节点建设布局;完善CDN业务及监控,保障CDN系统稳定、高效运行;分析业务加速频道的文件特性和数量,制定最优的加速策略和资源匹配;负责用户劫持等CDN日常故障排查工作。 服务器选型、交付和维护 负责服务器的测试选型,包含服务器整机、部件的基础性测试

和业务测试,降低整机功率,提升机架部署密度等。结合对公司业务的了解,推广新硬件、新方案减少业务的服务器投入规模。负责服务器硬件故障的诊断定位,服务器硬件监控、健康检查工具的开发和维护。 OS、内核选型和OS相关维护工作 责整体平台的OS选型、定制和内核优化,以及Patch的更新和内部版本发布;建立基础的YUM包管理和分发中心,提供常用包版本库;跟进日常各类OS相关故障;针对不同的业务类型,提供定向的优化支持。 资产管理 记录和管理运维相关的基础物理信息,包括数据中心、网络、机柜、服务器、ACL、IP等各种资源信息,制定有效的流程,确保信息的准确性;开放API接口,为自动化运维提供数据支持。 基础服务建设 业务对DNS、NTP、SYSLOG等基础服务的依赖非常高,需要设计高可用架构避免单点,提供稳定的基础服务。

IT运维服务管理和保障体系

IT运维服务管理和保障 目前企业的IT运维管理服务能力遇到的挑战主要包括:基础环境复杂、过程管理复杂、知识积累复杂等等。构建IT服务管理体系的过程需要结合业务特点以及人员、流程、工具现状,依据监控指标数据全面化解运维难题。尤其是近两年来云计算、虚拟化技术的不断成熟、发展,在IT硬件资源方面的资金投入降低,在充分提高资源的利用率以及系统的高可用保障方面有很大程度的提高。然而运维管理的复杂程度也不断攀升。 各个公司的IT架构不同,运维系统在发展过程中有不同的关注点,基础服务设施是否能够很好的跟进,直接决定了业务内容能否满足海量用户的并发访问。实验室运维系统需要足够地完善、高效、流程化,基于ITILv3的运维服务管理。在ITILV3标准划定的10个核心流程中,与服务支持相关的5个运营级流程与IT系统结合比较紧密,属IT运维范畴。五个流程相互关联形成一整套IT运维处理机制。 ITIL的核心流程 以下为实验室云平台在过去的运维经验中总结指定出符合规范的管理流程 1、事件管理流程 事件是指可能引起或已经引起IT服务中断或服务质量下降的活动,事件管理的目的就是尽可能在最短时间内解决故障,减少事件对业务运作的影响。该流程首先是新建事件,在运维平台中,新建事件有两个来源: 一是当用户发现信息系统故障,通过电话或者邮件通知服务台,由服务台人员在系统中手动创建事件; 二是当监控平台通过监视工具发现性能指标超过闭值时,系统会自动创建事件。在创建事件时,服务台人员根据事件信息进行事件的分类以及设定优先级,同时系统会自动从运维知识库里搜寻该事件的解决方案,为服务台人员处理事件提供参考。如果服务台可以处理该

运维管理体系方案

运维管理体系方案 需求概述 伴随着企事业规模的不断扩大,企事业业务量的增多,售后服务的运维管理也变的越来越重要。一旦系统网络、服务器、数据库、各种应用出现问题,而没有及时地得到妥善解决,常常会给企事业造成很大的损失。怎样能7x24小时保证设备系统的正常运行,避免各种故障的发生,优化和改进传统的运维模式,提高客户服务的及时性和满意度就显得非常重要。 因此,运维管理体系就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、设备、数据库、各种应用系统的服务;一旦客户使用人员通过电话或其他电子信息等将故障信息反馈给提供设备系统的服务商。运维管理人员就可以及时排除故障,避免造成重大损失。 运维管理体系的内容: 故障发现与警报; 记录日常运维日志信息; 设备故障统计; 设备软硬件信息统计; 服务进程管理; 将数据信息存储备份,并使用图形方式直观的展示出来; 服务人员绩效、考核管理; 将数据生成报表; 运维管理体系的特点: 建立专业的客户服务中心; 建立完整的巡检体制及客户满意度调查维护机制; 接收电话和邮件实时故障报警并作出及时响应; 对运维人员电话或现场处理故障的全程跟踪并将结果纳入绩效考核; 统计日常故障处理的方式方法,以便下次出现同样故障时能够更快的解决问题; 运维任务的电子和纸质文档管理; 运维费用的标准和回款管理; 操作流程统计与管理;

流程体系结构 运维管理体系采用循环制构架,由客户服务中心对故障报修进行响应和对运维服务人员的工作情况作全程跟踪,将故障的处理结果进行记录并反馈给客户报修人员;故障的发起与响应有2种方式:1.客户发现故障并直接向客户服务中心报修,客户服务中心按流程作出响应;2.客户或客户的其他服务商人员发现故障并将信息反馈给公司人员,公司人员须向客户服务中心报修,客户服务中心按流程作出响应。 该体系的流程由客户发起开始任务至完成任务并得到客户同意结束,具体流程为:客户发起故障报修(任务开始)→客户服务中心(报修记录)→部门负责人(任务分派)→运维人员(执行任务、任务信息反馈)→客户服务中心(任务跟踪)→客户(任务结束:电话回访、满意度调查)。 体系示意图 该体系结构以围绕客户服务展开,各部门及人员密切协调合作与监督。当任务发起开始后客户服务中心记录信息并传达给任务主管负责人,主管负责人接到任务后分派工程师进行协调与维护,同时与客户服务中心一起对工程师任务情况进行监督;工程师接到任务并开始实施和完成后将信息及时反馈给客户服务中心并做好维护记录;客户服务中心得到完整的任务信息后做电话回访和满意度调查;针对客户直接电话或其他方式联系公司人员进行报修的,公司人员也必须走服务流程。

相关文档
最新文档