多渠道智能一体化运维管理平台

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多渠道智能一体化运维管理平台

项目背景及目标

在我国过去20年里,IT信息化建设在国内各行各业发展迅速,尤其在金融领域极为明显。然而随着业务规模的不断扩大,IT 基础资源建设规模也越来越大,IT基础资源规模的快速增长给IT 管理部门带来了莫大的挑战,即“网络安全稳定、基础设施安全可靠、应用系统安全稳定高效、业务满足7×24小时服务等”各种要求,再加上监管部门的各种安全规范与要求,IT管理部门需要克服现实工作中的各种技术及管理问题。在诸多问题中最突出的问题主要集中在“IT运维的系统化管理”上:

一是在如此繁杂IT架构下,IT基础信息管理混乱、对象间关系模糊,缺少对IT对象的系统化、标准化管理;二是IT监控分专业,专业间数据无关联,缺少一套集中式监控与预警系统;三是业务发生故障时IT响应滞后、被动,缺少网络性能及交易性能方面的监控手段。

这些问题的存在,从短期看,已或大或小地影响了天津农商银行IT信息化建设,如:不利于IT基础设施资产统计、不利于IT基础设施生命周期的跟踪、控制与管理、围绕IT基础设施生产运维工作效率提升不上去及生产运维工作难以形成“主动运维”机制等等;从长期看,已经严重影响到了天津农商银行新数据中心的建设,关系到未来天津农商银行新数据中心启用后IT运维管理水平能否再上新台阶。

综上所述,天津农商银行需要搭建一套能够满足未来新数据中心需求、为信息科技管理工作质量提升及快速实现“科技引领业务”目标起到推动作用的“多渠道一体化运维管理平台”。

项目方案

天津农商银行通过构建“多渠道智能一体化运维管理”体系,并以此指导“多渠道智能一体化运维管理平台”建设过程。该平台能够有效实现对IT运行整体环境的监控,即对主机系统、网络系统、安全设备、数据库、中间件、存储设备、应用系统、IT环境等的集中监控和管理。能够及时采集各类告警数据、性能数据和配置数据,进行集成统一的分析、查询、报告和展示,帮助运维管理人员方便有效的定位系统问题,直观快速的诊断和分析问题,将运维模式由被动的支持转为主动式服务。通过帮助服务台接收各类告警事件,按照预先定义的事件管理流程完成事件的处理。建立故障管理、问题管理、变更管理、配置管理等服务工作流程,通过管理人员、技术和流程的有机结合,实现IT运维管理标准化和规范化,形成一套完整的IT一体化运维管理体系。平台主要功能包括:一是,基于ITIL理念,结合IT信息化管理要求,构建IT基础信息数据库(CMDB),实现对天津农商银行IT基础信息的统一标准化、系统化管理;

二是,结合当今IT信息化技术,采用带外技术构建基于带外数据的性能监控系统,实现对天津农商银行重要、一级、二级业务系统网络性能及交易性能方面监控;

三是,构建“多渠道智能一体化运维管理平台”基础平台,打通该平台与各专业监控系统信息通道,实现对IT基础对象的集中式监控与统一预警。

创新点

一、本系统的技术架构以基于SOA架构,集成动环、网络、系统监控以及交易监控等系统,以IT基础信息配置管理为建设基础,以CMDB为核心支撑点,以业务为管理视角实现监控集中和统一展现;

二、基于CMDB构建ITSM流程化控制与管理功能和移动终端APP功能;

三、利用大数据技术通过对全IT日志进行统计分析实现“事件关联预警”,结合各种IT运维场景,利用机器学习与算法建模技术,实现基于IT运维日志数据辅助提升IT运维质量的“精准预警、异常检测、容量管理”等深度应用。

技术实现特点

“多渠道智能一体化运维管理平台”技术架构图如上图所示:

一、内部结构采用分层式设计,各层间通过接口对接,为了保证接口的标准化和数据传递的规范性,设计中采用服务总线的设计思想和相关技术实现数据整合平台(DIP)。它介于专业子系统层和集中处理层之间,起到规范数据交换标准、可以消除不同监控应用之间的技术差异,让不同的专业子系统协调运作,实现了不同服务之间的通信与整合。

二、数据整合平台采用标准、通用的接口技术(如Web Service等),实现性能数据、事件告警数据、其它事件数据、配置数据、报表数据在专业子系统层与集中处理层之间的数据传送;

三、外部访问接口提供多种接口,如文件接口、rest接口、Web service接口等,以满足三方系统不同接入方式,这也为后续该平台的可扩展性提供了方便。

项目过程管理

依项目初期制定的目标,整个项目实施分成了两个子项目,即“多渠道智能一体化运维管理平台”基础平台和基于带外流数据的“性能监控系统”。前者实现对IT基础信息的统一标准化、系统化管理及“集中监控与统一预警”功能,后者主要实施“网络性能监控”及“交易性能监控”。因为两个系统间有关联,所以由一个大项组分出两个小项目组各负责一个子项目,大项目组统一管理两个小项目组,负责项目间协调和统一项目管理工作。整个项目从项目启动会直至投产试运行,平均12个人历经8个月。

运营情况

一、“多渠道智能一体化运维管理平台”已经实现了基于天津农商银行IT信息化管理要求的IT基础信息数据结构落地工作,各部分数据按要求有序入库管理,数据管理工作例行纳管流程有序推进;平台已纳管全部重要、一级、二级业务系统相关服务器、数据库、中间件、应用等监控任务,经过近半年左右的优化,已能够对服务器硬件、存储硬件、操作系统、数据库、中间件、应用等进行实时监控,并能够按照预设的预警规则进行有效预警;

二、“网络性能监控”已实现对天津农商银行全部生产环境中重要网络设备的网络性能监控;

三、“交易性能监控”已实现对天津农商银行重要、一级、二级近40余套业务系统的交易性监控,预警信息实时推送“多渠道智能一体化运维管理平台”实现统一预警;

四、“动环监控”系统实时推送预警信息给“多渠道智能一体化运维管理平台”实现统一预警。

项目成效

一、在IT基础信息管控方面,“多渠道智能一体化智能运维管理平台”让IT运维人员彻底告别了之前台账式无系统的IT基础数据管理时代,CMDB结合制度化流程管控,IT基础数据账实相符度比之前提高了40%-50%,数据质量显著提高;

二、网络性能监控实时监测重要监测点的网络流,特别是与第三方相关的网络,如银联、人行、农信银等,比起之前在出现与三方间交易性能或交易中断问题时通过命令排查网络问题,排查效率大大提升;

三、交易性能监控系统实时从“交易量、响应时间、响应率、成功率”四个维度对每个业务系统的相关监控点进行监控,实时保存流水数据,并依预设预警规则实时预警,这既改变了之前交易故障时IT运维人员的被动运维状态,而且也为IT运维人员排障提供了有效的排障依据,从而提高了排障速度。

经验总结

经过多渠道智能一体化运维管理平台的落地实施,天津农商银行已经实现了对IT运行整体环境的集中监控、管理和统一展现,并

相关文档
最新文档