银行数据中心自动化智能运维平台需求

合集下载

智能运维助力数据中心数字化转型

智能运维助力数据中心数字化转型

Application 魅智能运维助力数据中心数字化转型文II中国民生银行信息科技部毕永军张舒伟、[/■前,民生银行正围绕“民营企业的 3银行、数字金融的银行、一体经营 的银行、精细管理的银行”战略定位,全 力推动民生银行实现稳健可持续发展。

“数 字金融的银行”就是将金融科技提升到核 心战略层面,实施全方位数字化转型,打 造敏捷高效、体验极致的数字化智能银行。

民生银行构建了“薄前台、强中台、稳后台”的信息系统架构,以更加敏捷的 方式满足客户需求,支撑业务发展。

最近,基于分布式和微服务技术自主研发的分布 式核心成功投产,将银行账户体系和业务 系统迁移到分布式架构上,标志着民生银 行数字化转型进入了新阶段。

数据驱动运维提高数据中心智能 化水平业务的数字化转型呼唤数据中心的数字化转型,民生银行提出了“数据驱动 运维”战略,打造用数据感知、用数据决策、标准化执行的智能化数据中心。

“数据驱 动运维”战略围绕以下几个方面展开。

感知能力。

面向数据中心全领域,对 全部运维对象实现标准化管理,采集各个 维度的运行数据,应用数据孪生技术,将 运维对象映射到数字领域。

借助运维对象 之间天然存在的关联关系,构建出运维知 识图谱,并在此基础上,应用智能故障发 现算法,对数据中心整个运行组件实现全 感知。

决策能力。

提升决策能力首先要在“感知一切”的基础上实现“可视化一切”,将数据中心正在发生的问题以多渠道、多角度、多粒度的方式呈现给运维专家等决策者,借助专家经验进行人工决策。

同时,通过建设运维大数据平台和智能运维平台,分场景逐步替代人工决策,实现7x24小时不间断ft速决策。

执行能力。

为了快速恢复服务、降低故障恢复时间,高效可靠的执行能力同样重要。

通过对常见运维操作的抽象,实现场景标准化、流程标准化和动作标准化,固化到自动化运维系统中,供决策系统调用。

当匹配到典型场景时,还可以用一键处置的方式,提髙事件处置效率。

数据底座。

银行数据中心自动化运维平台设计

银行数据中心自动化运维平台设计

银行数据中心自动化运维平台设计本文介绍银行数据中心自动化运维平台设计的背景和目的。

随着银行业务的扩张和数据量的增长,传统的手动运维方式已经无法满足业务运营的要求。

为了提高运维的效率和可靠性,银行决定设计一个自动化运维平台来管理数据中心的各项运维任务。

自动化运维平台设计的目的是实现对数据中心运维任务的全面自动化管理,减少人工干预,提高运维效率,降低运维成本,并确保数据中心的稳定性和安全性。

通过自动化运维平台,银行可以实现运维任务的快速响应、高效执行和实时监控。

本文将介绍自动化运维平台的设计原则、功能模块以及实施方案,以帮助银行了解和理解此平台的重要性和潜在好处。

本文旨在分析银行数据中心运维的需求,以及自动化运维的优势和目标。

银行数据中心运维需求分析银行作为金融行业的重要组成部分,数据中心扮演着关键的角色。

银行数据中心的运维需要满足以下需求:高可用性:银行数据中心需要保证24/7的稳定运行,以确保业务连续性和系统可用性。

高可用性:银行数据中心需要保证24/7的稳定运行,以确保业务连续性和系统可用性。

安全性:银行数据中心存储了大量的敏感客户信息和交易数据,因此必须具备严格的安全保护机制,包括访问权限控制、数据加密等。

安全性:银行数据中心存储了大量的敏感客户信息和交易数据,因此必须具备严格的安全保护机制,包括访问权限控制、数据加密等。

安全性:银行数据中心存储了大量的敏感客户信息和交易数据,因此必须具备严格的安全保护机制,包括访问权限控制、数据加密等。

安全性:银行数据中心存储了大量的敏感客户信息和交易数据,因此必须具备严格的安全保护机制,包括访问权限控制、数据加密等。

灵活性:由于业务需求的不断变化,银行数据中心需要具备灵活的运维能力,能够快速部署和调整系统资源,以适应不同的业务场景。

灵活性:由于业务需求的不断变化,银行数据中心需要具备灵活的运维能力,能够快速部署和调整系统资源,以适应不同的业务场景。

灵活性:由于业务需求的不断变化,银行数据中心需要具备灵活的运维能力,能够快速部署和调整系统资源,以适应不同的业务场景。

数据中心的智能化运维策略

数据中心的智能化运维策略
传统运维手段无法满足需求
运维现状
面临的挑战
02
智能化运维策略概述
智能化运维是指利用人工智能、大数据、物联网等技术,实现数据中心的自动化、智能化、高效化的运维管理。
智能化运维的目标是提高数据中心的稳定性、可靠性、安全性,同时降低运维成本,提高运维效率。
智能化运维定义
智能化运维重要性
适应数字化时代的发展需求,满足数据中心日益增长的运维压力。
1
大数据技术
2
3
利用大数据技术,实现海量数据的存储与分析,为决策提供实时、准确的数据支持。
数据存储与分析
通过对历史数据的挖掘和分析,预测设备未来的运行状态和趋势,提前采取措施以避免潜在问题。
数据挖掘与预测
通过数据可视化技术,将复杂的数据以直观的方式呈现,便于运维人员了解设备运行状况。
数据可视化与监控
数据中心智能化运维策略
2023-11-06
CATALOGUE
目录
数据中心运维现状及挑战智能化运维策略概述智能化运维技术智能化运维平台构建智能化运维应用场景智能化运维的挑战与未来发展案例分析:某大型数据中心智能化运维实践建议与展望
01
数据中心运维现状及挑战
数据中心规模不断扩大
运维人员技能和经验不足
加强企业间交流与合作
企业间交流与合作是促进数据中心智能化运维发展的重要途径,应加强企业间的交流与合作,共享资源和技术成果。
总结词
建立企业间交流平台,促进企业之间的合作和沟通,共享智能化运维的技术和经验。同时,开展国际合作,引进国外先进技术和管理经验,推动我国数据中心智能化运维的快速发展。
详细描述
感谢观看
THANKS
利用人工智能技术,实现运维任务的自动化执行,提高运维效率和质量。

天津银行构建一体化综合运维管理平台,助推数字化转型

天津银行构建一体化综合运维管理平台,助推数字化转型

的利用 ,使I T 运维人员可 以快速评估系统的健康状态及可用性 ,快速应对问题 ;三是平台的智能学习能力 ,大大提升 了I T 运维中的故障定位和评估的水平 ;四是完善的流程管理 ,使得一线人员处理问题的成功率不断提高 ,大大降低费
用昂贵的二线支持的投入 ;五是灵活定制的 自动化巡检功能 ,使系统的维护和检查工作变得高效。经过两期项 目的实 施 ,天津银行逐步缩小了与国内先进银行在I T 运维方面的差距 ,基本实现了从手工向电子化运维方式的转变 ,今后将 继续围绕I T I L 标准建设完善I T 运维体 系。
ND U 5T NF OR M
A T I 业界资讯 业 r 贝 I I ON I
金融科技3 0 即将开启
日前 ,易观发布了 《 中国金融科技 ( F i n T e c h )专题分析2 0 1 7 》( 以下简称 “ 报告” )。报告分析指出,中国经 济结构转型背景下 ,金融科技外部环境主要包括4 方面 :政策环境 、经济环境 、社会环境 、技术环境 。一是政策环
境 :互联网金融首次被纳入政府工作报告 ,并被 写进 “ 十三五”规划 ;政府 围绕建设科技励科技创新 的政策 。二是经济环境 :居民可支配收入增加 ,货币宽松下 ,市场上资金充裕 ,理财需求持 续增长 ;供给侧改革核心之一是金融改革 ,即降低企业融资成本 ,提升资金利用率。三是社会环境 :国内互联 网金 融逐渐发展成熟 ,国内外交流加深,为更深层次 的转型提供契机 ;各数据中心 、征信系统等基础设施 的建设逐渐完
系统运行更加高效 ,行业竞争能力不断提升 。 据了解 ,根据多年 的运维工作经验总结和分析 ,天津银行认识到其I T 运维技术和手段存在着短板 。于2 0 1 3 年启动
了一体化综合运维平台项 目。在一期建设中搭建了B MC 的B P P M基础架构监控平台,实现了服务器统一性能监控 、告 警管理 , 覆盖了含核心系统在内的3 0 多套业务系统的1 0 0 多台服务器。初步解决了天津银行I T 运维工作点多面广 、 维护 力量不足 、维护工作难等一系列问题。二期项 目进一步巩固和优化了基础设施监控管理能力。一方面,天津银行在原 有B MC P a t r o l 系统基础之上 ̄ I / N . B MC T r u e S i g h t ,实现了系统 、应用故障的全流程管理 ,从应用到数据库 、中间件 、操

数据中心中的人工智能与自动化运维

数据中心中的人工智能与自动化运维

数据中心中的人工智能与自动化运维随着信息技术的不断发展,数据中心成为了现代企业重要的IT基础设施之一。

而在数据中心的运营中,人工智能和自动化运维技术的应用已经变得越来越重要。

本文将探讨数据中心中人工智能与自动化运维的应用,并探讨其对数据中心运营的影响。

1. 人工智能在数据中心中的应用数据中心作为大规模的IT设施,面对着海量的数据和复杂的系统运维任务。

人工智能技术可以通过对海量数据的分析和学习,自动化地提取有用的信息,为数据中心的决策提供支持。

比如,人工智能可以通过对历史数据和实时数据的分析,预测数据中心的负载趋势,从而提前做好资源的调配和扩容计划,以确保数据中心的稳定运行。

此外,人工智能还可以应用于故障预测和自动化运维。

通过对数据中心设备的大数据监测,人工智能可以准确地预测设备的故障,及时采取措施避免故障的发生。

同时,人工智能还可以自动化地执行维护和巡检任务,通过机器学习算法不断优化运维流程,提高运维效率。

2. 自动化运维在数据中心中的应用自动化运维技术是指利用软件和工具来代替人工进行运维管理和操作。

在数据中心中,自动化运维可以减少人工操作的繁琐和错误,提高运维的效率和准确性。

首先,自动化运维可以应用于服务器的集中管理和配置。

通过自动化的脚本和工具,管理员可以远程对服务器进行批量配置和管理,节省了大量的人力资源。

同时,自动化运维可以通过配置管理系统实现对服务器配置的自动化管理,确保服务器配置的一致性和可追踪性。

其次,自动化运维还可以用于应用程序的发布和部署。

通过自动化工具,管理员可以快速地将新的应用程序版本发布到生产环境中,并自动完成必要的测试和配置。

这样可以减少人工操作的错误和时间成本,提高应用程序的部署效率和稳定性。

3. 人工智能与自动化运维的优势和挑战人工智能和自动化运维技术在数据中心中的应用带来了许多优势,但也面临一些挑战。

首先,人工智能和自动化运维可以提高数据中心的运维效率和稳定性。

通过自动化的任务执行和智能的决策支持,可以减少人为的错误和疏忽,提高数据中心的运行效率和安全性。

智慧运维平台

智慧运维平台

智慧运维平台引言概述:随着信息技术的不断发展,企业的IT系统越来越复杂,运维工作也变得愈发繁重。

为了提高效率和降低成本,越来越多的企业开始采用智慧运维平台来管理和监控他们的IT系统。

智慧运维平台是一种集成为了人工智能、大数据分析和自动化技术的综合性解决方案,能够匡助企业实现智能化运维管理,提高系统稳定性和安全性。

一、智慧运维平台的功能特点1.1 自动化运维:智慧运维平台能够自动监测和诊断系统故障,实现故障的自动修复和恢复,减少人工干预的需求。

1.2 大数据分析:通过对海量数据的分析和挖掘,智慧运维平台可以预测系统故障的发生,提前采取措施避免故障的发生。

1.3 智能决策:基于人工智能技术,智慧运维平台可以根据实时数据做出智能决策,提高运维效率和准确性。

二、智慧运维平台的应用场景2.1 云计算环境:在云计算环境下,智慧运维平台可以实现对虚拟化资源的自动化管理和优化,提高云平台的性能和稳定性。

2.2 大型数据中心:对于大型数据中心来说,智慧运维平台可以匡助管理人员实时监控数据中心的运行状态,及时发现并解决问题。

2.3 物联网设备:在物联网设备的管理中,智慧运维平台可以对设备进行远程监控和管理,实现设备的智能化运维。

三、智慧运维平台的优势3.1 提高效率:智慧运维平台能够自动化和智能化运维管理,减少人工干预,提高运维效率。

3.2 降低成本:通过预测系统故障和自动化修复,智慧运维平台可以降低企业的运维成本。

3.3 提高安全性:智慧运维平台能够及时发现系统漏洞和安全隐患,提高系统的安全性和稳定性。

四、智慧运维平台的发展趋势4.1 人工智能技术:随着人工智能技术的不断发展,智慧运维平台将更加智能化,能够做出更加准确的决策。

4.2 自动化技术:自动化技术将会更加成熟和普及,智慧运维平台将实现更高程度的自动化运维管理。

4.3 云原生架构:未来的智慧运维平台将更多地基于云原生架构,实现更高的弹性和灵便性。

五、智慧运维平台的未来展望5.1 智能化运维:智慧运维平台将成为企业IT系统管理的重要工具,实现智能化运维管理。

招行数据中心建设及运维管理

招行数据中心建设及运维管理

招行数据中心建设及运维管理在当今数字化时代,银行业对于数据的依赖程度日益加深。

作为国内领先的商业银行之一,招商银行高度重视数据中心的建设与运维管理,以确保其业务的稳定运行和持续创新。

招行数据中心的建设是一个复杂而系统的工程,需要综合考虑多个方面的因素。

首先是选址问题。

为了保障数据中心的稳定性和安全性,招行通常会选择地质条件稳定、电力供应充足、网络通信便捷且远离自然灾害频发区域的地点。

同时,还会充分考虑当地的政策环境和成本因素。

在基础设施建设方面,招行数据中心采用了先进的技术和设备。

数据中心的机房环境要求极高,需要具备良好的通风、散热、防火、防潮等功能。

为此,招行配备了高效的空调系统、消防系统以及智能的监控系统,实时监测机房内的各项环境参数。

电力供应是数据中心运行的关键。

招行数据中心通常会接入多路市电,并配备大容量的 UPS(不间断电源)系统和备用发电机,以确保在市电出现故障时能够迅速切换,实现无缝供电,保障业务的连续性。

网络架构的设计也是至关重要的一环。

招行构建了高速、可靠、冗余的网络,采用了最新的网络技术和设备,以满足大量数据的传输和处理需求。

同时,通过与多家运营商合作,实现了网络的多线路接入,提高了网络的稳定性和可靠性。

在硬件设备方面,招行选用了性能强大、稳定性高的服务器、存储设备等。

为了应对不断增长的数据量和业务需求,还采用了云计算、虚拟化等技术,实现资源的灵活分配和高效利用。

而数据中心的运维管理更是保障其正常运行的关键。

招行建立了一套完善的运维管理体系,包括人员组织架构、流程规范、技术支持等方面。

运维团队由具备丰富经验和专业知识的人员组成,涵盖了网络工程师、系统管理员、数据库管理员、安全管理员等多个角色。

他们分工明确,协同工作,共同保障数据中心的稳定运行。

在流程规范方面,招行制定了详细的操作流程和应急预案。

对于日常的运维操作,如设备的巡检、维护、升级等,都有严格的流程和标准。

而在遇到突发情况时,能够迅速按照应急预案进行处理,将损失和影响降到最低。

智慧运维管理平台建设方案

智慧运维管理平台建设方案

智慧运维管理平台建设方案智慧运维管理平台是指基于人工智能、物联网、大数据等技术,通过对各种设备、系统和网络进行全面、实时的数据采集、分析和管理,从而提高设备可靠性和效率,降低运维成本的一种管理方式。

建设一个智慧运维管理平台需要以下步骤:一、需求分析1.明确目标:根据公司的业务、发展规划、运维管理现状和问题,明确智能运维平台的目标和意义。

2.需求调研:通过调研运维管理人员和用户的需求,深入了解运维流程、问题和瓶颈,并分析企业信息化现状,为平台需求的确认和预测提供依据。

二、平台架构设计1.技术选型:根据需求分析,确定人工智能、物联网、大数据等所需技术,并选择相应的开发平台和工具。

2.平台架构图:根据所需的功能和特性,设计整个智慧运维管理平台的结构,包括前端、后端、数据中心、模型库、算法库等模块。

三、平台开发与实现1.前端开发:采用HTML5、CSS3、JavaScript等前端技术,开发用户登录界面、数据展示、操作界面等前端页面。

2.后端开发:采用Java、Python等后端开发语言,基于所选的开发平台和框架,开发管理系统、数据采集、运行监测和故障诊断等后端功能。

3.数据处理:采用大数据技术,对采集到的数据进行清洗、处理和分析,形成可视化数据统计报表,并用于后续的预测和决策支持。

4.智能模型开发:基于采集到的设备数据和监测数据,开发各类智能模型,并针对不同的运维场景进行测试和调试。

5.平台实现:完成平台各类业务和功能的需求,实现各类业务场景。

四、测试与上线测试:进行各类测试,包括单元测试、集成测试、应用测试和性能测试等,发现问题并及时匹配解决。

上线:进行产品的打包、部署、及配置,同时开通相应的用户权限,为开启智慧运维管理平台的使用做好最后的准备。

五、数据管理及维护1.数据管理:根据数据管理手册,对接收、存储、处理、分发、删除等数据全命周期进行管理,保证数据的安全和完整性。

2.故障维护:通过持续监测和预警,对平台可能出现的故障进行及时的排查和维护,保证系统的稳定运行。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

需求分析:3
• 审计和合规管理:
– 支持配置与操作审计,包括操作用户的审计、操作时间的审计、 操作内容的审计等,可以具体到用户的击键记录; – 内置多种合规或最佳实践要求,包括Sarbanes Oxley, PCI, FISMA, HIPAA, ITIL, COBIT, COSO等; – 也可由用户自定义合规策略,可以针对文件、目录、用户、组、 补丁、软件包、注册表、应用配置模板等多种对象制定合规策略; – 当发现不合规情况下,可以提供自动修补功能。
项目目标
• 改变IT部门的传统运维模式,建立新的自动化运维模式,建设开放平 台服务器自动化配置管理系统将。 • 从范围上来说,该系统不仅能满足目前中国XX银行 IT部门对数据中心 开放平台服务器的日常运维管理需求,而且应能够具备良好的扩展性, 可以在未来为中国XX银行 IT部门提供从数据中心到测试中心、开发中 心、各分行,乃至地市分行的端到端自动化运维管理。 • 从功能上来说,该系统应可以为开放平台服务器的整个管理生命周期 的提供一系列自动化配置管理手段,涵盖开放平台服务器规划、设计、 实施和运维的各个阶段。
容量估算
• SA服务器自动化工具后台服务器2台,建议 配置如下:
– 处理器:CPU Dual-core Processor Intel Xeon, 3.0+ GHz,4颗以上 – 内存:16GB RAM以上 – 硬盘:200 GB以上, SCSI – 网卡:100/1000Mbps以太网卡,2个
容量估算
– SA客户化功能实现配置信息自动化
服务器列表范例
29
2013年5月11日星 期六
操作系统报表范例
30
2013年5月11日星 期六
软件信息报表范例
31
2013年5月11日星 期六
日常巡检自动化
• 日常巡检自动化内容: – 包括用内置的模板进行检查,以及由用户自定义检查,比如检查CPU利用 率、表空间利用率、日志文件搜集和分析、补丁规范、配置规范、安全 设置等 – 标准操作系统软件/补丁信息
应用或技术架构图
• 应用架构图 • 技术架构图 • 系统示意图
技术架构图
外部 系统
工单 系统
监控 系统
变更 管理
帮助 台
开放平 台自动 化管理 系统
自动化运维流程整合系统
配 置 管 理
合 规 管 理
操 作 系 统 安 装
日 常 巡 检
变 更 管 理
单 点 登 录
补 丁 管 理
软 件 分 发
脚 本 执 行
卫星节点
分布部署,高可用性
数据中心1 OO+SA
3001
数据中心2 OO+SA
被管服务器
3001
被管机器
1002
被管机器
1002
架构说明
• Multi-Master
– 统一集中的服务器管理 – 避免单点故障 – 多个SAS核心服务器之间的数据共享
• 卫星节点
– 分担核心服务器负载 – 穿越防火墙 – 有效平衡网络带宽
数据中心自动化智能运维平台 项目背景、目标描述 • 描述项目的背景及需要解决的问题 • 描述项目的目标 • 评价项目目标是否实现的衡量指标
项目背景
• 目前我行所负责运维的开放平台服务器已经达到了相当的 数量规模,但是大多数配置管理和变更工作仍还由IT维护 人员手工运维。 • 随着设备数量的增长、运维标准的提升、配置和运维规范 的日益严格,手工运维的模式已经越来越难以实现我行在 IT运维方面的高标准要求,在配置管理、变更管理、合规 审计和联合排障等方面,因手工运维带来的大量繁琐工作 和易出错的操作都给安全生产带来极大隐患。 • 从运维管理模式上看,数据的集中意味着运维管理也必须 相应的向集中式的运维模式转型,如果IT还停留在传统的 运维模式和运维水平,势必对集中的业务带来极大的潜在 风险。
– 数据库信息
– 中间件信息

配置信息自动化采集和管理的解决方案
– SA默认功能实现配置信息自动化
• 对于大多数硬件信息, 标准操作系统软件/补丁信息, 操作系统信息, SA默认可以自动 采集, 同时生成相应的报表, 不需要定制 • 对于数据库信息, 中间件信息, 可以开发OGFS脚本, 把这些信息写入数据库如服务器 的custom attribute字段, 再用BIRT报表工具自定义用户需求的报表
– 处理器:CPU Dual-core Processor Intel Xeon, 3.0+ GHz,2颗以上 – 内存:4GB RAM以上 – 硬盘:80 GB以上, SCSI – 网卡:100/1000Mbps以太网卡,2个
部署方案详细描述
• 详细的部署方案图及描述,描述需求到方案的推导过程,包括:
需求分析:4
• 软件/补丁安装和回退:
– 操作系统补丁安装升级 – 应用补丁安装,包括:数据库补丁、中间件补丁、XXX银行自己开 发应用的补丁,以及如何自动部署新的应用 – 软件/补丁的回退, 能够回退到上一状态 – 以工作流方式实现对各个运维管理子系统的指挥调度和协同工作 – 实现IT流程完整的生命周期自动化,对流程进行闭环管理; – 提供可视化工具定制流程;
应 用 可 视 化
报 表 管 理
HP自动化运维术语
SA Core Slice MR SAR Server automation Core slice Model Repository Service automation report 服务器自动化系统 SA的核心服务器 和agent通讯的组件 oracle 数据库 报表管理系统
– – – – 跨越多个数据中心提供全面的硬件、软件和操作活动的全面报表; 可以自动生成通用的合规报表,如Sarbanes-Oxley报表等; 可以创建可互操作的图表,提供多层次数据并可层层深入挖掘; 可以导出报表数据与其它报表工具进行集成。
需求分析:7
• 代理(Agent)对目标机器的影响:
– Agent应该支持数据中心大多数的操作系统 – Agent应该对目标机器的磁盘和内存要求不高 – Agent运行时占用CPU, Memory, I/O等资源少

自定义脚本实现日常巡检自动化范例
自定义脚本: 密码长度>6位
定时日常巡检范例
定义运行时间
服务器合规报表范例
审计和合规管理
• 审计和合规的内容
– 用户操作行为审计
• 用户登陆哪台服务器、登陆时间、执行的操作命令、 命令执行的时间等
– 业绩多种合规或最佳实践
• Sarbanes Oxley, PCI, FISMA, HIPAA, ITIL, COBIT, COSO等 这些业绩规范的合规审计
– 检查内容非常广泛,包括用内置的模板进行检查,以 及由用户自定义检查,比如检查CPU利用率、表空间利 用率、日志文件搜集和分析、补丁规范、配置规范、 安全设置等; – 检查可以由管理员触发进行,也可以在设定的时间窗 口自动周期性执行,效率大大高于传统方式,并且可 以实现密集的检查,及时发现和消除故障隐患,变频 频救火为防患于未然,从根本上提升系统可靠性。
• OO流程自动化工具后台服务器2台,建议配 置如下:
– 处理器:CPU Dual-core Processor Intel Xeon, 3.0+ GHz,4颗以上 – 内存:8GB RAM以上 – 硬盘:80 GB以上, SCSI – 网卡:100/1000Mbps以太网卡,2个
容量估算
• OO流程自动化工具数据库2台,建议配置如 下:
• 日常巡检的内容由于每个企业,每个银行,每个数据中心都不同, 没有统一的标准, 需要利用
据库, 再用BIRT报表工具自定义用户需求的报表 • 日常巡检可以有管理员定义schedule定时执行, 以可以立即执行
现有脚本或者开发新的脚本(shell,perl,VBscript,.bat,python)开进行日常巡检. 有的日常巡检 需要采集某些信息如CPU利用率等, 有的日常巡检只是判断某个参数是否合规(符合定义的 数值), 通常用SA的audit功能的custom script或者OGFS脚本来实现, 相关数据会写入数
8,000 7,200 4,500 2,250
Managed Servers
容量估算
• SA数据库服务器2台,建议配置如下:
– 处理器:CPU Dual-core Processor Intel Xeon, 3.0+ GHz,4颗以上 – 内存:16GB RAM以上 – 硬盘:200 GB以上, SCSI – 网卡:100/1000Mbps以太网卡,2个
需求分析
• 业务需求:
– 业务量估算; – …… – …… – – – – – – – –
• 应用非功能性需求:
性能需求; 容量需求; 质量需求; 业务连续性需求; 安全需求; 运维管理需求; …… ……
需求分析
1. 2. 3. 4. 5. 6. 7. 配置信息自动化采集和管理 日常巡检自动化 审计和合规管理 软件/补丁安装和回退 用户权限管理 报表管理 代理(Agent)对目标机器的影响
• 补丁版本、xxx.rpm包版本等信息

日常巡检自动化方法: – 取代传统的人工检查, 自动化管理 – 检查可以由管理员触发进行,也可以在设定的时间窗口自动周期性执行, 效率大大高于传统方式,并且可以实现密集的检查,及时发现和消除故 障隐患,变频频救火为防患于未然,从根本上提升系统可靠性. 日常巡检自动化的解决方案
OO Central Server
SQL Server
Operation Orchestration Central Server
SQL Server
自动化运维流程整合 系统 OO的核心服务器
SQL服务器
基础设施部署架构图
相关文档
最新文档