基于大数据的运维场景分析及探索

基于大数据的运维场景分析及探索
基于大数据的运维场景分析及探索

开展大数据量化分析 提升配电网运维精准性

开展大数据量化分析提升配电网运维精准性 摘要】针对配电网薄弱、智能化程度不高的问题,通过挖掘多个系统的数据, 深入挖掘数据价值,推动数据共享,为规划设计、电网建设、运维管理提供有效 支撑。 一、面临的形势 当前,特高压和配电网“两头薄弱”是制约供电能力提升的关键问题,尤其是 配电网薄弱、智能化程度不高,严重影响电网智能化、自愈化程度。发展配电网 是当务之急,要提高投入产出效率,集中解决突出问题。国家能源局制定的《配 电网建设改造行动计划2015-2020年》,提出“十三五”期间投资全国配电网建设改造投资不低于1.7万亿元。各级电力管理部门、电力企业持续加大资金投入, 对配电网规划、建设、运行、管理、标准等各环节提出了更高的要求,配电网运 行效率和投资效益显著提升。因为配电网面向用户、涉及环节多、数据海量,引 入大数据分析是提升配电网精准运维的必然选择。 二、解决的思路 针对配电网运营数据涉及范围广、设备数量巨大、数据频次要求高等特点, 使用大数据挖掘技术,构建配电网运行效率和供电能力模型,实现配电网运行效率、投资效益等方面的量化评价,为配电网从规划设计,到运行维护、线路改造 等多个专业部门提供量化分析支撑,有效提升投资精准化和管理精益化水平,推 动配电网发展方式由重视数量和质量逐步向关注效率和效益的转变,助力现代配 电网建设进程。通过结构化数据平台和海量数据平台,接入PMS、EMS、营销业务、用电信息采集等业务系统中配电网设备档案及运行类明细数据。基于业务明 细数据,构建配电网供电能力和运行效率的大数据评价模型,按照供电区、功能区,电压等级、设备类型开展供电能力、运行效率等内容的数据挖掘。打开各专 业系统的“信息孤岛”,推动系统间数据的融合和共享,实现配电网全量设备及系 统运行效率、供电能力的准实时计算与监测,为配电网管理提供量化分析支撑; 通过运用大数据挖掘技术,深入挖掘配电网运营精益化管理的相关影响因素,预 判配电网运行和发展趋势,为规划设计、采购建设、运行检修等业务提供辅助支持,促进配电网规划、建设及改造更加科学化和规范化。 三、采取的措施 大数据分析的核心是从海量数据中挖掘出隐含的、未知的、对决策有潜在价 值的信息,并用这些信息和规则构建模型,提供预测性决策支持的方法、工具和 过程。 (一)构建量化分析评价模型 针对配电网缺乏供电能力及运行效率量化分析的现状,构建统筹考虑安全性、可靠性、经济性的配电网供电能力和运行效率分析模型。将模型分为三个层次, 分别为单体设备的供电能力及运行效率、同层设备总体的供电能力及运行效率和 配电系统的供电能力及运行效率。以单个设备的配电网供电能力和运行效率评价 模型为基础,建立同层设备总体及配电系统整体的供电能力和运行效率评价模型,从而形成一套完整的配电网供电能力与运行效率评价指标体系。实现综合设备物 理属性、资产价值、电网结构、运行特性等,能够量化110千伏及以下配电网运 营效率和供电能力,反映投入产出水平;模型涵盖从单体设备、同层设备到整个 配电系统,能准确定位到存在问题的具体区域、具体层级、具体设备,涉及设备 容量、运行数据等业务系统字段,具有较强的系统性、针对性和可操作性。运营

大数据技术与应用专业人才需求分析和预测性调研报告

大数据技术与应用专业 人才需求分析和预测性调研报告 一、调研情况分析 (一)政府发展规划与政策动态 推动大数据产业持续健康发展,是党中央、国务院作出的重大战略部署,是实施国家大数据战略、实现我国从数据大国向数据强国转变的重要举措。日前,工业和信息化部正式印发了《大数据产业发展规划(2016-2020年)》(以下简称《规划》),全面部署“十三五”时期大数据产业发展工作,加快建设数据强国,为实现制造强国和网络强国提供强大的产业支撑。 2018年,贵州提出“万企融合”大行动,计划用五年时间,带动10000家企业通过应用大数据技术,提升企业数字化、网络化、智能化水平,实现发展新增长、服务升级。有预测称,这次行动将在贵州形成超过1200亿美元的市场。 (二)市场需求和行业发展趋势 1)大数据市场需求 大数据经过前几年的概念热炒之后,逐步走过了探索阶段、市场启动阶段,当前已经在接受度、技术、应用等各个方面趋于成熟,开始步入产业的快速发展阶段。大数据巨大的应用价值带动了大数据行业的迅速发展,行业规模增长迅速。截至 2014 年,全球大数据市场规模已经成长到300 亿美元的空间,预测到2017 年全球大数据技术和服务市场的2018 年的复合年增长率将达到26.4%,规模达到415 亿美元,是整个IT 市场增幅的6 倍。大数据市场规模在2020 年有望达到611.6 亿美元,符合年增长率将达到26%。 中国大数据产业起步晚,发展速度快。物联网、移动互联网的迅速发展,使数据产生速度加快、规模加大,迫切需要运用大数据手段进行分析处理,提炼其中的有效信息。“大数据”已成为一个热门词语高频出现在各种场合,其专门人才已不能满足市场需求。经过专门调研数据显示,大数据人才岗位缺口2018年高达150万,俱预测2025年中国大数据人才缺口达到200万,这给高校和人力资源企业的一个很大的优惠。未来几年人才需求将持续走俏。引进和培养1000

大数据中心运维服务方案设计

数据中心机房及信息化终端设备维护方案 一、概况 xxx客户数据中心机房于XX年投入使用,目前即将过保和需要续保运维的设备清单如下: 另外,全院网络交换机设备使用年限较长,已全部过保,存在一定的安全隐患。 二、维保的意义 通过机房设备维护保养可以提高设备的使用寿命,降低设备出现故障的概率,避免重特大事故发生,避免不必要的经济损失。设备故障时,可提供快速的备件供应,技术支持,故障处理等服务。

通过系统的维护可以提前发现问题,并解决问题。将故障消灭在萌芽状态,提高系统的安全性,做到为客户排忧解难,减少客户人力、物力投入的成本。为机房内各系统及设备的正常运行提供安全保障。可延迟客户设备的淘汰时间,使可用价值最大化。 通过引入专业的维护公司,可以将客户管理人员从日常需要完成专业性很强的维护保养工作中解放出来,提升客户的工作效率,更好的发挥信息或科技部门的自身职能。 通过专业的维护,将机房内各设备的运行数据进行整理,进行数据分析,给客户的机房基础设施建设、管理和投入提供依据。 三、维护范围 1、数据中心供配电系统 2、数据中心信息化系统 3、全院信息化终端设备 4、数据库及虚拟化系统 四、提供的服务 为更好的服务好客户,确实按质按量的对设备进行维护;我公司根据国家相关标准及厂商维护标准,结合自身多年经验积累和客户需求,制定了一套自有的服务内容: 1、我公司在本地储备相应设备的备品备件,确保在系统出现故障时,及时免费更换新的器件,保障设备使用安全。 2.我公司和客户建立24小时联络机制,同时指定一名负责人与使用方保持沟通,确保7*24小时都可靠联系到工程技术人员,所有节日都照此标准执行。 3.快速进行故障抢修:故障服务响应时间不多于30分钟,2小时内至少2人以上携带相关工具、仪器到达故障现场,直到设备恢复正常运行。

统一运维大数据分析平台建设和应用综合解决方案

统一运维大数据分析平台建设和应用综合解决方案2020年3月30 统一运维大数据分析管理平台 建 设 方 案

目录 第1章.方案概述 (4) 1.1.项目背景 (4) 1.2.需求分析 (5) 1.3.建设目标 (7) 1.3.1.建立统一运维门户 (7) 1.3.2.建立IT异构资源的全面集中化管理 (7) 1.3.3.建立全面准确的资产配置管理 (8) 1.3.4.建立符合最佳实践的服务流程管理 (9) 1.3.5.建立IT资源全面直观的可视化管理 (9) 第2章.解决方案 (10) 2.1.系统设计原则 (10) 2.1.1.实用性和模块化原则 (10) 2.1.2.一致性和开放性原则 (11) 2.1.3.安全性与可靠性原则 (11) 2.2.系统安全设计 (12) 2.2.1.用户安全机制 (12) 2.2.2.SSO统一认证 (12) 2.2.3.权限分权分域 (12) 2.3.系统建设方法 (13) 2.3.1.体系架构 (13) 2.3.2.功能架构 (17) 2.3.3.技术架构 (17) 2.3.4.部署架构 (18) 第3章.功能概述 (19) 3.1.运维监控系统 (19)

3.1.1.统一运维管理 (19) 3.1.2.资源监控管理 (23) 3.1.3.拓扑管理 (45) 3.1.4.IP地址管理 (59) 3.1.5.告警管理 (61) 3.1.6.业务管理 (66) 3.2.3D机房管理 (70) 3.2.1.监控可视化管理 (72) 3.2.2.资产管理可视化 (76) 3.2.3.机房3D图形化展示 (78) 3.2.4.配线可视化管理 (80) 3.2.5.容量可视化管理 (82) 3.2.6.资源分配情况管理 (84) 3.2.7.上下架可视化 (85) 3.2.8.自定义动画 (86) 3.2.9.交互式演示汇报 (87) 3.3.配置文件管理 (87) 3.3.1.巡检管理 (88) 3.3.2.机房虚拟现实展现 (91) 3.3.3.资产管理系统 (95) 3.3.4.供应商管理 (96) 3.3.5.配置建模管理 (97) 3.3.6.空间资源管理 (99) 3.3.7.配置项导入 (101) 3.3.8.配置项管理 (102) 3.3.9.配置项视图 (105) 3.4.运维流程管理系统 (107) 3.4.1.服务台 (107) 3.4.2.服务设计 (115)

大数据运维及综合分析系统(Orca)

目录 1、Orca-SCMDB (2) 1.1产品简介 (2) 1.2功能特点 (2) 1.3功能说明 (3) 2、ORCA-Radar (4) 2.1 产品简介 (4) 2.2隐患扫描指标 (5) 2.3扫描范围 (5) 2.4产品优势 (6) 2.5设备监控 (6) 2.6性能监控 (7) 3、IT运维大数据分析 (7) 3.1性能Top N (10) 3.2系统安全评测 (10) 3.3性能预测 (11) 3.4容量预测 (11) 3.5可靠性预测 (12)

智能维保Orca包括Orca-SCMDB(信息管理),Orca-Radar(隐患扫描),Orca-HHM (大数据分析),Orca-BSM(业务监控),Orca-ITSM(服务管理)等产品。 1、Orca-SCMDB 1.1产品简介 Orca-SCMDB(Super Configuration Management Database),IT运维管理系统是北京合力思腾结合近十余年的IT运维经验,以解决用户实际问题为根本目标,从实用性、易用性的角度出发,收集、索引和利用整个IT基础架构(服务器、存储、网络、数据库和中间件等)的所有数据,为运维和业务支撑提供精确的数据分析。 1.2功能特点 采用“动态建模”技术,支持资源库模型的自定义和灵活扩展,可统一管理各类IT资源目标 多维度、多视角管理整个IT架构,有效反映IT资源之间复杂的关联关系,帮助用户梳

理IT架构内部关联和相互影响 通过自主开发的数据采集引擎(Shell命令集库),经Telnet/SSH协议,完全实现IT 配置信息的自动采集和动态更新 提供精细的IT性能分析和趋势预测,为业务系统的优化、升级、扩容提供数据基础和理论依据 1.3功能说明 动态建模与数据采集 从用户自己的管理思路和管理流程出发,自定义资源库动态模型。从业务角度建立“业务部门>业务系统>基础架构”的业务数据模型,从维护角度建立“网络(或机房)>设备类型>设备>关联业务”的运维数据模型,以及其他任意角度建立数据模型。独立的数据采集引擎,支持Agent和非Agent两种采集方式,支持格式化数据的批量导入。 多视角视图

探索基于大数据分析技术的智能运维体系

技术 Special Technology D I G I T C W 专题 58DIGITCW 2019.09 整体而言,我国互联网金融的发展起步较晚,运维体系有很大的改进空间,将大数据技术融合到智能运维体系中,可以挖掘数据的潜在价值,并且实时进行监控,做好事前预测和事故处理工作。针对传统运维方式的不足之处,本文从新的角度对智能运维体系进行了研究,具有一定的积极意义。 1 大数据分析技术智能运维体系的构建 目前,IT 运维环境日益复杂,需要管控的对象日益庞大,传统的运维体系在应用过程中显得捉襟见肘,所以需要应用大数据分析技术构建智能运维体系。1.1 采集 本文以某工商银行的管理系统为例,并且采访了相关的专家,根据专家的意见,确定了模型的数据范围,比如登录日志、交易日志等,以2017年1~12月的数据为主要参考对象,在此基础上进行了加工处理,并且分为登录、登出、失败、交易和异常五大指标,然后对这些指标进行汇总,建立了相关的时间序列。1.2 探索 在对数据进行探索时,需要将数据进行分类,比如分为训练集、验证集等,并且对五大指标进行观察,可以选择10分钟为一个时间粒度。经过探索发现,工作日的上午和下午都会有两个波峰,趋势相似,但是幅度有所区别,而非工作日,比如周末、法定假日等,交易量明显减少。如果系统出现故障,那么交易量会急速下降,而当故障解除后,交易量会逐渐回到正常水平。因为系统日志记录存在一定的误差,也没有对出现异常的原因进行分析,加上登录失败可能是由于密码错误引起的,所以本文以登录、登出和交易这三大指标为主要研究对象。 2 大数据分析技术智能运维体系的拓展 2.1 开发 首先,要对数据进行预处理和预分析,可以通过数据的集合,观察系统亚健康状态时变量的情况和特征,找到规律。一般而言,系统发生故障时,系统变量会有所降低,而且在故障发生之前,这种降低已经出现,只是比较缓慢,需要经过多个周期。 其次,要建立参考区间,对历史数据进行全面的分析,确定不同时间段内变量的波动区间。为了保证序列能够进行对比,我们需要将数据进行统一的处理,形成标准数据。公式为Vit=Iit/ηit ,其中Iit 指的是t 时刻第i 个变量的输入值,而ηit 指的是标准化系数,也就是均值,而Vit 指的是经过处理后的变量值,也是频数相对率。 再次,因为变量标准化需要获取当日均值,而在进行实时监控时,要引入因子指标,计算出不同时刻频数占总频数的比值。一般而言,上班时间开始时,系统的变异系数相对较低,约等于0.2。 最后,在预警信号的产生方面,需要对变量的相对值和边界值进行加权计算,这样能够提高信号的准确性。对于一些突发式的故障或者是黑客的攻击等,该系统并不适用,所以在应用的过 程中,还要具体情况具体分析。2.2 检验 在对智能运维体系模型进行检验时,需要做好概念的分析工作,比如系统故障,假设15个工作日,其中有8次波形异常,而系统亚健康状态发生时间在波形异常之前,如果缺乏记录,就会影响频数最低点记录的真实性,而且会产生较大的误差。至于波形异常,包括波形显著上升、显著下降和平稳时间过长三类。经过检验,发现故障点共有13个,有10次识别成功并且进行了预警,而波形异常情况共有20次,有18次成功识别。在对信号进行统计后,发现智能运维体系的准确率为77%,漏报率为23%,而且预报的平均时间比故障时间提前了将近半小时,能够很好地保证系统运行的效果,并且为故障的及时解决争取到了宝贵的时间[1]。2.3 应用 大数据分析技术智能运维体系的流程如图1所示,在模型应用过程中,发现能够准确预测和判断系统的亚健康状态,尤其是在2017年10月份,系统运行出现高峰,在这一期间运维体系发挥了得天独厚的优势,对故障进行了多次预警,帮助和协调工作 人员顺利完成维护工作,减少了可能出现的损失。 图1 大数据分析技术智能运维体系 3 大数据分析技术智能运维体系的优化 为了保证智能运维体系达到最佳效果,对所有故障都能够进行准确的判断和预警,需要从以下三方面入手: 第一方面,扩大数据来源。在数据采集方面,要打破纵向和横向的局限,扩大数据的周期,比如选择十一五期间某银行的数据,这样可以减少系统用户行为受到季节或者是特殊日期的影响,从而保证结果的真实性。另外,可以对数据进行分类,分为管控数据、配置数据、作业数据、容器数据以及集成数据等,同时还要做好故障的定位工作。 第二方面,丰富算法规则。可以引入新的变量,然后结合关键指标的变化情况,建立决策树或者是使用神经网络算法,提高预测结果的精度,降低外界因素的干扰。如果输入和输出存在正相关的关系,那么就可以对向量进行分解,然后调节各个分量之和的参数,让最终结果能够接近真实结果,如图2所示。 第三方面,结合专业经验。在对数据进行定量分析和定性分析时,不能停留在表面,而是需要与大数据领域的专家进行沟通和交流,并且根据故障发生的场景,总结出故障的特点,然后形成模型,这样能够保证当再次发生同样的故障时,可以及时采取 探索基于大数据分析技术的智能运维体系 钟茂年 (中兴通信股份有限公司,深圳 518057) 摘要:新的时代背景下,大数据分析技术的价值日益凸显,在社会各领域发挥着积极的作用。本文以银行为例,探讨了基于大数据分析技术的智能运维体系,从构建、拓展、优化和保障四方面进行了分析,希望能够为相关的工作提供一定的参考,促进智能运维体系的良好发展。 关键词:大数据;智能运维;故障;信号doi :10.3969/J.ISSN.1672-7274.2019.09.039中图分类号:F832.2 文献标示码:A 文章编码:1672-7274(2019)09-0058-02

统一运维大数据分析平台建设方案 一体化智能运维管理平台解决方案

统一运维大数据分析平台建设方案 统一运维大数据分析平台 建 设 方 案

目录 第1章.方案概述 (4) 1.1.项目背景 (4) 1.2.需求分析 (5) 1.3.建设目标 (6) 1.3.1.建立统一运维门户 (7) 1.3.2.建立IT异构资源的全面集中化管理 (7) 1.3.3.建立全面准确的资产配置管理 (8) 1.3.4.建立符合最佳实践的服务流程管理 (8) 1.3.5.建立IT资源全面直观的可视化管理 (8) 第2章.解决方案 (10) 2.1.系统设计原则 (10) 2.1.1.实用性和模块化原则 (10) 2.1.2.一致性和开放性原则 (10) 2.1.3.安全性与可靠性原则 (11) 2.2.系统安全设计 (11) 2.2.1.用户安全机制 (11) 2.2.2.SSO统一认证 (12) 2.2.3.权限分权分域 (12) 2.3.系统建设方法 (12) 2.3.1.体系架构 (12) 2.3.2.功能架构 (15) 2.3.3.技术架构 (16) 2.3.4.部署架构 (17) 第3章.功能概述 (18) 3.1.运维监控系统 (18)

3.1.1.统一运维管理 (18) 3.1.2.资源监控管理 (22) 3.1.3.拓扑管理 (41) 3.1.4.IP地址管理 (52) 3.1.5.告警管理 (55) 3.1.6.业务管理 (59) 3.2.3D机房管理 (63) 3.2.1.监控可视化管理 (64) 3.2.2.资产管理可视化 (69) 3.2.3.机房3D图形化展示 (71) 3.2.4.配线可视化管理 (73) 3.2.5.容量可视化管理 (75) 3.2.6.资源分配情况管理 (77) 3.2.7.上下架可视化 (78) 3.2.8.自定义动画 (79) 3.2.9.交互式演示汇报 (79) 3.3.配置文件管理 (80) 3.3.1.巡检管理 (81) 3.3.2.机房虚拟现实展现 (83) 3.3.3.资产管理系统 (87) 3.3.4.供应商管理 (87) 3.3.5.配置建模管理 (88) 3.3.6.空间资源管理 (90) 3.3.7.配置项导入 (92) 3.3.8.配置项管理 (93) 3.3.9.配置项视图 (96) 3.4.运维流程管理系统 (98) 3.4.1.服务台 (98) 3.4.2.服务设计 (105)

统一运维大数据分析管理平台建设方案 智慧运维大数据分析平台建设方案

统一运维大数据分析管理平台建设方案 统一运维大数据分析管理平台 建 设 方 案

目录 第1章.方案概述 (4) 1.1.项目背景 (4) 1.2.需求分析 (5) 1.3.建设目标 (6) 1.3.1.建立统一运维门户 (6) 1.3.2.建立IT异构资源的全面集中化管理 (7) 1.3.3.建立全面准确的资产配置管理 (7) 1.3.4.建立符合最佳实践的服务流程管理 (8) 1.3.5.建立IT资源全面直观的可视化管理 (8) 第2章.解决方案 (10) 2.1.系统设计原则 (10) 2.1.1.实用性和模块化原则 (10) 2.1.2.一致性和开放性原则 (10) 2.1.3.安全性与可靠性原则 (11) 2.2.系统安全设计 (11) 2.2.1.用户安全机制 (11) 2.2.2.SSO统一认证 (12) 2.2.3.权限分权分域 (12) 2.3.系统建设方法 (12) 2.3.1.体系架构 (12) 2.3.2.功能架构 (15) 2.3.3.技术架构 (16) 2.3.4.部署架构 (17) 第3章.功能概述 (18) 3.1.运维监控系统 (18)

3.1.1.统一运维管理 (18) 3.1.2.资源监控管理 (22) 3.1.3.拓扑管理 (41) 3.1.4.IP地址管理 (52) 3.1.5.告警管理 (55) 3.1.6.业务管理 (59) 3.2.3D机房管理 (63) 3.2.1.监控可视化管理 (64) 3.2.2.资产管理可视化 (69) 3.2.3.机房3D图形化展示 (71) 3.2.4.配线可视化管理 (73) 3.2.5.容量可视化管理 (75) 3.2.6.资源分配情况管理 (77) 3.2.7.上下架可视化 (78) 3.2.8.自定义动画 (79) 3.2.9.交互式演示汇报 (79) 3.3.配置文件管理 (80) 3.3.1.巡检管理 (81) 3.3.2.机房虚拟现实展现 (83) 3.3.3.资产管理系统 (87) 3.3.4.供应商管理 (87) 3.3.5.配置建模管理 (88) 3.3.6.空间资源管理 (90) 3.3.7.配置项导入 (92) 3.3.8.配置项管理 (93) 3.3.9.配置项视图 (96) 3.4.运维流程管理系统 (98) 3.4.1.服务台 (98) 3.4.2.服务设计 (105)

相关文档
最新文档