企业级大数据平台的需求

集团企业大数据云平台建设方案

集团企业大数据云平台建设方案

目录 第1章方案总述 (1) 1.1项目背景 (1) 1.2项目目标 (2) 1.3项目建设原则 (2) 第2章系统建设规划 (4) 2.1项目建设目标的理解 (4) 2.1.1 项目建设范围 (4) 2.1.1.1 业务范围 (4) 2.1.1.2 组织范围 (4) 2.1.1.3 数据范围 (4) 2.1.2 项目建设内容 (4) 2.1.2.1 基础数据平台 (5) 2.1.2.2 集团级指标体系 (6) 2.1.2.3 统一报表平台 (6) 2.2集团(企业)数据平台的建设目标 (7) 2.2.1 集团(企业)数据平台一期建设目标 (7) 2.2.2 集团(企业)数据平台二期建设目标 (7) 第3章整体设计方案 (8) 3.1系统设计方法论 (8) 3.1.1 方法论 (8) 3.1.2 设计原则 (10) 3.1.2.1 标准规范 (11) 3.1.2.2 开放性 (12) 3.1.2.3 可扩展性 (12) 3.1.2.4 高性能 (13)

3.1.2.5 可管理性 (14) 3.1.2.6 高可用性 (15) 3.1.2.7 安全性 (16) 3.1.2.8 可重用性 (17) 3.2数据平台技术体系 (18) 3.2.1 数据平台逻辑架构 (18) 3.2.1.1 数据集成区 (18) 3.2.1.2 集团分析型数据区 (19) 3.2.1.3 管理平台区 (19) 3.2.1.4 统一报表展现平台 (20) 3.2.1.5 ETL设计关键技术点说明 (20) 3.2.1.5.1.1 ETL处理策略 (20) 3.2.1.5.1.2 ETL处理流程 (21) 3.2.1.5.2 质量检核 (21) 3.2.1.5.2.1 ETL处理原则 (21) 3.2.1.5.2.2 ETL处理方法 (21) 3.2.2 数据采集设计 (21) 3.2.2.1 T+1数据采集 (22) 3.2.2.2 数据补录 (23) 3.2.2.2.1 检核规则管理 (24) 3.2.2.2.2 录入任务管理 (24) 3.2.2.2.3 数据录入 (26) 3.2.2.2.4 查询操作 (27) 3.2.2.2.5 录入任务审批 (28) 3.3数据平台数据体系 (28) 3.3.1 数据架构设计 (28) 3.3.1.1 源系统数据落地区 (29) 3.3.1.2 缓冲数据层(ODM) (30)

中国移动企业级大数据中心建设指导意见V1.1(终版)资料

中国移动企业级大数据中心建设指导意见 为进一步提高中国移动互联网战略的服务能力,对驱动企业管理的精细化、智能化,对外提供信息服务型产品,实现大数据开放后的运营和服务提升,公司决定在全国围实施中国移动企业级大数据中心建设工作,通过整合全公司数据资源,盘活数据资产,助力公司第三条曲线的拓展,以服务“增效、外增收”的整体企业战略,保证中国移动在激烈市场竞争中的可持续发展。 一、建设要求与重点 企业级大数据中心作为中国移动唯一、统一的数据采集、处理、服务和运营的平台,通过“统一采集、统一存储、统一管理、统一运营和统一服务”,形成集团及各省市公司“多节点”、“网状网”形态的数据和服务共享能力;具备独立机构以承担平台建维、数据交换、资产管理、应用开发、数据服务和数据运营职责。为企业、外部客户提供“按需”的服务能力,辅助企业决策,彰显数据价值。 企业级大数据中心的建设要求包括三方面: (一)建好组织:建立相对独立的、专业的企业级大数据中心管理机构,立足公司全局,全面负责企业级大数据平台的规划、建设、运维,以及数据资产管理、产品开发和数据运营等职能。 (二)搭好平台:企业级大数据中心满足中国移动全部数据“统一采集、统一存储、统一管理、统一运营、统一服务”的要

求,实现逻辑集中;全部数据的采集、处理和存储分布于多个节点,进行物理分散,同时实现关键数据资产的异地容灾备份。 (三)做好服务:企业级大数据中心能为集团各部门、专业基地(位置等)、专业公司(咪咕、互联网、政企、在线服务、物联网等)、各省公司及外部行业提供灵活的“按需”服务。 二、建设重点 企业级大数据中心建设重点要求如下: (一)企业级大数据中心的能力要求 为了承接大数据中心的基础平台管理、数据交换、资产管理、应用开发、数据应用、数据运营六个职责,在大数据平台技术架构层面提供数据基础服务能力、系统平台管理能力、数据资产管理能力和应用共享开放能力四个部分: 数据基础服务能力:数据基础服务能力是大数据平台的基础,包含数据采集功能、数据存储运算功能、数据交互功能。数据采集需包括来自BSS、OSS、MSS的基础数据、来自于用户上网行为的DPI二次解析数据以及来自外部的第三方数据的数据采集。数据存储运算功能可根据数据类型及应用采用不同类型的数据库技术实现对不同价值、规模、时效性的数据差异化存储和运算。数据交互功能是实现不同形式的数据存储之间的数据交互。 系统平台管理能力:大数据平台需具备系统平台管理能力,提供对大数据平台的软件和硬件资源的管理,包括诸如资源管

某大型企业大数据平台整体解决方案

某大型企业数据平台整体解决方案

目录 1项目概述 (15) 1.1建设背景 (15) 1.1.1集团已有基础 (15) 1.1.2痛点及需提升的能力 (15) 1.1.3大数据趋势 (16) 1.2建设目标 (16) 1.2.1总体目标 (16) 1.2.2分阶段建设目标 (17) 1.3与相关系统的关系 (18) 1.3.1数据分析综合服务平台 (18) 1.3.2量收系统 (19) 1.3.3金融大数据平台 (20) 1.3.4各生产系统 (20) 1.3.5CRM (20) 1.4公司介绍和优势特点 (20) 1.4.1IDEADATA (20) 1.4.2TRANSWARP (22) 1.4.3我们的优势 (24) 2业务需求分析 (27) 2.1总体需求 (27)

2.2.1数据采集 (29) 2.2.2数据交换 (29) 2.2.3数据存储与管理 (29) 2.2.4数据加工清洗 (30) 2.2.5数据查询计算 (31) 2.3数据管控 (32) 2.4数据分析与挖掘 (32) 2.5数据展现 (33) 2.6量收系统功能迁移 (34) 3系统架构设计 (35) 3.1总体设计目标 (35) 3.2总体设计原则 (35) 3.3案例分析建议 (37) 3.3.1中国联通大数据平台 (37) 3.3.2恒丰银行大数据平台 (49) 3.3.3华通CDN运营商海量日志采集分析系统 (63) 3.3.4案例总结 (69) 3.4系统总体架构设计 (70) 3.4.1总体技术框架 (70) 3.4.2系统总体逻辑结构 (74)

3.4.4系统接口设计 (83) 3.4.5系统网络结构 (88) 4系统功能设计 (91) 4.1概述 (91) 4.2平台管理功能 (92) 4.2.1多应用管理 (92) 4.2.2多租户管理 (96) 4.2.3统一运维监控 (97) 4.2.4作业调度管理 (117) 4.3数据管理 (119) 4.3.1数据管理框架 (119) 4.3.2数据采集 (122) 4.3.3数据交换 (125) 4.3.4数据存储与管理 (127) 4.3.5数据加工清洗 (149) 4.3.6数据计算 (150) 4.3.7数据查询 (170) 4.4数据管控 (193) 4.4.1主数据管理 (193) 4.4.2元数据管理技术 (195)

企业大数据管理平台软件哪家好

大数据时代,企业大数据管理显得尤为重要。企业大数据管理分为企业自身的数据管理,如企业的客户、产品、销售、库存等数据和企业的外部数据管理,如产品服务的评价、情报信息、行业信息的收集等。所以选择一个好用的企业大数据管理平台软件对企业的发展非常重要。 移动互联网、社交媒体和其他来源的数据爆炸式增长,产生了海量的数据,企业会仔细收集这些数据,并将其存储起来,以便重复使用。数据已经作为企业重要资产被广泛应用于盈利分析与预测、客户关系管理、合规性监管、运营风险管理等业务当中。 大数据对企业有多重要? 1. 帮助企业了解用户 通过大数据分析技术,企业可以将客户、用户和产品进行有机串联,对用户的产品偏好,客户的关系偏好进行个性化定位,生产出用户驱动型的产品,提供客户导向性的服务。 从大数据技术方面来看,用数据来指引企业的成长,将不再单单是一句口号。通过运用大数据,不仅可以从数据中发掘出适应企业发展环境的社会和商业形态,用数据对用户和客户对待产

品的态度,进行挖掘和洞察,准确发现并解读客户及用户的诸多新需求和行为特征,这必将颠覆传统企业在用户调研过程中,过分依赖主观臆断的市场分析模式。 2. 帮助企业进行资源精准定位 通过大数据技术,可以实现企业对所需资源的精准定位,在企业在运营过程中,所需要的每一种资源的挖掘方式、具体情况和储量分布等,企业都可以进行搜集分析,形成基于企业的资源分布可视图,就如同“电子地图”一般,将原先只是虚拟存在的各种优势点,进行“点对点”的数据化、图像化展现,让企业的管理者可以更直观地面对自己的企业,更好地利用各种已有和潜在资源。 3. 帮助企业做好运营推广 以往企业品牌如果需要做市场预测,大多靠自身资源、公共关系和以往的案例来进行分析和判断,得出的结论往往也比较模糊;很少能得到各自行业内的足够重视。通过大数据的相关性分析,根据不同品牌市场数据之间的交叉、重合,企业的运营方向将会变得直观而且容易识别,在品牌推广、区位选择、战略规划方面将做到更有把握地面对。 通过大数据分析可以判断客户话题各类来源的占比,确定客户上网的习惯;信息的主要话题,以及相关媒体平台曝光量,企业可以针对性得选择并制定营销活动平台、推广方向等,提升企业运营效果。 4. 协助企业更好的开展服务

生产企业大数据平台建设项目建议书

大数据平台建设项目建议书

目录 第一章、项目背景..................... 错误!未定义书签。第二章、项目思路..................... 错误!未定义书签。第三章、建设内容与方案............... 错误!未定义书签。第四章、时间进度..................... 错误!未定义书签。第五章、项目预算..................... 错误!未定义书签。第六章、企业效益及社会效益........... 错误!未定义书签。第七章、结论......................... 错误!未定义书签。

第一章、项目背景 企业对信息化工作历来较为重视,也是省内较早开始实施信息化的大型企业。目前已经建成财务系统、生产调度系统、农务系统、供应链系统等:调度系统,2015年公司共投资了175万元,按集团分步建设、逐步投入的规划,完成了系统基本硬件与亚控平台软件的结合,构建了一个以明阳糖厂生产调度指挥中心为核心,生产信息能够上至集团,下至车间的生产调度网络系统。 农务系统,2005年开始实施,经过多次升级,现涵盖了计划、报蔗、派车、质检、过磅、结算、短信管理、移动应用等一系列模块,覆盖公司4家直属糖厂和大桥制糖公司,实现了农务统一的信息化管理。 供应链系统,利用用友NC供应链系统,以公司存货管理为核心的采、供、销、存供应链管理平台,实现物资、仓储、供应、销售、物流一体化业务协同处理平台,建立了公司对各直属厂工作的监督平台,总部可以实时对下属各公司的工作进行监督,实时对各公司的具体业务执行情况进行查看,及时的对下属公司进行指导和监督。 尽管在两化融合及企业信息化方面已取得了相当的成效,但在实际应用过程中仍然存在一些较为显著的问题。 (一)总部与下属糖厂未实现完全的集约管理 a)企业在原先六家糖厂的基础上,又收购了三博公司五家糖厂。三博五厂 由上海迁回南宁,在宜州设立管理下属五厂的二级管理总部。 b)从系统部署上分析,企业总部与原先六厂为一套架构,而三博总部与下 属五厂为一套架构,各自独立,暂未整合为一体。 c)为了保证各糖厂生产的稳定,企业总部与下属六厂之间仅在NC供应链、 OA、财务、人力等系统方面实现了集约管理,农务管理系统、生产调度 系统以及化验系统均由各厂自建,因此出现各厂建设系统的厂家不同, 使用的系统版本不同等现象。三博总部与下属五厂的关系亦如此。(二)总部及各厂之间的数据共享有限 a)由于大多数生产相关的系统均为各厂自建,因此不管是企业总部,或者

企业大数据平台下数仓建设思路

企业大数据平台下数仓建设思路 本文章来自于阿里云云栖社区 摘要:介然(李金波),阿里云高级技术专家,现任阿里云大数据数仓解决方案总架构师。8年以上互联网数据仓库经历,对系统架构、数据架构拥有丰富的实战经验,曾经数据魔方、淘宝指数的数据架构设计专家。与阿里云大数据数仓结缘介然之前在一家软件公司给企业客户做软件开发和数仓开发实施,数仓开发和实施都是基于传统的 免费开通大数据服务:https://https://www.360docs.net/doc/5916663657.html,/product/odps 介然(李金波),阿里云高级技术专家,现任阿里云大数据数仓解决方案总架构师。8年以上互联网数据仓库经历,对系统架构、数据架构拥有丰富的实战经验,曾经数据魔方、淘宝指数的数据架构设计专家。 与阿里云大数据数仓结缘 介然之前在一家软件公司给企业客户做软件开发和数仓开发实施,数仓开发和实施都是基于传统的基础架构。2008年加入阿里进入淘宝数据平台部后,他开始接触分布式计算平台Hadoop。 初始时在Hadoop平台上构建数仓主要解决企业内部数据分析的需求,在2010年公司决定对外开放数据后,开始于2011年利用自建的数仓体系支持对外数据产品数据魔方、淘宝指数。后续在平台和产品上不停的丰富数据内容,同时离线和流式两套数据体系支持数据产品。 从2012年开始,之前在Hadoop上的数据体系搬迁到阿里云数加MaxCompute (原ODPS)(原文链接: https://https://www.360docs.net/doc/5916663657.html,/product/odps?spm=5176.100239.blogcont67020.17.8 okFBH),并完成了数据体系的重构,此时介然负责平台基础数据的建设支持全

GBASE企业级大数据平台-功能测试报告

GBASE企业级大数据平台功能测试报告

目录 1.基础功能 (4) 1.1.基础SQL功能测试 (4) 1.1.1.建立数据库 (4) 1.1.2.建表 (4) 1.1.3.建立,修改,删除视图 (4) 1.1.4.INSERT语句 (5) 1.1.5.SELECT 语句 (5) 1.1.6.DELETE (6) 1.1.7.UPDA TE (6) 1.1.8.join 关联查询 (6) 1.1.9.函数建立,修改,运行,删除 (7) 1.1.10.存储过程建立,修改,运行,删除 (8) 1.1.11.建用户,设置密码,删除用户,赋权限 (8) 1.2.数据加载 (9) 1.2.1.工具简介 (9) 1.2.2.启动dispatch服务 (10) 1.2.3.准备测试数据文件 (10) 1.2.4.建立ctl加载任务文件 (10) 1.2.5.导入命令 (11) 1.2.6.数据导出 (11) 1.3.数据库备份与恢复 (12) 1.3.1.简介 (12) 1.3.2.建立备份测试表 (12) 1.3.3.建立备份目录 (13) 1.3.4.登陆gcrcman工具,查看备份内容 (13) 1.3.5.第一次全备 (14) 1.3.6.第二次备份 (15) 1.3.7.第三次备份 (17) 1.3.8.备份注意事项 (19) 1.3.9.使用备份命令注意事项 (20) 1.3.10.清除数据,整理备份数据 (21) 1.3.11.第一次恢复到第三次备份状态 (21) 1.3.12.第二次恢复到第二次全备状态 (23) 1.3.13.使用恢复命令注意事项 (25) 1.3.14.删除备份点 (25) 1.3.15.使用删除命令注意事项 (26) 1.3.16.集群相关操作 (27) 1.4.jdbc连接8a集群未测试,没有直连的myeclips (27) 1.4.1.环境准备 (27) 1.4.2.测试JA V A程序 (27)

大数据平台数据治理体系建设和管理方案

XXX企业级省大数据平台数据治理子系统的 建设和管理方案

目录 1.范围 (5) 2.规范性引用文件 (5) 3.术语、定义和缩略语 (17) 4.总体说明 (23) 4.1.概述 (23) 4.2.目标 (23) 4.3.原则 (24) 5.数据治理体系 (25) 5.1.总体框架 (25) 5.2.组织架构 (26) 5.2.1.组织构成 (26) 5.2.2.角色职责 (27) 5.3.系统架构 (29) 5.3.1.系统功能框架 (29) 5.3.2.系统模块流程 (32) 5.4.系统边界 (33) 5.4.1.与企业级省大数据平台关系 (34) 5.4.2.与对外能力开放平台关系 (34) 5.4.3.与平台运维系统关系 (34) 6.数据治理核心模块 (35)

6.1.数据标准管理 (35) 6.1.1.背景 (35) 6.1.2.目标及原则 (37) 6.1.3.业务分类和定义 (37) 6.1.4.技术功能要求 (45) 6.1.5.本期建设范围及内容 (51) 6.1.6.实施要求 (52) 6.2.元数据管理 (52) 6.2.1.背景 (52) 6.2.2.元数据运营模式 (55) 6.2.3.元模型标准 (55) 6.2.4.元数据运维 (62) 6.2.5.本期重点建设内容 (63) 6.3.数据质量管理 (64) 6.3.1.与传统经营分析系统的区别 (64) 6.3.2.范围和原则 (66) 6.3.3.与其它功能模块的关系 (67) 6.3.4.本期数据质量功能需求 (70) 6.3.5.本期数据质量运维要求 (72) 6.4.数据资产管理 (73) 6.4.1.数据资产概述 (73) 6.4.2.数据资产范围 (75)

GBase 8a MPP企业级大数据平台-性能测试报告

GBase 8a MPP企业级大数据平台 性能测试报告

目录 第1章测试定义 (1) 1.1测试背景 (1) 1.2测试目的 (1) 1.3测试时间 (1) 第2章测试环境 (2) 2.1硬件环境 (2) 2.2软件环境 (2) 2.3测试数据 (2) 2.3.1 测试数据加载 (3) 第3章测试内容 (6) 3.1测试项目 (6) 3.2测试内容 (6) 3.2.1 13个标准sql的串行执行测试 (6) 3.2.2 小查询并发性能测试 (7) 3.2.3 大查询并发性能测试 (8) 3.2.4 并发插入性能测试 (9) 3.2.5 并发加载性能测试 (10) 第4章性能测试结果 (10) 4.1测试结果 (10) 4.1.1 十三条sql (10) 4.1.2 并发性能 (11) 4.1.3 加载性能 (12) 4.2测试资源使用情况 (14) 4.2.1 十三条sql执行过程 (14) 4.2.2 Sql并发压力测试 (16) 4.2.3 三加载机并发加载 (18) 4.2.4 单加载机多加载进程测试 (19) 第5章附件 (21) 5.1标准查询13个SQL (21) 5.2经改造的SQL12 (21) 5.3 SSB测试包 (21) 4.2测试脚本 (22)

第1章测试定义 1.1测试背景 本次测试是建立在36节点GBase8a MPP集群数据库环境上,测试数据均为在其他负载的情况看下测得,能够比较客观的反应出GBase8a MPP集群数据库在该环境下的性能表现。 1.2测试目的 本次测试旨在评估GBase8a MPP集群数据库在串行、小查询并行、大查询并行、加载模式并行的场景下其的性能表现,以及评估在类场景下系统资源的使用情况。 1.3测试时间

生产企业大数据平台建设项目建议书v

大数据平台建设项目建议书 目录 第一章、项目背景...................................... 第二章、项目思路...................................... 第三章、建设内容与方案................................ 第四章、时间进度...................................... 第五章、项目预算...................................... 第六章、企业效益及社会效益............................ 第七章、结论.......................................... 第一章、项目背景 企业对信息化工作历来较为重视,也是省内较早开始实施信息化的大型企业。目前已经建成财务系统、生产调度系统、农务系统、供应链系统等: 调度系统,2015年公司共投资了175万元,按集团分步建设、逐步投入的规划,完成了系统基本硬件与亚控平台软件的结合,构建了一个以明阳糖厂生产调度指挥中心为核心,生产信息能够上至集团,下至车间的生产调度网络系统。 农务系统,2005年开始实施,经过多次升级,现涵盖了计划、报蔗、派车、质检、过磅、结算、短信管理、移动应用等一系列模块,覆盖公司4家直属糖厂和大桥制糖公司,实现了农务统一的信息化管理。 供应链系统,利用用友NC供应链系统,以公司存货管理为核心的采、供、销、存供应链管理平台,实现物资、仓储、供应、销售、物流一体化业务协同处理平台,建立了公司对各直属厂工作的监督平台,总部可以实时对下属各公司的工作进行监督,实时对各公司的具体业务执行情况进行查看,及时的对下属公司进行指导和监督。 尽管在两化融合及企业信息化方面已取得了相当的成效,但在实际应用过程中仍然存在一些较为显着的问题。

相关文档
最新文档