如何进行数据仓库的建设实施
数据仓库的建立与管理

数据仓库的建立与管理随着数据规模的不断增长以及业务需求的不断变化,越来越多的企业开始重视数据仓库的建设和管理。
数据仓库是指一个集成、主题化、时间基础的数据集合,用于支持企业的决策分析。
在本文中,我们将探讨数据仓库的建立与管理的重要性、方法和技巧。
一、数据仓库的建立与管理的重要性数据仓库的建立和管理对企业的发展和运营具有重要的意义。
首先,数据仓库可以提供更加准确和可靠的数据。
数据仓库将企业内部各部门的数据进行整合和加工,消除了数据源的不一致性和重复性,提高了数据的准确性和可靠性。
其次,数据仓库可以提供更加灵活和全面的数据查询和分析功能。
作为企业决策支持的核心系统,数据仓库可以灵活地支持各种查询和分析需求,提供全面的数据视角和多维度的数据分析结果。
最后,数据仓库可以帮助企业提高决策的效率和质量。
通过数据仓库,企业可以从海量的数据中快速分析出关键的信息和趋势,为企业的决策提供有力的支持。
二、数据仓库的建立方法数据仓库的建立包括数据建模、数据抽取、数据清洗、数据加工、数据存储和数据查询等多个环节。
下面,我们将分别介绍这些环节的具体方法和技巧。
1. 数据建模:数据建模是数据仓库建立的第一步。
数据建模包括概念模型、逻辑模型和物理模型。
概念模型是对业务过程的描述,逻辑模型是将概念模型转换成数据表的结构,物理模型是将逻辑模型映射为数据库实现。
数据建模是数据仓库建立的基础,需要仔细推敲业务需求,保证模型的规范和准确。
2. 数据抽取:数据抽取是将不同数据源的数据引入数据仓库的过程。
数据抽取需要考虑数据源的类型、格式和数据量等多个因素。
数据抽取的技巧包括增量抽取、并行抽取、数据加速等方法。
3. 数据清洗:数据清洗是将原始数据转换为可以使用的数据的过程。
数据清洗需要对数据进行格式转换、数据清除、数据校验等多个步骤。
数据清洗的技巧包括数据去重、数据标准化、数据填充等方法。
4. 数据加工:数据加工是将清洗后的数据转换为数据仓库中的格式。
《数据仓库建设指南》

《数据仓库建设指南》数据仓库建设指南随着企业信息化的趋势不断发展,数据化已经成为企业成长的必经之路。
数据成为了企业在竞争中的筹码,企业数据分析的能力也成为了企业成功的关键。
更多的企业意识到,要想在市场上占有一席之地,精细管理企业,就必须建立一个合理的数据仓库。
那么,数据仓库建设需要考虑哪些要素和步骤呢?本文将一一为您解析。
一、数据仓库简介数据仓库是一种长期积淀和管理数据的系统,它可以帮助企业集中存储和管理来自各种渠道的数据,为企业提供分析支持。
它可以将内部和外部的数据整合、加工之后建立一个统一的数据层用于分析,这样企业就可以在分析过程中减少对数据来源的依赖,加快数据分析过程。
二、数据仓库建设步骤1.规划和准备数据仓库建设是需要投入大量的时间和精力的,因此,首先需要确定需求,明确数据仓库的建设目标,并确保团队中所有成员都清楚地理解目标和业务需求。
同时,团队还需要了解企业的业务流程。
在规划和准备阶段,团队需要对企业业务进行分析和评估,确定数据仓库中需要的信息和数据以及其来源;需要制定数据建设计划,分步骤地完成数据仓库的各个环境的建设和测试,以确保其稳定性和数据可靠性。
2.设计在设计阶段,需要确定数据仓库的基本结构和架构等。
从不同的维度来考虑数据仓库的数据设计,面向业务时的数据设计包括事实表和维度表的设计,以及定义关系型数据模式。
面向数据仓库的设计要考虑数据的存储形式和数据的管理:如何利用索引快速查找数据,如何存储不同的数据格式或类型等。
3.实施实施是数据仓库建设中最为繁琐的环节,这个过程需要投入大量的人力和物力资源。
需要与各种数据源进行连接和整合,然后将这些数据存储到数据仓库中,来适应变化的数据分析需求。
在实施过程中,需要考虑数据清洗、转换和加工等过程。
数据清洗的目的是过滤掉不必要的数据,转换是将数据从一种格式转换为另一种;加工就是从原数据中提取关键信息。
4.测试和验证测试与验证是数据仓库建设过程中很重要的步骤,通过测试可以验证数据仓库所设计的模型和工具是否能够适应实际的业务需求,同时也可以提供一些有益的改进建议。
详解数据仓库的实施步骤

详解数据仓库的实施步骤建立数据仓库是一个解决企业数据问题应用的过程,是企业信息化发展到一定阶段必不可少的一步,也是发展数据化管理的重要基础。
数仓的知识市面上的书籍和文章不少,但是实际实施依据行业不同,企业核心诉求不同,从技术到方法论各有不同。
如何实施数仓项目,本文先以传统行业的数仓切入,从整体上讲下数据仓库的实施方法论!数据仓库的通用实施步骤一、需求分析需求分析是数据仓库项目最重要的一个环节,数仓说到底还是服务于业务,支撑于业务,如果需求分析不准确,做了没人用,上了不好用,会直接影响业务/客户的使用,最终导致项目的失败。
为了避免最坏的情况,磨刀不误砍柴工,前期一定要重视需求的调研、挖掘和分析,并采用一些严谨科学的措施和方法去做需求分析。
在实际调研过程中分享几个经验:1、尽可能与业务方/客户方一起分析需求,引导对方将项目所要实现的整体框架和业务细节部分述清楚,最好的方式就是需求人员和设计人员基于原型来讨论,从而正确理解实际的业务需求。
2、必须实事求是地将数据仓库所能实现的目标和不容易解决的问题与协商清楚。
这一个环节趟过不少坑,IT方急着上线,业务方对于项目还处于一知半解,甚至在推动的时候可能避重就轻,比如一期不满足的需求强行上,长远来看项目会产生不少推诿和扯皮,消磨的是对方的信任。
所以在需求讨论的基础上,需要理解业务工作流程,当然如果你已经具备了这个行业丰富的业务知识,那可以在需求调研的时候尽可能地让对方按照自己的思路去完成数据仓库系统的功能设计。
3、需求方群体的分类,BI项目最终的使用对象可以分为以下几类:数据查询者、报表查询者、企业决策者这三类人群的需求特点完全不一样,沟通的时候需要注意区分并深刻理解4、需求调研的再完美,也避免不了需求变更。
现实是很多情况下需求是不确定的,业务方是提不出有价值的需求的,需求今天是A 明天又变成B无法一步做到位的,这都很正常,作为项目实施者要做好心理预期。
一般情况下,业务方能够提供的都是需求的整体框架部分或者是实际需求的一部分内容,不能预见未来需要增加的需求,这也注定了数仓项目是一个不断循环、反馈,使系统不断完善增长的过程。
高校数据仓库建设方案

高校数据仓库建设方案一、引言随着信息化的发展,高校面临着越来越多的数据管理和分析需求。
数据仓库作为一种数据集中存储和分析的解决方案,被广泛应用于高校管理和决策过程中。
本文将针对高校数据仓库的建设,提出一套合理有效的方案。
二、需求分析1. 数据管理需求:高校拥有庞大的数据量,包括学生信息、教职工信息、科研成果、财务数据等。
这些数据需要进行统一管理,以方便查询和使用。
2. 决策支持需求:高校管理层需要依据数据进行决策,如招生计划、教学改革、财务分析等。
数据仓库可以提供决策支持系统,帮助管理层进行数据分析和决策。
3. 数据安全需求:高校数据涉及学生和教职工的个人隐私,数据仓库建设需要确保数据的安全性和隐私保护。
三、方案设计1. 数据采集:建立数据仓库的第一步是进行数据采集。
通过与高校各个部门、系统对接,实现数据的自动、定时抽取和加载。
同时,对采集到的数据进行清洗和转换,确保数据的准确性和一致性。
2. 数据存储:为了满足数据管理需求,需要选择合适的数据存储方式。
可以采用关系型数据库或者分布式文件系统等技术,根据数据量和性能需求进行选择。
同时,建立数据存储的备份和恢复机制,确保数据的安全性和可用性。
3. 数据模型设计:数据模型是数据仓库的核心部分,它决定了数据的组织结构和关系。
在设计数据模型时,需要充分考虑高校的业务特点和数据分析需求。
可以采用星型模型、雪花模型或者其他合适的模型,根据具体情况进行选择。
4. 数据分析工具:数据仓库的价值在于数据的分析和挖掘,因此需要选择合适的数据分析工具。
可以使用商业智能工具、数据挖掘工具或者自主开发的分析系统,根据用户需求进行选择。
同时,提供用户友好的可视化界面,方便用户进行数据分析和查询。
5. 数据安全和隐私保护:在数据仓库建设过程中,数据的安全和隐私保护是必不可少的。
可以采用数据加密、权限管理、审计和监控等技术手段,确保数据的安全和隐私不被泄露。
同时,建立灾备机制和容灾方案,防止数据丢失和系统故障。
数仓建设标准

数仓建设标准
随着数据量的不断增长和数据应用的日益广泛,数仓建设已成为企业数据战略中不可或缺的一部分。
建设一个高效、稳定、易维护的数仓,对于企业的数据应用和决策具有至关重要的意义。
本文将介绍数仓建设的标准,包括以下几个方面:
1. 数据质量标准:数据质量是数仓建设的核心,必须确保数据准确、完整、一致、可靠。
数据应该按照一定的规范进行采集、清洗、转换和加载。
2. 数据安全标准:数仓中存储的数据可能包含企业的核心业务信息,因此必须采取严格的数据安全控制措施,包括访问权限控制、数据备份和恢复、数据加密等。
3. 数据集成标准:数仓建设需要集成多个数据源,包括内部系统和外部数据,因此需要制定统一的数据集成标准,确保数据的一致性和可靠性。
4. 数据模型标准:数仓建设需要设计数据模型,包括维度模型和事实模型。
这些模型需要符合统一的标准,以便数据分析和查询。
5. 数据仓库架构标准:数仓建设需要设计合适的架构,包括存储层、计算层、数据服务层等。
这些层需要按照一定的标准进行设计和实现,以保证数据处理的高效性和可扩展性。
6. 数据治理标准:数仓建设需要实施数据治理,包括数据质量管理、数据血缘分析、数据资产管理等。
这些工作需要按照一定的标准进行实施,以保证数据的可信度和可用性。
以上是数仓建设的标准,企业在建设数仓前需要认真制定相应的标准并进行严格实施,以保证数仓能够为企业提供可靠、高效的数据支持。
数据建库方案

数据建库方案第1篇数据建库方案一、项目背景随着信息化建设的不断深入,数据已经成为企业、政府及各类组织的重要资产。
为充分发挥数据价值,提高管理效率,降低运营成本,本项目旨在建立一套完善的数据建库体系,以满足各类业务需求。
二、项目目标1. 建立一套标准化、规范化的数据建库流程。
2. 构建高质量、易维护的数据仓库,确保数据的准确性、完整性和一致性。
3. 提供高效、灵活的数据查询、统计和分析功能,满足业务需求。
4. 确保数据安全,遵循相关法律法规,保护个人隐私。
三、数据建库原则1. 合法合规:遵循国家相关法律法规,确保数据采集、存储、使用等环节的合法性。
2. 实用性:以满足业务需求为导向,确保数据建库的实用性和可操作性。
3. 标准化:采用统一的数据标准,规范数据采集、存储、处理等环节。
4. 安全性:加强数据安全防护,确保数据不被非法访问、泄露或篡改。
5. 可扩展性:预留足够的扩展空间,满足未来发展需求。
四、数据建库流程1. 数据采集(1)明确数据来源,确保数据真实、准确、完整。
(2)根据业务需求,确定数据采集范围和频率。
(3)采用技术手段,实现数据的自动采集、清洗和转换。
2. 数据存储(1)选择合适的数据库系统,如关系型数据库、非关系型数据库等。
(2)建立数据存储结构,设计合理的表结构、字段和索引。
(3)确保数据存储的安全性、可靠性和可扩展性。
3. 数据处理(1)对数据进行清洗、去重、校验等操作,确保数据质量。
(2)根据业务需求,对数据进行整合、加工、分析等处理。
(3)建立数据更新机制,定期检查和更新数据。
4. 数据查询与分析(1)提供多维度、多角度的数据查询功能,满足不同业务需求。
(2)利用数据分析工具,对数据进行统计、分析和可视化展示。
(3)根据业务需求,定制化开发数据分析模型。
5. 数据安全与合规(1)遵循国家相关法律法规,确保数据合规性。
(2)加强数据安全防护,防止数据泄露、篡改等风险。
(3)定期进行数据备份,确保数据可恢复。
数据中心建设项目数据库设计开发方案及实施方案

数据中心建设项目数据库设计开发方案及实施方案本项目中, 数据库设计与建设包括用于数据中心进行数据存储、交换、应用的数据中心数据库, 和用于数据统计、分析、挖掘的数据仓库的设计与建设。
本数据中心数据库的建设要满足金信工程的相关设计要求, 满足上级工商、质监、知识产权等市场监管部门的工作要求。
数据中心顾名思义, 是专注于数据处理和服务的中心, 旨在建立数据采集、更新、管理、使用机制, 加快系统内部信息交流与反馈, 为公众服务和相关政府部门数据交换建立基础, 为工商、质监、知识产权部门各级管理人员提供决策支持服务。
1.1.数据中心应用功能与业务处理功能的不同之处在于数据中心是以数据为管理对象, 而业务应用系统以业务为管理对象。
数据中心将从业务应用系统采集到的数据进行清洗和统一存放, 根据不同的需求进行加工, 生成不同的数据产品供各系统使用。
数据中心独立于应用系统之外, 又与应用系统有密切的联系。
1.2.数据中心是存储市场监督管理局经过筛选、去重、整理后的核心业务、人员数据等信息, 整合了全市各类主体信息资源和市场主体、人员相关的信息资源, 并进行统一管理和维护;数据中心通过深入挖掘数据价值, 开发实现灵活、高效的数据查询、业务报表、数据共享和数据交换等功能, 为政务公开、业务协同、绩效考核、决策支持、公共服务等提供数据保障。
1.3.数据中心建设原则金信工程数据中心建设遵循如下原则:1.总体规划, 建立科学、完整的信息资源管理体系整体规划, 将以往分散的数据资源进行整合, 建立科学、完整的信息资源体系结构, 确保业务人员、技术开发人员等使用和维护信息资源的用户从整体上把握数据资源的情况, 方便、准确的利用信息资源和有效的维护、管理信息资源。
科学、完整的信息资源管控体系不但包括信息资源自身的完整性, 科学性, 也应包括信息采集、管理、共享、利用方式的规划, 以及数据模型、数据指标等规范化、标准化的考虑。
2.统一规划、集中管理各类信息资源统一规划数据资源, 不只是要对各类信息资源进行物理集中存储管理, 还要在对业务数据分析的基础上, 一体化规划并设计系统数据模型, 统一制定业务数据指标体系, 以管理服务对象为核心, 组织相关联的业务数据, 实现对内业务使用、对外服务应用的统一视图。
数据仓库体系规划及实施流程

数据仓库体系规划及实施流程⼀、前⾔数仓规划是数仓建设的蓝图,涵盖从需求分析开始到最终的数仓评估验收整个环境;数仓规划之所以重要,是因为它是描述了数据流动的概念性框架,为元数据管理奠定了基础,对数据加⼯过程的理解、数仓建设的交流分享、数据的使⽤和问题排查、数仓健康度的评估都提供了极⼤的帮助。
需要强调的是本节是从宏观上描述数仓的框架,具体到数据模型的细节对⽐、存储选型和管理、接⼊数据源管理等数仓建设的周边在本节不涉及。
通过本节的阅读,你将了解到以下知识:从业务矩阵的设计(宏观、微观)、横向的分层、纵向的分线到主题划分等⾓度解构数仓;数仓建设的实施流程。
⼆、规划1、矩阵分宏观和微观来看,宏观的是公司的整体业务布局,微观的是产品的业务过程布局和业务过程的维度分解交叉信息。
2、宏观矩阵宏观矩阵描述的是公司的业务线和对应的数据状况,其⾏和列⼀般分别对应着业务主题和数据主题。
1)业务主题对应着公司的业务线布局,⽐如电商、游戏、视频、应⽤商店、新闻资讯、浏览器等。
2)数据主题根据抽象的程度和视⾓有不同的取法:⼀般取业务线中⽤户对内容的消费或者相关⾏为,⽐如曝光、点击、消费、播放、分享等,对这些⾏为的划分⼜可分为原⽣⾏为主题(通⽤和业务相关)、衍⽣⾏为主题(留存、活跃、流失等),这种划分⽅法更多的取⾃数据的底层和公共层,因为⾼层的数据都是多⾏为的汇总。
对数据主题的另外划分⽅式参加分主题部分,这种划分⽅法更多的取⾃数据的⾼层。
引⾃《数据仓库实践之业务数据矩阵的设计-⽊东居⼠》3、微观矩阵微观矩阵描述的是主题和对应的维度关系,下⾯以常见的内容消费和⽤户主题两个维度来看微观矩阵的规划。
-w698业务过程描述的⼀般是对内容的消费抽象,可以是原⼦的,也可以是抽象的,⽐如卡⽚曝光维度的划分可以从以下两个⼤⽅向⼊⼿:通⽤标识维度(版本、机型、渠道、⽹络、时间等);业务过程维度:消费者等级、消费位置、消费路径、其它等。
4、分层ODS->DW->DM->DA(ADS)层是如何划分的,分层的原因(引⾃《⼀种通⽤的数据仓库分层⽅法-⽊东居⼠》):清晰数据结构:每⼀个数据分层都有它的作⽤域和职责,在使⽤表的时候能更⽅便地定位和理解;减少重复开发:规范数据分层,开发⼀些通⽤的中间层数据,能够减少极⼤的重复计算;统⼀数据⼝径:通过数据分层,提供统⼀的数据出⼝,统⼀对外输出的数据⼝径;复杂问题简单化:将⼀个复杂的任务分解成多个步骤来完成,每⼀层解决特定的问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
V_2
地 市
部署在地市的 业务系统数据
特色业务应用数据
数据 缓冲区
综合数据库
数据中心建设过程
数据展现 性能调优 元 数 据
系 统 建 设 过 程 应用设计 ODS建模 数据仓库建模 数据的获取与整合 源数据分析
管
理
逻辑分析
需求分析
迭代式开发
逻辑分析
ODS 建模
需求分析 数据仓库 建模
应用设计 数据获取 与整合
逻辑模型 物理模型 验证实例
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
数据展现 性能调优
元 数 据
系 统 建 设 过 程
应用设计
ODS建模
数据的获取与整合
管
理
数据仓库建模
逻辑分析
源数据分析
需求分析
数据仓库建模
业务元数据包括以下信息:
使用者的业务术语所表达的数据模型、对象名和属性名; 访问数据的原则和数据来源; 系统所提供的分析方法及公式、报表信息。
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
ODS建模
架构设计
数据建模
数据质量 分析
物理数据 设计
数据获取 设计
应用功能 设计
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
需求分析
调研内容
内容1
调研计划
实际调研
需求规格说明书
调研对象
调研时间
调研地点
内容2
内容3
SYBASE数据源
名称 数据源分析
数据源格式
数据更新频率
数据量
数据质量
代码
User_inf User_cost bill_data
用户基本信息 按户电费数据 电费数据
用电性质代码表
用电类别 电价表 计费日期对应电价日期
Code_e_kind
Code_usage_date Price cal_price_date
需求分析
调研计划 实际调研 需求规格说明书
•
–
需求规格说明书
需求规格说明书模板详见附录4
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
逻辑分析
处理逻辑分析 支撑数据分析 业务元数据建立
单一主题处理逻辑分析
Web内容管理
单点登录
个性化定制
多渠道接入
门户管理与维护
业务流程集成
数据中心
商务智能 数据仓库 企业资源 管理平台 全 局 数 据 字 典 公 共 信 息 模 型
身份认证登录
身份 管理 认证 代理
业务系统
人力资源 安全生产 物资管理 协同办公 业务数据集成 营销管理 财务管理
安 全 管 理
运 维 管 理
调研计划
需求分析
实际调研
需求规格说明书
•
调研内容:针对不同层面的人员,调研内容不同
•
– – – – –
对IT人员
此主题所需要的数据源都取自哪些业务系统? 与本主题有关的现有的业务系统的数据结构怎样? 与本主题有关的现有的业务系统的数据更新频率如何? IT人员对数据仓库的期望是什么? IT人员在平时的工作中最关心的哪些指标?
内容4
…
需求分析
调研计划
实际调研
需求规格说明书
• 调研方式:
– 当面访谈; – 问卷调查; – 访谈及问卷提纲模板请参见附录2
需求分析
调研计划 实际调研 需求规格说明书 实例
• •
– – – – – – – – –
调研内容:针对不同层面的人员,调研内容不同 对企业领导层
领导层目前的工作重点有哪些和此主题相关,和哪几个指标相关? 领导层最关心哪几个指标? 针对这些指标,领导层目前采用何种获取方式? 针对这些指标,领导层目前都进行哪些分析,采用何种分析手段,采用何种分析方 法? 目前状况下,针对这些指标都有哪些展现方式? 领导层对数据仓库的期望是什么? 领导层希望决策分析系统能提供哪些分析功能? 领导层希望以何种方式来看这些指标? 领导层希望对这些指标进行哪些方面的比较?
单位代码
行业代码表 电压代码表 时段
Dept
Code_trade_new Codvolt Code_period
用户类别
用户使用电表 用电分类代码表 用电分类与用电性质关系表
Code_user_type
User_ammeter rep_salse_kind rep_salse_relation
其它电费数据
名称
用电分类 电价表 行业 欠费信息表 AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES
代码
客户信息
电量与电费表 地区(单位) 部门 电压
EP_CUST_INFO
EP_RESULT SU_AREA SU_DEPT AC_VOLT_GRADE
数据源范围
从业务逻辑入手,分析各指标的组成关系;
多主题处理逻辑分析
综合考虑各分析主题间的逻辑关系;
逻辑分析
处理逻辑分析 支撑数据分析 业务元数据建立
单一主题支撑数据分析
单个主题分析所需要的原始支撑数据分析
多主题支撑数据分析
所有主题统一考虑做需要的支撑数据分析
逻辑分析
处理逻辑分析
支撑数据分析
业务元数据建立
逻辑模型 物理模型 验证实例
ODS逻辑模型
逻辑结构:完成实体的定义,各实体间的关系等 存储周期(立即删除、过一段时间删除或者是备份到其它介质上) 存储粒度(与源系统基本保持一致)
ODS物理模型
数据的存储结构 索引策略 数据存放位置(硬盘或磁带等) 存储分配 分区设计
ODS建模
需求分析
•
调研计划
实际调研
需求规格说明书
调研内容:针对不同层面的人员,调研内容不同
•
– – – – – – –
对中间管理层
中间管理层通常需要上报哪些指标?和此分析主题相关的有哪些指标? 平时领导层通常询问哪些指标?在这些指标中哪几个和此分析主题有关? 中间管理层目前的工作重点有哪些和此主题相关,和哪几个指标相关? 中间管理层本身最关心哪几个指标? 中间管理层对下属的工作人员都考核哪些指标?哪几个指标与此分析主题有关? 针对这些指标,中间管理层目前采用何种获取方式? 针对这些指标,中间管理层目前都进行哪些分析,采用何种分析手段,采用何种分 析方法? 目前状况下,针对这些指标都有哪些展现方式? 中间管理层对数据仓库的期望是什么? 中间管理层希望决策分析系统能提供哪些分析功能? 中间管理层希望以何种方式来看这些指标? 中间管理层希望对这些指标进行哪些方面的比较?
代码
AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES EP_CUST_INFO EP_RESULT SU_AREA SU_DEPT AC_VOLT_GRADE
数据量
92 355 595 1309341 147692 2775326 15 102 6
数据中心(数据仓库)的 建设实施
深圳海联讯科技股份公司 张千福
一体化平台总体拓扑图
展 现 层 的 应 用 集 成
企
基本 应用 基础支 撑功能
业 门
户
扩展 应用 搜索
协同工作 对8大系统中 协同办公的 规范要求 Portlet框架
待办事宜 对应用集成 项目的规范 要求 虚拟门户
BI展现 对BI接入的 规范要求
数据集市
安全生产数据集市 财务与绩效集市 人力资源集市
省 电 力 数 据 中 心
部署在省的 八大业务系 统数据
EAI
数据仓库
O_5
O_4
营销集市 数据挖掘集市
O_2
部署在地市,通过数据 复制到网省数据中心 的业务系统数据
缓冲区
其它集市
对下接口区 影像/文档型数据 元数据 网省下传数据
V_1
数据交换平台 或 ETL 或 数据复制
数据源分析
数据源范围 数据源格式 数据更新频率 数据量 数据质量
Data Profiling 数据特性
Custom Profiling 客户化数据特性
数据源 分析
ቤተ መጻሕፍቲ ባይዱ
国网典设建议的甲方项目组织
网省项目组 PM 项目经理 助理
业务 负责人
业务系统 负责人
数据中心 实施负责人
各业务部门 代表
各业务系统 开发商代表
软/硬件平台 提供商PIM
集成商 PIM
海联讯的项目组织
项目经理
QAL/CML
需求定义
设计
开发
测试
部署实施
需求采集