数据仓库技术介绍
大数据分析知识:数据存储与管理——数据仓库、云计算和数据库

大数据分析知识:数据存储与管理——数据仓库、云计算和数据库随着技术的不断发展,越来越多的数据产生并蓄积,如何进行有效管理和利用已成为人们关注的焦点之一。
本文将从数据存储和管理的角度出发,分别介绍数据仓库、云计算和数据库的概念、特点及其在大数据领域的应用。
一、数据仓库数据仓库(Data Warehouse)是指从各个数据源中提取数据并经过处理后存储到一个统一且独立的数据集合中,以方便用户进行分析和决策的系统。
数据仓库通过将数据分析和查询分离,实现了数据决策支持系统的高效运行,从而提高数据的利用率。
数据仓库的特点:1.面向主题:数据仓库是面向主题的,即数据集中一般针对某个主体领域或数据分析任务。
例如,销售数据仓库、人力资源数据仓库等。
2.集成性:数据仓库具有集成性,可以将不同类型的数据源通过ETL(Extract-Transform-Load)的方式进行标准化、转换和加载,并保证数据之间的一致性和完整性。
3.时间性:数据仓库关注历史数据的存储和分析,并提供不同时间维度的数据展示方式,为决策者提供多样化的选择。
数据仓库在大数据领域的应用:1.数据分析和挖掘:通过数据仓库中的数据进行多维分析和数据挖掘,为决策者提供全面的数据支持。
2.企业级统一视图:数据仓库可以实现企业级统一视图,使决策者可以获得一份全面的数据报告。
3.交互式查询:数据仓库提供交互式的查询功能,用户可以根据需要自定义查询条件和维度,获得满足自己需求的数据结果。
二、云计算云计算(Cloud Computing)是指通过网络以服务方式提供计算资源的一种模式。
云计算基于分布式计算、虚拟化技术和自动化管理,通过网络实现数据处理和存储,通过服务模式进行资源使用和计费。
云计算的特点:1.弹性伸缩:云计算可以根据需求进行弹性伸缩,为企业和个人提供更加灵活的资源使用方式,从而降低IT成本、提高效率。
2.服务化:云计算基于服务的方式提供资源,用户可以根据需要选择提供商和服务类型,并根据实际使用量进行计费,降低了技术和资金门槛。
数据仓库技术知识

一、数据仓库数据仓库,英文名称为Data Wareh ouse,可简写为DW或DWH。
数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
它是单个数据存储,出于分析性报告和决策支持目的而创建。
为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
1、数据仓库是面向主题的;操作型数据库的数据组织面向事务处理任务,而数据仓库中的数据是按照一定的主题域进行组织。
主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
2、数据仓库是集成的,数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出数据仓库的核心工具来,进行加工与集成,统一与综合之后才能进入数据仓库;数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到当前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
3、数据仓库是不可更新的,数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询;4、数据仓库是随时间而变化的,传统的关系数据库系统比较适合处理格式化的数据,能够较好的满足商业商务处理的需求。
数据仓库与数据挖掘技术研究与应用

数据仓库与数据挖掘技术研究与应用1. 引言数据是当今社会的核心资源之一,企业需要从海量数据中提取有价值的信息以支持业务决策和发展。
数据仓库和数据挖掘技术是处理和分析大规模企业数据的重要手段。
本文将探讨数据仓库和数据挖掘技术的研究与应用。
2. 数据仓库技术2.1 数据仓库定义和特点数据仓库是一个面向主题、集成、历史和稳定的数据存储库。
数据仓库的主要特点包括:面向主题,即聚焦于特定业务领域的数据集合;集成,即从不同数据源中提取数据,转换为一致的格式和编码;历史,即保留不同时间点的数据快照以分析趋势和历史演变;稳定,即数据仓库结构和内容相对稳定,不随源系统而改变。
2.2 数据仓库架构数据仓库架构包括数据源层、ETL层、存储层和应用层。
数据源层包括企业各个应用系统、数据文件和传感器等各种数据来源。
ETL层负责数据的提取、转换和加载,将数据转换为适合数据仓库的格式。
存储层为数据提供持久化存储,包括数据仓库、数据集市和数据清单等不同层次的存储结构。
应用层提供多种用户界面和分析工具,以供用户查询和分析数据。
2.3 数据仓库建设数据仓库建设需要遵循一些基本原则,如需求驱动、迭代开发、数据治理和数据质量保障等。
实施建设的流程包括:需求分析、设计规划、技术实现和运营管理。
在规避风险和提高效率方面,可采用敏捷开发、自动化测试和基础设施自动化等现代开发技术。
3. 数据挖掘技术3.1 数据挖掘定义和技术分类数据挖掘是指从大量数据中提取有用信息的技术。
数据挖掘技术可分为分类、聚类、关联规则和最优化等多种类型。
分类是明确将数据分为不同类别,如预测客户流失或判断股票波动等;聚类是将相似的数据分为同一类别,如在销售数据中识别消费者购买偏好;关联规则是寻找数据项之间的联系和规律,如在购物篮数据中识别购物行为模式;最优化则是寻求最佳状态或解决方案,如关于生产效率和资源利用的优化问题。
3.2 数据挖掘流程数据挖掘流程包括问题定义、数据准备、建模、评估和应用等阶段。
数据仓库技术的名词解释

数据仓库技术的名词解释随着数据的快速增长和业务需求的不断变化,数据仓库技术在企业管理和决策中变得愈发重要。
本文将对数据仓库技术中涉及的一些关键名词进行解释,帮助读者更好地理解和应用这一技术。
一、数据仓库数据仓库(Data Warehouse)是指将企业内部各个业务系统产生的数据进行抽取、转换和加载,经过集成、整理和归档后存放在一个统一的数据存储系统中。
通过对数据的汇总和整合,数据仓库提供了一个面向决策和分析的统一数据源,为企业提供战略决策和业务分析等方面的支持。
二、ETLETL(Extraction, Transformation and Loading)是指数据仓库中的数据抽取、转换和加载过程。
数据仓库需要从各个业务系统中抽取数据,进行清洗、转换和整理,然后加载到数据仓库中。
这一过程确保了数据的一致性和可靠性,使得数据可以被有效地用于决策分析和报表生成等业务场景中。
三、维度建模维度建模(Dimensional Modeling)是一种对数据进行建模的方法论,用于构建数据仓库中的维度模型(Dimensional Model)。
维度模型基于维度表和事实表的关系,通过定义维度和度量,将事实数据与上下文信息进行关联,提供了一种直观和灵活的数据分析方式。
维度建模常用的方法有星型模型和雪花模型。
四、星型模型星型模型(Star Schema)是一种常用的维度模型,以一个中心的事实表和多个维度表构成。
中心的事实表记录了业务过程中的事实,如销售额、订购数量等,而维度表则提供了和事实表相关的上下文信息,如产品、时间、地域等。
星型模型的简单结构和高性能查询使得其在数据仓库中被广泛采用。
五、雪花模型雪花模型(Snowflake Schema)是星型模型的一种扩展,通过将维度表进一步细化为多个层级的表,实现了对维度关系的更精细管理。
雪花模型的优势在于可以减少数据的冗余性和提升查询性能,但同时也增加了表的数量和复杂度。
在实际应用中,根据业务需求和系统性能,选择适合的维度模型是至关重要的。
数据仓库技术

数据仓库技术数据仓库技术是一种广泛应用于数据管理和商业智能的技术。
它的主要目的是将各种异构的数据源整合到一个单一的数据存储中,并提供基于这些数据的分析和报告功能。
首先,数据仓库技术使用抽取、转换和加载(ETL)过程将来自不同源的数据提取出来。
这些源可以是关系型数据库、平面文件、Web服务或其他任何形式的数据。
然后,数据经过转换和清洗处理,使之能够被仓库接受和使用。
最后,数据被加载到数据仓库中,通常是一个专门设计的数据库系统,采用维度模型或星型模型的结构。
这种结构能够更好地支持数据的分析和查询。
数据仓库技术有许多优点。
首先,它提供了一个统一的数据视图,使得数据分析更加方便和高效。
通过整合不同的数据源,用户可以从一个地方获取到所有的相关数据,节省了时间和努力。
其次,数据仓库还可以提高数据的质量和准确性。
在ETL过程中,数据经过了转换和清洗处理,从而减少了数据错误和不一致性的可能性。
此外,数据仓库还支持历史数据的保存和查询,使得用户可以分析和了解数据发展的趋势和模式。
然而,数据仓库技术也有一些挑战和限制。
首先,数据仓库的建设和维护成本较高。
由于涉及到多个数据源和复杂的ETL过程,数据仓库的搭建需要大量的资源和专业知识。
其次,数据仓库的性能和扩展性可能会受到限制。
随着数据量的增加,仓库数据库的查询和处理速度可能会变慢,需要采取一些优化措施来提高性能。
同时,随着数据需求的增加,仓库的存储容量可能会成为一个瓶颈,需要进行适当的扩展。
总之,数据仓库技术是一种重要的数据管理和商业智能工具。
它能够将各种异构的数据整合到一个统一的视图中,并为用户提供强大的分析和报告功能。
尽管数据仓库技术存在一些挑战和限制,但随着技术的不断发展和创新,相信它将继续发挥重要的作用,并在企业决策和业务分析中发挥越来越大的价值。
数据仓库技术在现代企业中扮演着重要的角色,它不仅为企业提供了业务分析和决策支持的基础,而且也促进了企业的创新和竞争力的提升。
数据仓库

9.1.1数据仓库技术的产生数据仓库(Data Warehouse)技术完全是在需求的驱动下产生与发展起来的。
在过去的十年中,数据库技术,特别是联机事务处理(OLTP:On-line Transaction Processing),主要是为自动化生产、精简工作任务和高速采集数据服务的。
它是事务驱动的、面向应用的。
随着社会的发展,人们产生了使用现有的数据,进行分析和推理,为决策提供依据。
这样的需求导致了决策支持系统(DDS:Decision Support System)的产生。
目前,传统的数据库(DB)仅对当前事务所产生的数据记录保存下来,并对这些数据进行各种日常事务处理。
随着数据量的增大,查询要求也越来越复杂,DB逐渐出现了许多难以克服的问题,集中表现为:数据分散、缺乏组织性;数据难以转化为有用信息;不能满足复杂的查询要求;只保存短期数据,分析时不能满足长期预测需要。
于是,人们开始尝试对DB中的数据进行再加工,形成一个综合的、面向分析的环境,以更好的支持决策分析,数据仓库的思想便逐渐形成了。
传统的信息技术一直未能提供一种行之有效的手段,帮助管理人员方便地访问制定决策需要的信息,辅助他们制定决策。
数据仓库的出现改变了这一状况,它能帮助人们正确的判断即将出现的机会,提高企业对市场变化的反应速度,帮助决策者解决商业过程中存在的问题。
DW的真正价值在于帮助人们制定能改进商业化过程的决策,而不只是使商业过程自动化。
1.数据仓库的效益数据仓库可以给企业带来许多无形的收益,主要体现在以下几方面:(1) 改变了企业的经商之道以前,企业只注重生产什么样的产品,以产品定位市场。
随着行业竞争的加剧和用户需求趋于多样化、个性化,企业的生产必须以用户需要为目标,及时捕捉用户信息,根据用户的需求来进行产品的生产和销售,而这一切都源于对数据仓库中所存储的大量信息的追踪和分析。
使用数据仓库可以行进行有目标的市场销售,把最满意的产品和服务送到可获得最大利润的客户手中。
数据仓库的技术要求

数据仓库的技术要求
x
数据仓库的技术要求
一、基础技术
1、硬件要求:数据库存储服务器应采用高性能的服务器,具有足够的内存容量和IO性能;
2、存储层:采用磁盘阵列等存储技术,支持高容量的数据存储、高IO性能等;
3、数据库层:采用Oracle、MySQL等主流数据库,支持多用户访问;
4、数据交换技术:支持从关系型数据库、文件系统、外部数据源进行数据传输,以满足数据采集、清洗等功能的需要;
5、数据挖掘技术:支持关联规则挖掘、分类、回归、聚类等算法,帮助分析系统挖掘出数据仓库中隐藏的关联及模式;
二、数据仓库技术
1、数据模型:支持多维结构的数据模型,通过分层存储、元数据管理、维度管理等技术,实现高效的数据分析及查询;
2、数据集成技术:支持多数据源的集成,实现对不同数据源的快速访问,支持多种格式的数据转换及ETL技术;
3、查询及分析技术:支持OLAP、SQL等多种查询及分析技术,满足用户的复杂分析需要;
4、数据可视化技术:采用数据可视化技术,更直观的将复杂的
数据模型及分析结果展现出来,便于用户阅读;
5、安全技术:采用数据加密、数据审计、灾难恢复等技术保障数据安全,支持多级用户权限管理;
6、元数据管理:支持元数据的抽取分析,帮助用户更快的完成数据集成及元数据的管理。
数据仓库技术

⑦InfoPrintBusinessIntelligenceSolution
⑧GlobalServicesBIOffering ⑨InsuranceUnderwritingProfitabilityAnalysis
• 2. Oracle数据仓库解决方案
1) Oracle数据仓库包含了一整套的产品和服务,覆盖了数据仓库定义, 设计和实施的整个过程。
• 1)建立DSS应用 • 2)理解需求,改善和完善系统,维护数据仓库
DSS应用开发的大致步骤
• 1)确定所需的数据。 • 2)编程抽取数据。 • 3)合并数据。 • 4)分析数据。 • 5)回答问题。 • 6)例行化、一次分析处理的最后、我们要决定是否将
在上面已经建立的分析处理例行化。
1.6 数据仓库的解决方案及工具介绍
三、面向对象数据模型
• 面向对象数据仓库系统包括一个面向对象的数据仓库 和各种面向对象的数据源。有两种面向对象的数据仓 库模型:未压缩模型和压缩模型。未压缩模型在面向对 象模型中保持了数据Q的原始结构。当数据源中的数据 改变时,数据仓库中的数据相应地跟着改变。这种模 型易于维护实例之间的关系,并能保持数据的完整性, 但查询性能不高。压缩模型,又叫棍合模型,把由视 图定义的各种类的属性联合起来,形成一个新类。根 据这个新的类产生新的实例,并存储到数据仓库中。 这种模型的查询性能大大提高。面向对象的数据模型 也有许多改进模式。
随时间变化的特点
• 特点: • 1)数据仓库随时间变化不断增加新的数据内容。 • 2)数据仓库也会随时间定期删除旧的数据。 • 3)数据仓库中包含大量的综合数据,这些综合数据中
很多跟时间有关,如数据经常按照时间段进行综合。随 时间的变化,这些综合数据可能需要被重新处理和在更 高层次上被综合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Oracle Financials
PeopleSoft
Baan
ODS 用于集成相关应用系统并且为决策支持
系统提供数据基础
近线存储器
活动监控器
交叉介质 数据管理器
近线存储器 扩展数据到近线存储器,可以极大地降低数据仓库 环境的成本,并且可以将存储能力扩展到无限大
探索仓库
探索仓库
relational
----著名的数据仓库专家Ralph Kimball
如何获得信息
数据仓库 获得信息
OLTP系统 归档文件 PC 电子表格 早期应用系统
获得有用的信息并非想象的那么容易(1)
第一,所有联机事务处理强调的 是数据更新处理性能和系统的可靠性 ,并不关心信息查询的方便与快捷; 联机分析和事务处理对系统的要求不 同,同一个数据库在理论上难以做到 两全;
数据爆炸问题
– 自动的数据收集工具和成熟的数据库技术导致巨 大的数据存储在文件系统、数据库和其它的信息 库中 。
– 我们会淹死在数据中, 但却为信息、知识所饿!
面临的挑战
如何在堆积如山的企业交易数据中 发现具有商业价值的闪光点?
如何使您的企业或组织在激烈的市 场竞争中保持对客户的吸引力?
如何预先发现和避免企业运作过程 中不易察觉的商业风险?
数据仓库的通俗定义
数据仓库是一个作为决策支持系 统和联机分析应用数据源的结构化数 据环境。
数据库与数据仓库的辩证关系
以辩证的眼光来看,数据仓库的兴起实际 上是数据管理的一种回归,是螺旋式的上升。今 天的数据库就好比当年的层次数据库和网型数据 库,它们面向事务处理;今天的数据仓库就好比 是当年的关系数据库,它针对联机分析。所不同 的是,今天的数据仓库不必再为联机事务处理的 特性而奔忙,由于技术的专业化,它可更专心于 联机分析领域的发展和探索。
存储和管理
数据仓库的真正关键是数据的存储和管理。 数据仓库的组织管理方式决定了它有别于传 统数据库,同时也决定了其对外部数据的表 现形式。
要决定采用什么产品和技术来建立数据仓库 的核心,则需要从数据仓库的技术特点着手 分析。
信息探索
信息探索实际上相当于数据仓库的门面,其 性能主要集中在多维分析、数理统计和数据 挖掘方面。
宝钢股份的质量方针
“重用户、重改进、重效率、重价值,为社会提供世 界一流的产品和服务。”
----- 宝钢股份质量方针
随着市场竞争的加剧和用户要求的提高,从大量数 据中挖掘规律性知识,制定正确的生产策略和市场 策略,显得越来越重要。
市场需求是技术发展的源动力
数据仓库的出现和发展是数据库和OLTP技术 发展、数据库应用深化的产物;
Loader
SAS External
Scheduler
Metadata Manager
数据的抽取
Metadata
Information Database
Web
EIS
Visualize
ODLSS AP
Quality Risk
Customer
Data Mining Query
Reporting
Product Market Future
分析型数据 综合的,或提炼的 代表过去的数据 不更新 操作需求事先不知道 完全不同的生命周期 对性能要求宽松 一个时刻操作一集合 分析驱动 面向分析 一次操作数据量大 支持管理需求
1990
数据仓库概念的诞生
业务系统 DSS(决策支持系统)
数据集市
现在
ODS
探索 仓库
近线存储器
数据仓库的定义
数据仓库是面向主题的、综合的、 不同时间的、稳定的时间集合,主 要用于支持经营管理中的决策制定 过程
多维分析又是数据仓库的重要表现形式,近 几年来由于互联网的发展,使得多维分析领 域的工具和产品更加注重提供基于Web前端 联机分析界面,而不仅仅是在网上发布数据 。
数据仓库的组成
ODS
数据集市
探索 仓库
近线存储器
集成和转换
自动处理数据
ETL
Hale Waihona Puke 如何避免脏数据进入1
2
3
4
1、通过不干净的遗留系统;2、不合适的集成;
- 我要写个汇总报告.
获取信息的重要因素
computer
- 贯穿公司的数据集成? - 公司的历史数据? - 详细数据及汇总数据?
决策的需要
应用在不断地进步,当 联机事务处理系统应用到一定 阶段的时候,企业家们便发现 单靠拥有联机事务处理系统已 经不足以获得市场竞争的优势 ;他们需要对其自身业务的运 作以及整个市场相关行业的态 势进行分析,从而做出有利的 决策。
企业数据仓库
- 综合数据 - 分粒度的数据 - 历史数据 - 共享的数据 - 决策的基础 - 大的存储量
数据集市
财务
销售
市场 会计 - 汇总的数据
- 部门级的数据
- 有限的历史数据
- 有限的存储量
- 重度索引
宝钢追求的目标
宝钢作为中国的特大型钢铁企业,它的主要建设目 标是在激烈的国际国内市场竞争中立于不败之地, 并且要加强管理、优化资源,追求效益最大化。这 就要求使其生产和经营过程共同达到优化,例如, 能够快速准确地提供报价、确定交货期、以及确保 产品质量等,并且制定有正确的企业发展战略,以 适应市场需求的变化,能做出及时反应。
获得有用的信息并非想象的那么容易(2)
第二,业务数据往往被存放于分散的 异构环境中,不易统一查询访问,而 且还有大量的历史数据处于脱机状态 ,形同虚设;
获得有用的信息并非想象的那么容易(3)
第三,业务数据的模式是针对事务处 理系统而设计的,数据的格式和描述 方式并不适合非计算机专业人员进行 业务上的分析和统计。
- 我的帐户现在有多少钱?
- 历史数据的缺乏是另一个 应用问题
- 你有 2,704.87元
- 在过去的三年中,我的帐户每月平均余额 是多少?
- 我怎样才能知道这些数字?
汇总问题
computer
另一个问题是汇总 ….
- 发往A公司的货物在哪里? - 在出厂中心,将于下周一运到
-我们上个月、去年有多少货物发往A公司? - 有多少货物准时到达? 晚到? 发生货损?
联机分析处理
决策需要对大量的业务数据包括历史业务 数据进行分析才能得到,而这种基于业务数据 的决策分析,我们把它称之为联机分析处理。 如果说传统联机事务处理强调的是更新数据库 ——向数据库中添加信息,那么联机分析处理 就是要从数据库中获取信息、利用信息。
市场需求是技术发展的源动力
“我们花了20多年的时间将数据放入数 据库,如今是该将它们拿出来的时候了。”
从数据库到数据仓库
传统的事务处理环境不适宜于决策支持应用 •事务处理和分析处理的性能特性不同 •数据集成问题 •数据动态集成问题 •历史数据问题 •数据的综合问题
操作型环境和分析型环境的分离
操作型数据 & 分析型数据的区别
操作型数据 细节的 在存取瞬间是准确的 可更新 操作需求事先可知道 生命周期符合 SDLC 对性能要求高 一个时刻操作一单元 事务驱动 面向应用 一次操作数据量小 支持日常操作
在计算机系统应用的早期,还没有积累大量的 历史数据可供统计与分析。从而,联机事务处 理成为整个80年代直到90年代初数据库应用的 主流。
联机事务系统的功能
在数据仓库以前大都是事物处理 系统(OLTP)的天下(1965 -1990)
这个现状持续了 25 年,它主要实现 - 数据的收集 - 数据的存储 - 数据的在线存取
3、数据仓库的过期;
4、用户需求的改变。
数据质量管理
如果数据质量不能被信任,则数据仓库将失去价值
,数据管理是一个循环往复的过程,包括四个基本
功能:
定义
定义
量度标准
量度标准
报告 改善
连续的改善 循环
改善
报告
操作数据存储(ODS)
探索数据仓库
ODS “遗产”系统
DSS
商业系统
客户开发系统
SAP
home grown
数据仓库技术介绍
了解你的组织
嵇晓
了解你的客户
了解你的供应商
内容提要
动机与需求 数据仓库技术 数据仓库在宝钢的实践 结束语
面临的问题
人们在日常生活中经常会遇到这样的情况: 超市的经营者希望将经常被同时购买的商品放在一
起,以增加销售; 保险公司想知道购买保险的客户一般具有哪些特征
; 医学研究人员希望从已有的成千上万份病历中找出
数据仓库的通俗解释
针对这一问题,人们专门为业务 的统计分析建立一个数据中心,它的 数据可以从联机的事务处理系统、异 构的外部数据源、脱机的历史业务数 据中得到;它是一个联机的系统,专 门为分析统计和决策支持应用服务, 通过它可满足决策支持和联机分析应 用所要求的一切。这个数据中心就叫 作数据仓库。
患某种疾病的病人的共同特征,从而为治愈这种疾 病提供一些帮助;
……
企业面临的问题
经过多年的计算机应用和市场积累,许多企业保存 了大量原始数据和各种业务数据, 它是企业生产经营 活动的真实记录
由于缺乏集中存储和管理,这些数据不能为本企业 加以利用, 不能进行有效的统计、分析及评估,无法 将这些数据转换成企业有用的信息
数据仓库之父--Bill Inmon
数据仓库的四个基本特征
数据仓库的数据是面向主题的 数据仓库的数据是集成的 数据仓库的数据是不可更新的 数据仓库的数据是随时间不断变化
的
数据仓库的体系结构
SAP RDBMS Legacy
Data Extraction
Transformation Engine