数据仓库的概念和体系结构概述

合集下载

数据仓库的介绍(数据仓库和数据库的区别)

数据仓库的介绍(数据仓库和数据库的区别)

数据仓库的介绍(数据仓库和数据库的区别)数据仓库的介绍⼀、数据仓库的基本概念数据仓库,英⽂名称为Data Warehouse,可简写为DW或DWH。

数据仓库顾名思义,是⼀个很⼤的数据存储集合,出于企业的分析性报告和决策⽀持⽬的⽽创建,对多样的业务数据进⾏筛选与整合。

它为企业提供⼀定的BI(商业智能)能⼒,指导业务流程改进、监视时间、成本、质量以及控制。

数据仓库的输⼊⽅是各种各样的数据源,最终的输出⽤于企业的数据分析、数据挖掘、数据报表等⽅向。

⼆、数据仓库的主要特征数据仓库是⾯向主题的(Subject-Oriented )、集成的(Integrated)、稳定的(Non-Volatile)和时变的(Time-Variant )数据集合,⽤以⽀持管理决策。

1.主题性不同于传统数据库对应于某⼀个或多个项⽬,数据仓库根据使⽤者实际需求,将不同数据源的数据在⼀个较⾼的抽象层次上做整合,所有数据都围绕某⼀主题来组织。

这⾥的主题怎么来理解呢?⽐如对于城市,“天⽓湿度分析”就是⼀个主题,对于淘宝,“⽤户点击⾏为分析”就是⼀个主题。

2.集成性数据仓库中存储的数据是来源于多个数据源的集成,原始数据来⾃不同的数据源,存储⽅式各不相同。

要整合成为最终的数据集合,需要从数据源经过⼀系列抽取、清洗、转换的过程。

3.稳定性数据仓库中保存的数据是⼀系列历史快照,不允许被修改。

⽤户只能通过分析⼯具进⾏查询和分析。

这⾥说明⼀点,数据仓库基本上是不许允许⽤户进⾏修改,删除操作的。

⼤多数的场景是⽤来查询分析数据。

4.时变性数据仓库会定期接收新的集成数据,反应出最新的数据变化。

这和稳定特点并不⽭盾。

三、数据仓库与数据库区别1、数据库数据库是⾯向交易的处理系统,它是针对具体业务在数据库联机的⽇常操作,通常对记录进⾏查询、修改。

⽤户较为关⼼操作的响应时间、数据的安全性、完整性和并发⽀持的⽤户数等问题。

传统的数据库系统作为数据管理的主要⼿段,主要⽤于操作型处理,也被称为联机事务处理 OLTP(On-Line Transaction Processing)。

数据仓库概述(概念、应用、体系结构)

数据仓库概述(概念、应用、体系结构)
使用浏览分析工具在数据仓库中寻找有用的信息; 基于数据仓库,在数据仓库系统上建立应用,形成 决策支持系统。
事务处理 分析处理
DB
从数据 OLTP 数据
DW
从数据 信息(知识) OLAP(DM、OLAM)
18
数据仓库与传统数据库的区别
19
OLTP和OLAP的区别

用户和系统的面向性:

转换描述从操作数据库到数据仓库的映射方法以及转换数据的算法访问权限备份历史存档历史信息传输历史数据获取历史数据访问等等29主题区和信息对象类型包括查询报表图像音频视频等支持数据仓库的其它信息例如信息传输系统包括的预约信息调度信息传送目标的详细描述商业查询对例如数据历史快照版本拥有权数据抽取的审计跟踪数据的使用方法30与数据访问和分析工具的集成31元数据库metadatarepository和工具32主要使用数据来源的物理结构信息企业数据模型和仓库数据模型最终用户最关心两类元数据
4
业务系统不适宜DSS应用

事务处理和分析处理的性能要求和特性不同


事务处理对数据的存取操作频率高而每次操作处理的时 间短; 在分析处理环境中,某个DSS应用程序可能需要连续几 个小时,会消耗大量的系统资源。

数据集成问题 历史数据问题 数据的综合问题(更高粒度)
5
建立数据仓库的投资回报
数据模型:(1)逻辑数据结构,包括为有效进行数据
用的数据集合,是不同于DB的一种新的数据环境, 是DW 扩 展后得到的一个混合形式。四个基本特点:面向主题的、 集成的、可变的、 当前或接近当前的。 库处理由DBMS提供的操作和约束;(2)数据表示系统( 例如,ER图和关系模型)。
25
元数据

数据仓库体系结构

数据仓库体系结构

数据仓库体系结构数据仓库是一个用于集成、管理和分析大量数据的系统。

在数据仓库中,数据从不同的源系统中提取、转换和加载,然后存储在一个统一的、可供分析的数据存储中。

为了实现这一目标,数据仓库需要一个合理的体系结构来支持数据的整合、存储和查询等功能。

数据仓库体系结构由以下几个主要组成部分组成:1. 数据源:数据源是数据仓库的基础,它可以是内部系统的数据库、外部数据提供商的数据文件、Web上的数据源等。

数据源可以包括结构化数据(如关系型数据库中的表)和非结构化数据(如文本文件、图像文件等)。

2. 数据提取:数据提取是将数据从源系统中抽取出来并转换为数据仓库可以使用的格式的过程。

数据提取可以通过批处理、定时任务或实时流式传输等方式进行。

3. 数据转换:数据转换是将提取的数据进行清洗、集成和转换的过程。

在这个阶段,数据被清理、去重、标准化和转换为统一的格式和结构,以便在数据仓库中进行分析。

4. 数据加载:数据加载是将转换后的数据加载到数据仓库中的过程。

数据加载可以分为全量加载和增量加载两种方式,全量加载是将所有数据加载到数据仓库中,而增量加载是只加载发生变化的数据。

5. 数据存储:数据存储是数据仓库中数据的物理存储方式。

常用的数据存储方式包括关系型数据库、多维数据库和列式数据库等。

数据存储的选择应根据数据的特点、查询需求和性能要求等因素进行。

6. 元数据管理:元数据是描述数据仓库中数据的数据,它包括数据的结构、定义、来源、质量等信息。

元数据管理是对元数据进行收集、存储、管理和查询的过程,它是数据仓库管理的重要组成部分。

7. 数据访问:数据访问是用户通过查询、报表和分析等方式对数据仓库中的数据进行访问和分析的过程。

数据仓库可以提供多种数据访问方式,包括在线分析处理(OLAP)、数据挖掘和数据可视化等。

8. 安全性和权限管理:安全性和权限管理是保护数据仓库中数据安全和控制用户访问权限的过程。

数据仓库应具备完善的安全措施,包括身份认证、权限控制、数据加密和审计等功能。

数据仓库知识点总结

数据仓库知识点总结

数据仓库知识点总结一、数据仓库概念数据仓库是一个用来集成、清洗、存储和管理企业数据的系统,以支持企业决策制定、分析和商业智能服务。

它是一个面向主题的、集成的、时间性的、非易失的数据集合,用于支持企业决策。

数据仓库是企业数据管理的重要组成部分,它与操作型数据处理系统相辅相成。

数据仓库以不同的视角和角度组织数据,帮助企业管理者对企业整体情况进行全面分析和评估。

二、数据仓库的特点1. 面向主题:数据仓库与传统数据库相比,更加侧重对业务应用的支持,主要面向业务应用的主题而不是基本事务数据,以方便企业管理者进行更好的分析和决策。

2. 集成性:数据仓库集成了来自不同数据源的数据,将数据统一管理,并且进行了数据清洗和转换,确保数据的一致性和准确性。

3. 时态性:数据仓库中的数据具有时间性,可以保存历史数据,能够支持分析历史数据的趋势和变化。

4. 非易失性:数据仓库中的数据不会丢失,可以持久保存,并且根据需要定期备份,确保数据的安全和可靠。

5. 大数据量和复杂性:数据仓库通常包含大量的数据,并且数据之间的关系复杂,需要采用专门的数据模型和处理方法来管理和分析。

6. 以支持决策为目标:数据仓库的目标是为企业管理者提供数据支持,帮助他们更好地了解企业的经营状况和趋势,以支持企业决策。

三、数据仓库架构数据仓库架构包括了多个重要组成部分,主要包括数据提取、数据清洗、数据转换、数据加载、元数据管理和数据查询分析等。

1. 数据提取:数据提取是指从各个数据源中将需要的数据提取出来,数据源可以包括企业内部的数据库、文件系统、应用系统等,也可以包括外部数据源,如公共数据等。

2. 数据清洗:数据清洗是指对提取的数据进行清洗和规范,包括去重、校验、纠错、转换等处理,以确保数据的准确性和一致性。

3. 数据转换:数据转换是指对清洗后的数据进行格式转换、相关联和整合,以便于数据仓库的统一管理和分析。

4. 数据加载:数据加载是将转换后的数据载入数据仓库中,通常包括全量加载和增量加载两种方式,以确保数据的及时性和准确性。

数据仓库的设计与构建研究

数据仓库的设计与构建研究

数据仓库的设计与构建研究随着互联网技术的发展,数据量的快速积累和每天不断增长的数据趋势,数据管理变成了日益复杂的任务。

数据仓库便应运而生,成为了企业管理和数据分析的必然选择。

在企业的决策和战略制定中,数据仓库所扮演的角色越来越重要,也越来越值得重视。

一、数据仓库的概念数据仓库是指将企业各种分散的数据源汇集起来,进行预处理、汇总、加工、再分析处理等操作后进行存储的一个系统。

其目的是为了利用大数据环境下的企业数据,将其变成决策支持的信息,从而为企业决策提供可靠的数据支撑。

数据仓库结构主要包含以下几个重要组成部分:1. 数据源数据源是数据仓库的来源,包括操作性数据库、文件系统、网络、接口等等。

通过提取不同来源的数据,并将其汇总到仓库中进行统一存储、管理和维护,实现数据的集成化管理。

2. 数据加工处理数据加工处理是数据仓库中最为复杂的一部分,包括数据清洗、数据挖掘、数据转换、数据整合等等。

这一过程要求数据仓库管理员具有一定的数据处理能力,并且需要考虑多种因素的影响,例如数据量、类型、格式、质量等等。

3. 元数据元数据是指描述数据仓库的数据,包括数据类型、数据来源、数据转换规则、质量检验规则等等。

元数据的作用是对数据进行管理、维护、分发和使用,为数据共享和商业决策提供支持。

4. 多维分析多维分析是指对数据仓库中的数据进行分析、整理和处理,以便更好地展现数据的特征和规律。

多维分析可通过OLAP(联机分析处理)的方式对数据进行分析,再根据分析结果制定企业针对性的业务决策。

二、数据仓库的设计思路数据仓库的设计与构建需要全面考虑企业的业务需求和数据特点,通过规范化、标准化的方式来进行设计,使其能够满足企业需求,并为企业的决策提供支持。

1. 初步分析通过初步分析了解企业的业务场景和数据来源,以及研究需求和决策支持信息的种类、格式等,以便进一步确定数据仓库的设计。

2. 数据建模数据建模是数据仓库的核心,它需要根据不同的业务需求和对数据的认识,对数据进行分类、构建数据模型,以便完成数据转化的目标。

数据仓库的概念和体系结构概述

数据仓库的概念和体系结构概述

数据仓库的概念和体系结构概述数据仓库是指将企业各个部门和业务系统产生的大量数据进行整合、清洗、集成和存储,以满足企业决策分析和业务需求的信息系统。

数据仓库的设计和建设需要考虑到数据的整合、一致性、稳定性、易用性和安全性等方面的需求。

它是一个面向主题的、集成的、相对稳定的、可供企业管理者和决策者使用的数据集合。

1.数据源层:数据仓库的数据源可以来自企业内部的各个部门和业务系统,也可以来自外部的合作伙伴和第三方数据提供商。

数据源的选择和集成是数据仓库建设的关键环节,需要确定数据的提取方式、频率、粒度和格式等。

2.数据提取层:数据提取层负责从各个数据源中提取数据,并进行初步的清洗和转换。

数据提取可以通过批量处理、定时任务或实时流数据处理等方式进行。

在数据提取过程中,需要解决数据一致性、完整性和准确性等问题。

3. 数据集成层:数据集成层是将从各个数据源提取的数据进行整合和合并的地方。

这里的数据整合包括数据清洗、数据转换和数据聚合等操作。

数据集成层可以使用ETL(Extract、Transform、Load)工具进行数据的清洗和转换。

在数据集成层,还需要对数据进行一致性校验和冲突解决。

4.数据存储层:数据存储层是数据仓库最核心的组成部分,它负责存储整合后的数据。

数据存储层可以采用关系数据库、数据仓库等不同的技术来进行存储。

在设计数据存储层时,需要考虑到数据的存储结构、索引方式、数据分区和冗余备份等问题。

6. 数据访问层:数据访问层是用户直接访问数据仓库的接口,它提供了用户对数据仓库的查询、分析和报表生成等功能。

数据访问层可以使用OLAP(Online Analytical Processing)工具、报表工具、数据挖掘工具和BI(Business Intelligence)平台等进行实现。

7.数据安全层:数据安全是数据仓库设计和建设过程中必须要考虑的问题之一、数据安全层负责保护数据仓库中的数据不受未经授权的访问、修改和破坏。

数据仓库与ETL

数据仓库与ETL

数据仓库与ETL1.引言在当今信息时代,企业面临着大量的数据,这些数据需要有效地收集、存储和分析。

数据仓库是一种解决这一问题的常用方法,它能够集成多个数据源,提供高效的数据管理与分析能力。

本文将重点介绍数据仓库的概念、作用以及ETL(抽取、转换和加载)过程。

2.数据仓库的概念与作用数据仓库可以被看作是一个集成的、面向主题的、非易失的数据集合,它用于支持管理决策和业务分析。

数据仓库主要通过抽取、清洗、转换和加载数据,构建一个结构化、一致性和易于查询的数据存储,为企业提供决策支持和业务洞察。

3.数据仓库的架构数据仓库的架构分为三层:数据源层、数据集成层和数据存储层。

数据源层包括各类数据源,如关系数据库、文件、传感器等;数据集成层通过ETL过程,将数据从数据源层抽取到数据仓库中;数据存储层包括数据仓库和数据集市,为用户提供数据查询和分析的能力。

4.ETL过程ETL是构建数据仓库的核心过程,包括抽取(Extract)、转换(Transform)和加载(Load)三个步骤。

抽取阶段将数据从不同数据源中提取出来;转换阶段对数据进行清洗、整合和变换;加载阶段将转换后的数据加载到数据仓库中。

ETL过程非常重要,它确保了数据仓库中的数据质量和一致性。

5.数据仓库的优势数据仓库具有以下几个优势:(1)集成性:数据仓库可以集成不同数据源中的数据,实现数据的统一管理和查询分析。

(2)高性能:数据仓库采用了优化的数据存储和查询机制,能够提供高性能的数据访问能力。

(3)决策支持:数据仓库为企业提供了全面、准确的数据,支持管理者做出正确的决策。

(4)灵活性:数据仓库的数据模型和查询方式可以根据业务需求进行灵活调整,满足不同用户的需求。

6.数据仓库的应用数据仓库广泛应用于企业的各个领域,包括市场营销、客户关系管理、风险管理、供应链管理等。

通过数据仓库,企业可以进行数据挖掘、预测分析、业务报表等多种分析应用,提升业务效率和竞争力。

数据仓库概要设计

数据仓库概要设计

数据仓库概要设计数据仓库(Data Warehouse)是指把企业分散在不同数据库中的数据统一整合到一个数据库中进行存储和管理,并对这些数据进行分析和管理的一种数据库应用系统。

数据仓库的建设是企业信息化建设的重要组成部分,是企业对内部外部信息资源进行整合、挖掘和利用最有效的平台之一。

因此,进行数据仓库的概要设计是非常重要的一步。

1.数据仓库概述数据仓库,是一个能够存储大量历史数据的集合体,使得企业能够快速地进行数据分析、查询和决策。

数据仓库通常包括存储、管理和查询技术。

数据仓库的设计是基于自底向上的过程,通过收集各种应用中的数据来建立。

数据仓库的需求分析是设计的第一个步骤,通过需求分析可以把握到数据的来源、数据的主要特征、数据的处理方法、数据的处理效果等。

2.数据仓库的工作过程a.数据的收集数据收集的目的是获取各个分散在企业内部外部的数据源,并把这些数据源整合成数据集。

数据收集包括了跟踪源数据、数据的标准化、数据的清洗、数据的转换等。

b.数据的整合数据整合意味着将不同的数据源集成到一起,通常是通过ETL工具来实现。

ETL(Extract, Transform, Load)工具的主要功能是提取、转换和加载。

c.数据的存储数据仓库的存储方式一般有两种:关系型数据库和非关系型数据库。

d.数据的查询与分析数据仓库的用户可以通过BI工具(Business Intelligence)来进行数据的查询、分析和报表生成。

3.数据仓库的概要设计步骤a.数据仓库设计的第一步是需求分析,需求分析的目的是明确数据仓库的目标、范围和需求。

需求分析应该包括数据仓库的使用者、数据仓库所需数据的类型、数据的来源、数据的质量要求等。

b.数据仓库的概念设计是在需求分析的基础上,开始进行数据仓库的抽象模型的设计。

概念设计包括了数据仓库的模型设计、元数据的设计等。

c.数据仓库的逻辑设计是在概念设计的基础上,开始进行数据仓库的逻辑结构的设计。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
维度层次越高、代表的数据综合度越高,数据量 越少。
维度层次越低、代表的数据综合度越低,细节越 充分,数据量越多。
有关操作:“上卷”(roll_up)、“下钻”( drill_down)、“钻过”(drill_across)和“ 钻透”(drill_through)等。
2020/8/11
数据仓库与数据挖掘
部门 部门1 部门2 2020/8/11 部门3
表1 (单位:万美元)
部门
销售
部门1
90
部门2
60
部门3
下 钻
80
上 卷
2004年
1季度
2季度
3季度
20
20
35
25
5
15
20 数据仓库与1数5 据挖掘 18
4季度
15
15
27
24
OLAP根据其存储数据的方式可分为 三类:ROLAP、MOLAP、HOLAP
维度是数据仓库中识别数据的索引。 维度具有层次性。 可以根据数据的组织层次进行“上卷”或“下钻” ,了解具体信息。
维是人们观察数据的特定角度
2020/8/11
数据仓库与数据挖掘
12
3.数据立方体
从不同角度对同一数据进行观察得到的数据 交点,构成了数据立方体。
当观察的角度(参数)超过三个所构成的数 据结果集称为超立方体,也称为超维数据集。

2002年
2003年
1季度 2季度 3季度 4季度 1季度 2季度 3季度 4季度
北京市 123 56
45
66 134 56
23
55
上海市 134 103
98
87 102 139 97
82
天津市 67
73
59
96
73
69
62
94
1季度
2002 2003
北京市 123
134
上海市 134
102
天津市 67
SQL查询
Database 服务器
查询结果
前端工具
Load
OR
SQL查询 MOLAP 服务器 用户请求
2020/8/11
查询结果 数据仓库与数据挖掘 查询结果
28
OLAP工具
2020/8/11
数据仓库与数据挖掘
29
1.3 数据仓库的技术、方法与产品
数据仓库实施中的三个关键环节
数据抽取; 数据存储与管理 数据表现
历史数据
不更新,但周期性刷新 一次处理的数据量大
响应时间合理 面向分析,分析驱动
2020/8/11
数据仓库与数据挖掘
10
OLAP技术的有关概念 :多维数据集、
维度、数据立方体、度量值和多维分析

1.多维数据集是数据的集合(多维数组)
多维数据集是决策支持的依据,也是OLAP的核 心。
OLAP展现的结果是一幅幅多维视图。
查询结果
2020/8/11
数据仓库与数据挖掘
26
2. MOLAP体系结构 将OLAP分析所用到的多维数据物理上存储
为多维数组的形式,形成“立方体”的结 构。维的属性值被映射成多维数组的下标 值或下标的范围,而总结数据作为多维数 组的值存储在数组的单元中。由于MOLAP采 用了新的存储结构,从物理层实现起,因 此又称为物理OLAP(physical olap)。
库中并根据应用的需要有选择地定义一批 实视图作为表也存储在关系数据库中。不 必要将每一个sql查询都作为实视图保存, 只定义那些应用频率比较高、计算工作量 比较大的查询作为实视图。
Database 服务器
ROLAP 服务器
SQL查询
用户请求
前端工具
查询结果
Metadata Request Processing
4季度
55 8库与数据挖掘
19
旋转后的维方向(不同维度间的旋转操作

2002年
2003年
1季度 2季度 3季度 4季度 1季度 2季度 3季度 4季度
北京市 123 56
45
66 134 56
23
55
上海市 134 103
98
87 102 139 97
82
天津市 67
2020/8/11
数据仓库与数据挖掘
16
服装切片
产品
北京 上海 江苏
12 3 4
销售数量: 10000
化妆品 玩具 服装 电器
时间(月)
2020/8/11
数据仓库与数据挖掘
17
(2)多维的切块
与切片类似,如果在一个多维数据集上对两个及 其以上的维选定维成员的操作称为切块。
如有多维数据集(维1,维2,……,维i,…… ,维k,……,维n,观察变量),对维i,…… ,维k,选定了维成员,那么(维1,维2,…… ,维i成员,……,维k成员,……,维n,观察 变量)就是多维数据集(维1,维2,……,维i ,……,维k,……,维n,观察变量)在维i, ……,维k上的一个切块。
73
2季度 2002 2003
56
56
103 139
73
69
3季度 2002 2003
45
23
98
97
59
62
4季度 2002 2003
66
55
87
82
96
94
2020/8/11
数据仓库与数据挖掘
21
(4)其它OLAP操作
维度是有层次性的,如时间维可能由:年、季、 月、日构成,维度的层次反映了数据的综合程度 。
2020/8/11
数据仓库与数据挖掘
30
从数据仓库的概念结构看,应该包含: 数据源、数据准备区、数据仓库数据库 、数据集市/知识挖掘库以及各种管理工
具和应用工具。
业务系
数据源

外部数 据源


数据
据 准 备
据 仓 库 数
集市/ 知识 挖掘 库
应用工具



数据
集市/
知识
应用工具
挖掘

管理工具
图1.1 数据仓库的概念结构
Database 服务器 Load MOLAP 服务器 用户请求
前端工具
2020/8/11
查SQ询L查结询果数据仓P库MRr与oeectq数aeudse据saistnt挖ag 掘
查询结果
27
3. HOLAP体系结构
由于molap和rolap有着各自的优点和缺点,且它们
的结构迥然不同,这给分析人员设计olap结构提
2020/8/11
数据仓库与数据挖掘
2
1.1 数据仓库的概念、特点与组成
数据仓库的特点:
面向主题; 集成的; 相对稳定的; 反映历史变化。
2020/8/11
数据仓库与数据挖掘
3
2020/8/11
数据仓库与数据挖掘
4
数据库与数据仓库的比较
数据库
细节的 在存取时准确的
可更新的 一次操作数据量小
2020/8/11
数据仓库与数据挖掘
18
(3)旋转
改变多维数据集显示的维方向。 旋转前的维方向
1季度
北京市 123 上海市 134 天津市 67
2002年 2季 3季度 度
56 45 103 98 73 59
4季度
66 87 96
2003年 1季度 2季度 3季度
134 56 23 102 139 97 73 69 62
MOLAP是以多维数据库的方式组织存储数 据
ROLAP是利用现有的关系数据库技术来模 拟多维数据。
HOLAP是一混合模式,对于常用的维度和 维层次,使用多维数据表来记录,对于 用户不常用的维度和数据,采用类似 ROLAP星型结构来存储。
2020/8/11
数据仓库与数据挖掘
25
1. ROLAP体系结构 OLAP将分析用的多维数据存储在关系数据
多维数据集可以用一个多维数组表示。例如经典 的时间、地理位置和产品的多维数据集可以表示 为:(时间,地理位置,产品,销售数据),类 似地,其它多维数据集可表示为:(维1,维2, 维3,……,维n,观察变量)形式。
2020/8/11
数据仓库与数据挖掘
11
2.维度
数据仓库是用于决策支持的,管理人员在进行 决策分析时,经常需要选择一个对决策支持活动有 重要影响的因素去进行决策分析,这些决策因素就 构成了分析问题的角度,这些分析角度就是数据仓 库中的维度。从而构成了三维、多维空间。
第1章 数据仓库的 概念与体系结构
2020/8/11
数据仓库与数据挖掘
1
1.1 数据仓库的概念、特点与组成
数据仓库的概念
数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相 对稳定的(Non-Volatile)、反映历史变 化(Time Variant)的数据集合,通常用 于辅助决策支持(DDS)
面向应用 支持管理
数据仓库
综合或提炼的 代表过去的数据
不更新 一次操作数据量大
面向分析 支持决策
2020/8/11
数据仓库与数据挖掘
5
1.1 数据仓库的概念、特点与组成
数据仓库的组成:
数据仓库数据库; 数据抽取工具; 元数据:技术元数据与业务元数据; 访问工具; 数据集市(Data Marts); 数据仓库管理; 信息发布系统。
数据仓库与数据挖掘
14
5.多维分析 OLAP的多维分析是指对多维数据集中的数
据用切片、切块、旋转等方式分析数据。 使用户能从多个角度、多个侧面去观察数
相关文档
最新文档