第4章 联机分析处理

合集下载

联机分析处理

联机分析处理

联机分析处理简介联机分析处理,英文名称为On-Line Analysis Processing,简写为OLAP。

随着数据库技术的发展和应用,数据库存储的数据量从20世纪80年代的兆(M)字节及千兆(G)字节过渡到现在的兆兆(T)字节和千兆兆(P)字节,同时,用户的查询需求也越来越复杂,涉及的已不仅是查询或操纵一张关系表中的一条或几条记录,而且要对多张表中千万条记录的数据进行数据分析和信息综合,关系数据库系统已不能全部满足这一要求。

操作型应用和分析型应用,特别是在性能上难以两全,人们常常在关系数据库中放宽了对冗余的限制,引入了统计及综合数据,但这些统计综合数据的应用逻辑是分散而杂乱的、非系统化的,因此分析功能有限,不灵活,维护困难。

在国外,不少软件厂商采取了发展其前端产品来弥补关系数据库管理系统支持的不足,他们通过专门的数据综合引擎,辅之以更加直观的数据访问界面,力图统一分散的公共应用逻辑,在短时间内响应非数据处理专业人员的复杂查询要求。

1993年,E.F.Codd(关系数据库之父)将这类技术定义为“联机分析处理”。

作用联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。

它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。

决策数据是多维数据,多维数据就是决策的主要内容。

OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。

联机分析处理具有灵活的分析功能、直观的数据操作和分析结果可视化表示等突出优点,从而使用户对基于大量复杂数据的分析变得轻松而高效,以利于迅速做出正确判断。

它可用于证实人们提出的复杂的假设,其结果是以图形或者表格的形式来表示的对信息的总结。

OLAP(联机分析处理)

OLAP(联机分析处理)

OLAP(联机分析处理)数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing); OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。

通俗的讲,就是对数据的增删改查等操作。

OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。

是对数据按不同维度的聚合,维度的上钻,下卷等。

OLAP可以分为ROLAP,MOLAP和HOLAPROLAP:使用关系型数据库或者扩展的关系型数据库来管理数据仓库数据,而OLAP中间件支持其余的功能。

ROLAP包含了每个后端关系型数据库的优化,聚合,维度操作逻辑的实现,附件的工具以及服务等。

所以ROLAP比MOLAP有更好的可伸缩性。

比较典型的ROLAP有mondrian, Presto(facebook)。

目前阿里的DRDS也可以看作是ROLAP的框架MOLAP:通过基于数据立方体的多位存储引擎,支持数据的多位视图。

即通过将多维视图直接映射到数据立方体上,使用数据立方体能够将预计算的汇总数据快速索引。

比较典型的MOLAP框架有kylin(apache), Lylin(ebay)、pinot(linkedin)和druid也就是说MOLAP是空间换时间,即把所有的分析情况都物化为物理表或者视图,查询的时候直接从相应的物化表中获取数据,而ROLAP则通过按维度分库,分表等方式,实现单一维度下的快速查询,通过分布式框架,并行完成分析任务,来实现数据的分析功能。

MOLAP 实现较简单,但当分析的维度很多时,数据量呈指数增长,而ROLAP在技术实现上要求更高,但扩展性也较好。

HOLAP:混合OLAP结合ROLAP和MOLAP,得益于ROLAP 较大的可伸缩性和MOLAP的快速查询。

第4章联机分析处理(OLAP)new精品PPT课件

第4章联机分析处理(OLAP)new精品PPT课件

2 OLAP多维数据结构
2.2 两种结构的使用
• 两者的实际使用情况
– 一般来说,多立方结构灵活性较大,但超立方结构更易于理 解。
– 终端用户更容易接近超立方结构,它可以提供高水平的报告 和多维视图。但具有多维分析经验的MIS专家更喜欢多立方 结构,因为它具有良好的视图翻转性和灵活性。
– 多立方结构是存储稀疏矩阵的一个更有效方法,并能减少计 算量。因此,复杂的系统及预先建立的通用应用倾向于使用 多立方结构,以使数据结构能更好地得到调整,满足常用的 应用需求。
– 用户的决策分析需要对关系数据库进行大量计算才能得 到结果,而OLTP查询的结果并不能满足决策者提出的需 求。因此,E.F.Codd提出了多维数据库和多维分析的概 念,即OLAP。
1 OLAP定义和特性 1.2 OLAP与OLTP的比较
事务型处理数据 细节的 在存取瞬间是准确的 可更新 操作需求事先可知道 生命周期符合SDLC 对性能要求高 一个时刻操作一个单元 事务驱动 面向应用 一次操作数据量小 支持日常操作
分析型处理数据 综合的,或提炼的 代表过去的数据 不可更新,只读的 操作需求事先不知 完全不同的生命周期 对性能要求宽松 一个时刻操作一组数据 分析驱动 面向分析 一次操作数据量大 支持管理需求
1 OLAP定义和特性
1.3 OLAP定义和目标
• 定义1
– OLAP (Online Analytical Processing)是针对特定问题的联机数 据访问和分析。通过对信息(维数据)的多种可能的观察形式进 行快速、稳定一致和交互性的存取,允许管理决策人员对数据 进行深入观察。
1 OLAP定义和特性
1.5 OLAP特性
• 快速性
– 用户对OLAP的快速反应能力有很高的要求。系统应能在5秒内对用户 的大部分分析要求做出反应。

联机分析处理

联机分析处理

联机分析处理(英语:On-Line Analytical Processing,简称OLAP),是一套以多维度方式分析数据,而能弹性地提供积存(英语:Roll-up)、下钻(英语:Drill-down)、和透视分析(英语:pivot)等操作,呈现集成性决策信息的方法,多用于决策支持系统、商务智能或数据仓库。

其主要的功能,在于方便大规模数据分析及统计计算,对决策提供参考和支持。

与之相区别的是联机交易处理(OLTP)。

∙OLAP需以大量历史数据为基础配合上时间点的差异并对多维度及汇整型的信息进行复杂的分析。

∙OLAP需要用户有主观的信息需求定义,因此系统效率较佳。

OLAP的概念,在实际应用中用广义和狭义两种不同的理解。

广义上的理解与字面意思相同,即针对于OLTP而言,泛指一切不对数据进行输入等事务性处理,而基于已有数据进行分析的方法。

但更多的情况下OLAP是被理解为其狭义上的含义,即与多维分析相关,基于立方体(CUBE)计算而进行的分析。

联机分析处理系统OLAP概述

联机分析处理系统OLAP概述

OLAP概述 OLAP分析,又称多维分析,是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。

OLAP也可以简单定义成使用户能够以多维视图分析数据的工具。

通常用来进行多维分析的维有时间、地点、产品、度量值(如销售额)等。

例如,在销售经理查看销售数据时,他可能想了解某个产品在某个地区、某段时间的销售额,并通过交叉表的功能来按不同的维对销售数据进行分析和通过挖掘功能来了解深层次的信息。

图3-20:数据的多维形式通过三维方式展现数据,并在此基础上进行分析,能够揭示出在二维方式下隐藏的关系;并通过方便的数据导航功能,使用户更易比较数据变量之间的关系,从而可以发现数据中隐藏的信息。

关系型数据库往往不能支持对数据进行逻辑分析和统计分析。

而采用OLAP系统,用户无须编程就可以定义新的逻辑、统计等方面的计算,并可将其做为分析的一部分,并以用户理想的方式给出报告。

用户可以在OLAP平台上进行数据分析,也可以连接到其他外部分析工具上,如时间序列分析工具、数据挖掘工具等。

OLAP产品根据其实现多维分析的技术以及要实现的目标而分为三类:  (1)、MOLAP(多维联机分析处理)。

MOLAP将事务型数据进行综合,通过多维结构的“立方体”的数据结构来储存经综合的数据。

MOLAP通过其层次型数据库及在内存内的索引来保障数据访问的性能。

用户可以利用数据导航工具来进行钻取、交叉查询及产生关于“立方体”的报告。

根据MOLAP的技术特点,MOLAP擅长于对一定数量的数据进行大量、复杂、快速的、反复的分析。

MOLAP通常用来进行假设分析和问题求解,如在预算应用中。

 图3-21:MOLAP架构图(2)、ROLAP(关系型联机分析处理)。

ROLAP在分析数据是直接到关系型数据库中取数据,而不建立自己的“立方体”。

什么是联机分析处理(OLAP)

什么是联机分析处理(OLAP)

OS Java CORBA COM+ Middleware XML&WebService Patterns ONE&NET P2P Development Database Download Doc什么是联机分析处理(OLAP )(转载自北大高科网站,/)联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd 于1993年提出的,他同时提出了关于OLAP 的12条准则。

OLAP 的提出引起了很大的反响,OLAP 作为一类产品同联机事务处理 (OLTP) 明显区分开来。

当今的数据处理大致可以分成两大类:联机事务处理OLTP (on-line transaction processing )、联机分析处理OLAP (On-Line Analytical Processing )。

OLTP 是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。

OLAP 是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。

下表列出了OLTP 与OLAP 之间的比较。

OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。

OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是"维"这个概念。

“维”是人们观察客观世界的角度,是一种高层次的类型划分。

“维”一般包含着层次关系,这种层次关系有时会相当复杂。

通过把一个实体的多项重要的属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。

因此OLAP也可以说是多维数据分析工具的集合。

OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill across、drill through 等。

第4章 联机分析处理概述及模型


2015-4-20
39
3. 事实群模型
在某些复杂应用中,可能需要多个事实表来共享维
表,这种模型类似于星形模型的集合,被称之为星
系模型或事实群模型。 销售事实表和货运事实表共享时间维、产品维和地 区维举例。
2015-4-20
40
3. 事实群模型(续)
2015-4-20
41
4.3 多维分析操作
常见的度量有:销售量、供应量、营业额等。
通常是具体数据值。
城市
北京 长沙 武汉 广州 上海 果汁 可乐 毛巾 浴巾 牛奶 2015-4-20
究竟想了解什么?
商品
1 2
3
4
21
日期
2. 度量(续)
2015-4-20
22
3. 数据立方体
多维数据模型构成的多维数据空间称作为数据立方 体(Data Cube,简记为cube)。
2015-4-20
13
1. 维(续)
维成员(member) 维由一些维成员构成。维的一个取值称为维的一个
成员。如果维已经分成了若干个维层次,那么维成
员就是不同维层次取值的组合。
城市
北京 长沙 武汉 广州 上海 果汁 可乐 毛巾 浴巾 牛奶 2015-4-20
商品、城市、日期维 工业 国家 年
多维数据模型是一个多维空间。 核心概念主要涉及:维、维成员、维层次、度量等。
2015-4-20
12
1. 维
维是人们观察数据的特定角度,是每个事物的属性。 如:在分析产品销售数据时,需要知道在什么时候?
什么地区?销售什么产品?就涉及到观察的时间、
地区、产品三个角度。 维是商业活动中的一个基本要素。 每个维都有一个唯一的名字,如:时间维、地区维、 产品维等。

4联机分析处理(NEW)


Dept. of Computers,CUIT
OLAP基本概念 基本概念
数据分析模型 ฀ ฀ ฀ ฀ OLAP的提出 多维数据结构 多维数据操作 多维数据模型的实现
Dept. of Computers,CUIT
多维数据模型
多维数据模型又称多维概念视图,通常用Cube Cube来表示。 Cube 多维数据模型可以更加直观的表示现实中的复杂关系 多维数据模型的基本组成:维、度量(变量、指标) 举例:计算每一个商场、每个产品的销售额
Dept. of Computers,CUIT
维层次和类的区别( 维层次和类的区别(续1) )
分析动作不同
按维层次进行分析
逐层向上综合数据;逐层向下细化数据;
按维成员的类进行分析
选择类属性对维成员全集进行分类 对同类维成员归纳出共同的特性 按类进行分析不能跨维层次,只在同层次(兄弟结点)进行
将维层次与类交叉组合进行分析(见下图)
解释模型(Exegetical Model) 解释模型( Model) ฀ ฀ ฀ 支持工具较多 静态数据分析 利用已有的多层次路径层层细化,找出事实
发生的原因
Dept. of Computers,CUIT
数据分析模型:思考模型 数据分析模型:
思考模型(Contemplative Model)฀ 思考模型( Model) 支持工具较少฀ 动态数据分析(动态性较低)฀ 在一维或多维上引入变量或参数,分析引入 后会发生什么฀ 引入变量时,须创建大量综合数据
按照一定维层次结构和度量(事实)的逻辑上的组织฀ 其逻辑上相当于一个多维数组
Dept. of Computers,CUIT
数据立方体(Cubes)(续) 数据立方体 (

第四章联机分析处理精选全文完整版

地区 北京 上海 地区 北京 上海 时间 产品 销售量 销售量 时间 第一季度 第二季度 ....... 产品 第一季度 : 第二季度 : (b) :
4.1 从OLTP到OLAP
4.1.1 OLAP的出现 4.1.2 什么是OLAP 4.1.3 OLTP和OLAP的关系及比较
4.1.1 OLAP的出现
1970年,E.F.Codd博士提出了关系数据模型,1979年Oracle发布了关系数据库管理系统 OLTP推动了业务处理自动化,积累了大量的数据
基本概念(续)
数据单元(单元格) 多维数组的取值称为数据单元 (维1维成员,维2维成员 ,···,维n维成员,变量的值) 数据单元:(北京,1997年1月,批发,10000)
基本概念(续)
多维分析是指对以多维形式组织起来的数据采取切片、切块、旋转等各种分析动作,以求剖析数据,使最终用户能从多个角度、多侧面地观察数据库中的数据,从而深入地了解包含在数据中的信息、内涵
: :
多维分析的基本分析动作
图6-3: 旋转
地区维
时间维
产品维
产品维
时间维
地区维
旋转以改变 页面显示
(c)
OLAP的多维数据的位置: 1. 作为数据仓库的一部分 2. 作为数据仓库工具层的一部分
第四章 在线分析处理OLAP
联机分析处理(OLAP)
4.1 从OLTP到OLAP 4.2 OLAP的特征及衡量标准 4.3 OLAP实施 4.4 基于多维数据库的OLAP实现 4.5 基于关系数据库的OLAP实现 4.6 两种技术间的比较
联机分析处理(OLAP)
决策支持中的典型问题: 东部地区和西部地区今年6月份和去年6月份在销售总额上的对比情况,并且销售额按10万-20万、20万-30万、30万-40万,以及40万以上分组 特点: 多角度 多层次 访问大量数据 快速回答

数据仓库,联机分析处理,数据挖掘Data WarehousingPPT演示文稿

中到低
每个事务只访问少量记 有的事务可能要访问大

量记录
以秒为单位计量
以秒、分钟、甚至小时 为计量单位
12
• 尽管OLTP系统和数据仓库有着许多不同的特性且 基本构建思想不同,但是他们却是紧密联系的,因 为OLTP系统是数据仓库的数据来源。
• OLTP系统并不是为了快速回答查询,也不是为了 存储分析趋势的历史数据而创建的。一般的, OLTP提供了大量的原始数据,这些数据不易被分 析。
9
d) non-volatile 数据的非易失性
• 数据仓库的非易失性是指数据仓库的数据不进行更 新处理,而是一旦数据进入数据仓库以后,就会保 持一个相当长的时间。因为数据仓库中数据大多表 示过去某一时刻的数据,主要用于查询、分析,不 像业务系统中的数据库那样,要经常进行修改、添 加,除非数据仓库中的数据是错误的。
10
e) in support of management dec的组织的根本目的在于对决策的支持。 高层的企业决策者、中层的管理者和基层的业务 处理者等不同层次的管理人员均可以利用数据仓 库进行决策分析,提高管理决策的质量。
• 企业管理人员可以利用数据仓库进行各种管理决 策的分析,利用自己所特有的、敏锐的商业洞察 力和业务知识从貌似平淡的数据发现众多的商机。 数据仓库为管理者利用数据进行管理决策分析提 供了极大的便利。
2
数据仓库的引出 1.传统数据库以及OLTP(On-Line Transaction Processing 联机事务处理)在日常的管理事务处理中 获得了巨大的成功,但是对管理人员的决策分析要 求却无法满足。 2.因为,管理人员常常希望能够通过对组织中的大 量数据进行分析,了解业务的的发展趋势。而传统 数据库只保留了当前的业务处理信息,缺乏决策分 析所需要的大量的历史信息。 3.为满足管理人员的决策分析需要,就需要在数据 库的基础上产生适应决策分析的数据环境——数据 仓库(Data Warehose)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多维分析中的一些基本概念
1. 变量 变量是数据的实际意义,即描述数据“是 什么”。 变量总是一个数值度量指标,例如人数、 单价、销售量等都是变量,而100则是变量 的一个值。
多维分析中的一些基本概念
2.维 维是人们观察数据的特定角度。 例如:
企业常常从时间的角度来观察产品的销售,所 以时间是一个维(时间维)。 企业也时常从地理分布的角度来观察产品的销 售,所以地理分布也是一个维(地理维)。 还有如产品维、顾客维等。
引言: 多维分析
决策者希望能从多个角度观察某一指标或多个指 标的值,并且找出这些指标之间的关系 如:“东北地区和西南地区今年一季度和去年一季 度在销售总额上的对比情况,并且销售额按10 万~50万、50万~100万以及100万以上分组” 决策所需数据总是与一些统计指标如销售总额、 观察角度(如销售区域、时间)和不同级别的统计 有关,我们将这些观察数据的角度称之为维。 联机分析处理(OLAP)使经理和分析人员可以交互 地检查和利用大量具体的、经过处理的多维数据。
OLTP与OLAP的比较
OLTP 用户 功能 DB 设计 数据 存取 工作单位 用户数 DB 大小 操作人员,低层管理人员 日常操作处理 面向应用 当前的、最新的、细节的、二 维的、分立的 读/写数十条记录 简单的事务 上千个 100MB~1GB OLAP 决策人员,高级管理人员 分析决策 面向主题 历史的、聚集的、多维的、集成 的、统一的 读上百万条记录 复杂的查询 上百个 100GB~1TB
MOLAP和ROLAP的优点和缺点比较
ROLAP 沿用现有的关系数据库的技术 响应速度比MOLAP慢; 现有关系型数据库已经对OLAP做了很多优化, 包括并行存储、并行查询、并行数据管理、基 于成本的查询优化、位图索引、SQL 的OLAP扩 展(cube、rollup)等,性能有所提高 数据装载速度快 存储空间耗费小,维数没有限制 借用RDBMS存储数据,没有文件大小限制 可以通过SQL实现详细数据与概要数据的存储 不支持有关预计算的读写操作 SQL无法完成部分计算 无法完成多行的计算 无法完成维之间的计算 维护困难 MOLAP 专为OLAP所设计
OLAP的基本分析操作——切片
产品 销售额 产品
销售额
时间
地区
地区
(地区,产品,销售量)切片
OLAP的基本分析操作——切块
定义:在多维数组的某一维上选定某一区间的维 成员的动作称为切块,即限制多维数组的某一维 的取值区间 例如选定多维数组(地区,时间,产品,销售渠道, ( 销售额)中的地区维、时间维与产品维.在另外的 销售渠道维,选取一个维成员(如“批发”)就得 到了多维数组(地区,时间,产品,销售渠道,销 售额)在地区、时间和产品三个维上的一个切块 (地区,时间,产品,销售额)。这个切块表示各 地区、各产品在各个年度的批发销售情况。
联机分析处理是数据仓库系统的一种 应用
联机分析处理直接仿照用户的多角度思考 模式,预先为用户组建多维的数据模型
例如对销售数据的分析,时间周期是一个维度, 产品类别、分销渠道、地理分布、客户群类也 分别是一个维度。
一旦多维数据模型建立完成,用户可以快 速地从各个分析角度获取数据,也能动态 的在各个角度之间切换或者进行多角度综 合分析,具有极大的分析灵活性。
多维分析
引例
在一次股东会议上,百事可乐公司(Pepsi Co)的首席执行官韦思.加洛韦(D. Wayne Calloway)说:“10年前.我可以告诉你们 立体脆(Doritos)在密西西比州西部的销售 情况。今天,我不但可以告诉你们立体脆 在密西西比州西部销售得多么好,而且还 可以告诉你们它们在加利福尼亚、在奥伦 奇城、在欧文县,以及每周四在本地Vons 超市第四通道的促销中销售得多么好。”
UDM数据源
数据源包括服务器名称、数据库名称以及 数据库登录身份认证等内容。 访问不同的数据库需要使用不同的OLE DB Provider,
本章内容
OLAP的基本概念 OLAP与多维分析 OLAP的分类 OLAP的特性与不足 SQL Server 2005统一维度模型
OLAP的基本概念
OLAP的发展背景
联机事务处理(OLTP,On-line Transaction Processing)应用积累了大量数据 如何从这些海量业务数据中提取对企业决策分 析有用的信息成为企业决策管理人员所面临的 重要难题。 数据仓库技术的发展 以支持决策管理分析为主要目的应用迅速崛起 联机分析处理的概念最早由关系数据库之父 E.F. Codd于1993年提出的
时间维具有日期、月份、年这三个层次,分别在日期、 月份、年上各取一个值组合起来,就得到了时间维的一 就得到了时间维的一 个维成员: 某年某月某日” 个维成员:“某年某月某日”。 一个维成员并不一定在每个维层次上都要取值,例如 “某年某月”、“某月某日”、“某年”等等都是时间 维的维成员。
对应一个数据项来说,维成员是该数据项在某维中 位置的描述。例如
OLAP的基本分析操作——旋转
旋转即改变一个报告或页面显示的维方向。 例如:
旋转可能包含交换行和列 或是把某一个行维移到列维中去
OLAP的基本分析操作——旋转
OLAP的基本分析操作——钻取
钻取是改变维的层次,变换分析的粒度。它包括 上卷(roll up)和下钻(drill down)。 上卷是在某一维上将低层次的细节数据概括到高 层次的汇总数据,或者减少维数; 下钻则相反,它从汇总数据深入到细节数据进行 观察或增加新维。 例如销售数据,可以按月聚集(上卷)销售数据。 反过来,给定时间为划分成月份的数据表示,可 能希望将月销售总和分解(下钻)成日销售总和, 当然,这要求基本销售数据的时间粒度是按天的。
多维分析中的一些基本概念
6.数据单元(单元格) 多维数组的取值称为数据单元。
当多维数组的各个维都选中一个维成员,这些维成员 的组合就唯一确定了一个变量的值。那么数据单元就 可以表示为(维1维成员,维2维成员,……维n维成员, 维成员, 维成员, 维成员, 维 维成员 维成员 维 维成员 变量的值)。 变量的值 例如,在产品、地区、时间和销售渠道上各取维成员 “牙膏”、“上海”、“1998年12月”和“批发”, 就唯一确定了变量“销售额”的一个值(假设为 100000),则该数据单元可表示为(牙膏,上海,1998 牙膏, 牙膏 上海, 年12月,批发,100000)。 月 批发,
第4章
联机分析处理 (OLAP)
华南理工大学 廖开际
kaiji@
教学目标
掌握联机分析处理的基本概念 掌握多维分析方法。
教学要求
知识要点 OLAP的基本 概念 能力要求 掌握OLAP的基本 概念 掌握多维分析的基 本操作 相关知识点 (1) 维 (2) 多维数据集 (3) 多维数据集的度量 (1) 切片、切块 (2) 旋转 (3) 钻探
OLAP的特性
多维数据库
以变量、维度、层次结构和多维数据集为中心 进行构造的数据库,而不是以表、行,列和关 系为中心
预处理聚合 方便理解
OLAP的不足
管理复杂 需要数据集市 延迟 只读
SQL Server 2005统一维度模型
在SQL Server 2005中,Microsoft引入了统 一维度模型(UDM,Unified Dimensional Model)技术。 UDM用来提供OLAP系统的所有优点,包 括多维存储和预处理聚合。 UDM也避免了传统OLAP系统的很多缺点。
多维分析中的一些基本概念
3.维的层次 一个维往往具有多个层次 例如:
日期、月份、季度、年等就是时间维的层次; 城市、地区、国家等构成了地理维的层次。
多维分析中的一些基本概念
4.维成员 维的一个取值称为该维的一个维成员。 如果一个维是多层次的,那么该维的维成员是由各 个不同维层次的取值组合而成。例如:
性能好、响应速度快
数据装载速度慢 需要进行预计算,可能导致数据爆炸,维 数有限;无法支持维的动态变化 受操作系统平台中文件大小的限制,难以 达到TB 级(只能10~20g) 缺乏数据模型和数据访问的标准 支持高性能的决策支持计算 复杂的跨维计算 多用户的读写操作 行级的计算 管理简便
HOLAP
混合型OLAP(HOLAP) 把MOLAP和 ROLAP两种结构的优点结合起来。 HOLAP结构不应该是MOLAP与ROLAP结 构的简单组合,而是这两种结构技术优点 的有机结合,能满足用户各种复杂的分析 请求。
理解数据立方
如果保持立方体的某些坐标轴的值不变而 改变另外某一个轴,便可以看到度量在不 同维上的变化情况。
OLAP的基本分析操作——切片
定义:在多维数组的某一维上选定一维成员的动 作称为切片,即在多维数组(维l,维2,…,维n, 变量)中选一维,如维i,并取其一维成员(设为 “维成员Vi”),所得的多维数组的子集(维1,…, 维成员Vi,…维n,变量)称为在维i上的一个切片。 一个多维数组的切片最终是由该数组中除切片所 在平面两个维之外的其他维的成员值确定的。 维是观察数据的角度,那么切片的作用或结果就 是舍弃一些观察角度,使人们能在两个维上集中 观察数据。
ROLAP
ROLAP将分析用的多维数据存储在关系数 据库中,并根据应用的需要有选择的定义 一批实视图作为表也存储在关系数据库中。 查询效率高。 ROLAP主要通过一些软件工具或中间软件 实现,物理层仍采用关系数据库的存储结 构,因此称为虚拟OLAP(VirtualOLAP)。
MOLAP
MOLAP将OLAP分析所用到的多维数据物 理上存储为多维数组的形式,形成“立方 体”的结构。 维的属性值被映射成多维数组的下标值或 下标的范围,而总结数据作为多维数组的 值存储在数组的单元中。 由于MOLAP采用了新的存储结构,从物理 层实现起,因此又称为物理 OLAP(PhysicalOLAP)
案例: 国际整流器公司
利用Essbase软件提取和分析销售数据 允许用户用增加的维度(例如销售地区)动态 分析数据, 为存货分析建立了多维数据立方体 用于分析市场部门的销售情况 公司的每个人都在利用公司的公用数据库
相关文档
最新文档