多维数据组织与分析
多维数据组织与分析.
昆明理工大学信息工程与自动化学院学生实验报告
( 2016 — 2017 学年第二学期)
课程名称:数据仓库与数据挖掘开课实验室: 2017年5 月4 日444信自楼
一、上机目的
-2-
目的:
1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系;
2.理解多维数据集创建的基本原理与流程;3.理解并掌握OLAP分析的基本过程与方法;
4. 学会使用基本的MDX语句
二、上机内容1.基于上次实验建立的地铁数据仓库,构建地铁公司收入的多维数据集。2.使用维度浏览器进行多维数据的查询、编辑操作。
3.对多维数据集进行切片、切块、旋转、钻取操作。
4.使用MDX语句对多维数据集进行切片。注意:可参照Analysis Services的教程,构建多维数据集。要求时间和站点维度采用层次结构。
利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。
-3-
三、实验原理及基本技术路线图(方框原理图或程序流程图)
请描述联机分析处理的相关基本概念(MOLAP、ROLAP、切片、切块、旋转、钻取等)。
1.MOLAP:表示基于多维数据组织的OLAP实
现。使用多维数组存储数据。
特点:将细节数据和聚合后的数据均保存在cube中,所以以空间换效率,查询时效率高,但生成cube时需要大量的时间和空间。
2.ROLAP:表示基于关系数据库的OLAP实现。将多维数据库的多维结构划分为事实表,和
维表。
特点:将细节数据保留在关系型数据库的事
实表中,聚合后的数据也保存在关系型的数据库中。这种方式查询效率最低,不推荐使用。
3.切片:在给定数据立方体的一个维上进
行选择操作就是切片,切片的结果是得到一个二维平面数据。
4.切块:在给定数据立方体的两个或多个
维上进行选择操作就是切块,切块的结果得到一个子立方体。
5.旋转:维度变换的方向,即在表格中重
新安排维的放置(例如行列互换)。
6.钻取:改变维的层次,变换分析的粒度。它 -4-
包括向下钻取和向上钻取。
四、实验方法、步骤(或:程序代码或操作过程)1.多维数据集
(1)卡类型维度
卡类别维度)(2
3()时间维度 -5-
站点维度4)(
(5)进出站
-6-
)多维数据集建立6(
2.集维理1()处多数据 -7-
部署完成2()
钻取)(3
4()旋转 -8-
(5)切片