2_第二讲(数据仓库、数据挖掘的OLAP技术和多维数据模型)

合集下载

数据仓库的多维数据模型

数据仓库的多维数据模型

数据仓库的多维数据模型数据仓库的多维数据模型是一种用于组织和表示数据仓库中数据的结构化方法。

它通过将数据组织成多维数据立方体的形式,提供了一种直观且高效的方式来分析和查询数据。

多维数据模型的核心概念是维度和度量。

维度是描述数据的属性,如时间、地点、产品等,它们用于对数据进行分类和分组。

度量是可以进行计量和分析的数据,如销售额、利润等。

维度和度量共同构成了多维数据模型中的数据立方体。

在多维数据模型中,数据立方体由多个维度和度量组成。

每个维度都有多个层次,用于对数据进行不同粒度的分析。

例如,时间维度可以包括年、季度、月份等层次。

每个层次都可以通过层次间的关系进行导航和聚合。

除了维度和度量,多维数据模型还包括事实表和维度表。

事实表是存储度量数据的表,它包含了与度量相关的各种属性。

维度表是存储维度数据的表,它包含了与维度相关的各种属性。

事实表和维度表通过共享维度的主键进行关联。

在多维数据模型中,还可以使用多种数据模型,如星型模型和雪花模型。

星型模型是最简单和最常见的多维数据模型,它由一个事实表和多个维度表组成,维度表与事实表直接关联。

雪花模型在星型模型的基础上,将维度表进一步规范化,以减少数据冗余和提高数据一致性。

多维数据模型的设计和建模是数据仓库开发中的关键步骤。

在设计多维数据模型时,需要考虑业务需求、数据源的结构和数据的粒度等因素。

合理的多维数据模型可以提高数据仓库的查询性能和分析效果,帮助用户更好地理解和利用数据。

在实际应用中,多维数据模型常用于OLAP(联机分析处理)系统和数据挖掘任务。

它可以支持复杂的数据分析和查询操作,如切片、切块、旋转和钻取等。

多维数据模型的灵活性和高效性使得它成为处理大规模数据和复杂分析任务的重要工具。

总结起来,数据仓库的多维数据模型是一种用于组织和表示数据仓库中数据的结构化方法。

它通过维度和度量的概念,将数据组织成多维数据立方体的形式,提供了一种直观且高效的方式来分析和查询数据。

数据挖掘作业讲解

数据挖掘作业讲解

《数据挖掘》作业第一章引言一、填空题(1)数据库中的知识挖掘(KDD)包括以下七个步骤:数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估和知识表示(2)数据挖掘的性能问题主要包括:算法的效率、可扩展性和并行处理(3)当前的数据挖掘研究中,最主要的三个研究方向是:统计学、数据库技术和机器学习(4)在万维网(WWW)上应用的数据挖掘技术常被称为:WEB挖掘(5)孤立点是指:一些与数据的一般行为或模型不一致的孤立数据二、单选题(1)数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于:(B )A、所涉及的算法的复杂性;B、所涉及的数据量;C、计算结果的表现形式;D、是否使用了人工智能技术(2)孤立点挖掘适用于下列哪种场合?(D )A、目标市场分析B、购物篮分析C、模式识别D、信用卡欺诈检测(3)下列几种数据挖掘功能中,( D )被广泛的应用于股票价格走势分析A. 关联分析B.分类和预测C.聚类分析D. 演变分析(4)下面的数据挖掘的任务中,( B )将决定所使用的数据挖掘功能A、选择任务相关的数据B、选择要挖掘的知识类型C、模式的兴趣度度量D、模式的可视化表示(5)下列几种数据挖掘功能中,(A )被广泛的用于购物篮分析A、关联分析B、分类和预测C、聚类分析D、演变分析(6)根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是( B )A.关联分析B.分类和预测C. 演变分析D. 概念描述(7)帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是( C )A.关联分析B.分类和预测C.聚类分析D. 孤立点分析E. 演变分析(8)假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是( E )A.关联分析B.分类和预测C. 孤立点分析D. 演变分析E. 概念描述三、简答题(1)什么是数据挖掘?答:数据挖掘是指从大量数据中提取或“挖掘”知识。

数据挖掘中文版

数据挖掘中文版

目录第一章引言 1.1 什么激发数据挖掘?为什么它是重要的?1.2 什么是数据挖掘?1.3 数据挖掘——在何种数据上进行?1.3.1 关系数据库1.3.2 数据仓库1.3.3 事务数据库1.3.4 高级数据库系统和高级数据库应用 1.4 数据挖掘功能——可以挖掘什么类型的模式? 1.4.1 概念/类描述:特征和区分1.4.2 关联分析1.4.3 分类和预测1.4.4 聚类分析 1.4.5 局外者分析 1.4.6 演变分析 1.5 所有模式都是有趣的吗? 1.6 数据挖掘系统的分类1.7 数据挖掘的主要问题1.8 总结.习题第二章数据仓库和数据挖掘的OLAP 技术 2.1 什么是数据仓库?2.2.1 操作数据库系统与数据仓库的区别2.1.2 但是,为什么需要一个分离的数据仓库. 2.2 多维数据模型2.2.1 由表和电子数据表到数据方 2.2.2 星形、雪花和事实星座:多维数据库模式. 2.2.3 定义星形、雪花和事实星座的例子 2.2.3 度量:它们的分类和计算.2.2.5 引入概念分 2.2.6 多维数据模型上的OLAP 操作2.2.7 查询多维数据库的星形网查询模型. 2.3 数据仓库的系统结构 2.3.1 数据仓库的设计步骤和结构 2.3.2 三层数据仓库结构2.3.3 OLAP 服务器类型:ROLAP、MOLAP 、HOLAP 的比较2.4 数据仓库实现2.4.1 数据方的有效计算2.4.2 索引OLAP 数据2.4.3 OLAP 查询的有效处理2.4.4 元数据存储2.5 数据方技术的进一步发展 2.5.1 数据方发现驱动的探查 2.5.2 多粒度上的复杂聚集: 多特征方2.5.3 其它进展2.6 由数据仓库到数据挖掘2.6.1 数据仓库的使用2.6.2 由联机分析处理到联机分析挖掘2.7 总结习题第三章数据预处理 3.1 为什么要预处理数据? 3.2 数据清理3.2.1 遗漏值3.2.2 噪音数据3.3 数据集成和变换3.3.1 数据集成3.3.2 数据变换3.4 数据归约3.4.1 数据方聚集3.4.2 维归约3.4.3 数据压缩3.4.4 数值归约3.5 离散化和概念分层产生3.5.1 数值数据的离散化和概念分层产生3.5.2 分类数据的概念分层产生. 3.6 总结习题第一章引言本书是一个导论,介绍什么是数据挖掘,什么是数据库中知识发现。

数据库中的多维数据分析研究

数据库中的多维数据分析研究

数据库中的多维数据分析研究随着信息时代的到来,数据的处理、分析和利用越来越重要。

数据库技术作为数据处理的核心技术,也不断地得到发展和改进。

在数据库中,多维数据分析是一种比较常见的方法,用于对大量数据进行展示和分析。

一、什么是多维数据分析多维数据分析是一种对数据进行分析和展示的方式,它可以将数据按照多个维度进行切分,形成多个交叉分析视图,从而揭示数据背后的规律和趋势。

多维数据分析一般包括四个方面的内容:维度、指标、分析、展示。

1. 维度:维度是指不同的角度或者分类,用于对数据进行切分和显示。

例如时段、地域、产品等。

2. 指标:指标是指需要分析的数据量,以衡量实体的表现。

例如销售额、利润等。

3. 分析:分析过程主要是针对不同维度和指标进行数据计算和统计分析,用于揭示数据背后的规律和趋势。

4. 展示:展示就是对分析结果进行可视化的展现,以便用户更直观地理解数据背后的规律和趋势。

展示可以采用表格、图表、图形等多种形式。

二、多维数据分析的应用多维数据分析广泛应用于企业管理、市场调研、金融分析、医学研究等各个领域。

以下是一些常见的应用场景。

1. 企业管理:多维数据分析可以用于企业的销售分析、产品分析、客户分析等多个方面。

通过对销售额、营收、客户评价等数据的分析,企业可以更好地了解市场需求和行业趋势,从而制定更精准的销售策略。

2. 市场调研:多维数据分析可以让企业更好地了解消费者的需求和偏好。

通过对市场份额、消费习惯、产品优劣等数据的分析,企业可以更好地把握市场动向,制定更具针对性的营销策略。

3. 金融分析:多维数据分析可以用于银行、证券等金融机构的业务分析、风险管理等多个方面。

通过对客户资产、交易数据等数据的分析,金融机构可以更好地评估客户风险和市场变化,及时调整投资组合,提高业务效益。

4. 医学研究:多维数据分析可以用于医学疾病的预测、诊断和治疗。

通过对大量患者的病例数据进行分析,研究人员可以更好地了解疾病的发展趋势和治疗效果,从而针对性地制定更科学的治疗方案。

数据仓库第二章——OLAP联机分析处理

数据仓库第二章——OLAP联机分析处理
(1)快速性:用户对OLAP的快速反应能力有很高的要求。 (2)可分析性:OLAP系统应能处理任何逻辑分析和统计分
析。
(3)多维性:系统必须提供对数据分析的多维视图和分析。 (4)信息性:OLAP系统应能及时获得信息,并且管理大容量
的信息。
4.1.2 OLAP准则
1993年,E.F.Codd提出OLAP的12条准则,其主 要的准则有:
6
4.1.1 OLAP的定义
1. OLAP理事会给出的定义 联机分析处理(OLAP)是一种软件技术,它
使分析人员能够迅速、一致、交互地从各个 方面观察信息,以达到深入理解数据的目的。 这些信息是从原始数据转换过来的,按照用 户的理解,它反映了企业真实的方方面面。
7
2. OLAP的简单定义
联机分析处理是共享多维信息的快速分析。 它体现了四个特征:
同时计算一些可能同时的聚集,避免不必要 的单元再次访问。
总结:
由于分块技术设计“重叠”某些聚集计算, 称该技术为多路数组聚集(Multiway array aggregation)
它同时聚集——即同时对多个维计算聚集。
44
4.2.4 MOLAP与ROLAP的比较
1.数据存取速度 2.数据存储的容量 3.多维计算的能力 4.维度变化的适应性 5.数据变化的适应性 6.软硬件平台的适应性 7.元数据管理
图4.4多维类型结构中的空间数据点
4.3.3多维数据的分析视图
在平面的屏幕上显示多维数据,是利用行、 列和页面三个显示组来表示的。例如,对上 例的四维MTS实例,在页面上选定商店维度 中“商店3”,在行中选定时间维的“1月、2 月、3月”共3个成员,在列中选定产品维中 的“上衣、裤、帽子”三个成员,以及指标 维中的“固定成本、直接销售”二个成员。 该四维数据的显示如图4.6所示。

【数据库系统课件】OLAP及其多维数据分析

【数据库系统课件】OLAP及其多维数据分析

OLAP及其多维数据分析国防科技大学系统工程与数学系陈元陈文伟联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。

当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简单查询也不能满足用户分析的需求。

用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。

因此Codd提出了多维数据库和多维分析的概念,即OLAP。

一、OLAP的概念根据OLAP产品的实际应用情况和用户对OLAP产品的需求,人们提出了一种对OLAP更简单明确的定义,即共享多维信息的快速分析。

(1)快速性用户对OLAP的快速反应能力有很高的要求。

系统应能在5秒内对用户的大部分分析要求做出反应。

如果终端用户在30秒内没有得到系统响应就会变得不耐烦,因而可能失去分析主线索,影响分析质量。

对于大量的数据分析要达到这个速度并不容,因此就更需要一些技术上的支持,如专门的数据存储格式、大量的事先运算、特别的硬件设计等。

(2)可分析性OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。

尽管系统需要事先编程,但并不意味着系统已定义好了所有的应用。

用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户理想的方式给出报告。

用户可以在OLAP平台上进行数据分析,也可以连接到其他外部分析工具上,如时间序列分析工具、成本分配工具、意外报警、数据开采等。

(3)多维性多维性是OLAP的关键属性。

系统必须提供对数据分析的多维视图和分析,包括对层次维和多重层次维的完全支持。

事实上,多维分析是分析企业数据最有效的方法,是OLAP的灵魂。

(4)信息性不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。

这里有许多因素需要考虑,如数据的可复制性、可利用的磁盘空间、OLAP产品的性能及与数据仓库的结合度等。

多维数据集的构建及其数据仓库OLAP

多维数据集的构建及其数据仓库OLAP

多维数据集的构建及其数据仓库OLAP071070012 李骁数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境,用以支持经营管理中的决策支持过程,数据模型是数据仓库研究的核心问题之一,由于传统数据模型不能有效地表示数据仓库的数据结构和语义,也难以有效地支持OLAP,因此,需要建立多维数据模型来支持分析。

本报告创建了多维数据模型,定义了数据仓库的度量和维度结构,并以此为基础,进行了简单的OLAP操作并得到了相关结论。

由于数据仓库操作面向的是大量的、各阶段的详细数据,直接创建是不现实的,这里直接采用了SQL Server自带的Foodmart 2000数据源作为操作基础。

数据仓库包含了4个层次的体系结构,分别是数据源、数据的存储和管理、OLAP服务器和前端工具。

报告只深入到基于数据的存储和管理的简单OLAP服务分析,microsoft的Analysis server在人性化方便做得很好,容易上手,基本不存在较大的操作问题。

(一)建立用于OLAP的数据库及数据源连接本次作业是在系机房的windows server 2003系统环境中完成的,建立数据源连接首先单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,再双击“数据源(ODBC)”。

在弹出的“ODBC数据源管理器”中选定“系统DSN”选项卡,单击“添加”添加数据源,由于本人并没有好的数据源,因此直接采用系统数据库中的样本作为数据源对象。

具体操作是在随后弹出的“ODBC Microsoft Access安装”中命名并找到样本数据库(windows server 2003在D盘),点击“确定”即可在SQL Server2000中,右击数据库名,建立新数据库如下:建立好数据库后,在Analysis Manager 树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”命令。

在随后弹出的“数据链接属性”对话框中,单击“Microsoft OLE DB Provider for ODBC Drivers”。

数据仓库和OLAP的基本概念

数据仓库和OLAP的基本概念

一数据仓库与OLAP技术1 数据仓库的定义与特征1.1 数据仓库的定义数据仓库已被多种方式定义,使得很难给出一种严格的定义。

宽松地来讲,数据仓库是一个数据库,它与组织机构的操作数据库分别维护,数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,为信息处理提供支持。

下面给出数据仓库之父对数据仓库的定义:数据仓库是面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于经营管理中的决策支持。

随着数据库技术的应用和发展,人们尝试对数据库DB中的数据进行再加工,形成一个综合的,面向分析的环境,以更好支持决策分析,从而形成了数据仓库技术。

其中,作为决策支持系统,数据仓库系统如图1.1包括:1. 数据仓库技术2. 联机分析处理技术3. 数据挖掘技术图1.1 数据仓库系统结构图1.2 数据仓库的特征数据仓库的四个主要特征。

1. 面向主题(subject-oriented)数据仓库中的数据是根据面向主题的方式组织的。

主题是用户所关心的数据对象,每个主题对应一个客观分析领域,如客户、商店等。

在系统中数据是根据业务流程进行组织的,同一主题的数据往往存放在多个数据表中,用户查询时需要在不同的数据表之间切换。

而在数据仓库中数据是根据主题组织的,同一主题的数据往往在一个事实表中,并且只有符合主题的数据才可进入数据仓库。

2. 集成(integrated)指在数据进入数据仓库之前,必须经过数据加工和集成,这是建立数据仓库的关键步骤,首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用向面向主题的转变。

通常构造数据仓库是将多个数据源,如关系数据库、文件和一些外部数据源,集成在一起。

使用数据清理和数据集成技术,确保命名约定、编码结构、属性度量等的一致性。

3. 时变(time-variant)数据仓库是不同时间的数据集合,数据存储从历史的角度提供信息。

它要求数据仓库中的数据保存时限能满足进行决策分析的需要,而且数据仓库中的数据都要标明该数据的历史时期。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数 据 挖 掘 概念与技术
第二讲
数据仓库和数据挖掘的 OLAP技术
数据仓库和数据挖掘的OLAP技术 主要授课内容:

什么是数据仓库? 多维数据模型 数据仓库的体系结构 数据仓库实现 数据立方体技术的进一步发展 从数据仓库到数据挖掘
什么是数据仓库?

数据仓库的定义很多,但却很难有一种严格的定义
历史数据: 决策支持需要历史数据,而这些数据在操作数据 库中一般不会去维护 数据汇总:决策支持需要将来自异种源的数据统一(如聚集 和汇总) 数据质量: 不同的源使用不一致的数据表示、编码和格式, 对这些数据进行有效的分析需要将他们转化后进行集成

其次是为了实现不同的功能、处理不同的数据:



多维数据模型
item
Sales Fact Table time_key item_key branch_key
item_key item_name brand type supplier_key
branch
branch_key branch_name branch_type
location_key units_sold dollars_sold avg_sales


不同于操作数据库,数据仓库无需进行事务处理 (最大目的保持数据一致性),恢复机制(回滚、 撤销),和并发控制机制(多人同时写操作数据 库时如何有效规避)。 对数据仓库只需要两种数据访问:

数据的初始转载和数据访问(读操作)
数据仓库与传统的异种数据库集成

传统的异种数据库集成:

在多个异种数据库上建立包装程序(wrappers,在每个数据库 上各自加上虚拟层,蒙蔽掉区别,转换为统一标准)和中介程序
2-D cuboids
time,location,supplier
3-D cuboids
time,item,supplier
item,l(base) cuboid
time, item, location, supplier
数据仓库的概念模型

最流行的数据仓库概念模型是多维数据模型。这种模 型可以以星型模式、雪花模式、或事实星座模式的形 式存在。


它是一个提供决策支持功能的数据库,它与公司的操作数据 库(日常用的数据库,即公司使用的数据库系统)分开维护。 为统一的历史数据分析提供坚实的平台,对信息处理提供支 持

定义:“数据仓库是一个面向主题的、集成的、随时 间而变化的、不容易丢失的数据集合,支持管理部门 的决策过程.”
------W. H. Inmon(数据仓库构造方面的领头
define cube <cube_name> [<dimension_list>]: <measure_list>

维定义 (维表) (维的属性的定义) 特殊案例 (共享维表的定义)

define dimension <dimension_name> as (<attribute_or_subdimension_list>)
branch_key branch_name branch_type
location_key units_sold dollars_sold avg_sales Measures
location
location_key street city province_or_state country
to_location dollars_cost units_shipped shipper

数据仓库的主要任务是联机分析处理OLAP


OLTP和OLAP的主要区别:



OLTP系统和OLAP系统的比较
特征
任务特点 面向 用户 功能 DB设计 数据 事务 办事员、DBA、数据库专业人员 日常操作 基于E-R,面向应用 最新的、详细的
OLTP
操作处理(联机事务处理) 分析
OLAP
星型模式实例
time
time_key day day_of_the_week month quarter year
item
Sales Fact Table time_key
item_key item_name brand type supplier_type
item_key branch_key
location_key units_sold dollars_sold avg_sales Measures
branch
branch_key branch_name branch_type
location
location_key street city state_or_province country
雪花模式实例
time
time_key day day_of_the_week month quarter year
设计师)


建立数据仓库(data warehousing):
指的是构造和使用数据仓库的过程。
数据仓库关键特征一——面向主题

总是围绕一些主题,如顾客、供应商、产品等
关注决策者的数据建模与分析,而不是集中于 组织机构的日常操作和事务处理。 排除对于决策无用的数据,这样数据的组织上 就能提供特定主题的简明视图。

数据仓库: 更新驱动


数据仓库与操作数据库系统

操作数据库系统的主要任务是联机事务处理OLTP

如日常操作: 购买,库存,银行,工资,注册,记帐等等 如数据分析和支持决策等 用户和系统的面向性: 服务于顾客 VS.服务于市场分析 数据内容: 当前的、详细的数据 VS. 历史的、汇总的数据 数据库的设计方法对比:实体-联系模型(ER)和面向应用的数 据库设计 VS. 星型/雪花模型和面向主题的数据库设计 视图: 当前的、企业内部的数据 VS. 经过演化的、集成的数 据 访问模式: 事务操作 VS. 只读查询(但很多是复杂的查询)



星型模式(Star schema): 事实表在中心,周围围绕地连接 着维表(维表有冗余),事实表含有大量数据,没有冗余。 雪花模式(Snowflake schema): 是星型模式的变种,其 中某些维表是规范化的(把引起冗余的字段用一个新表来表 示,被分解的表都连接到主维度表而不是事实表),因而把 数据进一步分解到附加表中,去除冗余。结果,模式图形成 类似于雪花的形状。其优点是 : 通过最大限度地减少数据存 储量以及联合较小的维表来改善查询性能。 事实星座(Fact constellations): 多个事实表共享维表, 这 种模式可以看作星型模式集,因此称为星系模式(galaxy schema),或者事实星座(fact constellation)
数据仓库关键特征三-----随时间而变化

数据仓库的时间范围比操作数据库系统要长的 多(公司日用使用的操作数据库的老数据要归 档操作,否则运行缓慢、占据存储空间)。


操作数据库系统: 主要保存当前数据(感兴趣、访 问计算效率高、时效性)。 数据仓库:从历史角度提炼出专门面向某一主题的数 据信息,其数据量较小(比如过去 5-10 年销售记 录),我们通常无法在操作数据库上直接进行挖掘

第一次作为维表定义 “cube definition”,如上,没有区别 然后:define dimension <dimension_name> as <dimension_name_first_time> in cube <cube_name_first_time>
(mediators ,将指令翻译为后台支持的每一个数据库系统所能 够理解的语言)


查询驱动方法——当从客户端传过来一个查询时,首先使用 元数据字典(各异种数据库系统的数据字典的集合,包含表、表 的字段及其定义的集合)将查询转换成相应异种数据库上的查 询;然后,将这些查询映射和发送到局部查询处理器 缺点:复杂的信息过虑和集成处理,中间包装程序、中介程 序的实现较复杂,占用计算空间且竞争操作数据库的资源。 将来自多个异种源的信息预先集成,并存储在数据仓库中, 供直接查询和分析,因为数据仓库中的数据无需最新。 最大优点:数据仓库技术的高性能性。
复杂的查询 数百万个 数百个 100GB-数十TB 高灵活性、端点用户自治 查询吞吐量(一个小时做几次 查询)、一个查询的响应时间
为什么需要一个分离的数据仓库?

首先是为了提高两个系统的性能


DBMS,数据库系统是为OLTP而设计的:其存储方式,索引, 并发控制, 恢复都是为了数据库系统进行OLTP处理而设计的 数据仓库是为OLAP而设计:例如数据仓库中复杂的 OLAP 查询, 多维视图,汇总是平时OLTP所用不到的。
数据立方体(四维)----------方体的格
all time item location supplier
0-D(apex) cuboid
1-D cuboids
time,item
time,location
item,location item,supplier
location,supplier
time,supplier time,item,location
shipper_key shipper_name location_key shipper_type
一种数据挖掘查询语言: DMQL

DMQL首先包括定义数据仓库和数据集市的语言原语, 这包括两种原语定义:一种是立方体定义,一种是维 定义

立方体定义 (事实表) (维表的关键字+事实的名称或度量)
一个数据仓库总是基于多维数据模型的:多维数据立方体!
相关文档
最新文档