数据库维度的基本概念

合集下载

数据库设计中的维度建模与事实建模

数据库设计中的维度建模与事实建模

数据库设计中的维度建模与事实建模在数据库设计中,维度建模和事实建模是两种重要的建模方法。

维度建模和事实建模针对不同的数据类型和数据关系进行建模,在构建数据仓库或者业务智能系统时起到关键的作用。

本文将介绍维度建模和事实建模的概念、原则以及应用场景。

一、维度建模维度建模是指以维度为中心进行数据建模的方法。

维度是一种反映业务面向用户部门的数据元素,是衡量和分析业务过程的关键属性,如时间、地点、产品、客户等。

维度建模的核心概念是"星型模型",其中一个中心表(事实表)与多个维度表相连。

1. 基本原则(1)维度应该具有唯一性和确定性。

(2)维度应该是可测量的属性,并且应该为业务过程的关键属性。

(3)维度之间应该具有层次关系。

2. 维度建模的步骤(1)识别关键业务过程和需求。

(2)识别和定义需要使用的维度。

(3)确定维度之间的层次关系。

(4)设计事实表,并且确定与维度表之间的关系。

(5)设计维度表。

(6)定义维度表之间的关系。

3. 应用场景维度建模适用于需要对业务过程进行度量和分析的场景,如经营决策、市场分析、销售分析等。

维度建模能够提供简洁、易于理解的数据模型,使得用户能够直观地分析和进行决策。

二、事实建模事实建模是指以事实为中心进行数据建模的方法。

事实是与业务过程中的事件和活动相关的数据集合,如销售金额、订单数量等。

事实建模的核心概念是"雪花模型",其中一个中心表(事实表)与多个维度表相连,并且维度表之间可以进一步展开。

1. 基本原则(1)事实应该与业务过程息息相关。

(2)事实应该是可计量和可观察的。

(3)事实应该能够满足系统设计的需求。

2. 事实建模的步骤(1)识别需要度量和分析的业务过程。

(2)确定需要度量的事实,并进行定义和测量。

(3)确定需要使用的维度,并与事实表建立关系。

(4)确定维度之间的关系,并进行细化。

3. 应用场景事实建模适用于需要对业务过程中的事件和活动进行度量和分析的场景,如销售分析、客户行为分析、物流分析等。

数据仓库多维数据模型的设计

数据仓库多维数据模型的设计

1、数据仓库基本概念1.1、主题(Subject)主题就是指我们所要分析的具体方面。

例如:某年某月某地区某机型某款App的安装情况。

主题有两个元素:一是各个分析角度(维度),如时间位置;二是要分析的具体量度,该量度一般通过数值体现,如App安装量。

1.2、维(Dimension)维是用于从不同角度描述事物特征的,一般维都会有多层(Level:级别),每个Level 都会包含一些共有的或特有的属性(Attribute),可以用下图来展示下维的结构和组成:以时间维为例,时间维一般会包含年、季、月、日这几个Level,每个Level一般都会有ID、NAME、DESCRIPTION这几个公共属性,这几个公共属性不仅适用于时间维,也同样表现在其它各种不同类型的维。

1.3、分层(Hierarchy)OLAP需要基于有层级的自上而下的钻取,或者自下而上地聚合。

所以我们一般会在维的基础上再次进行分层,维、分层、层级的关系如下图:每一级之间可能是附属关系(如市属于省、省属于国家),也可能是顺序关系(如天周年),如下图所示:1.4、量度量度就是我们要分析的具体的技术指标,诸如年销售额之类。

它们一般为数值型数据。

我们或者将该数据汇总,或者将该数据取次数、独立次数或取最大最小值等,这样的数据称为量度。

1.5、粒度数据的细分层度,例如按天分按小时分。

1.6、事实表和维表事实表是用来记录分析的内容的全量信息的,包含了每个事件的具体要素,以及具体发生的事情。

事实表中存储数字型ID以及度量信息。

维表则是对事实表中事件的要素的描述信息,就是你观察该事务的角度,是从哪个角度去观察这个内容的。

事实表和维表通过ID相关联,如图所示:1.7、星形/雪花形/事实星座这三者就是数据仓库多维数据模型建模的模式上图所示就是一个标准的星形模型。

雪花形就是在维度下面又细分出维度,这样切分是为了使表结构更加规范化。

雪花模式可以减少冗余,但是减少的那点空间和事实表的容量相比实在是微不足道,而且多个表联结操作会降低性能,所以一般不用雪花模式设计数据仓库。

数据仓库中的多维数据模型设计与实现教程

数据仓库中的多维数据模型设计与实现教程

数据仓库中的多维数据模型设计与实现教程在数据仓库中,多维数据模型设计与实现是一项关键任务。

它不仅可以帮助企业组织和分析庞大的数据量,还能提供决策支持和洞察力。

本文将介绍数据仓库中多维数据模型的概念、设计原则以及实现方法,帮助读者全面了解和掌握这一重要主题。

一、多维数据模型的概念多维数据模型是基于数据的特征和关联性来组织数据的一种模型。

它通过将数据按照不同的业务维度进行分组和分类,将数据以多维方式呈现,从而提供了更加直观和灵活的数据分析能力。

多维数据模型主要由维度、度量和层次结构组成。

1. 维度:维度是描述业务问题的属性,它可以是时间、地理位置、产品、客户等。

维度用来描述数据的特征,例如销售额可以按照时间、地理位置和产品维度进行分析。

2. 度量:度量是可以进行数值计算和分析的数据,例如销售额、利润、数量等。

度量用来描述数据的量度,便于进行各种统计分析。

3. 层次结构:层次结构是维度之间的关系,它描述了维度之间的层次结构和上下级关系。

例如时间维度可以由年、月、日等层次结构组成。

二、多维数据模型的设计原则在设计多维数据模型时,需要遵循一些原则,以确保模型的合理性和有效性。

1. 简单性:多维数据模型应该尽可能简单,避免过于复杂的维度和层次结构。

简单的模型易于理解和维护,提高数据分析效率。

2. 一致性:多维数据模型中的维度和度量应该保持一致性,避免冗余和重复。

一致的模型有助于提高查询效率和数据一致性。

3. 可扩展性:多维数据模型应该具有良好的扩展性,能够容纳未来的需求变化和数据增长。

设计时需要考虑到未来可能发生的维度扩展和度量变化。

4. 性能优化:多维数据模型的设计也要考虑到查询性能的优化。

根据实际需求和查询模式,合理设计维度的层次结构、聚集表和索引等,以提高查询效率。

三、多维数据模型的实现方法在实现多维数据模型时,需要选择合适的工具和技术来支持模型的构建和数据的加载。

1. 数据抽取和转换:多维数据模型的实现通常需要进行数据抽取和转换,将源系统的数据转化为可用于多维模型的格式。

数据维度的名词解释

数据维度的名词解释

数据维度的名词解释数据维度是指用于描述一组数据的可度量或可观察方面的属性。

在数据分析和数据挖掘中,维度是非常重要的概念,它通过定义不同的属性,可以帮助我们更好地理解和解释数据。

一、什么是数据维度数据维度是用于表示数据的特定方面或属性。

它是一种将数据集合划分成不同类别或类别的过程。

通过对数据进行维度建模,可以将数据集组织成一个多维数据立方体,其中数据的每个维度都表示不同的特征或描述。

举个例子来说,假设我们要分析一家电子商务公司的销售数据。

在这个数据集中,我们可以使用多个维度对销售进行描述,如产品、地区、销售时间等。

通过将数据按照这些维度进行划分,我们可以更好地了解不同产品在不同地区和时间下的销售情况。

这样的维度建模有助于我们从不同的角度来观察数据,并发现数据中隐藏的模式和趋势。

二、数据维度的类型数据维度可以根据其性质和组织方式进行分类。

常见的数据维度类型包括:1. 时间维度:时间维度用于描述数据发生或记录的时间点或时间段。

例如,销售数据中的年份、季度、月份等都可以作为时间维度来分析销售情况的季节性变化和趋势。

2. 地理维度:地理维度用于描述与地理位置相关的数据特征。

例如,销售数据中的国家、城市、区域等都可以作为地理维度来分析不同地域的销售情况和市场发展趋势。

3. 产品维度:产品维度用于描述数据中的不同产品或商品。

例如,销售数据中的产品类别、品牌、型号等都可以作为产品维度来分析不同产品的销售情况和市场需求。

4. 客户维度:客户维度用于描述与客户相关的数据特征。

例如,销售数据中的客户类型、客户等级、客户地域等都可以作为客户维度来分析不同客户群体的购买行为和市场潜力。

5. 行为维度:行为维度用于描述与特定行为或事件相关的数据特征。

例如,用户行为数据中的点击、购买、访问时长等都可以作为行为维度来分析用户行为轨迹和决策过程。

通过将数据按照不同的维度进行划分,我们可以更好地理解数据的内在关系和潜在规律。

这种维度分析有助于我们获取有关数据集的更多信息,从而做出更准确的决策和预测。

数仓事实表和维度表

数仓事实表和维度表

数仓事实表和维度表数据仓库(Data Warehouse)是一个用于支持大规模数据分析和决策制定的数据库系统。

在数据仓库中,事实表和维度表是两个核心组件,它们在数据存储和分析过程中起着重要的作用。

事实表(Fact Table)是一个用于存储数仓中的事实数据的表。

事实表通常包含大量的记录,用于描述业务中的事实或事件。

事实表的每一行记录都与一个或多个维度表相关联,通过这种关联关系,我们可以对事实数据进行分析和查询。

例如,在一个销售数据仓库中,事实表可以存储每次销售交易的详细信息,如销售日期、产品ID、客户ID、销售数量和销售金额等。

维度表(Dimension Table)是用于描述事实数据所属的特定维度的表。

维度通常描述了业务中的各种特征,如时间、地理位置、产品、客户等。

维度表的每一行记录包含了一个唯一的标识符和与该维度相关的其他属性信息。

维度表与事实表之间通过共同的标识符建立关联,从而实现数据的分类、分组和筛选。

例如,在销售数据仓库中,时间维度表可以存储每一天的日期信息,如年、季度、月份和星期等。

事实表和维度表的设计与建模是数仓架构的关键步骤之一。

在设计事实表时,我们需要仔细分析业务需求,并确定需要存储的事实数据的粒度。

事实表的粒度应该是尽可能细粒度的,以便于后续的分析和查询。

同时,我们还需要确定事实表与维度表之间的关联关系,选择合适的联接键进行关联操作。

这些关联关系将决定了数仓中数据的聚合和汇总方式。

维度表的设计同样重要。

在设计维度表时,我们需要确定哪些属性是维度属性,并通过标识符和其他属性进行描述。

维度表的属性应具有确定性和稳定性,以便于数据的一致性和可靠性。

此外,我们还可以为维度表添加层级结构,以支持多层次的数据分析和查询。

例如,地理位置维度可以包含国家、省份、城市等多个层级。

在数据仓库中,事实表和维度表的设计要根据具体的业务需求和分析目标进行调整和优化。

有时候,我们可能需要对事实表进行分区和索引,以提高数据查询的效率。

数据库设计中的维度建模与关系模型

数据库设计中的维度建模与关系模型

数据库设计中的维度建模与关系模型在数据库设计中,维度建模和关系模型是两种重要的方法。

它们分别在不同的场景下发挥着重要的作用。

本文将对这两种方法进行详细的介绍和比较分析。

1. 维度建模维度建模是一种面向主题的数据库设计方法,它的核心思想是将数据按照不同的主题进行分类,并建立一个具有层次结构的数据模型。

在维度建模中,通常采用星型模型(Star Schema)或雪花模型(Snowflake Schema)来表示数据之间的关系。

星型模型是维度建模中最简单的模型之一,它由一个事实表(Fact Table)和多个维度表(Dimension Table)组成。

事实表存储了与某个特定的业务主题相关的事实数据,而维度表用于描述事实表中的数据。

维度表是一个包含了该维度的所有属性(如地理位置、时间、产品等)的表格,而事实表中的数据与维度表中的数据通过外键关联起来。

雪花模型基于星型模型,通过进一步拆分维度表,将一些维度表的属性再次细分成更小的维度表。

这样可以使得数据模型更加灵活,但同时也增加了数据冗余的可能性。

维度建模的优点在于:a. 易于理解和使用。

维度建模采用简单的模型结构来表示数据之间的关系,使得用户可以快速理解数据模型并进行查询和分析。

b. 高效的查询性能。

维度建模中的星型模型适用于大多数查询场景,可以通过索引的方式快速检索数据。

2. 关系模型关系模型是一种广泛应用的数据模型,它用关系(表)来表示数据之间的关系,并利用关系之间的连接来实现数据查询和处理。

关系模型使用结构化查询语言(SQL)进行数据操作。

在关系模型中,数据被组织成多个表,每个表都有列(属性)和行(记录)。

表与表之间通过外键关系进行连接。

关系模型使用范式(Normalization)来规范化数据,以减少数据冗余和提高数据的一致性。

关系模型的优点在于:a. 灵活性和扩展性。

关系模型可以根据具体需求进行灵活的数据模型设计,支持数据结构的变化和扩展。

b. 数据完整性和一致性。

问卷调查 数据库设计 维度

问卷调查 数据库设计 维度

问卷调查数据库设计维度
维度(Dimension)在数据库设计中是指数据库中的一组相关属性或特征,它描述了事物或实体的某个方面。

在数据仓库或数据分析领域,维度常用于描述商业活动的不同方面,例如时间、地理位置、产品、客户等。

维度通常与事实表(Fact table)结合使用,构成了星型模型或雪花模型。

通过使用维度,可以对事实数据进行分析和报表,从而提供用户对业务数据的全面认识和深入了解。

在进行问卷调查的数据库设计中,维度可以包括以下几个方面:
1. 调查时间维度:包括调查日期、调查时段等时间相关的属性,用于分析调查结果在不同时间维度上的变化趋势。

2. 调查地点维度:包括调查地区、调查场所等地理位置相关的属性,用于分析调查结果在不同地理位置上的差异。

3. 调查对象维度:包括被调查者的属性,例如年龄、性别、教育程度等,用于分析不同人群在调查结果上的差异。

4. 问卷题目维度:包括问卷的题目、选项等属性,用于分析不同题目对调查结果的影响。

5. 调查结果维度:包括调查结果的各个指标、评分等属性,用于对调查结果进
行统计和分析。

以上仅是一些可能的维度示例,具体的问卷调查数据库设计需要根据实际情况而定。

在设计维度时,需要考虑维度之间的关系和层次结构,并灵活应用维度建模技术,以满足用户的数据分析需求。

数据库设计中的维度建模与日期模型研究

数据库设计中的维度建模与日期模型研究

数据库设计中的维度建模与日期模型研究随着数据的迅速增长和企业对数据洞察力的需求不断增加,数据库设计变得越来越重要。

维度建模和日期模型作为数据库设计中的常用技术,被广泛应用于各类企业的数据仓库和商业智能系统中。

本文将探讨维度建模和日期模型的概念、设计原则以及其在数据库设计中的应用。

一、维度建模概述维度建模是一种将事实数据与维度数据连接起来的设计技术。

维度是描述业务过程或事务的属性或者业务分类的基础数据。

维度建模通过将业务过程或者事务数据沿着业务分类进行拆分,并通过维度进行关联,形成一个多维度的数据结构,方便分析、查询和报告。

在维度建模中,最常见的是星型模型和雪花模型。

星型模型由一个事实表和多个维度表组成,每个维度表与事实表之间是一对多的关系。

而雪花模型在星型模型的基础上,通过细化维度表进行归一化,以减少数据冗余。

维度建模具有简单、易理解、易扩展等特点,非常适用于企业业务数据的分析和洞察。

二、日期模型研究日期模型是维度建模的一种特殊类型,用来处理与日期相关的数据,如销售数据、交易数据等。

在日期模型中,时间被当做一个维度进行处理,与其他维度进行连接,以实现更详细的分析和查询需求。

日期模型的设计原则主要包括:1. 粒度日期模型中的时间粒度需要根据业务需求进行确定。

不同的业务场景可能需要不同的时间粒度,如按日、按周、按月、按季度或按年。

在设计日期模型时,需要根据实际情况选择适当的粒度,以满足业务分析和查询的需求。

2. 事实表与维度表的设计在日期模型中,事实表通常用来存储与日期相关的业务度量数据,如销售额、利润等。

维度表则用来描述与日期相关的业务分类和属性。

通过将事实表与维度表进行关联,可以实现更加灵活和深入的数据分析。

3. 关联关系在日期模型中,需要特别注意日期维度表与其他维度表之间的关联关系。

日期维度表应该与事实表建立一对多的关联,而与其他维度表建立一对一的关联。

这样可以确保日期维度的数据被正确地应用于事实表和其他维度的数据分析中。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基本概念:1.多维数据集:多维数据集是联机分析处理(OLAP) 中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。

多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。

2.维度(dimension):是多维数据集的结构性特性。

它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。

这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。

3.度量值:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。

此外,度量值是所分析的多维数据集的中心值。

即,度量值是最终用户浏览多维数据集时重点查看的数字数据。

您所选择的度量值取决于最终用户所请求的信息类型。

一些常见的度量值有sales、cost、expe nditures 和production count 等。

4.元数据:不同OLAP 组件中的数据和应用程序的结构模型。

元数据描述OL TP 数据库中的表、数据仓库和数据集市中的多维数据集这类对象,还记录哪些应用程序引用不同的记录块。

5.级别:级别是维度层次结构的一个元素。

级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。

6.数据挖掘:数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP 数据集中的数据。

之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。

7.多维OLAP (MOLAP):MOLAP 存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。

根据分区聚合的百分比和设计,MOLA P 存储模式为达到最快查询响应时间提供了潜在可能性。

总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。

8.关系OLAP (ROLAP):ROLAP 存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。

但是,可为分区数据使用ROLAP 存储模式,而不在关系数据库中创建聚合。

9.混合OLAP (HOLAP):HOLAP 存储模式结合了MOLAP 和ROLAP 二者的特性。

10.粒度:数据汇总的层次或深度。

11.聚合|聚集:聚合是预先计算好的数据汇总,由于在问题提出之前已经准备了答案,聚合可以改进查询响应时间。

12.切块:由多个维的多个成员限定的分区数据,称为一个切块。

13.切片(slice):由一个维的一个成员限定的分区数据,称为一个切片。

14.数据钻取:最终用户从常规多维数据集、虚拟多维数据集或链接多维数据集中选择单个单元,并从该单元的源数据中检索结果集以获得更详细的信息,这个操作过程就是数据钻取。

15.数据挖掘模型:数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP 数据集中的数据。

之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。

数据库维度(Database dimension)“数据库维度”是与某个键属性相关的维度属性的集合,而该键属性又与度量值维度中的事实数据相关。

维度属性(Dimension attribute)“维度属性”被绑定到维度表中的一个或多个列并包含成员。

维度属性可以包含客户名称、月份名称和产品名称。

成员(Member)“成员”是维度属性(包括度量值维度)的值。

层次结构中的成员可以是叶成员、父成员、数据成员或“(全部)”成员。

度量值(Measure)“度量值”是来自事实数据表的值,也称为“事实数据”。

度量值维度的值有时也通称为“成员”。

度量值通常是数值,但也可以是字符串值。

Measures 维度(Measures dimension)“度量值维度”是包含多维数据集中所有度量值的维度。

度量值维度是一种特殊的维度,其中的成员通常是根据各个维度属性(存在指定的度量值)的当前成员(通常采用求和或计数方式)进行聚合。

度量值组(Measure Group)“度量值组”是SQL Server 2005 Analysis Services 多维数据集中的相关度量值集合(通常是来自同一事实数据表的度量值)。

在SQL Server 2005 Analy sis Services 中,一个多维数据集可包含多个度量值组。

“(全部)”成员((All) member)“(全部)”成员是属性层次结构或用户定义的层次结构中的所有成员的计算值。

计算成员(Calculated member)“计算成员”是在查询时定义和计算的维度成员。

可以在用户查询或MDX 计算脚本中定义计算成员,并将其存储在服务器上。

一个计算成员对应于定义它们的维度中的多个维度表行。

数据成员(Data member)“数据成员”是在父子层次结构中与父成员相关联的子成员。

数据成员包含其父成员的数据值,而不是该父成员的子级的聚合值。

父成员(Parent member)“父成员”是父子层次结构中的成员,包含其子级的聚合值。

叶成员(leaf member)“叶成员”是层次结构中不包含子级的成员。

子成员(Child member)“子成员”是层次结构中位于顶层下面的成员。

键属性(Key attribute)数据库维度的“键属性”是维度中的所有非键属性(以直接或间接方式)所链接到的属性。

键属性通常也是粒度属性。

粒度属性(Granularity attribute)多维数据集维度的属性,它将维度链接到度量值维度内度量值组中的事实数据。

如果粒度属性和键属性为不同的属性,则非键属性必须直接或间接地链接到粒度属性。

在多维数据集中,粒度属性定义维度的粒度。

多维数据集维度(Cube dimension)“多维数据集维度”是多维数据集中的数据库维度实例。

属性层次结构(Attribute hierarchy)“属性层次结构”是包含以下级别的属性成员层次结构:包含所有非重复属性成员的叶级别,叶级别的各个成员也称为“叶成员”。

中间级别(如果属性层次结构为父子层次结构)。

可选的“(全部)”级别(IsAggregatable=True),它包含属性层次结构的叶成员的聚合值。

“(全部)”级别的成员也称为“(全部)”成员。

默认情况下,将为每个维度属性定义属性层次结构(AttributeHierarchyEnabled =True)。

属性层次结构默认为可见(AttributeHierarchyVisible=True)。

均衡层次结构(Balanced hierarchy)“均衡层次结构”是顶级成员与任何叶成员之间存在相同级别数的层次结构。

不齐整层次结构(Ragged hierarchy)请参见“非均衡层次结构(Unbalanced hierarchy)”。

非均衡层次结构(Unbalanced hierarchy)“非均衡层次结构”是顶级与叶级之间存在不同级别数的层次结构。

父子层次结构即是不齐整层次结构的一个例子。

非均衡层次结构也称为“不齐整层次结构”。

父子层次结构(Parent-child hierarchy)“父子层次结构”是一种将维度属性设置为parent 类型的特殊的属性层次结构。

父子层次结构是由子成员和父成员构成的非均衡层次结构。

父子层次结构包含以下级别:包含父成员子级的子级别。

父成员的子级包含聚合到父成员的属性成员(包括数据成员)。

包含父成员的中间级别。

可选的“(全部)”级别(IsAggregatable=True),它包含父子层次结构叶成员的聚合值,“(全部)”级别的成员也称为“(全部)”成员。

每个维度中只能存在一个父子层次结构,并且必须与键属性相关。

用户定义的层次结构(User-defined hierarchy)“用户定义的层次结构”是属性层次结构的均衡层次结构,旨在帮助用户浏览多维数据集数据。

用户定义的层次结构不添加到多维数据集空间。

在某些情况下可以隐藏用户定义的层次结构中的级别并使其以非均衡的形式显示。

属性关系(Attribute relationship)“属性关系”是属性间的一对多关系,例如州省市自治区和城市维度属性间的关系。

成员属性(Member property)成员属性是特性成员的属性,例如客户的性别或产品的颜色。

单元(Cell)多维数据集中的“单元”是度量值维度成员的成员与多维数据集中各个属性层次结构的成员相交处所在的空间。

度量值维度的成员可以是叶成员(单个事实数据)或聚合成员(例如,特定年份聚合的销售额)。

维度的成员可以是叶成员、数据成员、父成员或“(全部)”成员。

多维数据集空间(Cube space)“多维数据集空间”是多维数据集属性层次结构的成员与多维数据集的度量值的交集。

子多维数据集(Subcube)“子多维数据集”是表示多维数据集的筛选视图的多维数据集子集。

可以使用MD X 计算脚本中的Scope 语句或MDX 查询中的嵌套select 语句定义子多维数据集。

带有嵌套select 语句的子多维数据集(Subcube with Subselect)用MDX 查询中的嵌套select 语句定义的子多维数据集包含符合子多维数据集定义的所有成员,其结果如下:包含层次结构的“(全部)”成员与包含层次结构的每个叶成员的结果是相同的。

包含任何成员将包括其祖先和后代。

包含用户定义的层次结构中某级别的每个成员将包含该用户定义的层次结构中的所有成员,但可排除不与此级别成员共存的其他层次结构的成员(例如不包含客户的城市)。

多维数据集中的每个“(全部)”成员始终存在于从该多维数据集创建的子多维数据集中。

子多维数据集中的聚合值将进行直接求和。

SQL Server数据库维度表和事实表概述:事实表每个数据仓库都包含一个或者多个事实数据表。

事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。

事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性纬度表的主键,而维度表包含事实记录的特性。

事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与纬度表中对应项的相关索引字段之外的任何数据。

包含在事实数据表中的“度量值”有两中:一种是可以累计的度量值,另一种是非累计的度量值。

最有用的度量值是可累计的度量值,其累计起来的数字是非常有意义的。

用户可以通过累计度量值获得汇总信息,例如。

可以汇总具体时间段内一组商店的特定商品的销售情况。

非累计的度量值也可以用于事实数据表,单汇总结果一般是没有意义的,例如,在一座大厦的不同位置测量温度时,如果将大厦中所有不同位置的温度累加是没有意义的,但是求平均值是有意义的。

相关文档
最新文档