数据仓库_6_多维建模

合集下载

数据仓库的多维数据模型

数据仓库的多维数据模型

数据仓库的多维数据模型数据仓库的多维数据模型是一种用于组织和表示数据仓库中数据的结构化方法。

它通过将数据组织成多维数据立方体的形式,提供了一种直观且高效的方式来分析和查询数据。

多维数据模型的核心概念是维度和度量。

维度是描述数据的属性,如时间、地点、产品等,它们用于对数据进行分类和分组。

度量是可以进行计量和分析的数据,如销售额、利润等。

维度和度量共同构成了多维数据模型中的数据立方体。

在多维数据模型中,数据立方体由多个维度和度量组成。

每个维度都有多个层次,用于对数据进行不同粒度的分析。

例如,时间维度可以包括年、季度、月份等层次。

每个层次都可以通过层次间的关系进行导航和聚合。

除了维度和度量,多维数据模型还包括事实表和维度表。

事实表是存储度量数据的表,它包含了与度量相关的各种属性。

维度表是存储维度数据的表,它包含了与维度相关的各种属性。

事实表和维度表通过共享维度的主键进行关联。

在多维数据模型中,还可以使用多种数据模型,如星型模型和雪花模型。

星型模型是最简单和最常见的多维数据模型,它由一个事实表和多个维度表组成,维度表与事实表直接关联。

雪花模型在星型模型的基础上,将维度表进一步规范化,以减少数据冗余和提高数据一致性。

多维数据模型的设计和建模是数据仓库开发中的关键步骤。

在设计多维数据模型时,需要考虑业务需求、数据源的结构和数据的粒度等因素。

合理的多维数据模型可以提高数据仓库的查询性能和分析效果,帮助用户更好地理解和利用数据。

在实际应用中,多维数据模型常用于OLAP(联机分析处理)系统和数据挖掘任务。

它可以支持复杂的数据分析和查询操作,如切片、切块、旋转和钻取等。

多维数据模型的灵活性和高效性使得它成为处理大规模数据和复杂分析任务的重要工具。

总结起来,数据仓库的多维数据模型是一种用于组织和表示数据仓库中数据的结构化方法。

它通过维度和度量的概念,将数据组织成多维数据立方体的形式,提供了一种直观且高效的方式来分析和查询数据。

数据仓库多维数据模型的设计

数据仓库多维数据模型的设计

1、数据仓库基本概念1.1、主题(Subject)主题就是指我们所要分析的具体方面。

例如:某年某月某地区某机型某款App的安装情况。

主题有两个元素:一是各个分析角度(维度),如时间位置;二是要分析的具体量度,该量度一般通过数值体现,如App安装量。

1.2、维(Dimension)维是用于从不同角度描述事物特征的,一般维都会有多层(Level:级别),每个Level 都会包含一些共有的或特有的属性(Attribute),可以用下图来展示下维的结构和组成:以时间维为例,时间维一般会包含年、季、月、日这几个Level,每个Level一般都会有ID、NAME、DESCRIPTION这几个公共属性,这几个公共属性不仅适用于时间维,也同样表现在其它各种不同类型的维。

1.3、分层(Hierarchy)OLAP需要基于有层级的自上而下的钻取,或者自下而上地聚合。

所以我们一般会在维的基础上再次进行分层,维、分层、层级的关系如下图:每一级之间可能是附属关系(如市属于省、省属于国家),也可能是顺序关系(如天周年),如下图所示:1.4、量度量度就是我们要分析的具体的技术指标,诸如年销售额之类。

它们一般为数值型数据。

我们或者将该数据汇总,或者将该数据取次数、独立次数或取最大最小值等,这样的数据称为量度。

1.5、粒度数据的细分层度,例如按天分按小时分。

1.6、事实表和维表事实表是用来记录分析的内容的全量信息的,包含了每个事件的具体要素,以及具体发生的事情。

事实表中存储数字型ID以及度量信息。

维表则是对事实表中事件的要素的描述信息,就是你观察该事务的角度,是从哪个角度去观察这个内容的。

事实表和维表通过ID相关联,如图所示:1.7、星形/雪花形/事实星座这三者就是数据仓库多维数据模型建模的模式上图所示就是一个标准的星形模型。

雪花形就是在维度下面又细分出维度,这样切分是为了使表结构更加规范化。

雪花模式可以减少冗余,但是减少的那点空间和事实表的容量相比实在是微不足道,而且多个表联结操作会降低性能,所以一般不用雪花模式设计数据仓库。

数据仓库中的多维模型设计与实现研究

数据仓库中的多维模型设计与实现研究

数据仓库中的多维模型设计与实现研究数据仓库在现代企业中扮演着重要的角色,它可以帮助企业从海量的数据中提取有价值的信息,为决策提供支持。

而多维模型作为数据仓库架构的核心组成部分,为数据分析与查询提供了有效的方式。

本文将探讨数据仓库中的多维模型设计与实现的研究。

一、多维模型概述多维模型是一种以多维思维方式组织数据的模型,它将数据组织成各种维度(Dimensions)和度量(Measures),并通过事实表(Fact Table)和维度表(Dimension Table)来建立关系。

多维模型的核心思想是以用户需要的方式组织数据,提供一种直观、灵活且高效的数据分析与查询方式。

二、多维模型的设计原则1. 精确建模:在进行多维模型设计时,要确保模型可以准确地反映业务需求。

这需要与业务人员密切合作,理解业务过程和数据要求,避免冗余和不必要的数据项。

2. 简单易用:多维模型应该具有直观的层次结构和易于理解的数据组织方式,以便用户可以轻松地进行数据分析和查询操作。

简化模型设计可以提高用户的可操作性和效率。

3. 可扩展性:多维模型应具备良好的可扩展性,能够适应企业数据规模和业务变化的需求。

当业务增长或更改时,应该能够方便地调整模型结构,以满足新的需求。

4. 性能优化:在多维模型设计时,考虑查询性能是至关重要的。

通过设计合适的索引、分区和聚合,可以提高查询的速度和效率,减少用户等待时间。

三、多维模型的实现步骤1. 数据源准备:在进行多维模型实现之前,首先需要对数据源进行准备。

这包括数据清洗、数据集成和数据转换等过程,以确保数据的质量和一致性。

2. 维度建模:在维度建模过程中,需要确定事实表和维度表的关系,并定义维度表中的维度属性。

同时,还需要确定事实表中的度量和细节级别,并定义度量的计算规则。

3. 模型设计:根据维度建模的结果,设计多维模型的结构。

这包括确定维度的层次结构、计算度量聚合和定义多维数据的面板结构等。

4. 模型实现:将设计好的多维模型实现到数据仓库中。

数据仓库中的多维数据模型设计与实现教程

数据仓库中的多维数据模型设计与实现教程

数据仓库中的多维数据模型设计与实现教程在数据仓库中,多维数据模型设计与实现是一项关键任务。

它不仅可以帮助企业组织和分析庞大的数据量,还能提供决策支持和洞察力。

本文将介绍数据仓库中多维数据模型的概念、设计原则以及实现方法,帮助读者全面了解和掌握这一重要主题。

一、多维数据模型的概念多维数据模型是基于数据的特征和关联性来组织数据的一种模型。

它通过将数据按照不同的业务维度进行分组和分类,将数据以多维方式呈现,从而提供了更加直观和灵活的数据分析能力。

多维数据模型主要由维度、度量和层次结构组成。

1. 维度:维度是描述业务问题的属性,它可以是时间、地理位置、产品、客户等。

维度用来描述数据的特征,例如销售额可以按照时间、地理位置和产品维度进行分析。

2. 度量:度量是可以进行数值计算和分析的数据,例如销售额、利润、数量等。

度量用来描述数据的量度,便于进行各种统计分析。

3. 层次结构:层次结构是维度之间的关系,它描述了维度之间的层次结构和上下级关系。

例如时间维度可以由年、月、日等层次结构组成。

二、多维数据模型的设计原则在设计多维数据模型时,需要遵循一些原则,以确保模型的合理性和有效性。

1. 简单性:多维数据模型应该尽可能简单,避免过于复杂的维度和层次结构。

简单的模型易于理解和维护,提高数据分析效率。

2. 一致性:多维数据模型中的维度和度量应该保持一致性,避免冗余和重复。

一致的模型有助于提高查询效率和数据一致性。

3. 可扩展性:多维数据模型应该具有良好的扩展性,能够容纳未来的需求变化和数据增长。

设计时需要考虑到未来可能发生的维度扩展和度量变化。

4. 性能优化:多维数据模型的设计也要考虑到查询性能的优化。

根据实际需求和查询模式,合理设计维度的层次结构、聚集表和索引等,以提高查询效率。

三、多维数据模型的实现方法在实现多维数据模型时,需要选择合适的工具和技术来支持模型的构建和数据的加载。

1. 数据抽取和转换:多维数据模型的实现通常需要进行数据抽取和转换,将源系统的数据转化为可用于多维模型的格式。

数据仓库建模方法论

数据仓库建模方法论

数据仓库建模方法论数据仓库建模是指将数据仓库中的数据按照某种标准和规范进行组织和管理的过程。

数据仓库建模方法论包括了多种方法和技术,用于帮助用户理解和分析数据仓库中的数据,从而支持决策制定和业务分析。

一、维度建模方法维度建模方法是数据仓库建模的核心方法之一,它以维度为核心,将数据按照维度进行组织和管理,从而提供给用户灵活和高效的数据查询和分析能力。

1.1 星型模型星型模型是最常见和简单的维度建模方法,它将数据仓库中的事实表和多个维度表通过共享主键的方式进行关联。

事实表包含了衡量业务过程中的事件或指标,而维度表包含了用于描述和过滤事实记录的属性。

星型模型的结构清晰,易于理解和使用,适用于绝大部分的数据仓库场景。

1.2 雪花型模型雪花型模型是在星型模型的基础上进行扩展和优化的一种模型,它通过拆分维度表中的属性,将其拆分为多个维度表和子维度表,从而使得数据仓库更加灵活和高效。

雪花型模型适用于维度表中的属性比较复杂和层次结构比较多的情况。

1.3 天际线模型天际线模型是一种比较先进和复杂的维度建模方法,它通过将事实表和维度表按照一定的规则进行分组和划分,从而实现多个星型模型之间的关联。

天际线模型适用于数据仓库中包含多个相互关联的业务过程和多个不同的粒度的情况。

二、多维建模方法多维建模方法是在维度建模方法基础上进行进一步抽象和简化的一种方法,它通过创建多维数据立方体和维度层次结构来组织和管理数据。

2.1 数据立方体数据立方体是多维建模的核心概念,它将数据按照事实和维度进行组织和管理,从而提供给用户直观和高效的数据查询和分析能力。

数据立方体包含了多个维度和度量,用户可以通过选择和组合维度和度量进行数据分析和挖掘。

2.2 维度层次结构维度层次结构是多维建模的关键技术,它通过将维度进行分层和组织,从而实现维度之间的关联和上下级关系。

维度层次结构可以有效地减少数据的冗余和复杂性,提高数据仓库的查询和分析效率。

三、模式设计方法模式设计方法是在维度建模方法和多维建模方法的基础上进行进一步的抽象和规范的一种方法,它通过定义模式和规则来组织和管理数据仓库中的数据。

数据仓库中的多维数据建模与查询优化技术研究

数据仓库中的多维数据建模与查询优化技术研究

数据仓库中的多维数据建模与查询优化技术研究数据仓库作为企业数据管理的重要工具,扮演着集成、分析和查询大量数据的关键角色。

为了更高效地使用数据仓库中的数据,多维数据建模与查询优化技术成为研究的焦点。

本文将从数据仓库中多维数据建模和查询优化两个方面进行研究。

第一部分:多维数据建模在数据仓库中,多维数据建模是数据分析和决策的基础。

多维数据建模通过定义维度、度量和维表来描述数据仓库中的数据。

以下是一些常用的多维数据模型:1. 星型模型:星型模型是最常见的多维数据模型之一。

在星型模型中,事实表位于中心,围绕它是多个维度表。

这种模型结构简单,易于理解和维护,适用于规模较小的数据仓库。

2. 雪花模型:雪花模型是星型模型的扩展,通过将维度表进一步细分为多个子表来进行优化。

雪花模型的优点是可以节省存储空间,但查询性能相对较低。

3. 网络模型:网络模型是多维数据模型的另一种变体。

在网络模型中,维度表和事实表通过连接表进行关联。

这种模型结构复杂,适用于复杂的分析场景。

在进行多维数据建模时,需要根据具体业务需求选择合适的模型。

同时,还需要考虑数据的一致性和灵活性,以支持不同层次的数据分析和各种查询。

第二部分:查询优化技术数据仓库中的查询优化是提高系统性能和用户查询响应时间的关键。

以下是一些常用的查询优化技术:1. 聚集与分区:聚集和分区通过在事实表和维度表上创建预聚集和分区索引,以加速查询性能。

聚集和分区可以减少磁盘I/O访问次数,提高查询效率。

2. 查询重写:查询重写是对用户查询进行优化和重构的技术。

通过对查询语句进行重写,可以更高效地执行查询操作。

例如,使用子查询或连接查询代替嵌套循环,减少查询时间。

3. 数据压缩:数据压缩是另一种提高查询性能的关键技术。

将数据进行压缩可以减少存储空间的占用,并提高数据的读取速度。

4. 并行处理:并行处理是一种同时处理多个查询的技术。

通过将查询任务划分为多个子任务,并在多个处理单元上并行执行,可以提高查询效率。

数据仓库的多维数据模型

数据仓库的多维数据模型

数据仓库的多维数据模型数据仓库是一个用于存储和管理大量数据的系统,它被广泛应用于企业和组织中,用于支持决策制定和业务分析。

在数据仓库中,多维数据模型是一种常用的数据建模方法,它能够提供灵活、高效的数据查询和分析功能。

本文将详细介绍数据仓库的多维数据模型的概念、特点和设计原则。

一、概念多维数据模型是一种以多维方式组织和表示数据的模型。

它将数据组织成多个维度和事实表的形式,通过维度之间的关联关系和事实表中的度量指标,可以对数据进行多维分析。

多维数据模型的核心思想是将数据组织成一个多维的立方体结构,其中每个维度都代表一个数据属性,而事实表则包含了度量指标和与维度相关的外键。

二、特点1. 多维性:多维数据模型能够同时考虑多个数据维度,包括时间、地理位置、产品、客户等。

通过在不同维度上进行切片、钻取和旋转等操作,可以快速获取不同层次的数据分析结果。

2. 立方体结构:多维数据模型可以被看作是一个立方体,其中每个维度都代表一个轴,而事实表则代表立方体的中心。

通过在不同维度上进行切片和钻取操作,可以从不同角度对数据进行分析。

3. 易于理解和使用:多维数据模型的结构清晰,易于理解和使用。

用户可以通过直观的界面进行数据查询和分析,无需编写复杂的SQL语句。

4. 高性能:多维数据模型采用了预计算和聚合等技术,可以提高数据查询和分析的性能。

通过事先计算和存储聚合结果,可以避免对大量数据进行复杂的计算操作。

三、设计原则1. 维度设计:在设计多维数据模型时,需要合理选择和定义维度。

维度应该具有明确的含义和层次结构,以便于用户理解和使用。

同时,维度之间应该具有清晰的关联关系,以支持多维分析。

2. 事实表设计:事实表是多维数据模型的核心,它包含了度量指标和与维度相关的外键。

在设计事实表时,需要选择合适的度量指标,并确定与维度之间的关联关系。

同时,事实表的结构应该尽量简化,以提高数据查询和分析的性能。

3. 聚合设计:为了提高数据查询和分析的性能,可以使用聚合技术对数据进行预计算和存储。

数据仓库的多维数据模型

数据仓库的多维数据模型

数据仓库的多维数据模型1. 引言数据仓库是一个用于存储和管理大量结构化和非结构化数据的系统,它被广泛应用于企业决策支持和商业智能领域。

多维数据模型是数据仓库中最常用的数据建模方法之一,它能够提供灵活、高效的数据查询和分析功能。

本文将详细介绍数据仓库的多维数据模型,包括概念、设计原则、模型结构和使用场景等方面的内容。

2. 概念多维数据模型是一种以多维数据结构来表示和组织数据的模型。

它将数据组织成多个维度(Dimensions)和度量(Measures),通过将维度和度量交叉组合形成多维数据立方体(Cube)。

维度表示数据的特征或属性,如时间、地点、产品等;度量表示需要进行分析和计算的数值数据,如销售额、利润等。

多维数据模型通过将维度和度量建立关联关系,形成多维数据立方体,实现对数据的灵活查询和分析。

3. 设计原则在设计多维数据模型时,需要遵循以下几个原则:3.1 清晰的业务需求首先,需要明确数据仓库的业务需求和分析目标。

根据业务需求确定需要分析的维度和度量,以及它们之间的关系。

清晰的业务需求是设计成功的关键。

3.2 维度的层次结构维度是多维数据模型的核心,需要将维度按照层次结构进行组织。

例如,时间维度可以按照年、季度、月、日等层次进行组织。

层次结构可以帮助用户更好地理解数据和进行钻取分析。

3.3 明确的度量度量是需要进行分析和计算的数值数据,需要明确度量的定义和计算方法。

例如,销售额可以定义为订单金额的总和。

明确的度量定义可以确保数据分析的准确性。

3.4 适当的聚集在设计多维数据模型时,需要考虑数据的聚集需求。

根据业务需求,可以在多维数据模型中预先计算和存储一些聚集数据,以提高查询性能。

4. 模型结构多维数据模型由维度、度量和多维数据立方体组成。

维度是数据的描述性属性,度量是需要进行分析和计算的数值数据。

多维数据立方体是维度和度量的交叉组合,可以进行灵活的查询和分析。

4.1 维度维度是描述数据的特征或属性,如时间、地点、产品等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.
库存事务

记录影响库存水平的主要因素,如:商品的进/出仓库事务等 每个事务(分列项)对应事实表中的一行
3.
库存累积快照

每一件商品在事实表中都有一行,用于记录该商品的分发历史,直至 其离开仓库为止
2015/6/3
Data Warehouse
29
库存模型 - 周期库存快照

目标

确保合适的商场在合适的时间中存在合适的商品 可最大限度地减少脱销现象,并减少存货维护的总体 开销
四步维度建模
业务处理过程 粒度 维度 事实(度量值)
2015/6/3
:零售商场的库存 :每个商场每天每种商品的库存 :最初的维度选择(日期,商场,商品) :库存数量
Data Warehouse 30
库存模型 - 周期库存快照
日期维度
日期关键字 日期属性…
事实表 日期关键字 产品关键字 商场关键字 现有数量
产品维度
产品关键字 产品属性…
商场维度 商场关键字 商场属性…
商场周期库存快照模型


‘商场’维也可以被替换为‘货栈’维 也会有新的维度表和维度属性加进来
Data Warehouse 31
2015/6/3
库存模型 - 周期库存快照

1 商品的‘库存’事实表与‘销售’事实表的区别

销售事实表是稀疏的

日期关键字(FK) 产品关键字(FK) 商场关键字(FK) 销售量 销售额

可以由外关键字的组合构成事实表 的主关键字(Primary Key)
Data Warehouse 5
2015/6/3
6.1 维度建模初步

维度表

维度表是事实表的查询入口,为用户提供了使用 数据仓库的接口。 维度表中的维度属性通常用于定义事实表上的查 询条件,也可作为定义报表和统计查询的列。 维度表的定义原则

在销售事实表中记录每天实际发生的商品销售情况

库存事实表则是稠密的

而库存事实表则需要记录每天、每种商品、在每个商场的库存 情况(不管是否发生了实际的销售事实) 即使某个产品在某个时期是零库存,也要在事实表中生成相应 的度量值为 0 的行

2015/6/3
Data Warehouse
32
库存模型 - 周期库存快照
2015/6/3
Data Warehouse
8
6.1 维度建模初步
‘产品’维度表 产品关键字(PK) 食物类型描述 产品描述 重 量 SKU编号 重量单位 商标描述 储藏类型 分类描述 货架类型 部门描述 货架宽度 包装类型描述 货架高度 包装尺寸 货架深度 含脂量描述 ……
Data Warehouse 9

可以存放5到10年的日期维度值

日期维度中的属性 日历日期编号 日历周编号 日历月编号 财政月日编号 周末指示符 月末指示符
Data Warehouse
日期关键字(PK) 日期完全描述 星期 纪元日编号 纪元周编号 纪元月编号
2015/6/3
日历周结束日期 年度日历周数 日历月名 年度日历月数 日历年月(YYYYMM)
2015/6/3
Data Warehouse
20
模型的演化

维度变得具有更多的粒度性

可能需要重建新的维度表和事实表

全新数据源的加入,会同时牵涉现存的维度和不 能预见的新维度

创建新的事实表和维度表
2015/6/3
Data Warehouse
21
6.2.1 案例之一:零售营销

维度表中关键字的设计
库存模型 - 周期库存快照

2 半加型事实 (Semiadditive Facts)

只在部分维度上具有可加性的度量值被称为‘半加型 事实’ 在商品营销中,绝大部分的度量值在所有的维度范围 内都具有极好的可加性。


在库存快照模型中,‘库存量’可以跨‘产品’或 ‘商场’进行汇总(具有可加性),但不具有跨‘日 期’的可加性。

来源:数据的入口

前台的POS机

后台的货物入库

目的:管理决策需要

定价
促销
2015/6/3
Data Warehouse
13
6.2.1 案例之一:零售营销
选取业务处理

考虑:在什么促销条件下,在什么样的日子里,在什 么商店,正在销售什么样的商品?
定义粒度

POS事务的单个商品条目 最初粒度的选择与可以执行的分析操作有关
库存模型 - 周期库存快照

扩充的事实表

库存数量(持有量,现有量) 销售量
成本核算值
最新售价核算值
在三个维度之间都是可加的

处于同一张事实表中的上述度量值需要具有统一 的统计粒度
2015/6/3

事实表的粒度类型:事务(细节),周期快照,累积快照
2015/6/3
Data Warehouse
3
6.1 维度建模初步

事实表 - 度量值

最常用的度量值:数值类型

可做加法运算(非常重要)
可沿着某些维度做加法运算(半加性质)
不能做加法运算(非加性质)

计数统计 计算平均值 取样统计
18
维度设计

退化维度

维度表为空,具体的维度值直接存放在事实表中。例 如:

事务编号 订单编号 发票编号 提货单编号 ……
2015/6/3
Data Warehouse
19
模型的演化

模型的演化

新的维度属性

新的维度

在事实表中填加新的外关键字

新的度量值

填加新的度量值属性 事实表的粒度考虑

很少采用文本形式的度量值

文本信息通常都放在维度表中,除非它对于事实表中的每一行 都是唯一的

度量值通常是一个可以连续取值的量
Data Warehouse 4
2015/6/3
6.1 维度建模初步

事实表 - 关键字

日销售情况事实表
每个事实表都有两个或两个以上的 外关键字(Foreign Key) 通过外关键字建立事实表与维表之 间的联系,从而可以通过维度表的 值来存取事实表中的度量值
1.
选取要建模的业务处理过程

分析需要
2.
定义业务处理的粒度

事实表中每一行的度量值的取值粒度
3.
选择事实表中的维度

确定维度表中的属性
4.
选择事实表中的度量值

分析对象 每一张事实表中可以有多个度量值
Data Warehouse 12
2015/6/3
6.2.1 案例之一:零售营销
需求分析

主要概念

商品值链 三种事实表模型

周期快照,事务,累积快照


半加型事实
增强型库存事实 数据仓库总线结构与矩阵 一致性维度与事实
Data Warehouse 25
2015/6/3
6.2.2.1 商品值链

值链:值链确定了企业主体活动的自然逻辑流程
2015/6/3
Data Warehouse
食物类型描述 重 量 重量单位 储藏类型 货架类型 货架宽度 货架高度 货架深度 ……
7
6.1 维度建模初步

维度表 - 维度属性

通常是文本数据,或者是离散数据 尽量减少使用编码属性

维度属性与度量值的区别

度量值:含有多种取值并可以参与统计运算的属性 维度属性:

离散的或取值不多的的属性; 取值不变或很少产生变化的属性; 从不参与统计计算但经常用作查询条件的属性
日销售情况事实表
日期关键字(FK)
产品关键字(FK) 商场关键字(FK)
销售量
销售额
2015/6/3
6.1 维度建模初步

事实与维度的融合

将一张事实表及其相关的若干张维表结合在一起可 以构成一个星型结构 产品维度
日销售情况事实表 产品关键字(PK) 产品属性……
日期维度 日期关键字(PK) 日期属性……

在稠密的周期库存快照事实表中,在每一天都需 要加入每一种商品在每一个商场的库存情况,这 将导致事实表的数据量过于庞大
解决办法


随着时间的推移可降低周期快照的频度,例如:

最近60天内的以天为粒度单位的周期快照 最近3年内的以周为粒度单位的周期快照
2015/6/3
Data Warehouse
33
其分析的依据是来自于每一步业务处理过程的事实表 从每一步业务处理过程的业务数据库中可以衍生出一 个或多个事实表

2015/6/3
Data Warehouse
28
6.2.2.2 库存模型

三种互补的库存模型
1.
周期库存快照


定期生成每种商品的库存水平(数量)
对于每一件商品,在事实表中都有若干行,以反映该商品在不同时期 的库存水平
第六章 多维建模 (Dimensional Modeling)
2015/6/3
1
6.1 维度建模初步

维度建模中的基本概念

事实表:存储主要实事 维度表:存放维成员的取值

事实与维度的融合

星型模型:维度表作为事实表的卫星 雪花模型:将星形模型中的维度表改造成星形模型 数据立方体
相关文档
最新文档