数据库维度的基本概念
数据库设计中的维度建模与事实建模

数据库设计中的维度建模与事实建模在数据库设计中,维度建模和事实建模是两种重要的建模方法。
维度建模和事实建模针对不同的数据类型和数据关系进行建模,在构建数据仓库或者业务智能系统时起到关键的作用。
本文将介绍维度建模和事实建模的概念、原则以及应用场景。
一、维度建模维度建模是指以维度为中心进行数据建模的方法。
维度是一种反映业务面向用户部门的数据元素,是衡量和分析业务过程的关键属性,如时间、地点、产品、客户等。
维度建模的核心概念是"星型模型",其中一个中心表(事实表)与多个维度表相连。
1. 基本原则(1)维度应该具有唯一性和确定性。
(2)维度应该是可测量的属性,并且应该为业务过程的关键属性。
(3)维度之间应该具有层次关系。
2. 维度建模的步骤(1)识别关键业务过程和需求。
(2)识别和定义需要使用的维度。
(3)确定维度之间的层次关系。
(4)设计事实表,并且确定与维度表之间的关系。
(5)设计维度表。
(6)定义维度表之间的关系。
3. 应用场景维度建模适用于需要对业务过程进行度量和分析的场景,如经营决策、市场分析、销售分析等。
维度建模能够提供简洁、易于理解的数据模型,使得用户能够直观地分析和进行决策。
二、事实建模事实建模是指以事实为中心进行数据建模的方法。
事实是与业务过程中的事件和活动相关的数据集合,如销售金额、订单数量等。
事实建模的核心概念是"雪花模型",其中一个中心表(事实表)与多个维度表相连,并且维度表之间可以进一步展开。
1. 基本原则(1)事实应该与业务过程息息相关。
(2)事实应该是可计量和可观察的。
(3)事实应该能够满足系统设计的需求。
2. 事实建模的步骤(1)识别需要度量和分析的业务过程。
(2)确定需要度量的事实,并进行定义和测量。
(3)确定需要使用的维度,并与事实表建立关系。
(4)确定维度之间的关系,并进行细化。
3. 应用场景事实建模适用于需要对业务过程中的事件和活动进行度量和分析的场景,如销售分析、客户行为分析、物流分析等。
数据仓库多维数据模型的设计

1、数据仓库基本概念1.1、主题(Subject)主题就是指我们所要分析的具体方面。
例如:某年某月某地区某机型某款App的安装情况。
主题有两个元素:一是各个分析角度(维度),如时间位置;二是要分析的具体量度,该量度一般通过数值体现,如App安装量。
1.2、维(Dimension)维是用于从不同角度描述事物特征的,一般维都会有多层(Level:级别),每个Level 都会包含一些共有的或特有的属性(Attribute),可以用下图来展示下维的结构和组成:以时间维为例,时间维一般会包含年、季、月、日这几个Level,每个Level一般都会有ID、NAME、DESCRIPTION这几个公共属性,这几个公共属性不仅适用于时间维,也同样表现在其它各种不同类型的维。
1.3、分层(Hierarchy)OLAP需要基于有层级的自上而下的钻取,或者自下而上地聚合。
所以我们一般会在维的基础上再次进行分层,维、分层、层级的关系如下图:每一级之间可能是附属关系(如市属于省、省属于国家),也可能是顺序关系(如天周年),如下图所示:1.4、量度量度就是我们要分析的具体的技术指标,诸如年销售额之类。
它们一般为数值型数据。
我们或者将该数据汇总,或者将该数据取次数、独立次数或取最大最小值等,这样的数据称为量度。
1.5、粒度数据的细分层度,例如按天分按小时分。
1.6、事实表和维表事实表是用来记录分析的内容的全量信息的,包含了每个事件的具体要素,以及具体发生的事情。
事实表中存储数字型ID以及度量信息。
维表则是对事实表中事件的要素的描述信息,就是你观察该事务的角度,是从哪个角度去观察这个内容的。
事实表和维表通过ID相关联,如图所示:1.7、星形/雪花形/事实星座这三者就是数据仓库多维数据模型建模的模式上图所示就是一个标准的星形模型。
雪花形就是在维度下面又细分出维度,这样切分是为了使表结构更加规范化。
雪花模式可以减少冗余,但是减少的那点空间和事实表的容量相比实在是微不足道,而且多个表联结操作会降低性能,所以一般不用雪花模式设计数据仓库。
数据维度的名词解释

数据维度的名词解释数据维度是指用于描述一组数据的可度量或可观察方面的属性。
在数据分析和数据挖掘中,维度是非常重要的概念,它通过定义不同的属性,可以帮助我们更好地理解和解释数据。
一、什么是数据维度数据维度是用于表示数据的特定方面或属性。
它是一种将数据集合划分成不同类别或类别的过程。
通过对数据进行维度建模,可以将数据集组织成一个多维数据立方体,其中数据的每个维度都表示不同的特征或描述。
举个例子来说,假设我们要分析一家电子商务公司的销售数据。
在这个数据集中,我们可以使用多个维度对销售进行描述,如产品、地区、销售时间等。
通过将数据按照这些维度进行划分,我们可以更好地了解不同产品在不同地区和时间下的销售情况。
这样的维度建模有助于我们从不同的角度来观察数据,并发现数据中隐藏的模式和趋势。
二、数据维度的类型数据维度可以根据其性质和组织方式进行分类。
常见的数据维度类型包括:1. 时间维度:时间维度用于描述数据发生或记录的时间点或时间段。
例如,销售数据中的年份、季度、月份等都可以作为时间维度来分析销售情况的季节性变化和趋势。
2. 地理维度:地理维度用于描述与地理位置相关的数据特征。
例如,销售数据中的国家、城市、区域等都可以作为地理维度来分析不同地域的销售情况和市场发展趋势。
3. 产品维度:产品维度用于描述数据中的不同产品或商品。
例如,销售数据中的产品类别、品牌、型号等都可以作为产品维度来分析不同产品的销售情况和市场需求。
4. 客户维度:客户维度用于描述与客户相关的数据特征。
例如,销售数据中的客户类型、客户等级、客户地域等都可以作为客户维度来分析不同客户群体的购买行为和市场潜力。
5. 行为维度:行为维度用于描述与特定行为或事件相关的数据特征。
例如,用户行为数据中的点击、购买、访问时长等都可以作为行为维度来分析用户行为轨迹和决策过程。
通过将数据按照不同的维度进行划分,我们可以更好地理解数据的内在关系和潜在规律。
这种维度分析有助于我们获取有关数据集的更多信息,从而做出更准确的决策和预测。
大数据分析基础——维度模型

大数据分析基础——维度模型大数据分析基础——维度模型1基本概念维度模型的概念出自于数据仓库领域,是数据仓库建设中的一种数据建模方法。
维度模型主要由事实表和维度表这两个基本要素构成。
1.1维度维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。
维度属于一个数据域,如地理维度(其中包括国家、地区、省以及城市等级别的内容)、时间维度(其中包括年、季、月、周、日等级别的内容)。
维度是维度建模的基础和灵魂。
在维度建模中,将度量称为“事实” ,将环境描述为“维度”,维度是用于分析事实所需要的多样环境。
例如,在分析交易过程时,可以通过买家、卖家、商品和时间等维度描述交易发生的环境。
维度所包含的表示维度的列,称为维度属性。
维度属性是查询约束条件、分组和报表标签生成的基本来源,是数据易用性的关键。
1.2事实表事实表是维度模型的基本表,每个数据仓库都包含一个或者多个事实数据表。
事实数据表可能包含业务销售数据,如销售商品所产生的数据,与软件中实际表概念一样。
事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度和与业务过程有关的度量。
事实表中一条记录所表达的业务细节程度被称为粒度。
通常粒度可以通过两种方式来表述:一种是维度属性组合所表示的细节程度:一种是所表示的具体业务含义。
作为度量业务过程的事实,一般为整型或浮点型的十进制数值,有可加性、半可加性和不可加性三种类型。
相对维度来说,通常事实表要细长,行的增加速度也比维度表快的多,维度表正好相反。
事实表有三种类型 :1.事务事实表:事务事实表用来描述业务过程,眼踪空间或时间上某点的度量事件,保存的是最原子的数据,也称为“原子事实表\周期快照事实表”。
2.周期快照事实表:周期快照事实表以具有规律性的、可预见的时间间隔记录事实,时间间隔如每天、每月、每年等。
3.累积快照事实表:累积快照事实表用来表述过程开始和结束之间的关键步骤事件,覆盖过程的整个生命周期,通常具有多个日期字段来记录关键时间点,当过程随着生命周期不断变化时,记录也会随着过程的变化而被修改。
数据库设计中的维度建模与雪花模型

数据库设计中的维度建模与雪花模型在数据库设计中,维度建模与雪花模型是两个重要的概念。
维度建模是一种用于创建数据仓库和数据集市的技术,而雪花模型是维度建模的一种扩展形式。
本文将详细介绍维度建模和雪花模型的概念、优缺点以及使用场景。
## 维度建模维度建模是一种用于组织和存储数据的方法,它主要关注数据的业务维度(如时间、地点、产品和客户)和度量(即数值)。
维度建模的核心概念是将数据按照维度来组织,这样可以使数据变得更易于理解和查询。
在维度建模中,通常将数据分为事实表和维度表。
事实表存储度量的数据,即可度量的数值,例如销售额、访问次数等。
而维度表则存储与事实表相关的维度信息,例如时间、地点、产品和客户等。
维度建模的优点包括:1. 易于理解:维度建模将数据按照业务维度组织,使数据更加直观和易于理解。
2. 灵活查询:维度建模可以支持多维度的数据查询,方便进行多维度分析。
3. 性能高效:维度建模可以通过预聚合技术提高查询性能,加快数据检索速度。
## 雪花模型雪花模型是维度建模的一种扩展形式,它通过进一步分解维度的层级关系来提高数据的存储效率。
在雪花模型中,维度表被进一步分解为多个维度表,形成一颗类似雪花的形态,因此得名雪花模型。
雪花模型的优点包括:1. 存储效率高:雪花模型通过分解维度表来减小数据冗余和存储空间的占用,提高数据存储效率。
2. 数据一致性:雪花模型可以更好地维护维度表之间的层级关系,保证数据一致性和准确性。
3. 灵活性:雪花模型可以根据具体需求进行维度表的分解,使数据更加灵活和可扩展。
然而,雪花模型也存在一些缺点:1. 查询复杂度高:雪花模型的查询涉及到多个维度表,查询语句的编写和执行较为复杂,可能会对性能产生一定的影响。
2. 维护成本增加:由于雪花模型包含多个维度表,对整个模型的维护和管理成本较高,需要更多的精力和资源进行维护。
## 使用场景维度建模和雪花模型在不同的场景中有不同的应用。
维度建模适用于以下场景:1. 数据仓库:维度建模是构建数据仓库的常用方法,可以用于存储和分析大量的历史数据。
数据库设计中的维度建模与关系模型

数据库设计中的维度建模与关系模型在数据库设计中,维度建模和关系模型是两种重要的方法。
它们分别在不同的场景下发挥着重要的作用。
本文将对这两种方法进行详细的介绍和比较分析。
1. 维度建模维度建模是一种面向主题的数据库设计方法,它的核心思想是将数据按照不同的主题进行分类,并建立一个具有层次结构的数据模型。
在维度建模中,通常采用星型模型(Star Schema)或雪花模型(Snowflake Schema)来表示数据之间的关系。
星型模型是维度建模中最简单的模型之一,它由一个事实表(Fact Table)和多个维度表(Dimension Table)组成。
事实表存储了与某个特定的业务主题相关的事实数据,而维度表用于描述事实表中的数据。
维度表是一个包含了该维度的所有属性(如地理位置、时间、产品等)的表格,而事实表中的数据与维度表中的数据通过外键关联起来。
雪花模型基于星型模型,通过进一步拆分维度表,将一些维度表的属性再次细分成更小的维度表。
这样可以使得数据模型更加灵活,但同时也增加了数据冗余的可能性。
维度建模的优点在于:a. 易于理解和使用。
维度建模采用简单的模型结构来表示数据之间的关系,使得用户可以快速理解数据模型并进行查询和分析。
b. 高效的查询性能。
维度建模中的星型模型适用于大多数查询场景,可以通过索引的方式快速检索数据。
2. 关系模型关系模型是一种广泛应用的数据模型,它用关系(表)来表示数据之间的关系,并利用关系之间的连接来实现数据查询和处理。
关系模型使用结构化查询语言(SQL)进行数据操作。
在关系模型中,数据被组织成多个表,每个表都有列(属性)和行(记录)。
表与表之间通过外键关系进行连接。
关系模型使用范式(Normalization)来规范化数据,以减少数据冗余和提高数据的一致性。
关系模型的优点在于:a. 灵活性和扩展性。
关系模型可以根据具体需求进行灵活的数据模型设计,支持数据结构的变化和扩展。
b. 数据完整性和一致性。
维度管理 数据标准

维度管理 数据标准
维度管理是数据仓库中的一个重要概念,它用于组织和管理数据。
维度是指用于描述数据的属性或特征,例如时间、地点、产品、客户等。
在数据仓库中,维度通常以表格形式存储,称为维度表。
维度管理的主要目标是确保数据的一致性、准确性和可用性。
为了实现这一目标,需要建立数据标准,包括以下方面:
1. 维度定义:明确每个维度的含义、范围和取值规则。
2. 维度层次结构:建立维度之间的层次关系,以便更好地理解和分析数据。
3. 维度编码:为每个维度的取值分配唯一的编码,以便在数据仓库中进行快速查询和分析。
4. 维度维护:定期更新和维护维度表,确保数据的准确性和一致性。
通过建立数据标准,可以提高数据质量,减少数据冗余和错误,从而提高数据分析的效率和准确性。
同时,数据标准也有助于不同部门之间的数据共享和协同工作。
问卷调查 数据库设计 维度

问卷调查数据库设计维度
维度(Dimension)在数据库设计中是指数据库中的一组相关属性或特征,它描述了事物或实体的某个方面。
在数据仓库或数据分析领域,维度常用于描述商业活动的不同方面,例如时间、地理位置、产品、客户等。
维度通常与事实表(Fact table)结合使用,构成了星型模型或雪花模型。
通过使用维度,可以对事实数据进行分析和报表,从而提供用户对业务数据的全面认识和深入了解。
在进行问卷调查的数据库设计中,维度可以包括以下几个方面:
1. 调查时间维度:包括调查日期、调查时段等时间相关的属性,用于分析调查结果在不同时间维度上的变化趋势。
2. 调查地点维度:包括调查地区、调查场所等地理位置相关的属性,用于分析调查结果在不同地理位置上的差异。
3. 调查对象维度:包括被调查者的属性,例如年龄、性别、教育程度等,用于分析不同人群在调查结果上的差异。
4. 问卷题目维度:包括问卷的题目、选项等属性,用于分析不同题目对调查结果的影响。
5. 调查结果维度:包括调查结果的各个指标、评分等属性,用于对调查结果进
行统计和分析。
以上仅是一些可能的维度示例,具体的问卷调查数据库设计需要根据实际情况而定。
在设计维度时,需要考虑维度之间的关系和层次结构,并灵活应用维度建模技术,以满足用户的数据分析需求。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基本概念:1.多维数据集:多维数据集是联机分析处理(OLAP)中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。
多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。
2.xx(dimension):是多维数据集的结构性特性。
它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。
这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。
3.度量值:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。
此外,度量值是所分析的多维数据集的中心值。
即,度量值是最终用户浏览多维数据集时重点查看的数字数据。
您所选择的度量值取决于最终用户所请求的信息类型。
一些常见的度量值有sales、cost、expenditures和productioncount等。
4.元数据:不同OLAP组件中的数据和应用程序的结构模型。
元数据描述OLTP数据库中的表、数据仓库和数据集市中的多维数据集这类对象,还记录哪些应用程序引用不同的记录块。
5.级别:级别是维度层次结构的一个元素。
级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。
6.数据挖掘:数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP数据集中的数据。
之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。
7.多维OLAP(MOLAP):MOLAP存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。
根据分区聚合的百分比和设计,MOLAP存储模式为达到最快查询响应时间提供了潜在可能性。
总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。
8.关系OLAP(ROLAP):ROLAP存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。
但是,可为分区数据使用ROLAP存储模式,而不在关系数据库中创建聚合。
9.混合OLAP(HOLAP):HOLAP存储模式结合了MOLAP和ROLAP二者的特性。
10.粒度:数据汇总的层次或xx。
11.聚合|聚集:聚合是预先计算好的数据汇总,由于在问题提出之前已经准备了答案,聚合可以改进查询响应时间。
12.切块:由多个维的多个成员限定的分区数据,称为一个切块。
13.切片(slice):由一个维的一个成员限定的分区数据,称为一个切片。
14.数据钻取:最终用户从常规多维数据集、虚拟多维数据集或链接多维数据集中选择单个单元,并从该单元的源数据中检索结果集以获得更详细的信息,这个操作过程就是数据钻取。
15.数据挖掘模型:数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP数据集中的数据。
之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。
数据库维度(Databasedimension)“数据库维度”是与某个键属性相关的维度属性的集合,而该键属性又与度量值维度中的事实数据相关。
维度属性(Dimensionattribute)“维度属性”被绑定到维度表中的一个或多个列并包含成员。
维度属性可以包含客户名称、月份名称和产品名称。
成员(Member)“成员”是维度属性(包括度量值维度)的值。
层次结构中的成员可以是叶成员、父成员、数据成员或“(全部)”成员。
度量值(Measure)“度量值”是来自事实数据表的值,也称为“事实数据”。
度量值维度的值有时也通称为“成员”。
度量值通常是数值,但也可以是字符串值。
Measures维度(Measuresdimension)“度量值维度”是包含多维数据集中所有度量值的维度。
度量值维度是一种特殊的维度,其中的成员通常是根据各个维度属性(存在指定的度量值)的当前成员(通常采用求和或计数方式)进行聚合。
度量值组(MeasureGroup)“度量值组”是SQLServer2005AnalysisServices多维数据集中的相关度量值集合(通常是来自同一事实数据表的度量值)。
在SQLServer2005AnalysisServices 中,一个多维数据集可包含多个度量值组。
“(全部)”成员((All)member)“(全部)”成员是属性层次结构或用户定义的层次结构中的所有成员的计算值。
计算成员(Calculatedmember)“计算成员”是在查询时定义和计算的维度成员。
可以在用户查询或MDX计算脚本中定义计算成员,并将其存储在服务器上。
一个计算成员对应于定义它们的维度中的多个维度表行。
数据成员(Datamember)“数据成员”是在父子层次结构中与父成员相关联的子成员。
数据成员包含其父成员的数据值,而不是该父成员的子级的聚合值。
父成员(Parentmember)“父成员”是父子层次结构中的成员,包含其子级的聚合值。
xx成员(leafmember)“叶成员”是层次结构中不包含子级的成员。
子成员(Childmember)“子成员”是层次结构中位于顶层下面的成员。
键属性(Keyattribute)数据库维度的“键属性”是维度中的所有非键属性(以直接或间接方式)所链接到的属性。
键属性通常也是粒度属性。
粒度属性(Granularityattribute)多维数据集维度的属性,它将维度链接到度量值维度内度量值组中的事实数据。
如果粒度属性和键属性为不同的属性,则非键属性必须直接或间接地链接到粒度属性。
在多维数据集中,粒度属性定义维度的粒度。
多维数据集维度(Cubedimension)“多维数据集维度”是多维数据集中的数据库维度实例。
属性层次结构(Attributehierarchy)“属性层次结构”是包含以下级别的属性成员层次结构:包含所有非重复属性成员的叶级别,叶级别的各个成员也称为“叶成员”。
中间级别(如果属性层次结构为父子层次结构)。
可选的“(全部)”级别(IsAggregatable=True),它包含属性层次结构的叶成员的聚合值。
“(全部)”级别的成员也称为“(全部)”成员。
默认情况下,将为每个维度属性定义属性层次结构(AttributeHierarchyEnabled=True)。
属性层次结构默认为可见(AttributeHierarchyVisible=True)。
均衡层次结构(Balancedhierarchy)“均衡层次结构”是顶级成员与任何叶成员之间存在相同级别数的层次结构。
不齐整层次结构(Raggedhierarchy)请参见“非均衡层次结构(Unbalancedhierarchy)”。
非均衡层次结构(Unbalancedhierarchy)“非均衡层次结构”是顶级与叶级之间存在不同级别数的层次结构。
父子层次结构即是不齐整层次结构的一个例子。
非均衡层次结构也称为“不齐整层次结构”。
父子层次结构(Parent-childhierarchy)“父子层次结构”是一种将维度属性设置为parent类型的特殊的属性层次结构。
父子层次结构是由子成员和父成员构成的非均衡层次结构。
父子层次结构包含以下级别:包含父成员子级的子级别。
父成员的子级包含聚合到父成员的属性成员(包括数据成员)。
包含父成员的中间级别。
可选的“(全部)”级别(IsAggregatable=True),它包含父子层次结构叶成员的聚合值,“(全部)”级别的成员也称为“(全部)”成员。
每个维度中只能存在一个父子层次结构,并且必须与键属性相关。
用户定义的层次结构(User-definedhierarchy)“用户定义的层次结构”是属性层次结构的均衡层次结构,旨在帮助用户浏览多维数据集数据。
用户定义的层次结构不添加到多维数据集空间。
在某些情况下可以隐藏用户定义的层次结构中的级别并使其以非均衡的形式显示。
属性关系(Attributerelationship)“属性关系”是属性间的一对多关系,例如州省市自治区和城市维度属性间的关系。
成员属性(Memberproperty)成员属性是特性成员的属性,例如客户的性别或产品的颜色。
单元(Cell)多维数据集中的“单元”是度量值维度成员的成员与多维数据集中各个属性层次结构的成员相交处所在的空间。
度量值维度的成员可以是叶成员(单个事实数据)或聚合成员(例如,特定年份聚合的销售额)。
维度的成员可以是叶成员、数据成员、父成员或“(全部)”成员。
多维数据集空间(Cubespace)“多维数据集空间”是多维数据集属性层次结构的成员与多维数据集的度量值的交集。
子多维数据集(Subcube)“子多维数据集”是表示多维数据集的筛选视图的多维数据集子集。
可以使用MDX计算脚本中的Scope语句或MDX查询中的嵌套select语句定义子多维数据集。
带有嵌套select语句的子多维数据集(SubcubewithSubselect)用MDX查询中的嵌套select语句定义的子多维数据集包含符合子多维数据集定义的所有成员,其结果如下:包含层次结构的“(全部)”成员与包含层次结构的每个叶成员的结果是相同的。
包含任何成员将包括其xx和后代。
包含用户定义的层次结构中某级别的每个成员将包含该用户定义的层次结构中的所有成员,但可排除不与此级别成员共存的其他层次结构的成员(例如不包含客户的城市)。
多维数据集中的每个“(全部)”成员始终存在于从该多维数据集创建的子多维数据集中。
子多维数据集中的聚合值将进行直接求和。
SQLServer数据库维度表和事实表概述:事实表每个数据仓库都包含一个或者多个事实数据表。
事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。
事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性纬度表的主键,而维度表包含事实记录的特性。
事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与纬度表中对应项的相关索引字段之外的任何数据。
包含在事实数据表中的“度量值”有两中:一种是可以累计的度量值,另一种是非累计的度量值。
最有用的度量值是可累计的度量值,其累计起来的数字是非常有意义的。
用户可以通过累计度量值获得汇总信息,例如。
可以汇总具体时间段内一组商店的特定商品的销售情况。
非累计的度量值也可以用于事实数据表,单汇总结果一般是没有意义的,例如,在一座大厦的不同位置测量温度时,如果将大厦中所有不同位置的温度累加是没有意义的,但是求平均值是有意义的。
一般来说,一个事实数据表都要和一个或多个纬度表相关联,用户在利用事实数据表创建多维数据集时,可以使用一个或多个维度表。