构建基于FoodMart数据库的数据仓库建立与OLAP(实验一)
数据仓库和数据挖掘的OLAP技术

感谢您的观看
THANKS
大数据OLAP技术可以提供多 维度的数据分析,帮助用户 深入了解数据的内在联系和 规律。
云端OLAP
01
云端OLAP技术将OLAP服务部署在云端,为用户提供灵活、可伸缩的数据分析 服务。
02
云端OLAP技术可以利用云计算的优势,实现快速部署、自动扩缩容和按需付 费等特性,降低用户的IT成本。
03
云端OLAP技术可以支持多用户同时访问和操作,提高数据分析的效率和协作 性。
雪花模型
维度表之间存在层级关系,数据结构 复杂,适用于数据量较大的情况。
多维数据的存储
分布式存储
将数据分散存储在多个节点上,提高存储容量和查询效率。
压缩存储
对数据进行压缩,减少存储空间占用,但会增加查询时的解压缩开销。
多维数据的查询
MDX查询语言
用于查询多维数据的专用语言,功能强大且灵活。
SQL查询
数据挖掘利用机器学习、统计学等方法,从大量数据中发现有价值的模式和规律,为企业提供新的商业 机会和竞争优势。
06
OLAP技术的发展趋势
实时OLAP
01
实时OLAP技术能够提供实时 的数据分析和查询,满足用户 对数据实时性的需求。
02
实时OLAP技术通过采用高性 能的数据存储和查询技术,如 列式存储、分布式计算等,提 高了数据查询的响应速度。
OLAP技术通过多维数据分析模型, 提供交互式的查询、报表、仪表板 等功能,使得用户能够从多个角度 分析数据,获得深入的业务洞察。
决策支持系统
决策支持系统(DSS)是利用数据仓库和OLAP技术,为决策者提供数据 分析和决策建议的系统。
DSS通过整合企业内外部数据,提供多维度的数据分析工具,帮助决策者 了解业务状况、预测未来趋势,从而做出科学、合理的决策。
构建基于FoodMart数据库的数据仓库建立与OLAP(实验一)资料

• 这时会在BI Studio环境中打开用于设计SSIS的 各种工具和窗口,数据提取、转换和加载的操作 都在这个界面下进行。 • (2)选择【项目】→【SSIS导入和导出向导】 命令,这时会弹出SSIS导入和导出向导的欢迎界 面,单击【下一步】按钮。 • (3)在“选择数据源”窗口中的“数据源”下拉 列表框中选择Access数据源选项,如图2-4所示。 然后在路径选择中选择此项目文件夹中的 foodmart 2000.mdb文件。
2-7
• 这时会让用户选择源表和源视图,如图2-7 所示。按照前面对数据仓库的设计,这里 选择原始表中的time_by_day、 promotion、product、product_class、 customer、store和sales_fact_1998表 作为需要输入的表。
• 这里对原始表中需要导入到数据仓库的数据有很 强的可定制性,对这些已经选择的表中的字段还 可以进行筛选和改变,对不需要的字段进行去除 操作,这就是所谓的数据清洗。当然也可以选择 其他的表一起导入数据仓库中。可以看到,不一 定所有的业务数据库中的数据都必须体现在数据 仓库中,数据仓库中的数据也有可能是经过业务 数据库中的数据运算而得到的,这都据源视图
• 数据源提供与数据库的简单连接,但更 多高级功能,如缓存元数据、添加关系、 创建计算和设置逻辑键等还需要使用数据 源视图来完成。为了对多维数据集进行这 些高级操作,这一步定义数据源视图。
• 可以在“数据源视图”文件夹对象上单击鼠标右 键,在弹出的快捷菜单中选择【新建数据源视图】 命令,然后在弹出的“数据源视图向导”窗口中 选择foodmartsaleDW选项作为关系数据源,单 击【下一步】按钮。这时会弹出如图2-13所示的 “名称匹配”窗口,其原因是在前面SSIS的数据 装载操作中没有为数据仓库中的表设置主键及其 关系,SSAS试图在匹配的列上创建逻辑关系, 可以选择“与主键同名”单选按钮,单击【下一 步】按钮继续
数据挖掘Olap实验报告

实验报告一、实验目的利用oracle 10g数据库和OLAP分析工具对数据仓库中的大量数据进行分析,经过对大量数据的分析总结,从分析的结果中得出这些大量数据中隐含的对企业或个人有用的知识和信息,这些知识有助于企业管理者对企业的发展做出有利的决策。
二、实验原理1)原理概述要想得到对决策者有用的知识和信息,必须是建立在对大量数据分析的基础上。
而这些数据是保存在基于数据分析的数据仓库中,数据仓库内保存了企业最近几年销售或和销售有关的大量数据。
利用对大量数据进行分析的OLAP工具,对数据仓库中的数据从企业关心的某个角度进行分析,就可以得出有用的知识,辅助决策者做计划。
对数据分析需要多维的数据信息,而我们目前用的都是二维的关系数据库,所以我们必须将多维的数据信息保存在二维的数据库中。
要达到这个目的,我们首先在关系数据库中建立两种表即维表和事实表,维表中记录了多维数据在每个维度的信息,事实表中记录了多维数据在交叉点处的具体取值。
我们主要看的就是事实表中那些关键的数据。
本实验涉及的一些术语:维:是我们观察某个问题的角度。
如我们可以从时间维,地理维,客户维等角度看数据。
层次:是对维的进一步细化。
如时间维可以划分为年月日等层次。
维的成员:就是某个维的具体取值。
2)分析数据的软件环境oracle 10g数据库:提供数据存储的地方。
oracle客户端:建立数据表和进行数据分析。
三、实验步骤1)启动oracle 10g数据库。
在系统的服务管理工具中手动启动,或系统开机自动加载。
2)设计所分析问题的数据结构和在数据库中建立的维表和事实表。
本实验中主要是对某公司产品的销售和盈利情况做数据分析。
我们从时间维,地理维,客户维,产品维四个角度对某公司的产品销售量和盈利情况分析,分别对应的维表名为W_TIME , W_POS ,W_CLIENT, W_PRODUCT,然后建立事实表,对应的表名为W_SALE,这五个表的结构如下图所示:图1客户维的数据表结构图2 地理维的数据结构图3 产品维的数据结构图4 时间维的数据结构图5 销售情况的事实表结构在数据库中建立这五个表后就可以在表中存放企业的业务数据,本实验中的数据如下:图6 客户维表中的数据图7 地理维表中的数据图8 产品维表中的数据图9 时间维表中的数据结构图10 销售事实表中的数据3)在数据库中建立了事实表和维表就意味着我们已经将多维的数据存储到二维的关系数据库中了。
数据仓库的构建与OLAP分析

数据仓库的构建与OLAP分析在当今信息爆炸的时代,企业和组织需要处理庞大的数据量,并从中获取有价值的信息和洞察力。
为了实现高效的数据管理和分析,数据仓库的构建和OLAP(联机分析处理)已经成为了重要的技术手段。
本文将介绍数据仓库的构建过程以及OLAP在数据仓库中的应用。
1. 数据仓库的构建1.1 数据仓库的概念数据仓库是指将来自各种数据源的、按照一定规则加工处理后储存在一个统一、集成的数据存储区域中的数据集合。
它是用于支持决策分析和业务智能的基础设施。
1.2 数据仓库的架构数据仓库的架构通常包括数据提取、数据清洗、数据转换和数据加载等环节。
首先,从各种数据源中提取数据,并进行初步的清洗工作,如去除重复数据和处理缺失值。
然后,对提取的数据进行转换和整合,以满足数据仓库的数据模型和规范。
最后,将经过处理的数据加载到数据仓库中。
1.3 数据仓库的设计原则在进行数据仓库的设计时,需要考虑以下原则:- 数据整合性:确保不同数据源的数据能够正确地整合到数据仓库中。
- 数据一致性:保证数据在不同时间点和不同维度上的一致性。
- 查询性能:设计合理的数据存储结构,以提供高效的查询性能。
- 数据安全性:对敏感数据进行保护,并设置适当的权限控制。
2. OLAP分析2.1 OLAP的概念OLAP(联机分析处理)是一种面向数据仓库的多维、高度交互式、快速的数据分析和查询技术。
它通过提供灵活的维度分析和聚集计算功能,帮助用户更好地理解和分析数据。
2.2 OLAP的基本操作OLAP的基本操作包括切片(Slice)、切块(Dice)、钻取(Drill)、旋转(Rotate)和透视(Pivot)等。
切片操作可以在一个或多个维度上对数据进行过滤。
切块操作可以从数据集中选择特定的维度和数据进行分析。
钻取操作可在数据的不同层次之间进行导航。
旋转操作可以改变数据的展示方式,以得到更直观的分析结果。
透视操作可以对数据进行领域间的转换和分析,提供全新的视角。
客户关系管理分析与数据挖掘——基于Foodmart数据库

数据展示
SPSS进行K-均值快速聚类分析结果
最终聚类中心
Recency Frequency Money
1 335.93
47.09 $316.25
2 139.87
7.07 $44.10
3 354.96
129.10 $864.96
4 305.27
13.30 $85.04
每一类客户的描述统计量
பைடு நூலகம்
value
20.26
分类
Common
个数
1127
33.18
Important
2144
37.96
Best
309
18.68
Uncetain
4244
以Customer_Segment表 为事实表, Segment_category表 、customer表和 region表为维度建立多维数据集Cube
以建立的Cube为数据源,建多维报表。
以“Country”,“State Province”,“City”,“Cluter Name”和“Gender”为维度,Value为度量建立的多维报表。
数据挖掘(Microsoft决策树)
分析客户的类别与什么相关。把CluterName作为 Customer表的属性,然后以CluterName作为可预测 列,然后进行数据挖掘。
对于Foodmart而言,不同的客 户具有不同的内在价值。 公司的首要问题就是采取有效方法对客 户进行分类,发现客户内在价值的变化规律 与分布特征,并以此制定客户的差别化服务 政策,通过政策的实施将客户分类的结果作 用于企业实践。
RFM模型经常使用的三个指标分别是: 近度(Recency) 、频度( Frequency) 、值 度(Monentary) ,以RFM模型为基础,通过 客户的RFM行为特征衡量分析客户忠诚度与 客户内在价值。
数据仓库中的OLAP多维模型设计与应用

数据仓库中的OLAP多维模型设计与应用导言:在当今信息时代,数据成为企业决策的重要基础。
为了更好地管理和分析海量数据,数据仓库通过采集、整合和存储数据,为企业提供决策支持。
而OLAP多维模型作为数据仓库中的数据分析和报表工具,具有较高的灵活性和可视化性,大大提高了企业对数据的利用价值。
本文将深入探讨数据仓库中OLAP多维模型的设计和应用。
一、数据仓库中OLAP多维模型的设计原则在进行数据仓库中OLAP多维模型设计时,需要遵循以下原则,以保证模型的有效性和可用性。
1. 根据业务需求进行建模:在设计多维模型之前,需要明确和全面理解企业的业务需求。
建模过程应该根据业务需求对数据进行合理、清晰的组织,使得数据结构可被直观理解和使用。
2. 划分维度和度量:多维模型中的维度和度量是构成模型的重要要素。
维度是描述业务的属性,例如客户、时间、地理位置等;度量是需要被分析和计量的指标,如销售额、利润、库存等。
在设计多维模型时,需要将维度和度量分类清晰。
3. 设计合适的粒度:模型的粒度决定了分析的详细程度。
过大的粒度可能导致信息丢失,而过小的粒度则会增加模型维度和冗余数据。
因此,在设计多维模型时,需要根据业务需求和数据的可用性选择合适的粒度。
4. 使用层次结构:利用层次结构可以对维度进行组织和层次化展示,方便用户进行数据分析。
例如,时间维度可以包含年、季度、月、日等层次。
在设计多维模型时,需要充分利用层次结构来提供灵活的分析能力。
5. 进行性能优化:多维模型中的数据量通常较大,为了保证查询和分析的效率,需要进行性能优化。
可以通过设计合适的聚集表、索引和分区等方式来提高查询性能,减少数据的读取和计算时间。
二、数据仓库中OLAP多维模型的应用案例在实际应用中,OLAP多维模型可以广泛用于企业的各个领域,以满足不同的决策支持需求。
以下以销售数据分析为例,介绍数据仓库中OLAP多维模型的应用。
1. 销售业绩分析:通过构建销售多维模型,可以对销售业绩进行多维度的分析。
数据仓库与OLAP实践

10
2.结构流程
获取Content MathML 定义变量U,用于存放解析生 成源码
进行DOM解析
否 否 是
解析结束
文本节点
是
否
元素节点
是
孩子节点 为空
否
是
属性为元素 />
U附加元素
U附加属性
源码格式处理
11
生成Harvest格式源码
3.演示
12
13
14
15
16
5
2.结构流程
爬行流程
种子注入 URL信息库 待抓取队列
爬取模块
初始种子
解析、抽取、转换
6
2.结构流程
解析流程
提取网页
MathML公式抽取模块
MathML公式转换模块
Harvest源码生成模块
Harvest文件存储模块
7
2.结构流程
MathML公式抽取
\\<\\S*?\\:??math[\\s\\S]*?\\>[\\S\\s]*?\\<\\/\\S*?\\:??math\\>
爬虫
1
1. 功能描述 2. 结构流程 3. 演示
2
1.功能描述
3
1.功能描述
从互联网上获取文档资源信息,解析文档获取数 学公式,将公式转化成harvest格式并存储到本 地硬盘上,以供后面分析
4
1.功能描述
<mws:harvest>
<mws:expr url=”/art12” expr_id=”13343” > <m:apply> <m:plus/> <m:ci>x</m:ci> <m:ci>y</m:ci> </m:apply> </mw:expr> </mws:harvest>
创建OLAP实例(数据仓库与数据挖掘)

实验报告课程名称数据仓库与数据挖掘实验项目创建OLAP实例专业班级蔡国庆吧姓名猜测学号指导教师实验成绩2012年10月8日一、实验目的1、熟悉SQL Server 2005 Management Studio和Business Intelligence Development Studio基本操作2、掌握数据仓库的基本构建方法3、理解数据浏览和分析的基本方法二、实验环境sql server 2005、Visual Studio 2005、Windows XP三、实验过程对华兴商业银行(一个虚拟的银行)在2000年至2005年之间的贷款数据进行的多维分析(原数据:华兴商业银行贷款数据_Data),具体完成以下实验内容:1、将“华兴商业银行贷款数据_Data”数据库按要求转换成新的数据库“华兴商业银行贷款”,并装载到Manager Studio中。
在附加完“华兴商业银行贷款数据”数据库后,右击“导出数据”功能。
创建“华兴商业银行贷款分析”数据库,并选择为目标数据库:但由于软件问题,导出失败,无法建立数据流连接:最终操作停止:改用Transact-SQL语言执行:select*into华兴商业银行贷款分析.dbo.贷款类别代码表from华兴商业银行贷款数据.dbo.贷款类别代码表select*into华兴商业银行贷款分析.dbo.贷款期限代码表from华兴商业银行贷款数据.dbo.贷款期限代码表select*into华兴商业银行贷款分析.dbo.法人基本信息表from华兴商业银行贷款数据.dbo.法人基本信息表select*into华兴商业银行贷款分析.dbo.信贷机构代码表from华兴商业银行贷款数据.dbo.信贷机构代码表select*into华兴商业银行贷款分析.dbo.贷款分析视图from华兴商业银行贷款数据.dbo.贷款分析视图2、建立“华兴商业银行贷款”的关系图。
在设置主码之前,先删除贷款类别代码表中的重复记录。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 这时会在BI Studio环境中打开用于设计SSIS的 各种工具和窗口,数据提取、转换和加载的操作 都在这个界面下进行。 • (2)选择【项目】→【SSIS导入和导出向导】 命令,这时会弹出SSIS导入和导出向导的欢迎界 面,单击【下一步】按钮。 • (3)在“选择数据源”窗口中的“数据源”下拉 列表框中选择Access数据源选项,如图2-4所示。 然后在路径选择中选择此项目文件夹中的 foodmart 2000.mdb文件。
建立foodmartsaleAS项目
• 打开“解决方案资源管理器”,可以看到 数据源、数据源视图、多维数据集、维度 和挖掘结构等8个文件夹对象,建立和管理 数据立方也是主要针对这8个对象进行的。 下面介绍创建数据立方的步骤
2.3.1 定义数据源
• 这是创建数据立方的第1步。在“解决方案 资源管理器”中的“数据源”文件夹上单 击鼠标右键,在弹出的快捷菜单中选择 【新建数据源】命令,如图2-11所示。
设置名称匹配
• 这时进入“选择表和视图”窗口,如图214所示。可以从选定的数据源提供的对象 列表中选择表和视图。这里主要的商务需 求是对销售数据进行分析,所以可以把相 关的数据表都选入数据源视图,对数据源 中与分析需求关联不大的要素也可以不选 入此分析视图,例如此处的region表可以 不用选入数据源视图。
• FoodMart数据库涉及到公司经营的各个 方面,包括产品、库存、人事、客户和销 售等。一个真正的商业智能应用应该对这 些业务需求进行全面地考虑。本章截取这 些需求中的销售部分构建商业智能
• 打开配套文件中附带的foodmart.mdf文件, 可以看到如图2-1所示的表
• 人事管理中的员工信息存储在employee表中 • 员工所属部门信息存储在department表中 • 职务信息则存储在position表中 • 库存管理业务中的仓库类型存储在 warehouse_class表中 • 具体的仓库存储在warehouse中。
基于FoodMart数据库的福马特 商业智能系统
构建基于FoodMart数据库的福马特商业智能系统。按 照学习理论,“大处着眼,小处着手”是快速学习的好方法, 它既能把握全局,又能掌握细节 内容安排上属于实践中的“务实”,理论上的“务虚”, 只着眼于操作过程而忽略其中的深奥理论,目的在于明确一 个商业智能应用的全貌
• 在图2-7的界面中,还可以对数据导入的目 标进行定制,可以对映射方式进行编辑, 甚至可以自己写“CREATE TABLE”语句作 为复制的目标表。这些改变都可以体现在 数据仓库的物理结构中。
• 这里不对映射及其目标进行变更,保持默认的状 态,使生成的数据仓库的物理模型完全符合前面 对数据仓库的逻辑模型的设计。 • (7)以上操作完成后,单击【下一步】按钮,系 统将会把前面的操作列表并要求用户确认,并提 示将会把包以“Package1.dtsx”作为文件名保存 在项目文件夹下面,而且不会立即执行。确认无 误后单击【完成】按钮。 • (8)在“解决方案资源管理器”中展开“SSIS 包”文件夹,在Package1.dtsx上单击鼠标右键, 在弹出的快捷菜单中选择【设为启动对象】命令, 如图2-8所示。
2.3 创建OLAP数据立方
• 设计好了结构良好的数据仓库,并且将需要分 析的业务数据装载到了数据仓库中之后,就为满 足商务决策的全方位需求打下了根基,以后的操 作都是基于这些拥有数据的数据仓库进行的。但 是,对数据的多维分析却并不是主要针对数据仓 库,而是针对从数据仓库中提取的子集,如数据 集市和多维数据集(也称为数据立方)。因此通 常还需要在具体分析数据之前创建数据立方。
• 以上操作完成后,单击【下一步】按钮, 为此数据源视图命名为Vfoodmartsale, 再单击【完成】按钮结束此向导
选择表和视图
• 同样也是由于数据源中的表没有设置主键的原因, 现在打开的数据源视图上的表都是独立的,相互 之间没有关系,还需要我们设置各个表的主键及 其关系才能成为可用的视图。 • 一般来说,事实表是没有主键的,而维度表都有 主键,且每一个维度表的主键都是事实表的外键, 因而,需要为每一个维度表设置主键,如图2-15 所示,在维度表中选择应该为主键的字段,然后 单击鼠标右键,在弹出的快捷菜单中选择【设置 逻辑主键】命令,即可设置维度表的主键。
• (9)单击工具条上的 运行按钮运行这个工 程,可以发现在SSIS设计界面的“控制流” 和“数据流”等选项卡内都有对象在活动, 这是系统正在把数据从foodmart 2000.mdb数据库中按照前面所确定的规 则装载入foodmartsaleDW数据仓库中。
• 新建的数据仓库中的表需要设置必要的主 键及外键,否则无法建立多维数据集 • SSIS的进一步使用请参照朱德利书第四章 • 案例见4.3
• 这里希望用雪花形结构来构建福马特商店 的销售数据仓库,逻辑结构设计图如图2-2 所示
销售数据仓库雪花形结构设计图
• 在数据仓库的逻辑结构中,数据表可以划 分为两类:一类是事实数据表(简称为 “事实表”),用来存储数据仓库中的实 际数据,如这里存储1998年销售数据的 sales_fact_1998表即为事实表; • 另一类是维度数据表(简称为“维度 表”),用来存储数据仓库中的维度数据, 如这里的关于时间、促销手段和产品等分 析要素的表均为维度表。
新建数据源
• 在弹出的“选择如何定义连接”窗口中选 择“基于现有连接或新连接创建数据源” 单选按钮,在“数据连接”列表框中选择 foodmartsaleDW数据源,如果没有此连 接,可以单击【新建】按钮,定义指向 foodmartsaleDW 数据仓库的连接。设置 完成后的页面如图2-12所示。由于向导下 面的操作是没有必要的,所以这里可以直 接单击【完成】按钮结束数据源向导。
2.1.2 设计数据仓库逻辑模型
• 福马特市场部的商务需求是要对1998年 进行的所有销售业务数据进行多角度分析, 以便市场分析人员能在查询数据库时获取 快速的响应,高层管理人员也能从总体上 把握影响本年度销售的因素。这需要利用 存储在公司业务数据库中的数据,建立数 据仓库,进而创建可用于分析的多维数据 结构。
2-7
• 这时会让用户选择源表和源视图,如图2-7 所示。按照前面对数据仓库的设计,这里 选择原始表中的time_by_day、 promotion、product、product_class、 customer、store和sales_fact_1998表 作为需要输入的表。
• 这里对原始表中需要导入到数据仓库的数据有很 强的可定制性,对这些已经选择的表中的字段还 可以进行筛选和改变,对不需要的字段进行去除 操作,这就是所谓的数据清洗。当然也可以选择 其他的表一起导入数据仓库中。可以看到,不一 定所有的业务数据库中的数据都必须体现在数据 仓库中,数据仓库中的数据也有可能是经过业务 数据库中的数据运算而得到的,这都取决于具体 商务活动的需求。
2.1.3 创建 foodmartsaleDW数据仓库
• 数据仓库也是一种数据库,其管理同样是 通过数据库管理系统(DBMS)来进行的。 因此数据仓库可以像普通数据库一样进行 创建、修改和删除。当数据仓库的逻辑结 构设计完后,就可以创建物理数据仓库了
• 这时可以在SQL Server Management •。 Studio中按照一般的建立数据库的方法建 立一个名为“foodmartsaleDW”的数据库, 然后把这里设计的表创建好,数据类型依 据原始数据库中的各个表和字段的数据类 型设置 • 但由于这里数据仓库的表结构与原始数据 库中的表结构基本一致,因此,创建 foodmartsaleDW数据仓库的物理结构过 程也可以在ETL阶段完成
定义数据连接
2.3.2 定义数据源视图
• 数据源提供与数据库的简单连接,但更 多高级功能,如缓存元数据、添加关系、 创建计算和设置逻辑键等还需要使用数据 源视图来完成。为了对多维数据集进行这 些高级操作,这一步定义数据源视图。
• 可以在“数据源视图”文件夹对象上单击鼠标右 键,在弹出的快捷菜单中选择【新建数据源视图】 命令,然后在弹出的“数据源视图向导”窗口中 选择foodmartsaleDW选项作为关系数据源,单 击【下一步】按钮。这时会弹出如图2-13所示的 “名称匹配”窗口,其原因是在前面SSIS的数据 装载操作中没有为数据仓库中的表设置主键及其 关系,SSAS试图在匹配的列上创建逻辑关系, 可以选择“与主键同名”单选按钮,单击【下一 步】按钮继续
•
FoodMart数据库是SQL Server以前版本所带 的示例数据库,它模拟了一家大型的食品连锁店 的经营业务所产生的数据。 • 其商业数据保存在一个数据库中,其中包括了 客户管理数据、销售数据、分销数据和库存数据 等。随着业务量的增加经营状况,而传统的报 表形式和数据处理方式已经不能满足这一要求, 因此在保留历史数据的基础上构建商业智能应用 已经迫在眉睫。下面就描述满足这一商务需求的 技术实现过程。
• 注意,在本例中设计的维度表和事实表与原始数 据中的表名及结构都一致,这主要是由原始数据 的特点和本章作为入门章节的定位决定的。在实 际设计的时候,通常需要根据需求情况重新建立 与原始数据不同的表结构。这主要是由于传统业 务的数据库是用来进行事务处理的(即OLTP), 而数据仓库则是用来进行分析处理的(即OLAP), 用途的不同决定了其结构的不同。这一点在以后 复杂的数据仓库设计中会通过示例体现出来。
•
如前所述,这里只着眼于销售方面的数据,因 而把与销售相关的表提炼出来进行分析。在 foodmart数据库中,销售业务的数据和时间、促 销手段、产品和店铺等都有关系,它们的关系体 现在表与表之间的逻辑关系上。 • 要从业务数据出发设计数据仓库的结构,必 须明确业务数据本身的结构,而业务数据的关系 一般是基于关系数据库设计的范式。数据仓库中 表的关系不受关系数据库设计范式的约束,但也 要遵循一定的结构规范,如星形结构和雪花形结 构即是这种类型的规范。同时这也是数据仓库逻 辑结构的两种类型。。