数据仓库的开发流程2精品PPT课件
合集下载
《数据仓库》PPT课件 (2)

数据仓库体系结构
数据库系统模式(操作型数据)
采购子系统: 订单(订单号,供应商号,商品号,类别,单价。数量,总金额,日
期, … ) 供应商(供应商号,供应商名,地址,电话,…)
销售子系统: 客户(客户号,姓名,地址,电话, … ) 销售(客户号,商品号,数量,单价,日期, … )
库存子系统: 进库单(编号,商品号,数量,单价,日期, … ) 出库单(编号,商品号,数量,单价,日期, … ) 库存(商品号, 库房号,类别,单价,库存数量,
21
第2章 数据仓库
数据仓库体系结构
数据源
数据仓库
RDBMS 数据文件
其他
综合数据 当前数据 历史数据 元数据
分析工具 查询工具 OLAP工具 DM工具
抽取、转换、装载
精选ppt
22
第2章 数据仓库
数据仓库体系结构
数据仓库体系结构实例-税务数据仓库
数据源
ETL
数据存储
数据访问 数据展示
生产 数据库
数据集市
EXCEL
数据仓库
5-10 年
当前 详细数据
过去 详细数据
精选ppt
25
第2章 数据仓库
数据仓库体系结构
数据仓库数据的组织
• 数据由操作型环境(综合)导入数据仓库 • 数据具有不同的细节
早期细节级(过期数据) 当前细节级 轻度综合数据级(数据集市) 高度综合数据级
精选ppt
26
第2章 数据仓库
多渠道
社保库
遗留系统 数据库
E
外部 数据源
数据复制 平台
转换 T 中转区
L 加载 中转区
文档 数据
地市库
个税库
数据库系统模式(操作型数据)
采购子系统: 订单(订单号,供应商号,商品号,类别,单价。数量,总金额,日
期, … ) 供应商(供应商号,供应商名,地址,电话,…)
销售子系统: 客户(客户号,姓名,地址,电话, … ) 销售(客户号,商品号,数量,单价,日期, … )
库存子系统: 进库单(编号,商品号,数量,单价,日期, … ) 出库单(编号,商品号,数量,单价,日期, … ) 库存(商品号, 库房号,类别,单价,库存数量,
21
第2章 数据仓库
数据仓库体系结构
数据源
数据仓库
RDBMS 数据文件
其他
综合数据 当前数据 历史数据 元数据
分析工具 查询工具 OLAP工具 DM工具
抽取、转换、装载
精选ppt
22
第2章 数据仓库
数据仓库体系结构
数据仓库体系结构实例-税务数据仓库
数据源
ETL
数据存储
数据访问 数据展示
生产 数据库
数据集市
EXCEL
数据仓库
5-10 年
当前 详细数据
过去 详细数据
精选ppt
25
第2章 数据仓库
数据仓库体系结构
数据仓库数据的组织
• 数据由操作型环境(综合)导入数据仓库 • 数据具有不同的细节
早期细节级(过期数据) 当前细节级 轻度综合数据级(数据集市) 高度综合数据级
精选ppt
26
第2章 数据仓库
多渠道
社保库
遗留系统 数据库
E
外部 数据源
数据复制 平台
转换 T 中转区
L 加载 中转区
文档 数据
地市库
个税库
数据仓库开发模型ppt课件

amou_mone
agelevel_id time_id year_id month_id
geo_id prov_id city_id county_id produ_id amou_mone
全连接结果
time_id year_id month_id
produ_id
agelevel_id time_id geo_id produ_id
d 概括与聚集:向需要概括总数的数据中增加新的数值。 d 预算与推导:创建附加的数据字段。 d 转换与再映像:把数据源信息转化为适合于数据仓库事
实表行的过程以及将许多表组成事实表行的过程。
42
2.5.3 元数据的收集
v 元数据遍及数据仓库中的任何地方和环境中,因此元数据的收 集过程应尽量采用自动收集方式进行。
48
2.6.4 聚集模型的处理
v 聚集事实表已经独立存在并且可以与基本事实表一同保存。 v 通过将当前加载数据添加到系统中的累积“桶”中 ,可以创建
某时间短的聚集。 v 将数据的聚集与数据仓库的加载过程组合为同一处理过程 。 v 在将数据仓库数据加载以后,再进行聚集处理 。 v 每次在加载数据仓库数据时,都需要对各种聚集进行计算和
34
2.5 数据仓库的元数据模型
35
2.5.1 元数据的类型与组成
v 元数据是数据的数据,是对数据仓库中的各种数据的详细 的描述与说明。
v 根据元数据在数据仓库中所承担的任务,可以将元数据分 成静态元数据和动态元数据两类。
v 静态元数据主要与数据结构有关;动态元数据主要与数据 的状态和使用方法有关。
增加,及时保持聚集与基本数据的同步性 。
49
2.6.5 聚集模型的管理
v 要根据使用情况删除不经常使用的聚集 。 v 需要减少层次过于接近的聚集生成 。 v 注意将聚集独立存储在自己的事实表中,便于用户直接进
agelevel_id time_id year_id month_id
geo_id prov_id city_id county_id produ_id amou_mone
全连接结果
time_id year_id month_id
produ_id
agelevel_id time_id geo_id produ_id
d 概括与聚集:向需要概括总数的数据中增加新的数值。 d 预算与推导:创建附加的数据字段。 d 转换与再映像:把数据源信息转化为适合于数据仓库事
实表行的过程以及将许多表组成事实表行的过程。
42
2.5.3 元数据的收集
v 元数据遍及数据仓库中的任何地方和环境中,因此元数据的收 集过程应尽量采用自动收集方式进行。
48
2.6.4 聚集模型的处理
v 聚集事实表已经独立存在并且可以与基本事实表一同保存。 v 通过将当前加载数据添加到系统中的累积“桶”中 ,可以创建
某时间短的聚集。 v 将数据的聚集与数据仓库的加载过程组合为同一处理过程 。 v 在将数据仓库数据加载以后,再进行聚集处理 。 v 每次在加载数据仓库数据时,都需要对各种聚集进行计算和
34
2.5 数据仓库的元数据模型
35
2.5.1 元数据的类型与组成
v 元数据是数据的数据,是对数据仓库中的各种数据的详细 的描述与说明。
v 根据元数据在数据仓库中所承担的任务,可以将元数据分 成静态元数据和动态元数据两类。
v 静态元数据主要与数据结构有关;动态元数据主要与数据 的状态和使用方法有关。
增加,及时保持聚集与基本数据的同步性 。
49
2.6.5 聚集模型的管理
v 要根据使用情况删除不经常使用的聚集 。 v 需要减少层次过于接近的聚集生成 。 v 注意将聚集独立存储在自己的事实表中,便于用户直接进
《数据仓库》课件 (2)

数据仓库PPT课件 (2)
本课程将介绍数据仓库的定义、架构和应用,以及未来发展趋势和实现要点。
什么是数据仓库
定义
数据仓库是为了支持企业决策而设计的一种面向主题的、集成的、随时间变化而存储的数据 集合。
特点
数据仓库通过ETL过程,将分散的、异构的数据整合在一起,便于数据分析和决策支持。
区别
相比传统的OLTP系统,数据仓库更侧重于历史数据的存储和分析,而不是实时的事务处理。
数据仓库的架构
三层架构
数据仓库通常采用三层架构:数据 源层、数据存储层和数据展示层。
星型模式
维度建模是一种常见的数据仓库设 计方法,其中以某个业务过程为中 心的表称为事实表,以事实表中记 录所描述的业务过程为主题的表称 为维度表。
存储技术
数据仓库的存储技术包括关系型数 据库、列式存储和NoSQL数据库等 多种形式。
数据仓库的案例
银行信用卡分析数据仓库
银行为了管理信用卡业务和客 户信息,建立了基于数据仓库 的信用卡分析系统。
零售企业销售数据仓库
零售企业通过数据仓库实现对 商品销售、客户关系和供应链 的管理和分析。
航空公司航班数据仓库
航空公司通过数据仓库对航班、 机票销售、客户关系等数据进 行分析,提高运营效率和服务 水平。
数据仓库的应用
数据分析与决策支持
数据仓库为企业提供决策支持所需 的数据平台,包括数据分析、数据 挖掘、业务智能等多个方面。
大数据、云计算与数据仓库
数据仓库在大数据和云计算时代呈 现全新发展趋势,例如基于云计算 的数据仓库服务、数据湖等。
数据仓库的发展趋势
数据仓库的发展趋势包括数据仓库 自动化、流数据仓库、企业级数据 智能等多个方面。
本课程将介绍数据仓库的定义、架构和应用,以及未来发展趋势和实现要点。
什么是数据仓库
定义
数据仓库是为了支持企业决策而设计的一种面向主题的、集成的、随时间变化而存储的数据 集合。
特点
数据仓库通过ETL过程,将分散的、异构的数据整合在一起,便于数据分析和决策支持。
区别
相比传统的OLTP系统,数据仓库更侧重于历史数据的存储和分析,而不是实时的事务处理。
数据仓库的架构
三层架构
数据仓库通常采用三层架构:数据 源层、数据存储层和数据展示层。
星型模式
维度建模是一种常见的数据仓库设 计方法,其中以某个业务过程为中 心的表称为事实表,以事实表中记 录所描述的业务过程为主题的表称 为维度表。
存储技术
数据仓库的存储技术包括关系型数 据库、列式存储和NoSQL数据库等 多种形式。
数据仓库的案例
银行信用卡分析数据仓库
银行为了管理信用卡业务和客 户信息,建立了基于数据仓库 的信用卡分析系统。
零售企业销售数据仓库
零售企业通过数据仓库实现对 商品销售、客户关系和供应链 的管理和分析。
航空公司航班数据仓库
航空公司通过数据仓库对航班、 机票销售、客户关系等数据进 行分析,提高运营效率和服务 水平。
数据仓库的应用
数据分析与决策支持
数据仓库为企业提供决策支持所需 的数据平台,包括数据分析、数据 挖掘、业务智能等多个方面。
大数据、云计算与数据仓库
数据仓库在大数据和云计算时代呈 现全新发展趋势,例如基于云计算 的数据仓库服务、数据湖等。
数据仓库的发展趋势
数据仓库的发展趋势包括数据仓库 自动化、流数据仓库、企业级数据 智能等多个方面。
数据仓库 讲解23页PPT

人也看不见自己的背脊。——非洲 2、最困难的事情就是认识自己。——希腊 3、有勇气承担命运这才是英雄好汉。——黑塞 4、与肝胆人共事,无字句处读书。——周恩来 5、阅读使人充实,会谈使人敏捷,写作使人精确。——培根
数据仓库 讲解
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。
数据仓库 讲解
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。
数据仓库设计与开发培训课件(ppt 61页)

客 户
客户号
客户固有信息:客户号,客户名,性别,年龄,文化程度, 住址,电话等
客户经济息:客户号,年收入,家庭总收入等
概念模型到逻辑模型的转换
(1星维)促型 数确销模据定商型模品决的型策设的分计依析销步据需售骤。数求据如。下决:策部门需求城市是地区建立多 (时2间)从需求中识别出事实。选择或设计反映
1
商品
m 商品号 商品名 商品类号
销售
1
m 销售日期
商店号
商品号
销售数量
m 销售单位
1
1
m
存货 星期 商店号 商品号 数量
转换示例
(2)E-R图向多维表的转换
商品维
地区维
部门
地区
时间维 年
商品大类
商店
月
商品
周
日
销售事实
转换示例
(3) 利用 维关 键字 制定 的星 型模 型
时间
时间键 时间说明 日期 星期 月 年 级别号
数据仓库的结构
数据仓库的应用结构
基于业务处理系统的数据仓库 单纯数据仓库 单纯数据集市 数据仓库和数据集市
数据仓库的技术平台结构
单层结构 客户/服务器两层结构 三层客户/服务器 多层式结构
数据仓库使用方案和项目规划预算
实际使用方案还可以将最终用户的决策支持要求与 数据仓库的技术要求联系起来
信息? (3)提供决策支持的细节程度是怎样的?
数据仓库的成功标准和关键性能指标
(1)衡量数据仓库成功的标准是什么? (2)哪些关键的性能指标?如何监控? (3)对数据仓库的期望是什么? (4)对数据仓库的预期用途有哪些? (5)对计划中的数据仓库的考虑要点是什么?
《数据仓库开发实例》课件

数据仓库是随时间变化的
数据仓库中的数据会随着时间的推移 不断更新和变化,反映企业的业务发 展和变化。
数据仓库的体系结构
数据源
数据仓库的数据来源程,将数据从源系 统加载到数据仓库中。
数据仓库
存储和管理企业数据的核心部分,包括事实 表和维度表。
根据逻辑设计和物理设计,开发ETL过程,实现数据的抽取、转换和加载。
开发查询和管理工具
开发数据仓库的查询和管理工具,方便用户对数据进行查询和管理。
测试和验证
对数据仓库进行测试和验证,确保数据的准确性和完整性。
PART 03
数据仓库开发实例
REPORTING
实例一:零售业数据仓库
总结词:销售分析
详细描述:该实例展示了如何构建一个零售业数据仓库,用于分析销售数据,包 括商品类别、销售量、销售额等指标,以及如何利用数据仓库进行市场趋势预测 和销售策略优化。
总结与展望
REPORTING
数据仓库开发的总结
01
技术应用
随着大数据时代的来临,数据仓库技术得到了广泛应用。 在本次开发实例中,我们采用了先进的数据处理和分析技 术,实现了高效的数据存储、查询和分析。
02 03
业务价值
数据仓库在业务领域中具有重要价值,它能够帮助企业更 好地理解客户需求、优化业务流程、提高决策效率。通过 本次开发,我们成功地将数据转化为有价值的业务信息, 为企业提供了决策支持。
OLAP
联机分析处理,通过多维数据分析工具对数 据仓库中的数据进行查询和分析。
PART 02
数据仓库开发流程
REPORTING
需求分析
1 2
明确目标
理解业务需求,确定数据仓库的构建目标。
调研现状
数据仓库中的数据会随着时间的推移 不断更新和变化,反映企业的业务发 展和变化。
数据仓库的体系结构
数据源
数据仓库的数据来源程,将数据从源系 统加载到数据仓库中。
数据仓库
存储和管理企业数据的核心部分,包括事实 表和维度表。
根据逻辑设计和物理设计,开发ETL过程,实现数据的抽取、转换和加载。
开发查询和管理工具
开发数据仓库的查询和管理工具,方便用户对数据进行查询和管理。
测试和验证
对数据仓库进行测试和验证,确保数据的准确性和完整性。
PART 03
数据仓库开发实例
REPORTING
实例一:零售业数据仓库
总结词:销售分析
详细描述:该实例展示了如何构建一个零售业数据仓库,用于分析销售数据,包 括商品类别、销售量、销售额等指标,以及如何利用数据仓库进行市场趋势预测 和销售策略优化。
总结与展望
REPORTING
数据仓库开发的总结
01
技术应用
随着大数据时代的来临,数据仓库技术得到了广泛应用。 在本次开发实例中,我们采用了先进的数据处理和分析技 术,实现了高效的数据存储、查询和分析。
02 03
业务价值
数据仓库在业务领域中具有重要价值,它能够帮助企业更 好地理解客户需求、优化业务流程、提高决策效率。通过 本次开发,我们成功地将数据转化为有价值的业务信息, 为企业提供了决策支持。
OLAP
联机分析处理,通过多维数据分析工具对数 据仓库中的数据进行查询和分析。
PART 02
数据仓库开发流程
REPORTING
需求分析
1 2
明确目标
理解业务需求,确定数据仓库的构建目标。
调研现状
第二章数据仓库的技术与开发hymPPT课件

数据集市的分类
• 独立的数据集市 • 从属的数据集市
28
数据源 数据源 数据源
独立的数据集市
独立 数据集市
独立 数据集市
应用工具 应用工具 应用工具
• 如果一个数据集市 不依赖于中央数据 仓库,则这个数据 集市为独立数据集 市。
• 独立数据集市可能 会造成各数据集市 中的数据不一致、 形成信息孤岛、维 护困难等问题。
• 数据集市的概念 • 数据集市的分类
23
数据集市
• 数据集市的概念 • 数据集市的分类
24
数据集市的概念
• 数据集市我们可以把它理解成为部门级 的数据仓库
• 数据仓库是数据集市的集合
25
数据集市
• 数据集市的概念 • 数据集市的分类
26
数据集市的分类
• 独立的数据集市 • 从属的数据集市
27
• 这就是多维数据模型
61
概念建模的方法
• 传统方法——ER图 • 缺点 • 多维数据模型(星型模型)
➢维度 ➢事实度
62
多维数据模型(星型模型)
• 它是一种能够清楚表达分析领域的数据模型。 • 它包括两种建模要素: • 观察事物的角度---维度 • 观察得到的事实数据---事实
维度1
维度2
事实
➢维度 ➢事实度
58
传统方法——ER图
供应商
客户
产品
订单
发货
• 从数据模型的角度 看,所有实体之间 的关系是对等的。
• 但是实际上数据仓 库的实体绝不会是 相互对等的。
59
概念建模的方法
• 传统方法——ER图 • 缺点 • 多维数据模型(星型模型)
➢维度 ➢事实度
数据仓库的开发流程2

数据库与数据仓库设计的区别
数据仓库开发流程的特点
原始需求不明确,且不断变化与增加,不能较 准确地预见到以后的需求; 采用原型法开发,从构建系统的简单的基本框 架着手; 数据驱动,着眼于有效地抽取、综合、集成和 挖掘已有数据库的数据资源。
原型法
原型(Prototype)是开发信息系统的一个可执行 模型或引导性版本; 帮助得到目标系统明确而严格的需求,促进客户 和各阶段系统人员之间的相互有效的信息交流, 并以此为基础进行需求分析和系统设计。 从本质上看,原型是未来目标系统的一个模型。
可以划定一个当前的大致的系统边界,集中精力 进行最需要的部分的开发。
概念模型设计
任务:界定系统边界 确定主题域及其属性描述 数据模型(多维数据模型,或E-R) 成果:是在原有的数据库的基础上建立一 个较为稳固的概念模型。
确定主题域及其内容
确定主要的主题域
对每个主题域的内容进行较明确的描述: · 主题域的公共码键; · 主题域之间的联系; · 充分代表主题的属性组。
因素;
数据分析处理的要求是选择数据分割标准的一个主要依据; 还要考虑到所选择的数据分割标准应是自然的、易于实施 的;
同时也要考虑数据分割的标准与粒度划分层次是适应的。
关系模式定义
由多个表实现;
对于多维数据模型:事实表和维度表;
对于E-R模型:主题的相关信息的内容表
如,商品主题的关系模式定义包括:
E-R模型
各主题的属性信息
数据仓库的设计步骤
概念模型设计 技术准备工作 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库使用与维护
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库的设计步骤
数据仓库的设计步骤
概念模型设计 技术准备工作 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库运行与维护
概念模型设计
任务:界定系统边界 确定主题域及其属性描述 数据模型(多维数据模型,或E-R)
成果:是在原有的数据库的基础上建立一 个较为稳固的概念模型。
概念模型设计
仓库 维护
数据 仓库
填充与 测试数
开发 中间件
应用
据仓库
数据仓库的开发流程
数据仓库系统的开发是一个经过不断循环、 反馈而使系统不断增长与完善的过程,这 也是原型法区别于系统生命周期法的主要 特点。
数据仓库的设计步骤
概念模型设计 技术准备工作 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库使用与维护
·主题域的公共码键; ·主题域之间的联系; ·充分代表主题的属性组。 举例 以商场的数据仓库设计为例
商场数据仓库概念模型设计
日趋激烈的市场竞争要求商场经营者更加准确地了解商场经营状况, 跟踪市场趋势,更加合理地制定商品采购与销பைடு நூலகம்策略。
由于商场以前的一些OLTP 的需要,在各个部门建立了许多分散的 数据库,分别处理各自的业务。如在人事、采购、库存、销售等部门分 别存储着各自的数据库,各个部门的数据按自己业务需要加以组织。
逻辑模型设计
分析主题域 确定粒度层次划分 确定数据分割策略 关系模式定义 数据源及抽取模型的定义
分析主题域
对概念模型设计步骤中确定的几个基本主题域进行分析, 选择首先要实施的主题域;
如果所选择的主题域很大并且很复杂,我们甚至可以针对 它的一个有意义的子集来进行开发;
商场数据仓库设计的例子: “商品”主题既是一个商场的最基本的业务对象,又是进 行决策分析的最主要的领域,因而较之另两个主题来说, “商品”主题具有更重要的意义与作用。所以,我们可以 先选定“商品”主题来实施。
E-R模型
各主题的属性信息
数据仓库的设计步骤
概念模型设计 技术准备工作 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库使用与维护
技术准备工作
工作包括:技术评估,技术环境准备。 成果是:技术评估报告,软硬件配置方案,系统
(软、硬件)总体设计方案。
数据仓库的设计步骤
概念模型设计 技术准备工作 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库使用与维护
这样的组织使得数据各自为政,缺乏全局性,管理层想要在这些数 据的基础上得到一些全局报表、进行一些分析工作是比较困难的。因此 商场的领导决定要在原有的数据库系统的基础上建立一个数据仓库。
界定系统的边界
需求:主要是商品采购和销售情况 商场经营者目前所要进行的分析主要有:
·分析顾客的购买趋势; ·分析商品供应市场的变化趋势; ·分析供应商信用等级。
原型法
原型(Prototype)是开发信息系统的一个可执行 模型或引导性版本;
帮助得到目标系统明确而严格的需求,促进客户 和各阶段系统人员之间的相互有效的信息交流, 并以此为基础进行需求分析和系统设计。
从本质上看,原型是未来目标系统的一个模型。
原型法
原型不是系统开发的最终产品,而是在某 个开发阶段中为达到一定的目的所生成的 系统简化模拟版本;
任务:界定系统边界 确定主题域及其属性描述 数据模型(多维数据模型,或E-R)
成果:是在原有的数据库的基础上建立一 个较为稳固的概念模型。
界定系统边界(初步需求分析)
基本的方向性需求: 要做的决策类型有哪些? 决策者感兴趣的是什么问题? 这些问题需要什么样的信息? 要得到这些信息需要包含原有数据库系统的哪些 部分的数据?
界定系统的边界
所需要的数据应包括: ·商品销售数据; ·商品采购数据; ·商品库存数据; ·顾客信息; ·供应商信息。
所以,我们可以将系统的边界定为包含原有的销售子系统、 采购子系统以及库存子系统在内的集合。
确定主要的主题域
三个基本主题:商品、供应商和顾客。 主题之间的联系是:
供应商供应多种商品,一种商品可由多个供应商提供,即 “商品”主题与“供应商”供应的商品直接联系; 供应商供应的商品同样也可以被不同的顾客购买,但“顾 客”主题与“供应商”主题间并不是直接发生关系的,它 们之间的联系是经过“商品”主题的间接联系。
可能只是目标系统的一个式样,或只包含 目标系统的某些功能,或仅仅是具有目标 系统的一个结构。
原型法
数据仓库的开发流程
规划 与确定 需求
开发 概念 模型
开发 逻辑 模型
规划分析阶段
设计 体系 结构
数据库 与元数
据设计
数据 仓库 评价
数据仓库 使用维 开发过程 护阶段
设计实施
阶段
确定 数据源
抽取
数据
5. 系统实现 (数据库实现、程序实现)
4. 系统测试与实施
数据库与数据仓库设计的区别
数据仓库开发流程的特点
原始需求不明确,且不断变化与增加,不能较 准确地预见到以后的需求;
采用原型法开发,从构建系统的简单的基本框 架着手;
数据驱动,着眼于有效地抽取、综合、集成和 挖掘已有数据库的数据资源。
数据仓库的技术与开发
数据仓库设计开发流程
数据库系统的开发流程
需求收集和分析 设计概念结构
设计逻辑结构 数据模型优化
设计物理结构 设计评价性能预测
不满意
物理实现 实验性运行
不满意 使用维护数据库
需求分析阶段 概念设计阶段 逻辑设计阶段
物理设计阶段
数据库实施阶段 数据库运行维护阶段
数据库设计流程的特点
有明确的应用需求; 严格遵循系统生命同期的阶段划分,较清楚的
设计开发步骤; 良好的可操作性,每一步骤的任务、文档内容
与格式有细致的规定。 举例:项目文档
数据库设计举例
1. 需求分析 (沟通、会议演示、软件需求说明书)
2. 系统概念设计 (系统功能结构、流程、数据结构等)
3. 系统详细设计 (E-R、功能模块、界面、业务过程、接口)
可以划定一个当前的大致的系统边界,集中精力 进行最需要的部分的开发。
概念模型设计
任务:界定系统边界 确定主题域及其属性描述 数据模型(多维数据模型,或E-R)
成果:是在原有的数据库的基础上建立一 个较为稳固的概念模型。
确定主题域及其内容
确定主要的主题域 对每个主题域的内容进行较明确的描述: