数据仓库设计方法
数据仓库方案

contents
目录
• 数据仓库概述 • 数据仓库的架构 • 数据仓库的设计 • 数据仓库的建立 • 数据仓库的使用和维护 • 数据仓库的发展趋势和未来展望
01
CATALOGUE
数据仓库概述
数据仓库的定义
数据仓库是一个大型、集中式存储系 统,用于存储和管理企业或组织的数 据。
它是一个面向主题的、集成的、非易 失的数据集合,支持管理决策制定。
根据业务需求,设计出符合逻辑 的数据视图,以便进行数据查询 和报表生成。
物理设计
选择存储方案
根据数据量、数据特点 和使用频率等因素,选 择合适的存储方案,如 关系型数据库、 NoSQL 数据库等。
设计索引
根据查询需求,设计出 高效的索引方案,以提 高查询速度和性能。
设计数据分区
根据数据量和查询特点, 将数据进行分区存储, 以提高查询性能和数据 管理效率。
T ( Transform)
对抽取的数据进行清洗、整合、转换和加载等 操作,使其满足数据仓库的需求。
L ( Load)
将转换后的数据加载到数据仓库中,供后续分析和查询使用。
存储层
星型模型
以事实表为中心,周围关联多个维度表,形 成星型结构。
雪花模型
将维度表进一步拆分,形成更复杂的结构。
星座模型
将多个星型模型关联起来,形成一个更大型 的模型。
数据仓库的发展趋势
云端化
随着云计算技术的普及,越来越多的企业选择将数据仓库 部署在云端,以降低成本、提高可扩展性和灵活性。
大数据集成
数据仓库在处理大数据方面发挥着越来越重要的作用,通 过高效的数据集成和数据处理技术,满足企业对大数据分 析的需求。
数据仓库的设计与构建研究

数据仓库的设计与构建研究随着互联网技术的发展,数据量的快速积累和每天不断增长的数据趋势,数据管理变成了日益复杂的任务。
数据仓库便应运而生,成为了企业管理和数据分析的必然选择。
在企业的决策和战略制定中,数据仓库所扮演的角色越来越重要,也越来越值得重视。
一、数据仓库的概念数据仓库是指将企业各种分散的数据源汇集起来,进行预处理、汇总、加工、再分析处理等操作后进行存储的一个系统。
其目的是为了利用大数据环境下的企业数据,将其变成决策支持的信息,从而为企业决策提供可靠的数据支撑。
数据仓库结构主要包含以下几个重要组成部分:1. 数据源数据源是数据仓库的来源,包括操作性数据库、文件系统、网络、接口等等。
通过提取不同来源的数据,并将其汇总到仓库中进行统一存储、管理和维护,实现数据的集成化管理。
2. 数据加工处理数据加工处理是数据仓库中最为复杂的一部分,包括数据清洗、数据挖掘、数据转换、数据整合等等。
这一过程要求数据仓库管理员具有一定的数据处理能力,并且需要考虑多种因素的影响,例如数据量、类型、格式、质量等等。
3. 元数据元数据是指描述数据仓库的数据,包括数据类型、数据来源、数据转换规则、质量检验规则等等。
元数据的作用是对数据进行管理、维护、分发和使用,为数据共享和商业决策提供支持。
4. 多维分析多维分析是指对数据仓库中的数据进行分析、整理和处理,以便更好地展现数据的特征和规律。
多维分析可通过OLAP(联机分析处理)的方式对数据进行分析,再根据分析结果制定企业针对性的业务决策。
二、数据仓库的设计思路数据仓库的设计与构建需要全面考虑企业的业务需求和数据特点,通过规范化、标准化的方式来进行设计,使其能够满足企业需求,并为企业的决策提供支持。
1. 初步分析通过初步分析了解企业的业务场景和数据来源,以及研究需求和决策支持信息的种类、格式等,以便进一步确定数据仓库的设计。
2. 数据建模数据建模是数据仓库的核心,它需要根据不同的业务需求和对数据的认识,对数据进行分类、构建数据模型,以便完成数据转化的目标。
3-3数据仓库设计-逻辑模型

数据的行数 数据所占存储设备空间 数据所需要的索引空间
只能做数据级上的估算 从一方或多方收集信息进行合理估算
粗略估算数据量算法
双重粒度和单一粒度
表的行数是影响粒度划分主要的因素 将数据库的总行数与下表进行比较
确定粒度的循环和反复
选择合适的粒度级别是体系结构设计环境成功 的关键。 选择粒度级别的一般方法,是利用常识,建立 数据仓库的一小部分,并让用户去访问这些数 据。然后仔细聆听用户的意见,根据他们的反 馈意见适当调整粒度的级别。 最坏的想法是想要事先设计好所有的粒度级别, 再进行数据仓库的建造。 即使在最好的情况下,能使设计的5 0 %是正 确的就已经很不错的了。数据仓库环境的特点 就是只有当决策支持系统分析员实际看到了报 告之后,才能想像哪些是真正需要的。
……
… …
……
……
数据概括表与事实表对应关系
概括表表.列 名 是否 导出 事实表.列 名 SPGYB.SP 商品编号 _ID SPGYB.G YS_ID 供应商编号 备注 SPGKB.SP_I 否 D SPGKB.GYS _ID SPGKB.SPG YZSL SPGKB.SPG YZJE …… 否 是 是
例: 银 行 粒 度 设 计
例: 银 行 粒 度 设 计
数据分割
数据分片概念
水平分片 垂直分片 混合分片 导出分片
按时间进行数据分割是最普遍的 分割标准
数据量 数据分析处理的实际情况 简单易行 粒度划分策略
数据仓库的数据抽取模型
F2 KHCG F3 SPQK F4 ZGYJ
F1 数据抽取规则
确定粒度的循环和反复
提高粒度的方法
当源数据置入数据仓库时,对它进行汇总。 当源数据置入数据仓库时,对它求平均或进行 计算。 把最大/最小的设定值置入数据仓库。 只把显然需要的数据置入数据仓库。 用条件逻辑选取记录的一个子集置入数据仓库。 对于数据怎样轻度汇总是没有限制的(限制只 存在于设计者的脑海里)。
数据仓库模型的设计

数据仓库模型的设计数据仓库模型的设计大体上可以分为以下三个层面的设计151:.概念模型设计;.逻辑模型设计;.物理模型设计;下面就从这三个层面分别介绍数据仓库模型的设计。
2.5.1概念模型设计进行概念模型设计所要完成的工作是:<1>界定系统边界<2>确定主要的主题域及其内容概念模型设计的成果是,在原有的数据库的基础上建立了一个较为稳固的概念模型。
因为数据仓库是对原有数据库系统中的数据进行集成和重组而形成的数据集合,所以数据仓库的概念模型设计,首先要对原有数据库系统加以分析理解,看在原有的数据库系统中“有什么”、“怎样组织的”和“如何分布的”等,然后再来考虑应当如何建立数据仓库系统的概念模型。
一方面,通过原有的数据库的设计文档以及在数据字典中的数据库关系模式,可以对企业现有的数据库中的内容有一个完整而清晰的认识;另一方面,数据仓库的概念模型是面向企业全局建立的,它为集成来自各个面向应用的数据库的数据提供了统一的概念视图。
概念模型的设计是在较高的抽象层次上的设计,因此建立概念模型时不用考虑具体技术条件的限制。
1.界定系统的边界数据仓库是面向决策分析的数据库,我们无法在数据仓库设计的最初就得到详细而明确的需求,但是一些基本的方向性的需求还是摆在了设计人员的面前:. 要做的决策类型有哪些?. 决策者感兴趣的是什么问题?. 这些问题需要什么样的信息?. 要得到这些信息需要包含原有数据库系统的哪些部分的数据?这样,我们可以划定一个当前的大致的系统边界,集中精力进行最需要的部分的开发。
因而,从某种意义上讲,界定系统边界的工作也可以看作是数据仓库系统设计的需求分析,因为它将决策者的数据分析的需求用系统边界的定义形式反映出来。
2,确定主要的主题域在这一步中,要确定系统所包含的主题域,然后对每个主题域的内容进行较明确数据仓库建模技术在电信行业中的应用的描述,描述的内容包括:. 主题域的公共码键;. 主题域之间的联系:. 充分代表主题的属性组。
数据仓库概要设计

数据仓库概要设计数据仓库(Data Warehouse)是指把企业分散在不同数据库中的数据统一整合到一个数据库中进行存储和管理,并对这些数据进行分析和管理的一种数据库应用系统。
数据仓库的建设是企业信息化建设的重要组成部分,是企业对内部外部信息资源进行整合、挖掘和利用最有效的平台之一。
因此,进行数据仓库的概要设计是非常重要的一步。
1.数据仓库概述数据仓库,是一个能够存储大量历史数据的集合体,使得企业能够快速地进行数据分析、查询和决策。
数据仓库通常包括存储、管理和查询技术。
数据仓库的设计是基于自底向上的过程,通过收集各种应用中的数据来建立。
数据仓库的需求分析是设计的第一个步骤,通过需求分析可以把握到数据的来源、数据的主要特征、数据的处理方法、数据的处理效果等。
2.数据仓库的工作过程a.数据的收集数据收集的目的是获取各个分散在企业内部外部的数据源,并把这些数据源整合成数据集。
数据收集包括了跟踪源数据、数据的标准化、数据的清洗、数据的转换等。
b.数据的整合数据整合意味着将不同的数据源集成到一起,通常是通过ETL工具来实现。
ETL(Extract, Transform, Load)工具的主要功能是提取、转换和加载。
c.数据的存储数据仓库的存储方式一般有两种:关系型数据库和非关系型数据库。
d.数据的查询与分析数据仓库的用户可以通过BI工具(Business Intelligence)来进行数据的查询、分析和报表生成。
3.数据仓库的概要设计步骤a.数据仓库设计的第一步是需求分析,需求分析的目的是明确数据仓库的目标、范围和需求。
需求分析应该包括数据仓库的使用者、数据仓库所需数据的类型、数据的来源、数据的质量要求等。
b.数据仓库的概念设计是在需求分析的基础上,开始进行数据仓库的抽象模型的设计。
概念设计包括了数据仓库的模型设计、元数据的设计等。
c.数据仓库的逻辑设计是在概念设计的基础上,开始进行数据仓库的逻辑结构的设计。
数据仓库建模

数据仓库建模数据仓库建模是指根据业务需求和数据分析目标,对数据仓库进行设计和构建的过程。
它包括数据仓库的架构设计、数据模型设计、ETL(提取、转换和加载)流程设计等方面。
以下是关于数据仓库建模的详细介绍。
1. 数据仓库架构设计:数据仓库架构设计是数据仓库建模的第一步,它确定了数据仓库的整体结构和组织方式。
常见的数据仓库架构包括星型模型、雪花模型和星座模型等。
在架构设计中,需要考虑数据仓库的数据来源、数据存储方式、数据访问方式等因素,以确保数据仓库的高效性和可扩展性。
2. 数据模型设计:数据模型设计是数据仓库建模的核心环节,它定义了数据仓库中的数据结构和关系。
常用的数据模型包括维度模型和事实模型。
维度模型主要用于描述业务维度和维度之间的关系,而事实模型主要用于描述业务事实和事实之间的关系。
在数据模型设计中,需要根据具体业务需求,确定维度和事实的属性,并建立它们之间的关联关系。
3. ETL流程设计:ETL流程设计是数据仓库建模的关键环节,它负责将源系统中的数据提取、转换和加载到数据仓库中。
ETL流程包括数据抽取、数据清洗、数据转换和数据加载等步骤。
在ETL流程设计中,需要考虑数据抽取的频率、数据清洗的规则、数据转换的逻辑和数据加载的方式等因素,以确保数据仓库中的数据质量和一致性。
4. 数据仓库建模工具:数据仓库建模通常使用一些专业的建模工具,如PowerDesigner、ERwin等。
这些工具提供了丰富的建模功能,可以帮助数据仓库建模人员快速设计和构建数据仓库。
在使用建模工具时,需要熟悉工具的操作流程和功能,以提高建模效率和质量。
5. 数据仓库建模的最佳实践:在进行数据仓库建模时,需要遵循一些最佳实践,以确保数据仓库的高效性和可维护性。
首先,需要与业务人员紧密合作,深入了解业务需求和数据分析目标,以确保数据仓库的建模结果能够准确满足业务需求。
其次,需要遵循一致性和标准化的建模规范,以确保数据仓库中的数据结构和关系的一致性和可理解性。
数仓建设方法论

数仓建设方法论随着大数据时代的到来,数据成为企业发展的重要资源。
为了更好地利用和管理数据,数仓建设成为企业信息化建设的重要环节。
数仓建设方法论是指在数仓建设过程中所采用的一系列方法和原则,旨在帮助企业高效、有序地构建数据仓库,实现数据价值最大化。
一、需求分析阶段在数仓建设的初期阶段,需求分析是关键的一步。
通过与业务部门的沟通和理解,明确企业的业务需求和数据需求,确定数仓的建设目标和规划。
在需求分析阶段,应注重以下几点:1. 充分了解业务需求:与业务部门进行深入交流,了解业务流程、数据来源和数据需求,明确业务指标和分析要求。
2. 定义数据模型:根据业务需求和数据特点,设计合适的数据模型,包括维度模型和事实模型。
数据模型的设计应符合规范,保证数据的准确性和一致性。
3. 制定数据采集计划:根据数据来源和数据质量要求,制定数据采集计划,明确数据的提取、清洗和转换等步骤,确保数据的完整性和可用性。
二、数据建模阶段数据建模是数仓建设的核心环节,它是将业务需求转化为数据模型的过程。
在数据建模阶段,应注意以下几点:1. 建立维度模型:根据需求分析阶段定义的数据模型,建立维度模型,包括维度表和事实表。
维度模型的设计应具有层次清晰、灵活性强的特点,方便后续的数据分析和查询。
2. 选择合适的ETL工具:ETL(Extract-Transform-Load)是将数据从源系统抽取、清洗和加载到数仓中的过程。
在选择ETL工具时,应根据数据量、数据质量和业务需求等因素进行评估,选择适合的工具。
3. 设计数据质量控制策略:数据质量是数仓建设的关键问题,对数据的准确性和一致性要求较高。
因此,在数据建模阶段应设计数据质量控制策略,包括数据清洗、数据校验和数据修复等措施,确保数据质量达到要求。
三、数据加载和存储阶段在数据建模完成后,需要将清洗好的数据加载到数仓中,并选择合适的存储方式进行数据存储。
在数据加载和存储阶段,应注意以下几点:1. 选择合适的存储方式:根据数据量、查询性能和成本等因素,选择合适的存储方式,包括关系型数据库、列式数据库和分布式存储等。
数据仓库的设计与开发

02
在物理设计时,我们常常要按数据的重要程度、使用频率以及对响应时间的要求进行分类,并将不同类的数据分别存储在不同的存储设备中。
01
重要程度高、经常存取并对响应时间要求高的数据就存放在高速存储设备上,如硬盘;
02
存取频率低或对存取响应时间要求低的数据则可以放在低速存储设备上,如磁盘或磁带。
03
10
主键
Product-Name
char
25
产品名称
Product-SKu
char
20库存单位ຫໍສະໝຸດ 销售员维表包括不同地区的所有销售员信息
Salpers-Key
integer
15
主键
Salpers-Name
char
30
销售员姓名
Territory
char
20
销售员所在区域
Region
char
20
所在地区
订单事实表
销售数据和维
销售数据
商品
促销
时间
部门
城市
地区
商店
图4.2 销售业务的多维数据
(4)确定数据汇总水平
(5)设计事实表和维表
按使用的DBMS和分析用户工具,证实设计方案的有效性 根据系统使用的DBMS,确定事实表和维表的具体实现。由于不同的DBMS对数据存储有不同的要求,因此设计方案是否有效还要放在DBMS中进行检验
包括公司收到的所有订单
Order-Key
integer
10
订单键
Order-Name
char
20
订单名称
Product-ref
integer
10
参考产品主键
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在数据库实施阶段,设计人员的主要工作是使用 DBMS所提供的语言和宿主语言,根据数据库逻
辑设计阶段和数据库物理设计阶段的成果建立数 据库,并编制和调试数据库应用程序。
在数据库运行和维护阶段,设计人员的主要工 作是将是运行后的数据库正式运行,并在运行过 程中,对数据库所反映出的问题不断修改、评价 、调试和完善。
规划与 确定需
求
规划 分析阶段
数据仓库 开发过程
设计实 施阶段
数据库 与元数 据设计
确定 数据 抽取源
数据仓 库评价
使用维护 阶段
开发 中间 件
数据 仓库 维护
数据 仓库 应用
填充与 测试数 据仓库
3. 数据仓库的开发特点
数据仓库的使用也即在数据仓库中建立DSS应用
。数据仓库的开发特点包括: (1)数据仓库开发要从数据出发 (2)数据仓库使用的需求不可能在开发初期就明
实际上,数据库实际步骤也包括了数据库应用 系统的设计过程。
有关对数据处理特性的描述中,不同的数据库 的设计过程、数据库设计的不同阶段应该具有不 同的数据模式。如在需求分析阶段,应该是用户 应用需求模式;在概念设计阶段,应该是产品的 概念模式;而在逻辑设计阶段,则应该是有关数 据产品支持的数据模型。
2. 数据仓库的体系结构
(1)信息获取层:负责数据的收集、提纯、净化 和聚合,以及从组织外部数据源和组织的业务处 理系统中获取数据。
(2)信息存储层:提供包含时点信息的单一逻辑 信息,这种数据通常以最分散的方式存放——需 要尽可能使物理设计符合数据模型,这对最终产 生满足各种设计要求的灵活性是十分重要。
,最终用户的需求主要体现在对工作流程的分析
、决策的查询需求、报表需求、操作需求和数据
需求等方面。同时,在进行数据仓库的最终用户
需求分析时,还需要对数据仓库的主题域、信息
的粒度、数据仓库的维度进行分析。
3.1.4 数据仓库规划
1.项目开发小组
(1)项目开发小组概述:
不是所有的团体都是小组。一个团体要作为
开发者负责数据仓库各个构件的物理安装和
集成。
开发者需求进一步包括如下四个方面: A.技术需求 B.试用需求 C.数据仓库产品就绪需求 D.开发与使用人员及其技术需求
(4)最终用户需求的分析
数据仓库相对最终用户而言是一个黑箱,他
们只能通过查询、报表工具和数据仓库内部信息
的某种影射关系来访问数据仓库内部数据。因而
(3)三层客户/服务器结构:这类结构包括基于 工作站的客户层、基于服务器的中间层和基于主 机的第三层。主机(宿主)层负责管理数据源和 可选的源数据转换;服务器运行数据仓库和数据 集市软件,并存储仓库的数据;客户工作站运行 查询和报表运用程序,且还可以存储从数据集市 或数据仓库卸载的局部数据。
(4)多层式结构:这是在三层客户/服务器结构 上发展起来的数据仓库结构。
来聚在一起,这就破坏了小组工作的一个关键—
—交流。
2.项目开发小组对数据仓库规划
与其他项目一样,一个好的计划能带来有效的开 端,数据仓库项目开发小组必须要对即将开发的 数据仓库项目进行整体规划,作出项目开发计划 书,以使项目变得易于理解。
表3-1 数据仓库项目对照表(1)
项目1
项目2
业务驱动因素
3.2.3 数据仓库的数据抽取、加载与复制 3.2.4 数据仓库逻辑模型的确定 3.2.5 数据仓库物理模型的确定 3.2.6 数据仓库测试 3.3 数据仓库典型解决方案
3.1.1 数据库设计方法简述
在相当长的一段时期内,数据库设计主要采用的 是手工试凑方法。
按照规范设计的思想,一般将数据库设计细分为 数据库需求分析阶段、数据库概念设计阶段、数 据库逻辑设计阶段、数据库物理设计阶段、数据 库实施阶段和数据库运行、维护六个阶段。
数据流图和判定表(判定树)、数据字典 中处理过程的描述
概 念 结 构 设计
概念模型(E-R图) 数据字典
系统说明书包括: A.新系统要求、 方案和概图 B.反映新系统信 自流的数据流图
逻 辑 结 构 设计
某种数据模型 关系
非关系
系统结构图 (模块结构)
图3-2 数据库结构设计(2)
存储安排 物 理 方法选择 设 存取路径建立 计
图3-3 数据库的不同模式
应用1 应用要求 应用2 应用要求 应用3 应用要求
应用4 应用要求
应用1 外模式
应用2 外模式
应用3 外模式
应用4 外模式
映象
概念 模式
逻辑 模式
内模式
综合
转换
映象
3.1.2 数据仓库开发流程
设计和建立数据仓库应采取工程管理的方式进行 。
1.数据仓库系统的4个阶段 (1)设想阶段:在数据仓库设想阶段,一般是为
从数据仓库的应用角度来看,DSS分析员一般 是企业的中上层管理人员,他们对决策分析的需 求不能预先做出规范的说明,只能给设计人员一 个抽象的(模糊的)描述。
应用需求 (数据、处理)
转换规则、 DBMS功能、
优化方法
应用要求, DBMS详 细特征
图3-1 数据库设计步骤
需求收集和分析 设计概念结构
用现在技术迅速产生结果,以后可以 加入新技术
项目方法 假设/约束
角色
表3-1 数据仓库项目对照表(2)
高度循环性的DW开发
可以得到优秀的员工;最务分析人员 系统分析员
开发人员 用户
主题事务专家
项目每六个月交付一次成果,然后继续 逐步交付结果
确立目标后要做的第一件事就是明确责任。
没有明确的职责分工,就、小组就要花一些时间
去搞清楚什么事情必须做、决定谁来做哪一件工 作、决定什么时候做和怎样去做。
小组确定了目标、分派好角色后,就要确定一个 达到目标的战略了。
小组成员接着再确定他们将要用来开始工作
的资料,并将其存档。
小组成员们都很忙,他们可能没有多少时间
竞争性的市场使一家金融组织认识到,它 必须开始利用其日常活动中包含的大量 信息。企业的资产很多,但它没有预测 其信用卡使用状况和利润率的能力
一家财产和事故保险公司无法为有多张保 险单和复杂保险险种的顾客传递统一的结 账数据。因此要求将多个来源中的数据与 一个能生成统一报表和进行用户查询的数 据模型对应起来
1.数据仓库的技术平台 (1)单层结构:主要是指在数据源和数据仓库之
间共享平台,或者让数据源、数据仓库、数据集 市与最终用户工作站使用同一个平台。
(2)客户/服务器两层结构:在这类结构中,一 层为客户机,一层为服务器。最终用户访问工具 在客户层运行,而数据源、数据仓库和数据集市 位于服务器上。该技术结构一般用于普通规模的 数据仓库。
可以得到优秀员工
用户项目代表 项目经理 数据建模人员 业务分析人员 系统分析员
开发人员 用户
主题事务专家
所选的步骤
建模 决策者的需求 主题区分析 源系统分析 最终用户(EU)访问方法设计 EU访问方法界定 EU访问方法开发
交换设计 物理数据库设计
DW开发 DW填充和实现
建模 DSS体系结构 决策者的需求 主题区分析 源系统分析 EU访问方法设计
(4)稳定阶段:主要任务是在使用决策支持和数 据仓库过程中不断的改进,是数据仓库逐渐成熟 。
2. 数据仓库的开发流程
(1)数据仓库规划分析阶段,在该阶段的工作内 容主要包括:
A.分析数据仓库应用环境,调查数据仓库开发需 求,完成数据仓库的开发规划。
B.建立包括实体关系图、星型模型、雪花模型、 元数据模型以及数据源分析的主题区数据模型, 并根据主题区数据模型开发数据仓库逻辑的模型 。
第三章 数据仓库设计
第3章 数据仓库设计
3.1 数据仓库的需求与规划 3.1.1 数据库设计方法简述 3.1.2 数据仓库开发流程 3.1.3 数据仓库需求分析 3.1.4 数据仓库规划 3.2 建立数据仓库 3.2.1 数据仓库的平台与结构选择 3.2.2 数据仓库接口与中间件设计
一个小组成功地运作,必须具备三个基本的条件
:
A.要完成的任务必须清楚明确。
B.小组必须是明确确定的。 C.小组必须对它的项目有自始至终的控制。
建立高效小组的四项基本原则是内聚力、目标、 反馈和共同工作框架。
(2)创建项目开发小组
当小组开始成为整体的时候,他们首先要确
定和接受一系列共同的目标。
(2)设计者需求的分析
数据仓库设计者不但要收集业主对数据仓库 的需求,还要收集实现这些需求所需的技术要求 。设计者介于投资者和实现者之间。
企业结构规划(EAP)法是用于结构设计的一
种最有效的方法,在该法中,设计者可以实现以 下3种结构。
A.数据结构。
B.应用程序结构。
C.技术结构。
(3)开发者需求的分析
数据范围 业务原因
分类
一个主题区“信用卡”
向接受该银行信用卡的组织宣传信用卡( 如趋势、人口统计特征等)的决策支持项 目
战略性的
多个主题区,包括“收入”、“赔款” 和“顾客”
业务支持,数据合并
战术性的
时间范围
3-6个月的增加业务价值
6-9个月取得初步成果
技术范围
公司近期政策要求把所有新的商务软件 都放在客户机/服务器体系结构上
确 (3)数据仓库的开发是一个不断循环的过程,是
启发式的开发。
3.1.3 数据仓库需求分析
数据仓库的需求分析根据不同领域可以划分为 业主(投资者)的需求、设计的需求、开发者的 需求和最终用户的需求等方面。
(1)业主需求的分析
数据仓库的业主关心的是创建数据仓库的目 标,建立数据仓库给组织战略带来的影响,创建 数据仓库所需的投资费用以及所具有的应用前景 。业主常常参与数据仓库概念模型的认可和评审 ,批准开发方案,为系统以后的不断升级和连续 投资进行决策。