第四章 数据仓库的建立和维护
数据仓库与数据挖掘结业论文

数据仓库与数据挖掘结业论文一、引言数据仓库与数据挖掘是当今信息时代的重要技术,它们在各个领域都有着广泛的应用。
本论文旨在探讨数据仓库与数据挖掘的相关概念、原理和方法,并结合实际案例进行分析和应用。
通过对数据仓库与数据挖掘的研究,可以为企业决策提供有力的支持和指导,提高企业的竞争力和运营效率。
二、数据仓库的概念和原理1. 数据仓库的定义数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策的分析和报告需求。
2. 数据仓库的架构和组成数据仓库的架构包括数据源层、数据抽取层、数据存储层、数据管理层和数据使用层。
数据源层负责从各个数据源中抽取数据,数据抽取层将抽取的数据进行清洗和转换,数据存储层用于存储清洗后的数据,数据管理层负责对数据进行管理和维护,数据使用层是用户进行数据分析和报告的接口。
3. 数据仓库的建设和维护数据仓库的建设包括需求分析、数据模型设计、ETL(抽取、转换和加载)过程、数据质量管理等步骤。
数据仓库的维护包括数据清洗、数据更新、性能优化等工作。
三、数据挖掘的概念和方法1. 数据挖掘的定义数据挖掘是从大量的数据中自动发现隐藏在其中的有价值的信息和知识的过程。
2. 数据挖掘的任务数据挖掘的任务包括分类、聚类、关联规则挖掘、异常检测等。
分类是将数据分为不同的类别;聚类是将数据分为相似的组;关联规则挖掘是发现数据中的关联关系;异常检测是发现与其他数据不符的异常数据。
3. 数据挖掘的方法数据挖掘的方法包括决策树、神经网络、关联规则、聚类分析等。
决策树是一种基于树结构的分类方法;神经网络是一种模拟人脑神经元工作的分类方法;关联规则是发现数据中的关联关系的方法;聚类分析是将数据分为相似的组的方法。
四、数据仓库与数据挖掘的应用案例以某电商平台为例,介绍数据仓库与数据挖掘在电商领域的应用。
1. 数据仓库的应用通过建立电商平台的数据仓库,可以实现对商品销售情况、用户行为等数据的统一管理和分析。
数据仓库的设计与构建研究

数据仓库的设计与构建研究随着互联网技术的发展,数据量的快速积累和每天不断增长的数据趋势,数据管理变成了日益复杂的任务。
数据仓库便应运而生,成为了企业管理和数据分析的必然选择。
在企业的决策和战略制定中,数据仓库所扮演的角色越来越重要,也越来越值得重视。
一、数据仓库的概念数据仓库是指将企业各种分散的数据源汇集起来,进行预处理、汇总、加工、再分析处理等操作后进行存储的一个系统。
其目的是为了利用大数据环境下的企业数据,将其变成决策支持的信息,从而为企业决策提供可靠的数据支撑。
数据仓库结构主要包含以下几个重要组成部分:1. 数据源数据源是数据仓库的来源,包括操作性数据库、文件系统、网络、接口等等。
通过提取不同来源的数据,并将其汇总到仓库中进行统一存储、管理和维护,实现数据的集成化管理。
2. 数据加工处理数据加工处理是数据仓库中最为复杂的一部分,包括数据清洗、数据挖掘、数据转换、数据整合等等。
这一过程要求数据仓库管理员具有一定的数据处理能力,并且需要考虑多种因素的影响,例如数据量、类型、格式、质量等等。
3. 元数据元数据是指描述数据仓库的数据,包括数据类型、数据来源、数据转换规则、质量检验规则等等。
元数据的作用是对数据进行管理、维护、分发和使用,为数据共享和商业决策提供支持。
4. 多维分析多维分析是指对数据仓库中的数据进行分析、整理和处理,以便更好地展现数据的特征和规律。
多维分析可通过OLAP(联机分析处理)的方式对数据进行分析,再根据分析结果制定企业针对性的业务决策。
二、数据仓库的设计思路数据仓库的设计与构建需要全面考虑企业的业务需求和数据特点,通过规范化、标准化的方式来进行设计,使其能够满足企业需求,并为企业的决策提供支持。
1. 初步分析通过初步分析了解企业的业务场景和数据来源,以及研究需求和决策支持信息的种类、格式等,以便进一步确定数据仓库的设计。
2. 数据建模数据建模是数据仓库的核心,它需要根据不同的业务需求和对数据的认识,对数据进行分类、构建数据模型,以便完成数据转化的目标。
水利工程安全数据仓库管理制度

一、总则为加强水利工程安全数据的管理,提高安全管理水平,确保工程安全稳定运行,特制定本制度。
二、数据仓库的建立与管理1. 数据仓库的建立(1)根据水利工程安全生产管理要求,建立水利工程安全数据仓库,用于存储、分析和处理各类安全数据。
(2)数据仓库应包括以下内容:安全生产法律法规、事故隐患排查治理、安全教育培训、安全检查、事故调查处理、应急救援等。
2. 数据仓库的管理(1)数据仓库的建立和维护由水利工程安全管理机构负责。
(2)数据仓库应实行分级管理,确保数据的安全、完整和准确。
(3)数据仓库的数据应定期更新,确保数据的时效性。
三、数据采集与录入1. 数据采集(1)数据采集应按照相关法律法规和行业标准进行。
(2)数据采集应全面、准确、及时,确保数据质量。
2. 数据录入(1)数据录入应按照数据仓库的要求进行。
(2)数据录入人员应具备一定的专业知识,确保数据录入的准确性。
(3)数据录入后,应进行审核,确保数据的真实性和完整性。
四、数据存储与备份1. 数据存储(1)数据仓库应采用高性能、高可靠性的存储设备。
(2)数据存储应按照数据类别进行分类,便于管理和查询。
2. 数据备份(1)数据仓库应定期进行数据备份,确保数据的安全。
(2)数据备份应采用多种备份方式,如磁带、光盘等,确保数据备份的可靠性。
五、数据分析与利用1. 数据分析(1)对收集到的安全数据进行统计分析,找出安全隐患和薄弱环节。
(2)根据分析结果,提出改进措施,提高安全管理水平。
2. 数据利用(1)将数据用于安全生产决策,为水利工程安全生产提供依据。
(2)将数据用于安全教育培训,提高员工安全意识。
六、安全数据仓库的使用与维护1. 使用(1)数据仓库的使用应遵循相关法律法规和行业标准。
(2)数据仓库的使用应确保数据的安全、完整和准确。
2. 维护(1)定期对数据仓库进行维护,确保系统稳定运行。
(2)对数据仓库的使用情况进行监督,防止数据泄露和滥用。
七、责任与奖惩1. 责任(1)水利工程安全管理机构负责安全数据仓库的建立、维护和管理。
《数据仓库建设指南》

《数据仓库建设指南》数据仓库建设指南随着企业信息化的趋势不断发展,数据化已经成为企业成长的必经之路。
数据成为了企业在竞争中的筹码,企业数据分析的能力也成为了企业成功的关键。
更多的企业意识到,要想在市场上占有一席之地,精细管理企业,就必须建立一个合理的数据仓库。
那么,数据仓库建设需要考虑哪些要素和步骤呢?本文将一一为您解析。
一、数据仓库简介数据仓库是一种长期积淀和管理数据的系统,它可以帮助企业集中存储和管理来自各种渠道的数据,为企业提供分析支持。
它可以将内部和外部的数据整合、加工之后建立一个统一的数据层用于分析,这样企业就可以在分析过程中减少对数据来源的依赖,加快数据分析过程。
二、数据仓库建设步骤1.规划和准备数据仓库建设是需要投入大量的时间和精力的,因此,首先需要确定需求,明确数据仓库的建设目标,并确保团队中所有成员都清楚地理解目标和业务需求。
同时,团队还需要了解企业的业务流程。
在规划和准备阶段,团队需要对企业业务进行分析和评估,确定数据仓库中需要的信息和数据以及其来源;需要制定数据建设计划,分步骤地完成数据仓库的各个环境的建设和测试,以确保其稳定性和数据可靠性。
2.设计在设计阶段,需要确定数据仓库的基本结构和架构等。
从不同的维度来考虑数据仓库的数据设计,面向业务时的数据设计包括事实表和维度表的设计,以及定义关系型数据模式。
面向数据仓库的设计要考虑数据的存储形式和数据的管理:如何利用索引快速查找数据,如何存储不同的数据格式或类型等。
3.实施实施是数据仓库建设中最为繁琐的环节,这个过程需要投入大量的人力和物力资源。
需要与各种数据源进行连接和整合,然后将这些数据存储到数据仓库中,来适应变化的数据分析需求。
在实施过程中,需要考虑数据清洗、转换和加工等过程。
数据清洗的目的是过滤掉不必要的数据,转换是将数据从一种格式转换为另一种;加工就是从原数据中提取关键信息。
4.测试和验证测试与验证是数据仓库建设过程中很重要的步骤,通过测试可以验证数据仓库所设计的模型和工具是否能够适应实际的业务需求,同时也可以提供一些有益的改进建议。
公开数据仓库管理制度

第一章总则第一条为规范公开数据仓库的管理,确保数据质量、安全与合规,提高数据利用率,根据国家有关法律法规和行业标准,结合本地区实际情况,特制定本制度。
第二条本制度适用于本地区所有公开数据仓库的建设、维护、使用和管理。
第三条公开数据仓库应遵循以下原则:1. 合法性:数据收集、存储和使用必须符合国家法律法规。
2. 安全性:确保数据安全,防止数据泄露、篡改和破坏。
3. 完整性:保证数据真实、准确、完整。
4. 可用性:确保数据易于获取、查询和使用。
5. 可维护性:便于数据仓库的更新、升级和维护。
第二章数据收集与存储第四条数据收集:1. 收集数据应遵循合法性、必要性、最小化原则。
2. 收集数据应明确数据来源、收集目的、数据范围和数据处理方式。
3. 收集数据应经数据提供方同意,并签订数据共享协议。
第五条数据存储:1. 数据存储应选择符合国家标准的存储设备和技术。
2. 数据存储应保证数据安全,防止数据泄露、篡改和破坏。
3. 数据存储应按照数据类型、数据来源、数据时效等属性进行分类管理。
第三章数据治理与维护第六条数据治理:1. 建立数据治理组织,明确各部门职责,制定数据治理策略。
2. 制定数据质量标准,对数据进行定期检查和评估。
3. 对数据进行清洗、转换、整合,确保数据质量。
第七条数据维护:1. 定期检查数据仓库运行状态,确保系统稳定、可靠。
2. 及时更新数据,确保数据时效性。
3. 定期备份数据,防止数据丢失。
第四章数据开放与共享第八条数据开放:1. 对符合开放条件的数据,按照国家规定进行公开。
2. 公开数据应确保数据真实、准确、完整。
3. 公开数据应便于用户查询、下载和使用。
第九条数据共享:1. 建立数据共享机制,明确共享范围、共享方式和共享责任。
2. 数据共享应遵循合法性、必要性、最小化原则。
3. 数据共享应签订数据共享协议,明确双方权利和义务。
第五章安全与保密第十条安全保障:1. 建立数据安全管理制度,明确数据安全责任。
医疗管理中的数据分析与运用

医疗管理中的数据分析与运用一、引言在当今数字时代,数据分析不仅在商业领域有广泛应用,也在医疗管理中得到了越来越多的关注和应用。
医疗管理中的数据分析能够快速发现疾病流行趋势、评估治疗方案的影响、提高临床诊断的准确性和效率等方面提供支持。
本文将从数据的来源及库的建立、数据分析的方法和常见应用方向等方面,探讨医疗管理中的数据分析与运用。
二、数据的来源及库的建立医疗管理主要涉及到医院经营管理、营销推广、患者管理、医疗资源配置等内容,其源数据主要包括医院管理系统中的各类数据,如病历信息、门诊预约、住院患者信息、检验报告、医用设备数据以及药品使用数据等。
相应的数据,可以通过医院信息系统进行整合和分析,形成完整的数据库,成为数据分析的基础。
建立完整的医疗管理数据库是前提。
建立数据仓库时需要考虑以下因素:1. 数据的来源:不同的数据来自不同的数据源。
这些数据源包括临床系统、财务系统、人事系统等。
建立数据仓库时,需要整合所有源数据。
2. 数据清洗:源数据中通常会包含缺失数据、重复数据等问题,需要对原始数据进行清洗和加工。
这里的清洗不仅是将错误数据剔除,还需要将格式不一致的数据转化为标准的数据。
3. 数据建模:在清洗和加工过期后,需要对数据进行建模,以便后续的数据分析工作可以直接基于模型进行。
模型应明确指定数据之间的关系,实现数据的高效查询和分析。
4. 数据仓库的维护和更新:建立数据仓库之后,还需要对其进行维护和更新。
数据仓库应当在每个季度或年度进行维护,以便让数据仓库处于完好的状态,便于日常用户的使用。
三、数据分析的方法数据分析有多种方法可以进行分析,业务人员需要根据实际业务需要和数据分析的目的,选择合适的分析方法和技术。
以下是常用的数据分析方法:1. 区间统计:包括平均值、标准差、方差等。
这些统计方法可以反映出数据的集中趋势和差异程度。
2. 超越比较:通过比较不同的批次或者不同地域的数据,可以寻找数据的差异性和变化趋势。
数据仓库与数据挖掘教程(第2版)课后习题答案 第四章

第四章作业1.数据仓库的需求分析的任务是什么?P67需求分析的任务是通过详细调查现实世界要处理的对象(企业、部门用户等),充分了解源系统工作概况,明确用户的各种需求,为设计数据仓库服务。
概括地说,需求分析要明确用那些数据经过分析来实现用户的决策支持需求。
2.数据仓库系统需要确定的问题有哪些?P67、、(1)确定主题域a)明确对于决策分析最有价值的主题领域有哪些b)每个主题域的商业维度是那些?每个维度的粒度层次有哪些?c)制定决策的商业分区是什么?d)不同地区需要哪些信息来制定决策?e)对那个区域提供特定的商品和服务?(2)支持决策的数据来源a)那些源数据与商品的主题有关?b)在已有的报表和在线查询(OLTP)中得到什么样的信息?c)提供决策支持的细节程度是怎么样的?(3)数据仓库的成功标准和关键性指标a)衡量数据仓库成功的标准是什么?b)有哪些关键的性能指标?如何监控?c)对数据仓库的期望是什么?d)对数据仓库的预期用途有哪些?e)对计划中的数据仓库的考虑要点是什么?(4)数据量与更新频率a)数据仓库的总数据量有多少?b)决策支持所需的数据更新频率是多少?时间间隔是多长?c)每种决策分析与不同时间的标准对比如何?d)数据仓库中的信息需求的时间界限是什么?3.实现决策支持所需要的数据包括哪些内容?P68(1)源数据(2)数据转换(3)数据存储(4)决策分析4.概念:将需求分析过程中得到的用户需求抽象为计算机表示的信息结构,叫做概念模型。
特点:(1)能真实反映现实世界,能满足用户对数据的分析,达到决策支持的要求,它是现实世界的一个真实模型。
(2)易于理解,便利和用户交换意见,在用户的参与下,能有效地完成对数据仓库的成功设计。
(3)易于更改,当用户需求发生变化时,容易对概念模型修改和扩充。
(4)易于向数据仓库的数据模型(星型模型)转换。
5.用长方形表示实体,在数据仓库中就表示主题,椭圆形表示主题的属性,并用无向边把主题与其属性连接起来;用菱形表示主题之间的联系,用无向边把菱形分别与有关的主题连接;若主题之间的联系也具有属性,则把属性和菱形也用无向边连接上。
数据仓库建设管理制度

第一章总则第一条为规范数据仓库建设管理工作,确保数据仓库建设质量,提高数据仓库应用效果,促进企业信息化建设,特制定本制度。
第二条本制度适用于企业内部数据仓库建设过程中的组织、规划、实施、维护等各个环节。
第三条数据仓库建设应遵循以下原则:1. 面向业务:以企业业务需求为导向,确保数据仓库满足企业决策分析需求。
2. 集成性:整合企业内外部数据资源,实现数据共享和交换。
3. 可扩展性:适应企业业务发展,满足未来数据增长需求。
4. 安全性:确保数据仓库运行稳定,保障数据安全。
第二章组织与管理第四条企业成立数据仓库建设领导小组,负责数据仓库建设的总体规划和决策。
第五条设立数据仓库管理部门,负责数据仓库建设过程中的日常管理工作,包括:1. 制定数据仓库建设方案;2. 组织项目实施;3. 监督项目进度;4. 确保项目质量;5. 做好数据仓库维护工作。
第六条数据仓库建设应成立项目组,负责具体实施工作,项目组由以下人员组成:1. 项目经理:负责项目整体规划、协调和监督;2. 技术负责人:负责技术选型、系统设计、开发与测试;3. 业务负责人:负责业务需求分析、数据质量监控;4. 运维负责人:负责数据仓库运维保障。
第三章数据仓库规划与设计第七条数据仓库规划应包括以下内容:1. 需求分析:明确企业业务需求,确定数据仓库主题;2. 数据模型设计:根据需求分析,设计数据仓库模型;3. 技术选型:选择合适的数据库、工具和技术;4. 系统架构设计:确定数据仓库系统架构,包括硬件、软件、网络等。
第八条数据仓库设计应遵循以下原则:1. 面向主题:围绕企业业务主题进行数据组织;2. 集成性:确保数据来源的多样性和一致性;3. 可扩展性:适应业务发展,满足未来数据增长需求;4. 易用性:便于用户查询、分析和使用。
第四章数据仓库实施与运维第九条数据仓库实施应包括以下步骤:1. 数据抽取:从源系统中抽取所需数据;2. 数据清洗:对抽取的数据进行清洗,确保数据质量;3. 数据转换:将清洗后的数据进行转换,满足数据仓库需求;4. 数据加载:将转换后的数据加载到数据仓库中;5. 系统测试:对数据仓库进行功能测试、性能测试和安全性测试。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(6)按使用的DBMS和分析用户工具,证实设计方案的有效 性
(7)随着需求变化修改设计方案
从的E—R图转换成星型模型实例说明
18
(1)业务数据的E-R图
地区 地区号 地区名 1 1 m 商店 商店号 商店名 地址 城市 省 邮编 地区号 1 m 销售 销售日期 商店号 商品号 销售数量 销售单位
名称
类型
长度
注释
包括公司所有产品 的信息
逻辑模型
产品维表
产品维表
Product-Key Product-Name Product-SKu
integer char char
10 25 20
主键 产品名称 库存单位 包括不同地区的所 有销售员信息
产品键 产品名 库存单位 品牌
订单事实表 订单键 订单名 产品键 销售员键 销售额 订单成本 销售员维表 销售员键 姓名 地域 地区
预连接表格
对于两个或多个表格共享一个公用链。
预聚集数据
以每天为基础存储数据。在一周结束时,以每周为基础存储数 据(即累加每天的数据)。月末时,则以每月为基础存储数据。
聚类数据 聚类将数据放置在同一地点,这样可以提高对聚类数据的查询。
知识探索
42
发现的问题并找出原因。
创建一个单独的探索仓库,不影响数据仓库的常规用户。同时采用“标识技术” 进行数据压缩,提高数据分析速度。
数据仓库评估
数据仓库评估
45
系统性能评定
投资回报分析 数据质量评估
系统性能评定
46
硬件平台是否能够支持大数据量的工作和多 类用户、多种工具的大量需求? 软件平台是否是用一个高效的且优化的方式 来组织和管理数据? 是否适应系统(数据和处理)的扩展?
数据仓 库维护
数据仓 库增长
概念 设计
维护与 评估 决策 支持
分析与 设计 数据 获取
逻辑 设计
知识 探索
物理 设计
信息 查询
数据 抽取
数据 装载 数据 转换
数据仓库开发过程
9
分析与设计阶段
10
需求分析 数据路线 技术路线 应用路线
需求分析
11
确定决策主题域 分析主题域的商业维度 分析支持决策的数据来源 确定数据仓库的数据量大小 分析数据更新的频率 确定决策分析方法
数据路线
13
概念设计 逻辑设计 物理设计 数据装载接口设计 数据装载功能 数据综合功能
概念设计
14
建立概念模型:对每个决策主题与属性以及主 题之间的关系用E-R图模型表示。 E-R图将现实世界表示成信息世界,便利向计 算机的表示形式进行转化。
逻辑设计
15
将概念模型(E-R图)转换成逻辑模型,即计算 机表示的数据模型。 数据仓库数据模型一般采用星型模型。
低级数据模型:
物理模型
DIS的基本结构
3
基本数据组
类型数据组
连接数据组
二级数据组
基本数据组:应包括主题的码和属性,一个主题只存在一个基本数据组。 如: 顾客 主题中的顾客号、顾客名、性别等。
联接数据组:反映主题之间的联系,往往是一个主题的公共码键。 二级数据组:相对稳定的数据组。如:顾客的地址、电话、文化程度等。
数据仓库开发过程
43
分析与设计阶段
数据获取阶段 决策支持阶段 维护与评估阶段
维护与评估阶段
44
数据仓库增长
数据仓库建立以后,随着用户的不断增加,时间 的增长,用户查询需求更多,数据会迅速增长
数据仓库维护
数据增长的处理工作有:去掉没有用的历史数据; 根据用户使用的情况,取消某些细节数据和无用 的汇总数据,增加些实用的汇总数据。 正常系统维护:数据仓库的备份和恢复
m 1
m 商品类 商品类号 商品类名 部门号
1 1
m
m 存货 星期 商店号 商品号 数量
商品 商品号 商品名 商品类号
销售业务的多维数据
销售数据 商品 促销 时间
部门
城市
地区 商店 销售数据和维
19
E-R图向多维表的转换
20
该问题的多维表模型中,商品维包括部门、商品 和商品大类,地点维包括地区和商店,忽略存货, 而只注意销售事实。在E-R图中不出现的时间, 在多维模型中增加时间维。
数据仓库的基础构造元素分成两大类: 1、操作型基础构造 2、物理基础构造
技术路线
29
1、操作型基础构造 包括人员、流程、培训和管理软件。
2、物理基础构造 (1)计算机平台 硬件和操作系统 服务器硬件 数据库管理系统 (2)工具
应用路线
30
1、OLAP模型设计
(1)总体维度分析 确定与任务相关的所有维 定义维度的层次及名称 确定层次信息的位置 确定目标维 (2)主题的维度设计 (3)确定事实表度量变量和数据粒度 (4)定义OLAP模型
主键 销售员姓名 销售员所在区域 所在地区 包括公司收到的所 有订单 订单键 订单名称 参考产品主键
Salpers-ref
Order-Amount Order-Cost
integer
Num Num
15
8,2 8,2
参考销售员主键
销售额 订单成本
26
数据仓库设计的基本步骤
27
数据仓库运行与维护
概念模型设计 界定系统边界
捕获数据的方法
36
完全刷新
对移入DW的数据进行完全复制 经常变化
增量更新
捕获数据源中修改的数据 流水型增长、数据量大
对两者结合的数据先考虑增量更新,再考虑完 全刷新
数据转换
37
数据格式的修正 字段的解码 单个字段的分离 信息的合并 变量单位的转化 时间的转化 数据汇总
数据仓库开发过程
33
分析与设计阶段
数据获取阶段 决策支持阶段 维护与评估阶段
数据获取阶段
34
数据抽取
数据转换 数据装载
数据抽取
35
对数据源的确认,确定数据抽取技术,确认数 据抽取频率,按照时间要求抽取数据。 由于源系统的差异性,如计算机平台、操作系 统、数据库管理系统、网络协议等的不同造成 了抽取数据的困难。
6
第五章 数据仓库的建立和维护
第五章 数据仓库的建立和维护
7
数据仓库的开发
数据仓库的建立过程 数据仓库的开发方法
数据仓库的维护
提高数据仓库性能 数据仓库的安全性
数据仓库开发过程
8
分析与设计阶段
数据获取阶段 决策支持阶段 维护与评估阶段
数据仓 库评估
需求 分析
销售员维表
Salpers-Key Salpers-Name Territory Region 订单事实表 Order-Key Order-Name Product-ref integer char integer 10 20 10 integer char char char 15 30 20 20
在多维模型中,实体与维之间建立映射关系,联 系多个实体的实体就成为事实,此处销售实体作 为事实,其他实体作为维。然后用维关键字将它 转换为星型模型。
E-R图向多维模型的转换
商品维
地区维
时间维
部门 商品大类
地区 商店
年 月 周
日
商品
销售事实
21
22
在各维中,只有部门,商品类,地区,商店的 编号没有具体的说明。 为了打印报表将增加这些编号的名称说明,即 部门名、商店名等,在维表中增加这些说明, 即修改该星型模型
地区 地理位置键 地理位置名 地区号 地区名 商店号 商店名 级别号
商品 商品键 商品名 部门号 部门名 商品类号 商品类名 级别号
修改后的星型模型
24
物理设计
25
对逻辑模型设计的数据模型确定物理存储结构和 存取方法。
数据仓库的星型模型在计算机中仍用关系型数据 库存储。 物理设计还需要进行存储容量的估计;确定数据 存储的计划;确定索引策略;确定数据存放位置 以及确定存储分配。
数据装载
38
初始装载:第一次装入数据仓库
增量装载:根据定期应用需求装入数据仓库 完全刷新:完全删除现有数据,重新装入新的数据
数据仓库开发过程
39
分析与设计阶段
数据获取阶段 决策支Байду номын сангаас阶段 维护与评估阶段
决策支持阶段
40
信息查询
知识探索
信息查询
41
创建数据阵列 将相关的数据(每月的数据)放在同一个物理位置上。
时间 时间键 时间说明 日期 星期 月 年 级别号
销售事实 时间键 地理位置键 商品键 销售数量 销售单位
地区 地理位置键 地理位置名 地区号 商店号 级别号
商品 商品键 商品名 部门号 商品类号 级别号
利用维关键字制定的星型模型
23
时间 时间键 时间说明 日期 星期 月 年 级别号 销售事实 时间键 地理位置键 商品键 销售数量 销售单位
使用一些模型帮助决策分析,例如客户分段、欺诈监测、信用分险、客户生存期、 渠道响应、推销响应等模型。 通过模型的计算来得出一些有价值的商业知识。