数据仓库与数据挖掘课件1

合集下载

数据仓库与数据挖掘ppt课件

数据仓库与数据挖掘ppt课件

精选编辑ppt
2
企业面临的问题
• 经过多年的计算机应用和市场积累,许多 企业保存了大量原始数据和各种业务数据, 它是企业生产经营活动的真实记录,由于 缺乏集中存储和管理,这些数据不能为本 企业加以利用, 不能进行有效的统计、分析 及评估,无法将这些数据转换成企业有用 的信息
精选编辑ppt
3
数据爆炸:
• 例如,事务处理应用一般需要的是当前数 据,主要考虑较短的响应时间;而分析处 理应用需要是历史的、综合的、集成的数 据,它的分析处理过程可能持续几个小时, 从而消耗大量的系统资源。
精选编辑ppt
10
• 人们逐渐认识到直接用事务处理环境来支 持DSS是行不通的。要提高分析和决策的 有效性,分析型处理及其数据必须与操作 型处理及其数据分离(不能都在一个数据 库环境中)。必须把分析型数据从事务处 理环境中提取出来,按照DSS处理的需要 进行重新组织,建立单独的分析处理环境。
精选编辑ppt
17
经典案例——尿布与啤酒
• 在一家超市中,人们发现了一个特别有趣的现象:尿布与 啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇 怪的举措居然使尿布和啤酒的稍量大幅增加了。这可不是 一个笑话,而是一直被商家所津津乐道的发生在美国沃尔 玛连锁超市的真实案例。
• 原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱 咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布 的同时又会顺手购买自己爱喝的啤酒。这个发现为商家带 来了大量的利润,但是如何从浩如烟海却又杂乱无章的数 据中,发现啤酒和尿布销售之间的联系呢?这又给了我们 什么样的启示呢?
13
特征及体系结构
• 数据仓库的特征 • 数据仓库的体系结构
精选编辑ppt

数据仓库与数据挖掘PPT课件

数据仓库与数据挖掘PPT课件
2.雪花模型
雪花模型是对星型模型的一个扩展,每个维表都可以 向外连接多个维表。雪花模型是对星型模型的维表进一步 标准化,维表分解成与事实表直接关联的主维表和与主维 表关联的次维表。它的优点是通过最大限度的减少存储量 以及将较小的标准化表而不是较大的非标准化表联合在一 起来改善查询性能。由于采用标准化及维的较低粒度,雪 花模型增加了应用程序的灵活性,但由于雪花模型增加了 连接操作的次数,因而也增加了查询的复杂性。
相关性网络是微软决策树算法创建的模型 视图,聚类挖掘模型没有相关性网络。
携手共进,齐创精品工程
Thank You
世界触手可及
时间、病种、患者、……;区域、产品、…… 时间维度:年、月、日 病种维度:ICD主类、ICD次类、ICD子类、疾病名称 患者维度:所属科室、经诊医师、患者(成员属性:性别、 年龄、身份、费用类别、手术情况、入院方式、入院病情、 出院方式、治疗结果、就诊次数、所患疾病等) 治疗结果:只有一个级别
度量值:主要是数值型字段,如:费用 金额、住院天数等
男性 80%
女性20%
年龄<=48 5%
男性 52%
女性 48%
司机 医生 律师 其他 33% 31% 28% 8%
居住地为 省会城市 或直辖市
82%
居住地非 省会城市 或直辖市
18%
子女数
>=2 85%
子女数
<2 15%
医生 律师 其他 43% 45% 12%
决策树分析模型
聚类模型
聚类分析是一种间接的数据挖掘方法,它 是用来查找多维空间中的自然分组,通过 提取数据之间的共同点来发现隐藏在数据 中的规律。
利用数据仓库解决四种类型的问题:
1. 2005年10月25日肝脏外科的住院人次数 是多少?

数据仓库与数据挖掘PPT课件

数据仓库与数据挖掘PPT课件

数据抽取
从源系统抽取数据,进行清洗、转换 和加载,保证数据质量。
性能优化
根据实际运行情况,对数据仓库的性 能进行优化,包括索引、查询优化等。
数据仓库的性能优化
索引优化
合理使用索引,提高查询效率。
查询优化
优化查询语句,减少不必要的计算和数据 量。
分区优化
并行处理
根据数据特点,对数据进行分区存储,提 高查询效率。
用户行为分析
通过分析用户的浏览、搜索、购买等行为数据,了解用户 的需求和偏好,为产品开发和推荐提供依据。
商品推荐
基于用户的购买历史、浏览记录等信息,利用数据挖掘算 法为用户推荐相关商品,提高用户满意度和购物体验。
营销活动优化
通过分析历史营销活动的数据,挖掘最佳的营销策略和渠 道,提高营销效果和ROI。
数据仓库与数据挖掘 ppt课件
目录
• 数据仓库概述 • 数据挖掘基础 • 数据仓库与数据挖掘的关系 • 数据仓库建设实践 • 数据挖掘实践 • 案例分析
01
数据仓库概述
数据仓库的定义与特点
定义
数据仓库是一个大型、集中式、长期 存储的数据存储环境,用于支持决策 支持系统和多维分析。
特点
数据仓库具有面向主题、集成、非易 失和时变的特点,能够提供高效的数 据检索和分析功能。
异常检测
通过数据挖掘技术检测数据仓库中的异常值,及 时发现潜在的问题和风险。
数据仓库与数据挖掘的未来发展
1据仓库与数据挖掘将更加紧 密地集成在一起,形成一体化的数据处理和分析 流程。
智能化
借助机器学习和人工智能技术,数据仓库与数据 挖掘将更加智能化,能够自动进行数据处理和模 式识别。
客户满意度分析

数据仓库与数据挖掘第1章[1]

数据仓库与数据挖掘第1章[1]
数据仓库与数据挖掘第1 章
PPT文档演模板
2020/11/21
数据仓库与数据挖掘第1章[1]
数据挖掘的应用—人文地理
PPT文档演模板
数据仓库与数据挖掘第1章[1]
数据挖掘的应用—娱乐传媒
PPT文档演模板
数据仓库与数据挖掘第1章[1]
数据挖掘的应用—智慧城市
PPT文档演模板
数据仓库与数据挖掘第1章[1]
课程结构
• 一、数据仓库与数据挖掘概述 • 二、数据仓库的OLAP技术 • 三、数据预处理 • 四、数据挖掘的系统结构 • 五、挖掘大型数据库中的关联规则 • 六、分类与预测 • 七、聚类分析 • 八、复杂类型的数据挖掘 • 九、数据仓库与数据挖掘的应用与发展趋势
PPT文档演模板
数据仓库与数据挖掘第1章[1]
Analysis services
▪ NCR Teradata Warehouse
•对各类海量数据需要自动分析、分类、汇总、发现和描述数
据蕴涵的趋势、标记异常等
PPT文档演模板
数据仓库与数据挖掘第1章[1]
课程简介
▪ 各类管理人员需要从大量复杂的业务数据中获取各自权限
内的决策信息,及时把握市场变化脉搏,作出正确有效的 判断与抉择
▪ 随着数据库系统的逐日运行,数据将堆积越来越庞大 ▪ 数据处理的重点需要从传统业务扩展到业务数据的联机分
析处理,并得到面向各种管理主题的统计信息和决策支DSS环境的核心
PPT文档演模板
数据仓库与数据挖掘第1章[1]
•课程简介
▪ 数据仓库的基本概念 ▪ 多维数据模型 ▪ 数据仓库的系统结构 ▪ 数据仓库的实现 ▪ 基于数据仓库的数据挖掘
第一节 什么是数据仓库
•2. 数据仓库的定义

数据仓库和数据挖掘课件

数据仓库和数据挖掘课件

Discoverer 支持下面的新特性:
• 自动摘要管理 • oracle 应用的支持 • 标志 • 改变计划业主 • 分析功能
想要一部手机 ?
经常跨省旅行 ?
有两个女 儿?
为她提供:
1. 覆盖域更广的 2. 数字电话计划 2. 针对她女儿的
3. 应急计划
Oracle Express系列
• 通过使用Oracle Express :
• 利用DM,公司能够提高在客户关系管理(CRM),企业 资源计划(ERP),网页入口和无线应用等商务智能方 面的能力。
– 鉴别最有利可图的消费者,避免客户流失 – 获得新客户,对已有客户进行交叉销售 – 检测欺诈行为 – 预测零件质量 – 寻找病人、药品和疗效之间的关系
数据挖掘功能的内嵌
• Oracle9i Data Mining 将数据挖掘功能嵌入
Oracle9i 数据库中,用于分类、预报和关联。 所有的模型构建、评分、以及元数据管理操作 经由基于 Java 的 API 来启动并完全在该关系 数据库中发生。
–采用贝叶斯法则进行预测和分类 –运用关联规则检测隐藏于数据库中“相关”或并发
事件 –自动提取商务信息并将其整合在其他应用软件之中
基于 Java 的 API
Oracle Warehouse Builder
• OWB是Oracle Developer Suits 中的一个组件, 是用于设计、实现、和管理企业数据仓库和数 据集市的集成系统。
• 通过向导驱动的用户界面来进行数据映射、元 数据导入,利用预定义的转换库,能够减少设 计和实施时间。
• 自动生成代码,并且通过校验程序保证编码的 正确性和唯一性,按照部署的要求生成不同的 编码类型。

数据仓库和数据挖掘PPT课件

数据仓库和数据挖掘PPT课件

客户细分
通过对客户的行为、偏好、资产等数据的分析,可以将客 户划分为不同的细分市场,为精准营销和服务提供支持。
投资决策
通过对历史数据的挖掘和分析,可以发现市场趋势和预测 未来走势,为投资者提供科学的投资决策依据。
电商行业的数据仓库和数据挖掘应用
总结词
电商行业是数据仓库和数据挖掘应用的另一个重 要领域,通过对用户行为、商品销售、市场趋势 等数据的分析和挖掘,可以优化营销策略、提高 用户体验和销售额。
03
数据挖掘基础
数据挖掘定义
总结词
数据挖掘是从大量数据中提取出有用 的信息和知识的过程。
详细描述
数据挖掘是一种从大量数据中通过算 法搜索隐藏在其中的信息、模式和关 联性的过程。这些信息可以用于决策 支持、预测趋势和行为等。
数据挖掘过程
总结词
数据挖掘过程包括数据预处理、数据探索、模型建立 和评估等步骤。
02
数据仓库基础
数据仓库定义
总结词
数据仓库是一个大型、集中式的存储系统,用于存储和管理企业的结构化数据。
详细描述
数据仓库是一个面向主题的、集成的、非易失的数据存储环境,用于支持管理 决策和业务操作。它通常包含历史数据,并支持对数据的分析和查询。
数据仓库架构
总结词
数据仓库架构包括数据源、ETL过程、数据 存储和数据访问等组成部分。
05
数据仓库和数据挖掘的实 际应用案例
金融行业的数据仓库和数据挖掘应用
总结词
金融行业是数据仓库和数据挖掘应用的重要领域,通过对 大量数据的分析和挖掘,可以提供风险控制、客户细分、 投资决策等方面的支持。
风险控制
金融机构可以利用数据仓库和数据挖掘技术,对海量的交 易数据进行实时监控和异常检测,及时发现和预防潜在的 金融风险。

数据仓库与数据挖掘培训课件

数据仓库与数据挖掘培训课件

数据挖掘定义
技术角度的定义
数据挖掘(Data Mining)是从大量的、不完全 的、有噪声的、模糊的、随机的实际应用数据中, 提取隐含在其中的、人们事先不知道的、但又是潜 在有用的信息和知识的过程。与数据挖掘相近的同 义词包括:数据融合、数据分析和决策支持等。
这一定义包括好几层含义:数据源必须是真实 的、海量的、含噪声的;发现的是用户感兴趣的知 识;发现的知识要可接受、可理解、可运用;并不 要求发现放之四海皆准的知识,仅支持特定的发现 问题。
金子(知 识)
概述
数据挖掘是八十年代投资AI研究项目失败后,AI转 入实际应用时提出的。它是一个新兴的,面向商业应用的 AI研究。
1989年8月,在美国底特律召开的第11届国际人工智 能联合会议的专题讨论会上首次出现数据库中的知识发现 (Knowledge Discovery in Database,KDD)这一术语。
• 起初,两类数据放到一起,即分散存储在各底层 的业务数据库中。
• 后来,随着企业规模的扩展、数据量的增加、以 及希望在决策分析时得到更多支持需求的日益迫 切,并且考虑保证原有事务数据库的高效性与安 全性。因此将分析型数据与事务型数据相分离, 单独存放,即形成了所谓的数据仓库。
➢ 数据仓库与数据库的关系
不同的管理业务需要建立不同的数据库。例如,银 行中储蓄业务、信用卡业务分别要建立储蓄数据库 和信用卡数据库。
数据库是为满足事务处理需求建立的,在帮助人们 进行决策分析时显得不适用。(举例)
➢ 数据库的局限性
传统数据库所能做到的只是对已有的 数据进行存取以及简单的查询统计,即使 是一些流行的OLAP工具,也无非是另一种 数据展示方式而已。人们仍然无法发现数 据中存在的关系和规则,无法根据现有的 数据预测未来的发展趋势。这也直接导致 了目前“数据爆炸但知识匮乏”的现状。

数据仓库与数据挖掘.第1章ppt课件

数据仓库与数据挖掘.第1章ppt课件

2021精选ppt
5
数据仓库在我国的发展
• 现状:数据仓库的概念已经被国内用户接受多年,但在 应用方面的收效仍很有限。
• 原因:
– 尚不存在可靠的、完善的、被广泛接受的数据仓库标准;
– 现有的数据库系统不健全,数据积累还不够,无法提出决策 支持需求;
– 缺乏能够担负规划、设计、构建和维护数据仓库的重任的复 合型人才;
• 面向主题的数据组织方式可在较高层次上对 分析对象的数据给出完整、一致的描述,能 完整、统一的刻画各个分析对象所涉及的企 业的各项数据以及数据之间的联系。
2021精选ppt
18
集成性
• 数据仓库中的数据是从原有分散的源数据 库中提取出来的,其每一个主题所对应的 源数据在原有的数据库中有许多冗余和不 一致,且与不同的应用逻辑相关。因此, 数据仓库在提取数据时必须经过数据集成, 消除源数据中的矛盾,并进行数据综合和 计算。经过数据集成后,数据仓库所提供 的信息比数据库提供的信息更概括、更本 质。
数据中隐藏的知识的手段,导致了“数据爆炸但知 识贫乏的”现象。
• 自80年代后期以来,联机分析处理(OLAP)和数 据挖掘技术应运而生。
2021精选ppt
24
数据挖掘的发展
• 数据挖掘(Data Mining,简记为DM)是从关系 数据库、数据仓库、WEB数据库以及其他文件系 统中发现重要的数据模式、规律的过程,因此又 称为数据库中的知识发现(Knowledge Discovery in Database, 简记为KDD),它是OLAP的高级阶 段。
2021精选ppt
9
分析型处理
• 分析型处理:用于管理人员的决策分析,例 如DSS、 EIS、和多维分析等。它帮助决策 者分析数据以察看趋向、判断问题。分析型 处理经常要访问大量的历史数据,支持复杂 的查询。在分析型处理中,并不是对从事务 型处理环境 中得到的细节数据进行分析。分 析型处理过程中经常用到外部数据。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.3 数据仓库和数据挖掘的结合
1.3.1 数据仓库和数据挖掘的区别与联系 1.3.2 基于数据仓库的决策支持系统 1.3.3数据仓库与商业智能
1.3.1 数据仓库和数据挖掘的区别与联系
1. 数据仓库与数据挖掘的区别
2.数据仓库与数据挖掘的关系 3.数据仓库中数据存储特点 4.数据仓库中数据挖掘特点
1.联机事务处理(OLTP)
OLTP的特点在于事务处理量大,但事务处理 内容比较简单且重复率高。 OLTP处理的数据是高度结构化的,涉及的事 务比较简单,数据访问路径是已知的,至少是 固定的。
OLTP面对的是事务处理操作人员和低层管理 人员。
2.联机分析处理(OLAP)
决策分析需要对多个关系数据库共同进行大量 的综合计算才能得到结果。 E.F.Codd在1993年提出了多维数据库和多 维分析的概念,即联机分析处理(On Line Analytical Processing,OLAP)概念。
1.1.3 数据字典与元数据
1. 数据库的数据字典 2.数据仓库的元数据
1. 数据库的数据字典
数据字典是数据库中各类数据描述的集合 。 (1) 数据项 (2) 数据结构 (3) 数据流 (4) 数据存储 (5) 处理过程
2.数据仓库的元数据
在数据仓库中引入了“元数据”的概念,它 不仅仅是数据仓库的字典,而且还是数据仓 库本身信息的数据。 元数据(metadata)定义为描述数据及 其环境的数据。 两方面的用途。首先,元数据能提供基于用 户的信息,如记录数据项的业务描述信息的 元数据能帮助用户使用数据。其次,元数据 能支持系统对数据的管理和维护
1.2.2数据挖掘含义
知识发现(KDD):从数据中发现有用知识的整个过程。 数据挖掘(DM) :KDD过程中的一个特定步骤,它用专门算 法从数据中抽取知识。 如在人类数据库中挖掘知识为:
(头发=黑色)∨(眼睛=黑色)→亚洲人
该知识覆盖了所有亚州人的记录。
1.2.3数据挖掘与OLAP的比较
1. OLAP的多维分析 OLAP的典型应用,通过商业活动变化的查询 发现的问题,经过追踪查询找出问题出现的原 因,达到辅助决策的作用。
沃尔玛数据仓库系统
每天要处理并更新2亿条记录,要对来自 6000多个用户的48,000条查询语句进行 处理。销售数据、库存数据每天夜间从4, 000多个商店自动采集过来,并通过卫星线 路传到总部的数据仓库里。 利用数据仓库,进行决策支持分析,具体表 现为:
存储数据的数据库和数据仓库
有什么不同???
统计学与数据挖掘的比较
统计学主要是对数量数据(数值)或连续值数 据(如年龄、工资等),进行数值计算(如初 等运算)的定量分析,得到数量信息。 数据挖掘主要对离散数据(如职称、病症等) 进行定性分析(覆盖、归纳等),得到规则知 识。
统计学与数据挖掘是有区别的。但是,它们之 间是相互补充的。
2. 数据挖掘 数据挖掘任务在于聚类(如神经网络聚类)、 分类(如决策树分类)、预测等。
1.2.4 数据挖掘与统计学
统计学与国家政治有紧密的关系。
支配着社会现象的法则和方法是概率论。 通过对全部对象(总体)进行调查,为制定 计划和决策提供依据。
统计学中应用于数据挖掘的内容
(1)常用统计 (2)相关分析 (3)回归分析 (4)假设检验 (5)聚类分析 (6)判别分析 (7) 主成份分析
1.2.1 从机器学习到数据挖掘
学习是人类具有的智能行为,主要在于获取知识。
机器学习是研究使计算机模拟或实现人类的学习行为, 即让计算机通过算法自动获取知识。 机器学习是人工智能领域中的重要研究方向。 20世纪60年代开始了机器学习的研究。
(1) 1980年在美国召开了第一届国际机器学习研讨会; 明确了机器学习是人工智能的重要研究方向
(2)数据存储的数据量的不同 (3)数据存储的结构不同
4.数据仓库中数据挖掘特点
(1)数据挖掘从数据仓库中挖掘更深层次 的信息 (2)数据仓库为数据挖掘提出了新要求 ①数据挖掘需要可扩展性 ②数据挖掘方法需要能挖掘多维知识
1.数据库用于事务处理
数据库作为数据资源用于管理业务中的事务处 理。 数据库中存放的数据基本上是保存当前数据, 随着业务的变化随时在更新数据库中的数据。 不同的管理业务需要建立不同的数据库。例如, 银行中储蓄业务、信用卡业务分别要建立储蓄 数据库和信用卡数据库。
2.数据仓库用于决策分析
(1)“数据太多,信息不足”的现状
(2)异构环境的数据的转换和共享
(3)利用数据进行数据处理转换为利用数据支 持决策
沃尔玛数据仓库系统
美国的沃尔玛(Wal*Mart)是世界最大的零售商。 沃尔玛的创始人萨姆.沃尔顿:“我总是喜欢尽快得到 那些数据、我们越快得到那些信息、我们就能越快据此 采取行动,这个系统已经成为我们的一个重要工具”。 Wal*Mart上世纪80年代建立了基于NCR Teradata数 据仓库的决策支持系统。
(2) 1989 年 8 月 于 美 国 底 特 律 市 召 开 的 第 一 届 知 识 发 现 (KDD)国 际学术会议; 首次提出知识发现概念 (3) 1995年在加拿大召开了第一届知识发现和数据挖掘 (DM)国际学术会议; 首次提出数据挖掘概念 (4) 我国于1987年召开了第一届全国机器学习研讨会。
1. 数据仓库与数据挖掘的区别
数据仓库是一种存储技术,它能适应于不同 用户对不同决策需要提供所需的数据和信息。 数据挖掘研究各种方法和技术,从大量的数 据中挖掘出有用的信息和知识。
2.数据仓库与数据挖掘的关系
数据仓库与数据挖掘都是决策支持新技术。但 它们有着完全不同的辅助决策方式。 在数据仓库系统的前端的分析工具中,数据挖 掘是其中重要工具之一。它可以帮助决策用户 挖掘数据仓库的数据中隐含的规律性。
数据仓库的元数据除对数据仓库中数据的描 述(数据仓库字典)外,还有以下三类元数 据: (1) 关于数据源的元数据 (2) 关于抽取和转换的元数据 (3) 关于最终用户的元数据
在数据仓库系统中,元数据机制主要 支持以下五类系统管理功能:
(1)描述哪些数据在数据仓库中; (2)定义要进入数据仓库中的数据和从数 据仓库中产生的数据; (3)记录根据业务事件发生而随之进行的 数据抽取工作时间安排; (4)记录并检测系统数据一致性的要求和 执行情况; (5)衡量数据质量
关系数据库是二维数据(平面机分析处理(OLAP)
OLAP的基本思想是决策者从多 方面和多角度以多维的形式来观 察企业的状态和了解企业的变化。
3.OLTP与OLAP的对比
OLTP 细节性数据 当前数据 经常更新 一次性处理的数据量小 对响应时间要求高 面向应用,事务驱动 OLAP 综合性数据 历史数据 不更新,但周期性刷新 一次处理的数据量大 响应时间合理 面向分析,分析驱动
沃尔玛数据仓库系统
利用数据仓库,沃尔玛对商品进行市场类组分 析,即分析哪些商品顾客最有希望一起购买。
一个意外的发现就是:跟尿布一起购买最多的 商品竟是啤酒!按常规思维,尿布与啤酒风马 牛不相及,若不是借助于数据仓库系统,商家 决不可能发现隐藏在背后的事实。 沃尔玛就在它的一个个商店里将它们并排摆放 在一起,结果是尿布与啤酒的销量双双增长。
综合或提炼的 代表过去的数据 不更新 一次操作数据量大 面向分析 支持决策
1.1.2从OLTP到OLAP
1.联机事务处理(OLTP)
2.联机分析处理(OLAP) 3.OLTP与OLAP的对比
1.联机事务处理(OLTP)
联机事务处理(On Line Transaction Processing,OLTP)是在网络环境下的 事务处理工作,以快速的响应和频繁的数据 修改为特征,使用户利用数据库能够快速地 处理具体的业务。 OLTP应用要求多个查询并行,以便将每个 查询分布到一个处理器上。
(5)数据仓库的数据量很大
大型DW是一个TB(1000GB)级数据库问题 (一般为10GB级相当于一般数据库 100MB的 100倍)
(6)数据仓库软、硬件要求较高 需要一个巨大的硬件平台 需要一个并行的数据库系统
1.2数据挖掘的兴起
1.2.1 从机器学习到数据挖掘
1.2.2 数据挖掘含义 1.2.3 数据挖掘与OLAP的比较 1.2.4 数据挖掘与统计学

88年数据是12GB。硬盘容量20MB 89年升级为24GB。 96年达到7.5TB 97年为圣诞节市场预测,达到了24TB 现在已经达到了170TB
沃尔玛数据仓库系统
美国的沃尔玛(Wal*Mart)是世界最大的零售商, Wal*Mart建立了基于NCR Teradata数据仓库的决策支 持系统,它是世界上第二大的数据仓库系统,总容量达 到170TB以上。 强大的数据仓库系统将世界4000多家分店的每一笔业务 数据汇总到一起,让决策者能够在很短的时间里获得准 确和及时的信息,并做出正确和有效的经营决策。 沃尔玛的创始人萨姆.沃尔顿:“我总是喜欢尽快得到 那些数据、我们越快得到那些信息、我们就能越快据此 采取行动,这个系统已经成为我们的一个重要工具”。
(3)数据仓库是稳定的 数据仓库中包括了大量的历史数据。数据经集 成进入数据仓库后是极少或根本不更新的。 (4)数据仓库是随时间变化的 数据仓库内的数据时限在5~10年,故数据的键 码包含时间项,标明数据的历史时期,这适合DSS 进行时间趋势分析。 而数据库只包含当前数据,即存取某一时间的 正确的有效的数据。
数据仓库用于决策分析
数据库保持事务处理的当前状态,数据仓库既 保存过去的数据又保存当前的数据 数据仓库的数据是大量数据库的集成 对数据库的操作比较明确,操作数据量少。对 数据仓库操作不明确,操作数据量大
相关文档
最新文档