数据仓库及其案例介绍

合集下载

数据仓库技术在物联网领域中的应用案例分析(十)

数据仓库技术在物联网领域中的应用案例分析(十)

数据仓库技术在物联网领域中的应用案例分析随着物联网技术的迅速发展和应用,海量的数据不断被收集和生成。

数据对于物联网应用来说,是一种无价的资源,但如何高效地管理和利用这些数据却是亟待解决的问题。

数据仓库技术作为一种专门用来处理大规模数据的技术,在物联网领域中发挥着重要的作用。

本文将通过几个实际案例,探讨数据仓库技术在物联网领域中的应用。

1. 数据仓库技术在智能家居中的应用智能家居通过连接各种智能设备,将家庭生活环境实现自动化和智能化。

在智能家居系统中,各个设备会产生大量的数据,如温度、湿度、光照等传感器采集的数据,以及用户行为数据等。

为了更好地实现智能家居系统的管理和优化,需要将这些数据收集起来进行分析。

这时,数据仓库技术就能派上用场。

通过将各个设备收集的数据整合到数据仓库中,可以对家庭环境进行全面的、历史数据的分析和预测,从而提供更加智能化的家居服务。

2. 数据仓库技术在智能交通中的应用智能交通系统通过各种传感器和设备实时监控交通状况,提供交通流量、路况、停车位等信息,以便更好地管理交通。

在这个系统中,大量的数据需要被实时收集、分析和处理。

数据仓库技术可以通过将各个传感器收集的数据整合到数据仓库中,实现对交通系统的全面分析。

例如,可以根据历史数据对道路拥堵情况进行预测,为交通管理者提供决策支持;同时,也可以对交通状况进行实时监控,及时发现并解决交通问题。

3. 数据仓库技术在智能健康监测中的应用智能健康监测系统通过各种传感器和设备实时监测人体健康指标,如心率、体温、血压等。

这些数据对于医护人员来说非常重要,可以用来判断人体健康状况并进行及时的干预。

数据仓库技术可以将这些健康指标数据整合到数据仓库中,对人体健康状态进行全面分析。

基于历史数据,可以进行疾病预测和风险评估,提供个性化健康指导。

同时,也可以通过实时监测数据提醒医护人员进行紧急处理,以提高病患救治的效果。

综上所述,数据仓库技术在物联网领域中的应用非常广泛。

数据库经典案例

数据库经典案例

数据库经典案例1. Facebook: Facebook是一个大型的社交媒体平台,它需要一个强大的数据库来管理和存储用户的个人资料、帖子、图片和视频等数据。

Facebook使用HBase作为其主要数据库,它是一个基于Hadoop的分布式数据库。

2. Amazon: 亚马逊是全球最大的在线零售商之一,它需要一个高度可扩展的数据库系统来管理和存储数十亿个产品列表、订单和用户数据。

亚马逊使用DynamoDB作为其主要数据库,它是一个NoSQL数据库,具有高度可扩展性和高可用性。

3. Uber: Uber是一家全球领先的网约车服务平台,它需要一个实时和高性能的数据库来管理和存储乘客、司机、行程和支付等数据。

Uber使用Cassandra作为其主要数据库,它是一个分布式的NoSQL数据库,具有高性能和可扩展性。

4. Airbnb: Airbnb是一个在线民宿预订平台,它需要一个可扩展和灵活的数据库来管理和存储大量的住宿列表、预订和用户信息。

Airbnb使用MySQL作为其主要数据库,它是一个关系型数据库,提供了强大的数据处理和查询功能。

5. Netflix: Netflix是一个全球流媒体平台,它需要一个大规模的数据库来管理和存储数十亿个影片、用户概要和观看历史等数据。

Netflix使用Apache Cassandra作为其主要数据库,它是一个高度可扩展的分布式数据库,可以有效处理大规模的数据。

6. LinkedIn: LinkedIn是一个专业社交媒体平台,它需要一个可扩展和高性能的数据库来管理和存储数亿个用户概要、连接和职位信息等数据。

LinkedIn使用Voldemort作为其主要数据库,它是一个分布式的键值存储系统,具有高可靠性和可扩展性。

这些都是一些经典的数据库案例,面临着复杂的数据管理需求和大规模的数据输入输出。

这些案例展示了数据库在不同领域中的广泛应用和技术挑战。

数据仓库与数据挖掘案例分析

数据仓库与数据挖掘案例分析

数据仓库与数据挖掘案例分析在当今数字化的时代,数据已成为企业和组织最宝贵的资产之一。

如何有效地管理和利用这些海量数据,以获取有价值的信息和洞察,成为了摆在众多企业面前的重要课题。

数据仓库和数据挖掘技术的出现,为解决这一问题提供了有力的手段。

接下来,让我们通过一些具体的案例来深入了解这两项技术的应用和价值。

一、零售行业的数据仓库与数据挖掘以一家大型连锁超市为例,该超市每天都会产生大量的销售数据,包括商品的种类、价格、销售数量、销售时间、销售地点等。

通过建立数据仓库,将这些分散在不同系统和数据库中的数据整合起来,形成一个统一的、集成的数据源。

数据挖掘技术则可以帮助超市发现隐藏在这些数据中的模式和趋势。

例如,通过关联规则挖掘,可以发现哪些商品经常被一起购买,从而优化商品的摆放和促销策略。

如果顾客经常同时购买面包和牛奶,那么将这两种商品摆放在相邻的位置,或者推出面包和牛奶的组合促销活动,可能会提高销售额。

通过聚类分析,可以将顾客分为不同的群体,根据每个群体的消费习惯和偏好,进行个性化的营销。

比如,将经常购买高端进口食品的顾客归为一类,针对他们推送相关的新品推荐和优惠信息;而对于注重性价比的顾客群体,则推送一些打折促销的商品信息。

二、金融行业的数据仓库与数据挖掘在金融领域,银行和证券公司也广泛应用数据仓库和数据挖掘技术。

一家银行拥有大量的客户数据,包括客户的基本信息、账户交易记录、信用记录等。

利用数据仓库,银行可以对这些数据进行整合和管理,实现对客户的全面了解。

数据挖掘可以帮助银行进行客户细分,识别出高价值客户和潜在的流失客户。

对于高价值客户,提供个性化的服务和专属的金融产品,提高客户的满意度和忠诚度;对于潜在的流失客户,及时采取措施进行挽留,比如提供优惠政策或者改善服务质量。

在风险管理方面,数据挖掘可以通过建立信用评估模型,预测客户的违约风险。

通过分析客户的历史交易数据、收入情况、负债情况等因素,评估客户的信用等级,为贷款审批提供决策依据,降低不良贷款率。

数据库数据仓库设计实例星型模式与雪花模式

数据库数据仓库设计实例星型模式与雪花模式

数据库数据仓库设计实例星型模式与雪花模式数据库数据仓库设计实例:星型模式与雪花模式数据仓库是指一个用于集成、存储和管理企业中大量历史、不同来源的数据的数据库。

在设计数据仓库时,我们需要考虑到如何最好地组织数据以满足分析和查询的需求。

星型模式和雪花模式是两种常见的数据仓库设计模式,本文将介绍它们的特点、应用场景以及优缺点。

一、星型模式星型模式是最简单和最直接的数据仓库设计模式之一。

它由一个中心的事实表和多个与之相关的维度表组成。

在星型模式中,事实表包含着企业中的业务事实,如销售金额、销售数量等。

每一条记录都与一个或多个维度表关联,维度表包含着描述业务事实的维度属性,如时间、地点、产品等。

事实表和维度表之间通过外键关联。

星型模式的主要特点是简单、易于理解和查询性能较高。

通过将数据分散到多个维度表中,星型模式提供了更好的数据查询性能。

此外,星型模式还具有较好的扩展性,因为维度表之间是独立的,并可以根据需求进行增加或修改。

然而,星型模式也有一些缺点。

首先,维度表之间的关系相对简单,无法表达一些复杂的业务关系。

其次,事实表中的数据冗余较多,可能浪费存储空间。

最后,当数据模型变得更加复杂时,星型模式的设计和维护会变得困难。

二、雪花模式雪花模式是星型模式的一种扩展,它在维度表中引入了层次结构,使得维度表不再是扁平的结构,而是具有层级关系。

在雪花模式中,维度表不仅包含维度属性,还包含了维度属性之间的关系。

这些关系通过将维度表进一步规范化来实现,使得维度表呈现出树状结构。

如一个产品维度表可以包含产品组、产品类别、产品子类等属性。

雪花模式的主要优点是可以更好地表达复杂的业务关系和层次关系。

通过规范化维度表,我们可以灵活地组织数据,并支持更复杂的分析查询。

此外,雪花模式还可以提供更好的数据一致性和维护性。

然而,雪花模式也有一些缺点。

首先,相对于星型模式而言,查询性能可能会稍差一些。

由于维度表的层次结构,查询需要多次连接和搜索。

HIS的医院数据仓库实例讲解

HIS的医院数据仓库实例讲解

HIS的医院数据仓库实例讲解1. 简介医院信息系统(Hospital Information System,简称HIS)是指用于管理和处理医院业务运转所需的信息的一种计算机化系统。

医院作为一个庞大而复杂的组织,会产生大量的数据,这些数据的收集、存储、处理和分析对于医院的运营和决策具有重要意义。

医院数据仓库就是为了满足这一需求而建立的一种数据管理和分析系统。

本文将以一个医院数据仓库实例为例,介绍HIS的医院数据仓库实现的过程和关键要点。

2. 数据仓库架构HIS的医院数据仓库主要由以下几个核心组件构成:•数据源层(Source Layer):负责从医院的各个业务系统中提取数据,并进行清洗和转换。

数据源可以包括门诊系统、住院系统、检验系统等。

•数据存储层(Storage Layer):负责将清洗和转换后的数据存储起来,常用的存储方式包括关系型数据库、数据仓库和数据湖等。

•数据管理层(Management Layer):负责管理数据仓库的元数据、数据质量、数据安全等方面的工作。

•数据应用层(Application Layer):提供给医院管理层、医生和研究人员等用户使用的各种数据分析和可视化工具。

3. 数据抽取和清洗在数据仓库的实施过程中,数据抽取和清洗是一个非常关键的步骤。

医院的业务系统中的数据格式和结构多种多样,需要通过数据抽取工具将其转换成统一的格式,以便进行后续的分析和挖掘。

数据的抽取可以采用多种方式,常见的包括定时导出和实时数据同步。

根据具体的需求,可以选择适合的数据抽取方式。

数据清洗是数据仓库实施过程中非常重要的一环。

由于医院业务系统中的数据多样性和复杂性,常常会出现数据中的噪声、重复、缺失等问题。

数据清洗的目标是保证数据的一致性和准确性,以及清除数据中的噪声。

4. 数据建模和维度设计数据建模是医院数据仓库设计的核心工作之一。

在数据建模过程中,需要根据医院业务需求确定合适的维度和度量,以及它们之间的关系和层次结构。

离线数据仓库实践案例

离线数据仓库实践案例

离线数据仓库实践案例离线数据仓库实践案例:1. 项目背景:随着业务的高速发展,企业需要处理的数据量越来越大,对数据处理的速度和质量也提出了更高的要求。

为了满足这些需求,离线数据仓库成为了一个重要的解决方案。

离线数据仓库可以在非实时环境下对大量数据进行处理和分析,为企业的决策提供支持。

2. 项目架构:离线数据仓库的架构包括以下几个主要部分:(1)数据源:数据源是数据的来源,包括数据库、日志文件、API等。

这些数据源中的数据被抽取到数据仓库中。

(2)ETL(Extract, Transform, Load)过程:ETL过程是数据仓库的核心,包括数据抽取、转换和加载三个步骤。

数据从数据源中被抽取出来,经过清洗、整合、转换等操作后,加载到数据仓库中。

(3)数据仓库:数据仓库是存储和管理数据的核心部分。

根据数据的不同类型和特点,数据仓库可以分为关系型数据仓库和非关系型数据仓库。

(4)报表和可视化工具:报表和可视化工具是用来展示和分析数据的工具,可以帮助用户更好地理解数据和做出决策。

3. 实践步骤:(1)需求分析:首先需要对业务需求进行深入分析,明确需要处理的数据类型、数据量和分析维度。

(2)设计数据模型:根据需求设计合适的数据模型,包括表结构、关系、索引等。

(3)开发ETL过程:根据数据源和数据模型开发ETL过程,实现数据的抽取、转换和加载。

(4)测试和优化:对ETL过程进行测试和优化,确保数据的准确性和处理效率。

(5)部署和维护:将ETL过程部署到生产环境中,并定期进行维护和更新。

4. 注意事项:(1)数据质量:在数据处理过程中,要确保数据的准确性和完整性。

对异常数据进行清洗和整合,避免对分析结果造成影响。

(2)性能优化:离线数据仓库的处理速度直接影响到数据分析的效率。

需要对数据处理过程进行优化,提高处理速度。

(3)可扩展性:随着业务的发展,数据量会不断增加。

离线数据仓库需要具备良好的可扩展性,能够支持大规模数据的处理和分析。

数据仓库案例

数据仓库案例

数据仓库案例随着信息时代的快速发展,数据充斥着人们的生活和工作。

人们越来越关注如何高效地管理和利用这些数据,以提高工作效率和决策能力。

这就催生了数据仓库的出现。

数据仓库是一种以主题为导向,集成、稳定、易于访问的数据集合,用于支持管理决策和业务智能的系统。

某电子商务公司作为一个新型的企业,涉及各种业务,如商品销售、库存管理、顾客管理等。

为了更好地管理和分析这些数据,他们决定建立一个数据仓库。

首先,他们进行了需求分析,确定了数据仓库的目标和内容。

由于销售是企业最关注的方面,他们决定将销售数据作为数据仓库的核心内容。

然后,他们收集了公司历年来的销售数据,包括销售额、销售量、销售渠道等。

为了增加数据的全面性和准确性,他们还收集了其他相关数据,如库存数据、顾客行为数据等。

接下来,他们对收集到的数据进行了清洗和整合。

由于数据来源不同,格式也各不相同,他们需要对数据进行转换和归一化,以确保数据的一致性和兼容性。

同时,他们还进行了数据清洗,将有错误或冗余的数据进行了删除或修复。

然后,他们设计了数据仓库的架构和模型。

他们使用了星型模型来组织数据,将销售事实表与维度表相连接,以实现对销售数据的多维度分析。

另外,他们还设计了一些指标和报表,用于监控销售情况和预测销售趋势。

最后,他们将数据仓库部署到了公司的服务器上,并对用户进行了培训和指导,以确保他们能够充分利用数据仓库的功能。

同时,他们也建立了一支数据仓库运维团队,负责维护和更新数据仓库,以适应企业的发展和变化。

通过建立数据仓库,该电子商务公司取得了许多好处。

首先,他们可以更好地管理和分析销售数据,及时了解销售情况和趋势,以便做出更有效的决策。

其次,他们可以通过数据仓库进行顾客行为分析,了解顾客的偏好和需求,以便精准地进行商业推广。

最后,他们还可以根据销售数据进行库存管理,避免库存过剩或缺货的情况。

综上所述,数据仓库在企业中的应用具有重要意义。

无论是传统企业还是新兴企业,都可以通过建立数据仓库来提高管理效率和决策能力,实现可持续发展。

数据仓库技术在客户细分分析中的应用案例分析

数据仓库技术在客户细分分析中的应用案例分析

数据仓库技术在客户细分分析中的应用案例分析随着信息技术的快速发展,企业在市场竞争中越来越重视客户细分分析。

客户细分分析是指通过对客户数据进行深入分析,将客户划分为不同的细分群体,从而更好地了解客户需求、实施个性化营销策略。

在这个过程中,数据仓库技术扮演着重要的角色。

本文将通过一个实际应用案例来介绍数据仓库技术在客户细分分析中的应用。

公司X是一家电商公司,拥有庞大的客户基础。

为了更好地了解客户需求,提高营销效果,公司X决定利用数据仓库技术对客户进行细分分析。

首先,公司X搭建了一个包含多个数据源的数据仓库系统。

数据仓库系统通过数据抽取、清洗和转换,将来自不同渠道的数据进行整合,形成一个集中的数据存储。

这些数据包括客户购买记录、浏览历史、点击行为等多种信息,可以提供大量的客户特征数据。

在数据仓库系统中,公司X使用了数据挖掘算法来进行客户细分。

首先,他们通过聚类分析算法将客户划分为不同的群组。

基于购买记录、点击行为等特征,算法可以自动将具有相似特征的客户归为一组。

例如,购买相同产品、在相同时间段内有类似点击行为的客户可能有着相似的购买偏好和消费行为。

通过这样的群组划分,公司X可以更好地理解客户群体的行为模式和喜好。

接下来,公司X利用关联规则挖掘算法来探索客户之间的关联关系。

这些关联关系可能包括共同购买的产品、相似的兴趣爱好等。

通过发现这些关联关系,公司X可以更好地了解客户的交叉购买行为和潜在的合作机会。

同时,这些关联规则还可以帮助公司X设计更有针对性的交叉销售策略,提高客户的复购率。

除了上述的数据挖掘方法,公司X还使用了数据可视化技术来呈现客户细分结果。

通过数据可视化,他们可以将复杂的客户数据转化为易懂的图表和图像,帮助市场部门更好地理解客户群体。

例如,通过绘制散点图,可以以购买金额为横轴,购买次数为纵轴,展示不同客户群体的消费习惯。

这样的可视化结果直观地展示了客户群体的特点和差异,为市场部门制定个性化营销策略提供了参考。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Shenzhen Hirisun Technology Incorporated
IBM数据仓库解决方案
Shenzhen Hirisun Technology Incorporated
Oracle解决方案
数据获取
源数据
中调 实时 接口
电量数据
人力资源
电厂KPI
……
电厂KPI
环保数据
……
中间库
RDATA MDATA
培训提纲
➢概念 ➢重要术语 ➢关键技术 ➢数据质量 ➢方法论 ➢典型案例
Shenzhen Hirisun Technology Incorporated
数据集市
人们在早期开发企业级数据仓库时,一般是先建立一个全局的数据仓库,然后在此基础上建立各种应用,即 “自顶向下”的方法。但在开发的过程中会出现以下问题。
时间相关的、不可修改的数据集合。 与其他数据库应用不同的是,数据仓库更像一种过程,对分
布在企业内部各处的业务数据的整合、加工和分析的过程。
Shenzhen Hirisun Technology Incorporated
企业管理与决策


决策信息
分析型(战略)数据

(辅助决策) 分析型(战略)应用
高层
数据仓库及其案例
张千福 zhangqianfu@
Shenzhen Hirisun Technology Incorporated
目的
➢ 掌握数据仓库的基本概念和数据中心的体系架构。 ➢ 掌握有关商业智能和数据仓库的重要术语 ➢ 了解数据中心建设过程 ➢ 了解公司数据仓库项目重要案例
Sales Table
Time_id Product_id Market_id Scenario
Dollars Units Discount%
"Fact Table"
Market Table
Market_id Market_Desc
MOLAP将OLAP分析所用到的多维数据物 理上存储为多维数组的形式,形成“立方 体”的结构。维的属性值被映射成多维数 组的下标值或下标的范围,而总结数据作 为多维数组的值存储在数组的单元中。
Shenzhen Hirisun Technology Incorporated
OLAP分类
OLAP
按照存储方式
Shenzhen Hirisun Technology Incorporated
星型模式(Star Schema)
Period Table
Time_id Period_Desc Quarter Year
"Dimension Table"
Product Table
Product_id Product_Desc Brand Size
EHR KPI
数据存储
数据展现
数据转换 粤电数据仓库
信息展现
OWB
抽取 转化 过滤 加载
Oracle 9i
关型模型

立方体


挖掘
转换
Report
Portal
报表
粤电用户
随即查询
BI Bean
多维分析
Discoverer KPI分析
应用 服务器
粤电用户
数据管理
OEM
页面集成
直接用户 (开发人员)
Shenzhen Hirisun Technology Incorporated
– 逐步扩展到企业数据仓库 (EDW) 把建造EDW作为一个长期的目标
存在的问题:
数据集市的数据都是可用的吗? 能生成数据模型吗? 如何解决不一致性?
操作数据 (全局) &
外部数据
操作数据 (局部)
操作数据 (局部)
数据集市
数据集市
企业数据仓库
Shenzhen Hirisun Technology Incorporated
− 1973年加州大学伯克利分校开发出关系数据库系统Ingres。后来由Oracle公司、 Ingres公司等厂商商品化。
− 在20世纪70年代提出了决策支持系统概念。在1970年, 联机分析处理工具—— Express诞生了。 1980年明确了其部件结构(对话部件、数据部件、模型部 件)。
− 1988年,IBM公司的研究者Barry Devlin和Paul Murphy发明了一个新的术语— 信息仓库,之后,IT的厂商开始构建实验性的数据仓库。1991年,W.H. "Bill" Inmon出版《如何构建数据仓库》。
Shenzhen Hirisun Technology Incorporated
培训提纲
➢概念 ➢重要术语 ➢关键技术 ➢数据质量 ➢方法论 ➢典型案例
Shenzhen Hirisun Technology Incorporated
历史沿革
计算机数据管理的历史:
− 1961年通用电气开发出网状数据库管理系统— 集成数据存储(Integrated DataStore IDS)。1968 年IBM 公司开发出层次数据库的IMS (Information Management System)。1970年关系模型建立。IBM研发全功能关系DBMS — System R。
构建数据仓库--自顶向下
– 建造企业数据仓库 建设中心数据模型 一次性的完成数据的重构工作 最小化数据冗余度和不一致性 存储详细的历史数据
– 从企业数据仓库中建造数据集市 得到大部分的集成数据 直接依赖于数据仓库的可用性
操作数据
外部数据
问题
投资效益的时间? 建设中心数据模型的必要性和可能性? 初始费用 ?
OLTP与OLAP
数据处理系统可以分成两大类: 联机事务处理OLTP(on-line transaction processing):OLTP是传统 的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如 银行交易、电力营销系统。 联机分析处理OLAP(On-Line Analytical Processing):OLAP是数据 仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提 供直观易懂的查询结果。 OLAP的目标是满足决策支持或多维环境特 定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也 可以说是多维数据分析工具的集合。数据仓库的核心是联机分析处理。

决策人员
管理信息 (数据分析)
基础数据 (统计查询)
分析型(战术)数据 分析型(战术)应用 企业级操作型数据 企业级操作型应用
操作型数据 操作型应用
中层 管理人员
基层 业务人员
数据Sh汇enz总hen粒Hi度risun Technology Incorporated
数据仓库的特点
➢ 1、面向主题 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自 分离,而数据仓库中的数据是按照一定的主题域进行组织的。
Shenzhen Hirisun Technology Incorporated
数据仓库与OLAP
数据仓库系统的核心是联机分析处理,但数据仓库包括更为广泛的内容。

-概括来说,数据仓库系统是指具有综合企业数据的能力,能够对
大量企业数据进行快速和准确分析,辅助做出更好的商业决策的系统。
它本身包括三部分内容:
− 把数据仓库、联机分析处理、数据挖掘、模型库、数据库、知识库结合起来形 成综合决策支持系统(Synthetic Decision Support System, SDSS)是今后的 发展方向。
Shenzhen Hirisun Technology Incorporated
数据仓库的概念
[William H.Inmon]: 数据仓库是在企业管理和决策中面向主题的、集成的、与
3. 维的成员:维的一个取值。是数据项在某维中位置的描述。(“某年某月某日”是在时间 维上位置的描述)
4. 多维数组:维和变量的组合表示。一个多维数组可以表示为:(维1,维2,…,维n,变 量)。(时间,地区,产品,销售额)
5. 度量(数据单元,单元格):多维数组的取值。(2000年1月,上海,笔记本电脑 , $100000)
物资
产品
使用产品信息
客户
资产信息
物资相关部门
资产
资产设备
设备管理人员 招投标信息
设备
电网所属的组织
物资项目信息 项目信息
人员组织
客户所属的组织信息
项目所属 组织信息
员工薪水
项目
核算对象
客户设备信息
组织相关指标 电网提供产品
核算对象
交易产品
综合
参与市场交易 的组织信合息同信息
项目账目信息
计划、统计
财务
➢ 2、集成的 数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上 经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性, 以保证数据仓库内的信息是关于整个企业的一致的全局信息。
➢ 3、相对稳定的 数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是 数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保 留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很 少,通常只需要定期的加载、刷新。
(1)如果按“自顶向下”的方法建立企业级数据仓库,建设规模往往较大,建设周期长,投资大。 (2)在数据仓库建好后,随着使用数据仓库的部门增多,对数据仓库资源的竞争将成为企业面临的—个难 题。 (3)各个部门希望能定制数据仓库中的数据,但数据仓库是面向企业的。
Shenzhen Hirisun Technology Incorporated
用传统的报表,或者采用数理统计和人工智能等数据挖掘手段,涵盖
的范围更广;就应用范围而言,联机分析处理往往根据用户分析的主 题进行应用分割,例如:销售分析、市场推广分析、客户利润率分析 等等,每一个分析的主题形成一个OLAP应用,而所有的OLAP应用实 际上只是数据仓库系统的一部分。
相关文档
最新文档