SAP BI的介绍

合集下载

sapbwbi培训教程

sapbwbi培训教程

sapbwbi培训教程SAP BW/BI培训教程是一门专门针对企业级数据管理和分析的培训课程。

该培训课程涵盖了如何在SAP系统中使用Business Warehouse(BW)和Business Intelligence(BI)工具来收集、准备和分析数据的全部内容。

本文将在以下三个方面对SAP BW/BI培训教程进行讲解:课程内容和形式、优点和劣势、培训方式和建议。

一、课程内容和形式SAP BW/BI培训教程旨在提升企业数据管理和分析的技能和能力。

为此,课程内容广泛而深入,从系统架构和安装到数据提取和分析的全部阶段都被详细讲解。

具体来说,培训课程包括以下核心内容:1.概述:介绍SAP BW/BI对企业数据管理和分析的价值和作用;2.系统架构:讲解SAP BW/BI系统的运作原理和组成结构;3.安装与配置:指导学习者如何安装和配置SAP BW/BI系统;4.数据提取与转换:教授如何从各种数据源中提取、转换和清洗数据;5.数据建模与分配:介绍如何使用SAP BW/BI将数据模型化和分配;6.报表和分析:演示如何利用SAP BW/BI报表和分析功能来展现和分析数据。

除了上述核心内容之外,SAP BW/BI培训教程还包括模拟实战、案例分析、小组讨论和问题解答等多种形式,以帮助学习者更加深入地理解和掌握培训内容。

二、优点和劣势SAP BW/BI培训教程有以下几个优点:1.全面和深入:SAP BW/BI培训教程涵盖了从系统架构到数据建模的全部内容,为学习者提供了一份全面而深入的数据管理和分析技能和能力;2.实践和体验:培训课程中除了理论知识之外,还包括案例分析、模拟实战和小组讨论等多种实践形式,以让学习者更好地掌握和应用知识;3.认证和资格:学习者可以通过SAP BW/BI的认证考试获得资格证书,证明自己具备了一定的数据管理和分析能力,提高自己的就业竞争力。

另一方面,SAP BW/BI培训教程也存在一些劣势:1.课程费用:SAP BW/BI培训教程的费用较高,对于个人学习者来说可能会造成一定的财务压力;2.使用门槛:SAPBW/BI系统本身就较为复杂,需要学习者掌握一定的技术和操作能力,否则可能会影响学习效果。

SAP BI基本概念

SAP BI基本概念

SAP BI基本概念2010-02-07 12:47SAP BI基本概念基本概念数据仓库基本理论数据仓库是体系结构化环境的核心,是决策支持系统(DSS)处理的基础;它的概念提出者、美国著名信息工程专家 William Inmon 博士在90年代初提出了数据仓库的一个表述。

他认为:“一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的用来支持管理人员决策的数据集合。

”主题,是指用户使用数据仓库进行决策时所关心的重点方面,如:收入、客户、销售渠道等;面向主题,是指数据仓库内的信息是按主题进行组织的,而不是像业务支撑系统那样是按照业务功能进行组织的。

集成,是指数据仓库中的信息不是从各个业务系统中简单抽取出来的,而是经过一系列加工、整理和汇总的过程,因此数据仓库中的信息是关于整个企业的一致的全局信息。

随时间变化,是指数据仓库内的信息并不只是反映企业当前的状态,而是记录了从过去某一时点到当前各个阶段的信息。

通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

本身相对稳定,是指一旦某个数据进入数据仓库以后,一般很少进行修改,更多的是对信息进行查询操作。

依据上面的定义,有人可能会把数据仓库简单地理解为仅仅是一个大型的数据存储机制,是一个静态的概念。

实际上,数据仓库更像一个过程,这个过程涉及数据的收集、整理和加工,生成决策所需要的信息,并且最终把这些信息提供给需要这些信息的使用者,供他们做出改善业务经营的正确决策。

数据仓库的重点与要求就是能够准确、安全、可靠地从业务系统中取出数据,经过加工转换成有规律信息之后,供管理人员进行分析使用。

因此数据仓库是一个动态的概念,应该称为数据仓库工程(Data Warehousing)。

SAP BI7.0介绍SAP BI(Business Intelligence)商务智能,是SAP公司的数据仓库解决方案,BI7.0以前的版本称为BW(Business Information Warehouse)业务信息仓库,它将来自源系统的数据(可以是SAP R3,也可以是其它事务处理系统、文本文件、数据库、或其它BW/BI系统),经过抽取、转换、上载至BI数据仓库,以EXCEL、WEB等形式的报表展示给用户。

商业智能(BI)I应用实例介绍

商业智能(BI)I应用实例介绍

BO
据和分析结果来制定有效且明智决策的能力。从高端分析师到普通业 务用户的所有用户都可访问他们所需的信息,尽可能不依赖 IT 资源
和开发人员。
BI与我司ERP的关系
BMS,WMS...
生成数据,对数据进行再 处理
ERP
数据
BI SAP BO
提取数据,将数据按需进行 呈现
SAP商务智能常用产品
01
需求变更
需求变更
识别 评价影响 变更方案 实施变更 跟进变更
Thank you !
2 SAP BI开发与使用
3 SAP BI应用实例
4 项目经验小结
1
Part One
BI系统介绍
BI到底是什么?
BI
SAP
BO
Business Intelligenced,即商务智能,它是一套完整的解决方案,用来将企业中现有的数
ห้องสมุดไป่ตู้BI
据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营
BI能做到的
BI报表:
可读性差,数据呈现方式单一
界面友好,高度可视化,可操作性强
2 Part Two SAP BI开发与使用
进行数据分析与挖掘,建立数 据仓库模型;
01
使用水晶报表实现在SAP
BI内呈现数据;完善数据格
02
式,制作报表参数;
调用水晶报表数据,使用水晶
易表生成图形化、可交互的多 03
决策。
SAP
1.SAP公司,它是成立于1972年总部位于德国沃尔多夫市的全球最大的 企业管理和协同化电子商务解决方案供应商、全球第三大独立软件供应 商 2.System Applications and Products”的简称,是SAP公司的产品— —企业管理解决方案的软件名称。

SAP各模块的简单介绍

SAP各模块的简单介绍

SAP各模块的简单介绍1、FICO模块:FICO是SAP中的财务模块,一块是FI(Finance)模块,CO(Controlling)模块。

FI模块即外部会计,关注的是按照一定的会计准则,组织账务,并出具满足财税等外部实体及人员要求的法定财务报表,通常比较标准。

而CO模块包括利润及成本中心、产品成本、项目会计、获利分析等功能,不仅可以控制成本,还可控制公司目标,另外还提供信息以帮助高级管理人员作出决策或制定规划。

不仅可以控制成本,还可以控制公司的目标。

2、HR模块:HR(Human Resource)模块,中文名称为人力资源模块。

HR模块属于SAP中的一个重要模块,包括人力资源规划、时间管理、招聘管理、员工薪资核算、培训计划、差旅管理等,并同SAP R/3的财务、物流等系统组成了高效的、具有高度集成性的企业资源系统。

通过ERP中的人力资源管理系统建立标准化的人力资源管理体系,提高人力资源管理工作效率,有效整合人力资源,合理配置人力资源,提高员工工作技能和工作满意度,加强公司凝聚力。

3、ABAP模块:ABAP(高级商务应用编程)是一种高级编程语言,由德国软件公司SAP开发。

目前,和最近引入的Java一起,ABAP主要用作SAP的编程。

这个服务器软件是SAP NetWeaver平台的一部分,这个平台主要用来开发商务应用。

ABAP支持有面向过程和面向对象。

4、BW模块:SAP BW 全称Business Information Warehouse ,SAP BW是mySAP 商务智能(BI)的集成化组件之一,为SAP数据和非SAP数据的采集、存储、分析和管理提供一个集成的,面向商务的平台。

它可以智能化地管理整个企业管理信息系统的海量数据信息并从中挖掘出最有价值的信息,以向企业管理者提供强有力的决策支持,从而使企业对市场反应更灵敏快捷,整个企业也更具有生命力和竞争力。

5、SD模块:SD(Sales and Distribution)模块,中文名称为销售与分销模块。

SAP BI 学习手册

SAP BI 学习手册

SAP BW 顾问靠手—InfoCube 信息立方体学习SAP InfoCube首先要了解什么是星形连接。

下面图示说明了什么是基本的星型链接,具体详细信息请到BW310去查看。

经典星型模式的优势和劣势•优势:–由于只有少量的联合操作(只有数据表和相关维度表之间的联合操作),因此能相当好地执行数据访问。

•劣势:–维度表中存在冗余的条目。

–与事实数据(通过时间维度表含蓄提供时间参考)的历史记录(如何对时间建模)不同,维度(缓慢更改的维度)的历史记录不易于建模。

–繁琐的多语言能力。

–对维度中的一些层次结构类型(例如,不平衡的并行层次结构)进行建模可导致出现异常。

–由于集合和基本事实数据存储在相同表(数据表)中,因此降低了查询性能。

SAP BI 中的多维模型是基于SAP BI 星形结构的,而SAP BI 的星形结构是为了解决传统的星形结构存在的问题研发而成的。

在SAP BI 星形结构中,事实表中的事实指的是关键值,维度属性指的是特性,这与前面介绍的内容是一致的。

维度表通过外键或主键关系连接到中心的事实表。

与传统的星形结构相比特性不是维度表的组件,也就是说,特性值没有存储在维度表中。

维度表中存储的是SID ,这里SID 代表替代ID C 替代性的键值),这些键值冠以前缀SID ,如"SID 客户"是客户的SID 。

每一个维度表有一个系统自动生成的数值型的关键值,称为维度键值。

主数据信息存储在独立的表中,和信息立方体无关,称为主数据表。

其中,属性、文本和层级是分开存储的。

在SAP BI 中,把事实表及与其连接的维度表称为信息立方体。

一个信息立方体包含一系列的关系型表格,这些表在多维的基础上结合起来。

换句话说,信息立方体包含一个中心的事实表和几个围绕着的维度表。

主数据表通过SID 的方式连接到信息立方体(到事实表的关键指标)。

信息立方体的分类(1) 基本信息立方体具有物理数据存储的,我们称为基本信息立方体。

SAPBI详细资料说明

SAPBI详细资料说明

SAP BI 详细资料说明SAP BO简介BO业务对象(Business Object,BO)是对数据进行检索和处理的组件。

是简单的真实世界的软件抽象。

业务对象通常位于中间层。

业务对象可以在一个应用中自动的加入一个特定的功能来获得增值效应。

使知识重用变为可能。

比如,如果你要开发一个包含多货币处理的应用,你可以选择使用一个已经开发完成的,包含所有多货币处理功能的业务对象来开始你的开发。

使您的开发工作极大的减少。

一、业务对象的必要条件1.由状态和行为组成2.表达了来自业务域的一个人,地点,事物或概念3.可以重用二、业务对象的分类1、实体业务对象:表达了一个人,地点,事物或者概念。

根据业务中的名词从业务域中提取。

如客户,订单,物品。

2、过程业务对象:表达应用程序中业务处理过程或者工作流程任务。

通常依赖于实体业务对象,是业务的动词。

作为应用程序的管理者或者控制者。

3、事件业务对象:表达应用程序中由于系统的一些操作造成或产生的一些事件。

三、业务对象的抽象与整合业务对象的抽象和整合有何联系呢,或许有人会问我这样的一个问题(以前的我也老想着这个问题),就这个问题我个人觉得,如果脱离业务抽象而想象一个架构体系,那么是一个本末倒置的愚蠢的做法,因为只有做了一个业务的抽象才能根本上满足需求本质,这样才能更实际的充分的得到现实业务现象的抽象才能合理有效的模拟实现的IT系统(一个IT 化的过程第一步骤)。

整合IT系统面临一个很大问题如何抽象IT系统的交互问题,这个方面IBM采取了消息通信的抽象;它这样做当然有他的道理(也是比较接近现实场景的),但是我在这里顺便提一下我个人的想法,消息其实只是通信和协调的一个实现而已,但是还没有到本质;本质就是通信的协议的定制。

我自己采取的就是在底层使用一个会话协议抽象(工作的保密关系不能再细说了,但是我的实践告诉我这样做有很高的架构体系扩展上,大家有机会可以试一试)。

所以业务抽象十分重要,只有把握好这一点,你的架构系统将体现更高的架构体系高度。

SAP BI基础知识

SAP BI知识收集一、SAP NetWeaver BIBI是SAP NetWeaver 的核心组件,它提供了DW、BI 平台、BI套件去最大的获取有用的信息。

BI 提供了复杂的报表和分析工具。

(图1 )BI 的关键组件(图2)SAP相关的产品1、EP:Enterprise Portal,代表企业的前端,就是通过WEB浏览器而不是SAP的专有用户界面提供对SAP的和非SAP资源的门户访问。

2、ECC:SAP ERP Central Component ,以及其前身R/3和R/3 Enterprise 均为联机事务处理系统(OLTP),它们可以满足许多客户日常事务处理的需要。

3、SCM:供应链管理,对业务过程的执行与协调进行流线化操作,从而增强了计划导向的业务过程.4、CRM:客户关系管理,被用在客户相关的端对端的过程中.可以全方位的审视你的客户和你的企业间不同触点.(图2)BI架构架构可以分为三层:1、sourcing data2、storing it in the warehouse3、reporting on it with analytics二、数据流BI 详细数据流图1、DataSource:是BI系统的一个数据对象,用来从源系统抽取和准备数据。

三、数据获得层(数据源)(图4)数据获得四、DW层的相关组件(图5)BI数据仓库:物理存储DW层主要是为企业报表提供需要的数据,对这些数据进行抽取、清洗、集成、管理.包括的有DW、ODS、DM、Open Hub Service;DW为相当长的时间内存储了详细的数据.DW层主要涉及到以下组件:1、数据抽取(Data ETL)(1)Source System :源系统包括SAP R/3 、Non SAP、XML 、Database.(2)InfoSource :信息源描述了企业在特定情况下,所有可用主数据或事物数据的总量。

数据有一个从数据源到信息源的转入过程。

BW、BI简介ppt课件


OLTP
Update Low Very small Detailed Must be current Frequently Complex Many (100s to 1000s) Quick Normalized Several Well defined
OLAP
Analyze High Very large Summary Current and historical Less frequent, new data only Simple Few Reasonable Denormalized Few Ad hoc
预报可以说是最热门的分析应用之一,各行各业都用得到。特别对于供应商来 说,能够准确预报需求,就可以让他们合理安排库存,既不会缺货,也不会积 压。
预测型建模 PREDICTIVE MODELING
回答:接下来会发生什么?它对业务的影响程度如何?
7
示例:酒店和娱乐行业可以预测哪些VIP客户会对特定度假产品有兴趣。
抽取器 非SAP系统
抽取器 SAP系统SAP系统
11
R/3 与SAP BW系统区别
R/3 (OLTP) ✓单一应用模块 ✓单一系统 ✓短期趋势分析 ✓实时分析 ✓一般分析 ✓日常业务操作数据 ✓明细操作型报表
BW(OLAP) ✓跨模块 ✓跨系统 ✓历史性分析 ✓战略性分析 ✓深层分析 ✓海量数据 ✓分析统计型报表
2
分析能力的八种等级 分析能力的八个等级
3
常规报表 STANDARD REPORTS
回答:发生了什么?什么时候发生的?
1
示例: 月度或季度财务报表
我们都见过报表,它们一般是定期生成,用来回答在某个特定的领域发生了什
么。从某种程度上来说它们是有用的,但无法用于制定长期决策。

SAP BI好学吗?前景怎么样-51SAP老学员整理

文章由51SAP教育中心SAP培训老学员整理,首发于51SAP论坛。

于SAP的BI模块,经过3个多月的系统学习及1个月的实习经历,使我的知识面更加的充实及丰富了。

刚开始,我本来是奔着ERP应用师培训去厦门了解信息的,当我到了厦门之后,我一个在金红叶公司上班的同学告诉我说,ERP行业现在已经不好入行了,一般都要5年左右的经验,像我们这种刚毕业的实习生,最好改成SAP。

学习SAP也比较有前途,世界500强企业,80%都是使用SAP。

因此,我到了培训学校之后,在了解了ERP及SAP BI之后,果断的选择了SAP BI模块。

当我第一天开始上课的时候,给我的感觉是,这方面的技术含量好像不是很高,很容易懂。

但,事实并非如此,当我回到宿舍信心满满的准备自己操作的时候,我发现,我的操作很多步骤都不成功,我就翻开老师给我的录屏,边看边做,看一点,感觉回了,就自己操作,但还是发现很多地方都有错误。

然后,我想到老师课后总结的一句话,让我们先把录屏仔细看一遍,再来实际操作。

于是,我从头开始认真看录屏,并做好每一步骤的笔记,果然,我第三次操作成功了,接下来我连续几次联系,都严格按照步骤来执行,果然每一次都是圆满的成功。

虽然说这些步骤的含义,每一步骤的作用我都不知道,但是,随着越来越深入的学习,慢慢的懂得了一开始的建模5步走,到底是怎么走的了。

学习完之后,其实实习是很重要的一部分。

在实习中,我们发现了在学习当中遇不到的难题。

最简单的一点,学校的开发机,测试机,生产机,不论是R3端的还是BW端的都是安装在一起的,我们可以在一个系统内使用SAP的任何T-code。

但是,到了项目上,R3端和BW端的开发机,测试机及生产机都是分开的,你要行使R3端的T-code必须打开R3端的系统,行使BW端的T-code也要做BW的系统内执行,否则就是无效T-code。

再者,实习期可以让我们把学习到的知识融入到现实中去,把过往经常忽略的部分重视起来。

BI-数据源介绍

1标准源系统的介绍与操作SAP BI 的数据源不局限于SAP 系统,所有向SAP BI 传输数据的系统都称为源系统。

几乎任何来源的数据可被用来在SAP BI 中进行数据抽取。

如下图所示,1. 源系统的类型源系统的主要类型包括以下几种:1) SAP 系统,如SAP R/3, SAP ERP, SAP CRM, SAP APO 和SAPSRM 等,SAPBI 会将自身作为一个源系统,因为SAPBI 内部不同对象之间也是可以传输数据的。

当然,SAP BI 也可以连接其他的BI 。

2) 文本文件,大多是用户定义的与其他系统的接口文件,又称平面文件。

3) 数据库系统,SAPBI 可以直接连接到数据库系统,在数据库级别进行数据抽取。

的统一数据连接(UDC) ,支持业界标准连接架构,如JDBC 、OLEDB 、XML 以及SAP查询连接器,可以连接关系型系统、多维系统及SAPBI 和其他系统。

5) XML 文件,使用Web 服务,将网络数据实时地推入SAPBI 的PSA 中进行存储。

此外,SAP BI 还为第三方系统提供了远程调用函数,非SAP 系统能调用这些函数,通过业务应用编程界面(BAPI) 来将数据直接载入到SAP BI 系统的信息提供者中,如数据存储对象。

创建源系统要从源系统中加载数据到BI 系统中,首先要创建SAP BI 系统与源系统的连接。

可在数据仓库工作台中的"建模"视图下维护源系统。

如下图:SAP 为不同类型的源系统连接分别建立了文件夹,从上图可以直观地看出SAP BI 可以连接的源系统的类型。

在这个界面,主要是维护与各个源系统的连接,这是从源系统中抽取数据的前提。

对于不同类型的源系统,SAPBI 提供了不同的连接方式。

(1) 创建SAP 系统作为源系统创建到BI 系统的连接和到其他的SAP 系统的连接都是一样的。

下面,我们以建立到SAPECC 系统的连接为例,说明在SAP BI 到SAP 的源系统的连接的建立过程。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库最根本的特点是物理地存放数据,而且这些数据不是最新的、专有的,而是来源于其它的数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据仓库在企业的信息环境中承担的是日常操作性的任务,数据仓库是数据库技术的一种新的应用,到目前为止,数据仓库还是常用数据库管理系统来管理其中的数据。
在采用“最小粒度原则”的同时,我们不必担心海量数据所带来的汇总分析效率问题,因为在后续建立多维分析模型(CUBE)的时候,我们会对数据提前进行汇总,从而保障产生分析结果的效率。
1
数据仓库是一个拥有自带数据库的系统,它从其他不同的系统中抽取数据来支持查询和分析。为了方便数据的检索和分析,我们需要一种特殊的数据库设计技术----星形模型。
数据仓库是一个面向主题的过程而操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息的系统相关。
SAP /I
如前边所述,SAP BI与BW的区别就是在于版本的问题,我们在介绍星状结构的时候你会发现二者在表的设计上可能发生了变化。但是在技术方面,BW的操作与BI的区别不是特别的大。只是我们在不同的版本上看到的界面不一致而已。所以如果大家看到关于BW的一些内容的时候也不要感到惊奇。
当出现BW与BI出现不一致的情况下,我会对二者进行比较,以方便大家的学习与操作。这里将包含概念的区分以及技术操作的变更。甚至会出现怎么将3.5版本的BW标准内容转换成7.0的BI内容。这些具体体现在技术的操作。
1.1
数据仓库(Data Warehouse DW)是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库,它的数据基于OLTP源系统。数据仓库中的数据是细节的、集成的、面向主题的,以OLAP系统的分析需求为目的。
数据仓库的架构模型包括了星型架构与雪花型架构两种模式。如图所示,星型架构的中间为事实表,四周为维度表,类似星星;而相比较而言,雪花型架构的中间为事实表,两边的维度表可以再有其关联子表,从而表达了清晰的维度层次关系。
1.2.2
在确定了主题以后,我们将考虑要分析的技术指标,诸如年销售额之类。它们一般为数值型数据。我们或者将该数据汇总,或者将该数据取次数、独立次数或取最大最小值等,这样的数据称为量度。
量度是要统计的指标,必须事先选择恰当,基于不同的量度可以进行复杂关键性能指标(KPI)等的设计和计算。
1.2.3
在确定了量度之后,我们要考虑到该量度的汇总情况和不同维度下量度的聚合情况。考虑到量度的聚合程度不同,我们将采用“最小粒度原则”,即将量度的粒度设置到最小。
目前,大家公认的数据仓库创始人是W.H.Inmon在他所著的《建立数据仓库》一书中对数据仓库所下的定义:数据仓库就是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程。数据仓库中的数据面向主题与传统的数据库面向应用相对应。主题是一个在较高层次将数据归类的标准,每一个主题对应一个宏观的分析领域。数据仓库的集成特性是指在数据进入数据仓库之前,必须进行数据加工和集成,这是建立数据仓库的关键步骤,首先要统一原始数据中的矛盾之处,还要将原始数据结构做成一个面向应用主题的转变,数据仓库的稳定性是指数据仓库反应的是历史数据的内容,而不是日常事务处理产生的数据,数据经加工和集成进入数据仓库后是很少修改或根本不修改的;数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时能满足进行决策分析的需要,而且数据仓库中的数据都要表明该数据的历史时期。
因此,在很多的场合,我们也把数据仓库系统成为“决策支持系统”。由于这些原因,数据仓库的用户不是类似银行柜员的终端操作人员,而是针对各个业务部门的用户和有关决策人员。因此,数据仓库的用户比传统的0LTP<OnLine Transaction Processing,联机事物处理>用户少的多。对于数据仓库而言,我们使用的是OLAP操作。这里又是与一般数据库的一个较大的区别。本章我们会涉及到对OLAP与OLTP的解释以及区别的介绍。
我们可以形象的将一个主题想象为一颗星星:统计数值型数据(量度)存在于星星中间的事实表;分析角度(维度)是星星的各个角;我们将通过维度的组合,来考察量度。那么,“某年某月某一地区的啤酒销售情况”这样一个主题,就要求我们通过时间和地区两个维度的组合,来考察销售情况这个量度。从而,不同的主题来源于数据仓库中的不同子集,我们可以称之为数据集市。数据集市体现了数据仓库某一方面的信息,多个数据集市构成了数据仓库。关于主题的介绍大家可以参考1.3小节。
这里解释一个目前对数据仓库某些认识上的误区。这个也是我在初学的时候犯下的错误。对数据仓库最大的误解就是,初学者把它当作一个现成、可以直接买来使用的产品。事实上,数据仓库和数据库不同,他不是现成的软件或者硬件产品。比较确切地说,数据仓库是一种解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户可以通过分析这些信息,从而做出策略性的决策。
例如:假设目前的数据最小记录到秒,即数据库中记录了每一秒的交易额。那么,如果我们可以确认,在将来的分析需求中,时间只需要精确到天就可以的话,我们就可以在ETL处理过程中,按天来汇总数据,此时,数据仓库中量度的粒度就是“天”;反过来,如果我们不能确认将来的分析需求在时间上是否需要精确到秒,那么,我们就需要遵循“最小粒度原则”,在数据仓库的事实表中保留每一秒的数据,以便日后对“秒”进行分析。
从OLAP系统的分析需求和ETL的处理效率两方面来考虑:星型结构聚合快,分析效率高;而雪花型结构明确,便于与OLTP系统交互。因此,在实际项目中,我们将综合运用星型架构与雪花型架构来设计数据仓库。
1.2
1.2.1
即确定数据分析或前端展现的主题。例如:我们希望分析某年某月某一地区的啤酒销售情况,这就是一个主题。主题要体现出某一方面的各分析角度(维度)和统计数值型数据(量度)之间的关系,确定主题时要综合考虑。
相关文档
最新文档