联机分析处理
气相色谱/质谱联机分析的信息

气相色谱/质谱联机分析的信息(1)总离子流色谱图总离子流色谱图(totaJ ionic chromatogram,TIc是指未经质量分离的各种质荷比离子的总强度与时间的对应关系图。
TIc的获得方式是在质谱仪的离子源和质量分析器之间设置总离子流检测器,当组分从Gc柱流出进入离子源时,总离子流强度增加,检测得到组分峰,在没有组分流出时只有本底。
因此获得的TIc与气相色谱图相似,可获得保留时间信息,其峰面积或峰高可用作定量。
这种方式记录的谱图,每个峰表示了在该峰时刻,存在于离子源中某个组分以不同质荷比存在的离子流的总强度,但不管其质量上的大小差异。
如果在此时进行质量扫描,把不同质荷比的离子流分开,便构成了质谱图。
如果在色谱流出的时问内按一定时问间隔进行质量扫描,便可以得到总离子流的三维图像。
将沿质荷比方向,即同一色谱流出时间的离子流强度(丰度)信号叠加,便得到了平面的总离子流色谱图。
(2)质量色谱图在质谱进行自动、重复扫描时,在色谱柱流出时段内可获得许多张质谱图,若将每一质谱图中指定质荷比离子的强度,按扫描序号即扫描时间作图,称为质量色谱图(mass chromatogmm,Mc),又称离子碎片色谱图。
它可从总离子流的三维图像中,以某一质荷比为断面截得。
九种正构烷烃的总离子流谱图和离子的质量色谱图。
而相应的质最色谱图中出现几个小峰,这些小峰是由于高碳数烷烃的断裂所致。
因此,质量色谱法可以从TIc图中快速寻找化合物或同系物。
当色谱分离效果不佳时,有时利用质量色谱图的信息对未分离混合物峰进行分析。
根据异构体对应质谱峰的强度差异,通过若干特征质量数作质量色谱图,从而对异构体进行分析。
(3)质谱图有机化合物的质谱图是指用其带正电荷的母离子和碎片离子的质荷比(m儿)与其相对强度作图。
图中的最强峰称为基峰,并定其强度为100%,其他峰以此为基准确定其相对强度。
一般讨论的是单电荷离子,因此峰的相应质荷比即为峰所对应离子的质量。
OLAP技术及其在统计分析中的应用前景

1993 年 由被称为关系数据库之父 的
二、 OLAP技术在统计分析中的
应 用前 景
E.F.Codd提出的, 他认为OLTP(联机事
务处理) 已不能满足终端用户对数据 库查询分析的 需要, 利用SQL对大数据
库进行的简单查询也不能满足用户分
目前统计系统的统计分析手段
还比较落后, 基本上还是半手工状态, 还没有建立起一个有效的统计分析平 台, 在对数据量较大、 比较复杂的经济
一、 素质教育的内涵 素质是指人在先天遗传的基础上, 经过后天环境和教育的长期 内化而形成的稳 定的品质。素质教育就是以提高人的素质为目标的教育。 正确理解知识 、 能力和素质的关系是正确理解素质教育的关键。知识是人们认
分析的内容更加细致、 深人。OLAP
的一项重要功能就是可以对数据在
不同层次上进行观察分析 , 从而找出 最原始的问题所在。例如在时间序
OLAP是针对某个特定 的主题进
杂, 比如我们要了解各行业中的大中 型企业的工业总产值、 利润总额情况, 也许还要同时分析它的经济类型, 这 在传统的应用系统中是很难完成的, 而采用OLAP系统, 通过构造多维数据
1.利用OLAP技术, 可以使统计分
析的角度更加全面、 多样。传统的报 表大多只能以二维形式展现, 例如甲
④信息性: 不论数据量有多大,
也不管数据存储在何处, OLAP系统应
能及时获得信息,并且管理大容量信
息。
应 用
去 子 记
可以看 出, OLAP技术完全是为
了进行大数据量数据分析而产生的,
它可以大大提高统计数据分析的质量 和效率。
点, 为许多用户所青睐。
一、 OLAP的基本概念及原理
OLAP联机分析处理的概念是在
基于联机分析处理olap技术的医院运营分析管理系统实现与应用

面向联机分析处理的多维产品模型研究

量产阶段/ 置产阶
试制阶段/ 试制阶
通 过 产 品 模 型 维 的 定 义 ,可从 较 长 的 时 间 跨 度 和 产 品 演 进 历 史 的角 度 整 体 上 考 虑 产 品 模 型 的 形 成 过 程 ,维 的 引 入 极 大 地 扩 展 了产 品 定 义 的 空 间 ,同 时 也 为 产 品 数 据 的联 机分 析 处 理 和决 策支 持 打 下 了基 础 。 ( )面 向 0 A 2 L P的三 维 产 品模 型 的 构 建 基 于 上 述 产 品 模 型 维 的 定 义 , 三 维 产 品 模 型 可 表 达
能够 包 含 尽 量 多 数 据信 息 , 同 时满 足决 策 支 持 和联 机 分 析 处 理 的需 要 ,本 文 定 义 了描 述 产 品模 型 的三 个维 ,分 别 为 结构 层 次 维 、属 性类 型 维 和生 命 周 期 维 ,如 图 1所示 ,每
一
⑧ 生命 周期 维 D 。生 命 周 期 维 主要 描 述 和定 义 产 品从
结 构 层 次
图 1 产 品 模 型 维 的定 义
,P , M ,
*, }
ES
其 中 ,朋 为 产 品 模 型 的结 构 层 次 维 映 射 ;用 为
产 品模 型 的属 性 类 型 维 映 射 ;用 为 产 品 模 型 在 生命 周期
维 的 映射 。 产 品 模 型在 任 一 状 态 所包 含 的 产 品 数据 实 例 可 记为 :
是在 不 同 的生 命 周 期 阶 段 产 生 的 ,产 品 模 型 在 整 个 生命 周
数据挖掘在通信侦察信号处理中的应用

从大 量长 期 积累 的观测 实验 数据 中发 现新知 识 的 过程 。计算 机 的应 用 、 其 是 人 工智 能 技 术 的发 尤 展, 为科 学 发现 提供 了高科 技手 段 。
按 照数 据发 掘 的 深 度 , 大体 上可 以分 为 两 个 联 机 分 析 处 理 ( AP 是 一 种 数 据 分 析 技 OL )
的最 有效 的方法 。
数据 挖掘是 从 大型数 据 库 的数 据 中提 取人 们
感兴趣 的知识 , 这些 知识 是隐 含 的 、 知 的和潜 在 未
的有 用信 息 。被 提 取 的知 识 可 表 示 为 概 念 ( o — C n
eps 、 则 ( ls 、 律 ( e uai e ) 模 式 e t) 规 Rue ) 规 R g lr is 、 t
而喻 的 。事 实上 , 学 家们通 过观 测 、 科 实验发 现定
理 、 律 或新 事物 的过 程 , 可 以说 是 一种数 据发 规 就
在 的有用 信息 , 于 所谓 “ 现 驱 动 ” 属 发 的数 据 发 掘 技术途径 。就 其实 质而 言 , D与各 种 机 器学 习 KD
方 法密 切相关 , 通过 观察 / 如 发现 学 习 、 比学 习 、 类
对 数据挖 掘 技 术 提 出 了更 高 的要 求 。 因此 , 据 数
维普资讯
数 据挖 掘 在通信 侦察 信号 处 理 中的应用
4 1
ห้องสมุดไป่ตู้
挖 掘技 术想 充分 发 挥潜 力就 必须 和数据 仓库 的发
展 相结 合 。 数 据挖 掘 过程 一般 由三 个 主要 阶段 组 成 : ①
据 的收集 、 集成 、 存储 和 管理 等工 作 。数据 挖 掘面 对 的是经 初步 加 工 的数 据 , 这使 得 数 据 挖 掘 更 专 注于 知识 的发 现 ; 另一 方面 , 数据 仓 库 的新特 点 又
国家开放大学《企业信息管理》形成性考核1-4参考答案剖析

可编辑修改精选全文完整版国家开放大学《企业信息管理》形成性考核1-4参考答案形成性考核(一)一、简答题1.什么是数据?什么是信息?信息的价值属性有哪些?答:信息是事物之间相互联系、相互作用的状态的描述。
例如某产品的市场需求和销售利润的变化,对生产或经销此产品的企业来说,是很重要的信息。
气象的变化、股市的涨落、竞争对手的行踪,对于与这些情况有关的个人或群体,都是信息。
数据(Data)是指记载下来的事实,是客观实体属性的值。
或者说,数据是可以记录、通信和识别的符号,它通过有意义的组合来表达现实世界中实体(具体对象、事件、状态或活动)的特征。
信息的价值属性:信息无论是在质和量上都具有可测量的“价值”。
当信息的价值被确定后,就可以对信息安全项目进行评估以确保它的花费和它所保护的信息的价值是相称的。
信息具有正确性、及时性、实用性、隐私性和安全性等属性。
信息的安全性又被分为机密性、完整性和可用性。
2.举例说明以下几个问题:(1)IT的战略作用是什么?答:信息时代,产品或服务开发及生产的速度以及对市场的反应能力是企业取得成功的关键,而这些在很大程序上取决于信息技术的应用,信息技术在支持企业的业务活动、生产活动,增强营销和生产的灵活性以及提高组织的竞争力方面发挥着极其重要的战略作用,它可以有效地提高企业在产品和服务方面的质量。
主要表现为产品设计和制造自动化、生产过程自动化、产品和设备智能化、管理现代化等方面。
(2)IT如何支持企业的业务活动?答:提高管理工作的效率和质量,提高整个企业的管理技术水平可以提高生产的效率和产品的质量;作为经营管理的组成部分,提高企业的竞争优势;发展公共关系,为企业赢得良好的信誉和形象;作为一种创新手段,使企业获得新的商业机会;提高财务活动、人事管理等工作的效率和质量。
(3)IT 如何提高生产效率和产品质量?答:信息技术最基本的任务是提高生产力。
因为信息技术具有准确、高速处理大量数据的能力,从而能够缩短时间、减少错误、降低各种信息处理的工作成本。
数据仓库培训
OLAP基本操作
上卷操作:通过维层次,在数据立方体上进 行聚集。 下钻操作:是上卷操作的逆操作,由不太详 细的数据到更详细的数据。 切片和切块:切片在给定的数据立方体的一 个维上进行选择,切块则是在两个或两个以 上的维进行选择。 旋转操作:是改变维度的位置关系,使最终 用户可以从其他视角来观察多维数据。
日期
一季度 二季度 三季度 四季度
ALL
南京 苏州 常州
TV PC
VCD ALL
产 品
地 区
ALL
数据仓库的主要应用
信息处理
支持查询和基本的统计分析,并使用表或图进行报告.
分析处理
支持基本的OLAP操作,在汇总的和细节的历史数据上操作.
数据挖掘
支持知识发现,包括找出隐藏的模式和关联,构造分析模型, 进行分类和预测,并用可视化工具提供挖掘结果.
一次处理的数据量小
面向应用,事务驱动
一次处理的数据量大
面向分析,分析驱动
面向操作人员,支持日常操作 面向决策人员,支持管理需要
OLTP和OLAP的区别
用户和系统的面向性:
OLTP是面向顾客的,用于事务和查询处理; OLAP是面向市场的,用于数据分析。
数据内容:
OLTP系统管理当前数据; OLAP系统管理大量历史数据,提供汇总和聚集机制。
Data Mart(数据集市)
小型的,面向部门或工作组级数据仓库.
数据仓库中的几个重要概念 (续)
Operation Data Store
操作数据存储 — ODS是能支持企业日常的全局应 用的数据集合,是不同于DB的一种新的数据环境, 是DW 扩展后得到的一个混合形式。 四个基本特点:面向主题的(Subject -Oriented)、集 成的、可变的、 当前或接近当前的。
第4章 数据仓库和OLAP
4.1 数据仓库基本概念
中间层:OLAP服务器
11
– 联机分析处理(Online Analytical Processing, OLAP)是数据仓库系统前端分析服务
的分析工具,能快速汇总大量数据并进行高效查询分析,为分析人员提供决策支持。 • 使用OLAP相关模型将多维数据上的操作映射为标准的关系操作,或者直接实现多维 数据操作 • OLAP操作可以与关联、分类、预测、聚类等数据挖掘功能结合,以加强多维数据挖 掘
物理模型设计
– 需要在充分了解数据和硬件配置的基础上确定数据的存储结构、索引策略、 数据存放位置等信息
16
4.2 数据仓库设计
物理模型设计-存储结构
– 充分考虑所选择的存储结构是否适合数据的需要 – 考虑存储时间和存储空间的利用率
17
4.2 数据仓库设计
物理模型设计-存储结构
表4-4 销售事实表存储结构关系模型
城市 销售商类型
起始地区键 地区维表
地区代码 到达地区键 成本
所在省 所在城市 所在街道
图4-4 产品销售数据仓库的事实星座模型
4.2 数据仓库设计
逻辑模型设计
– 进一步的完善和详细化设计,扩展主题域 – 奠定数据仓库的物理设计的基础
12
– 通过实体和实体之间的关系勾勒出整个企业的数据蓝图和规划 • 分析主题域,确定要装载到数据仓库的主题 • 粒度层次划分,通过估计数据量和所需的存储设备确定粒度划分方案 • 确定数据分隔策略,将逻辑上整体的数据分割成较小的、可以独立管理 的物理单元进行存储 • 定义关系模式,概念设计阶段时基本的主题已经确定,逻辑模型设计阶 段要将主题划分成多个表以及确定表的结构
20
在不同的存储设备上
数据仓库与联机分析在高速公路收费系统中的应用
分析 比较 。多种 分析 方法 结 合在 一起 ,促成 了联机 分 析处 理 系统 强大 的 数
ห้องสมุดไป่ตู้据分析 功 能。 [ ] 5
的 情 况 ,如 可 以方 便 地 查看 各 种 车 辆 的 收 费情 况 如 正 常何 载 货 车 车 型收
费 ,超 限车 辆计 重 收 费, 以及利 用 切片 、切 块 、和 旋转 操 作能 更加 方 便的 分析 数据 ,从而 使 决策 者 能够根 据 各种 数据 的显示 做 出相 映 的决策 ,如何 控制 车 辆 的载重 情 况能 够及 时对 路 面进 行养 护 保证 措 施 ,还可 以根 据 每年
摘
0引言
车类 型描 述 );车辆 种类 维表 (E ILT P ) (d V HC EY E i车辆 种类 编号 ,nm 车 ae 辆 种类 描述 );计 重维表 (V REG T (X SN O O EW IH ) A IIF 轴重信 息 ,A IN M XSU 车
轴组数 ,O E L A R T 超 载率 ,W I H T L 计重 计算 金额 ,A I E C E W I V ROD AE EG TO L XSX EDE
好 地管 理数 据 ,保 持 数据 的一 致性 ,以及 企 业 的分析 数 据 的需 求 ,引 出 了 数 据 仓 库 的概 念 与 模 型 , 联机 分 析 处 理 ( LP OA )为 企 业 提供 联 机 数 据 访 问、处 理和 分析 ,通 过 直观 的方式 从 多个 维度 、多种 数据 综 合程 度将 系 统 的运 营情 况展 现给 使用 者 。 [,2 ] 1 ,3
1数据 仓库 的E L T 过程 数 据 仓 库 一 般 由三 个 主 要 的 部 分 组 成 :数 据 的提 取 一 转 换 一装 载 (T )、数据 仓 库 的基 本存 储数 据 、综 合 管理 / 机 分 析处 理 。它 按照 数 EL 联 据 处理 的流 程 ,从输 入 开始 组 织成 一定 的存 储 形式 ,并按 照 用户 要求 的形
SAS9联机分析处理(OLAP)在宝钢企业级营销数据分析中的应用
关键 词 :A 9 联机 分析 处理 ; SS ; 维度 ; 据 立方体 数 中图分 类号 : P 7 . T 24 2 文献标 识 码 : B 文章编 号 :6 2 6 6 2 0 )1 0 4一 5 1 7 —1 1 (0 8 0 —0 1 O
1
收 稿 日期 :0 7—1 —2 20 1 3
作者简介 : 杨
仪( 9 9 , ( 16 一)女 回族 )江苏镇江人 , 山钢铁股份有限公司工程 师 , , 宝 主要研究方 向为营销信息管理系统。
9 机分析处理 ( 联 O
) 述 概
) 述 概
应能在 5 内对 用 户 的 大 部 分 分 析 要 求 做 出 反 应 , s 这也是 OL P最 为显 著 的一 个 特 点 。 ( ) 分 析 A 2可 性 。OL AP数据 分 析 系统 能 够 处 理 与 应 用 有 关 的 任何 逻辑 分析 和统 计分 析 , 户无 需 编程 就可 以定 用
2 10 ) 0 9 0
摘要 : 简要 描 述 了联 机 分析 处J OL )  ̄( AP 的定 义 、 工作原 理 、 点 和 S 9联 机 分析 处理 工具 ; 特 AS 分析 了宝钢企 业级 营销 数据 分析 现状 与 需 求 ; 以竞 争产 品 多维分 析 和 库存 多维分 析 两个 应 用 实例 探
oL 技术 的核心 是 多维 结 构 , 在一 个 oL P A
数据模 型 中, 息被抽 象 为一个 立方体 , 信 包括 维 ( i n i ) 度 量 ( aue 。 利 用 多 维 数 据 模 Dmes n 和 o Mesr) 型可以使得终端用户提交的复杂查询 、 报表数据分 类排 列 、 要数 据 向详 细 数 据 的转 化 和过 滤 、 据 概 数 的切片等 工作 变得 简 单 而 直 观 。应 用 oL 工具 建 立 的数据 分析 系 统 具 有快 速 性 、 分 析性 、 可 多维 性 、 享 性 和 信 息 性 几 个 特 点 J ( ) 速 性 。用 共 : 1快 户对 OL P的快 速 反 应 能 力 有 很 高 的 要 求 , 统 A 系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
联机分析处理简介联机分析处理,英文名称为On-Line Analysis Processing,简写为OLAP。
随着数据库技术的发展和应用,数据库存储的数据量从20世纪80年代的兆(M)字节及千兆(G)字节过渡到现在的兆兆(T)字节和千兆兆(P)字节,同时,用户的查询需求也越来越复杂,涉及的已不仅是查询或操纵一张关系表中的一条或几条记录,而且要对多张表中千万条记录的数据进行数据分析和信息综合,关系数据库系统已不能全部满足这一要求。
操作型应用和分析型应用,特别是在性能上难以两全,人们常常在关系数据库中放宽了对冗余的限制,引入了统计及综合数据,但这些统计综合数据的应用逻辑是分散而杂乱的、非系统化的,因此分析功能有限,不灵活,维护困难。
在国外,不少软件厂商采取了发展其前端产品来弥补关系数据库管理系统支持的不足,他们通过专门的数据综合引擎,辅之以更加直观的数据访问界面,力图统一分散的公共应用逻辑,在短时间内响应非数据处理专业人员的复杂查询要求。
1993年,E.F.Codd(关系数据库之父)将这类技术定义为“联机分析处理”。
作用联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。
它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。
决策数据是多维数据,多维数据就是决策的主要内容。
OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。
联机分析处理具有灵活的分析功能、直观的数据操作和分析结果可视化表示等突出优点,从而使用户对基于大量复杂数据的分析变得轻松而高效,以利于迅速做出正确判断。
它可用于证实人们提出的复杂的假设,其结果是以图形或者表格的形式来表示的对信息的总结。
它并不将异常信息标记出来,是一种知识证实的方法。
起源联机分析处理(OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。
OLAP的提出引起了很大的反响,OLAP 作为一类产品同联机事务处理(OLTP) 明显区分开来。
Codd提出OLAP的12条准则来描述OLAP系统:准则1 OLAP模型必须提供多维概念视图准则2 透明性准则准则3 存取能力推测准则4 稳定的报表能力准则5 客户/服务器体系结构准则6 维的等同性准则准则7 动态的稀疏矩阵处理准则准则8 多用户支持能力准则准则9 非受限的跨维操作准则10 直观的数据操纵准则11 灵活的报表生成准则12 不受限的维与聚集层次分类当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。
OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
OLAP 是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
下表列出了OLTP与OLAP之间的比较。
OLTP OLAP用户操作人员,低层管理人员决策人员,高级管理人员功能日常操作处理分析决策DB 设计面向应用面向主题数据当前的, 最新的细节的, 二维的分立的历史的, 聚集的, 多维的集成的, 统一的存取读/写数十条记录读上百万条记录工作单位简单的事务复杂的查询用户数上千个上百个DB 大小100MB-GB 100GB-TB一、OLAP的发展背景随着数据库技术的广泛应用,企业信息系统产生了大量的数据,如何从这些海量数据中提取对企业决策分析有用的信息成为企业决策管理人员所面临的重要难题。
传统的企业数据库系统(管理信息系统)即联机事务处理系统(On-LineTransactionProcessing,简称OLTP)作为数据管理手段,主要用于事务处理,但它对分析处理的支持一直不能令人满意。
因此,人们逐渐尝试对OLTP数据库中的数据进行再加工,形成一个综合的、面向分析的、更好的支持决策制定的决策支持系统(DecisionSupportSystem,简称DSS)。
企业目前的信息系统的数据一般由DBMS管理,但决策数据库和运行操作数据库在数据来源、数据内容、数据模式、服务对象、访问方式、事务管理乃至无力存储等方面都有不同的特点和要求,因此直接在运行操作的数据库上建立DSS是不合适的。
数据仓库(DataWarehouse)技术就是在这样的背景下发展起来的。
数据仓库的概念提出于20世纪80年代中期,20世纪90年代,数据仓库已从早起的探索阶段走向实用阶段。
业界公认的数据仓库概念创始人W.H.Inmon在《BuildingtheDataWarehouse》一书中对数据仓库的定义是:“数据仓库是支持管理决策过程的、面向主题的、集成的、随时间变化的持久的数据集合”。
构建数据仓库的过程就是根据预先设计好的逻辑模式从分布在企业内部各处的OLTP 数据库中提取数据并对经过必要的变换最终形成全企业统一模式数据的过程。
当前数据仓库的核心仍是RDBMS管理下的一个数据库系统。
数据仓库中数据量巨大,为了提高性能,RDBMS一般也采取一些提高效率的措施:采用并行处理结构、新的数据组织、查询策略、索引技术等等。
包括联机分析处理(On-LineAnalyticalProcessing,简称OLAP)在内的诸多应用牵引驱动了数据仓库技术的出现和发展;而数据仓库技术反过来又促进了OLAP技术的发展。
联机分析处理的概念最早由关系数据库之父E.F.Codd于1993年提出的。
Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的要求,SQL 对大数据库的简单查询也不能满足用户分析的需求。
用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。
因此,Codd提出了多维数据库和多维分析的概念,即OLAP。
OLAP委员会对联机分析处理的定义为:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP 也可以说是多维数据分析工具的集合。
二、联机分析处理的特点在过去的二十年中,大量的企业利用关系型数据库来存储和管理业务数据,并建立相应的应用系统来支持日常业务运作。
这种应用以支持业务处理为主要目的,被称为联机事务处理(OLTP,On-line Transaction Processing)应用,它所存储的数据被称为操作数据或者业务数据。
随着市场竞争的日趋激烈,近年来企业更加强调决策的及时性和准确性,这使得以支持决策管理分析为主要目的的应用迅速崛起,这类应用被称为联机分析处理,它所存储的数据被称为信息数据。
联机分析处理的用户是企业中的专业分析人员及管理决策人员,他们在分析业务经营的数据时,从不同的角度来审视业务的衡量指标是一种很自然的思考模式。
例如分析销售数据,可能会综合时间周期、产品类别、分销渠道、地理分布、客户群类等多种因素来考量。
这些分析角度虽然可以通过报表来反映,但每一个分析的角度可以生成一张报表,各个分析角度的不同组合又可以生成不同的报表,使得IT人员的工作量相当大,而且往往难以跟上管理决策人员思考的步伐。
联机分析处理的主要特点,是直接仿照用户的多角度思考模式,预先为用户组建多维的数据模型,在这里,维指的是用户的分析角度。
例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。
一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析,具有极大的分析灵活性。
这也是联机分析处理在近年来被广泛关注的根本原因,它从设计理念和真正实现上都与旧有的管理信息系统有着本质的区别。
事实上,随着数据仓库理论的发展,数据仓库系统已逐步成为新型的决策管理信息系统的解决方案。
数据仓库系统的核心是联机分析处理,但数据仓库包括更为广泛的内容。
-概括来说,数据仓库系统是指具有综合企业数据的能力,能够对大量企业数据进行快速和准确分析,辅助做出更好的商业决策的系统。
它本身包括三部分内容:数据层。
实现对企业操作数据的抽取、转换、清洗和汇总,形成信息数据,并存储在企业级的中心信息数据库中。
应用层。
通过联机分析处理,甚至是数据挖掘等应用处理,实现对信息数据的分析。
表现层。
通过前台分析工具,将查询报表、统计分析、多维联机分析和数据发掘的结论展现在用户面前。
从应用角度来说,数据仓库系统除了联机分析处理外,还可以采用传统的报表,或者采用数理统计和人工智能等数据挖掘手段,涵盖的范围更广;就应用范围而言,联机分析处理往往根据用户分析的主题进行应用分割,例如:销售分析、市场推广分析、客户利润率分析等等,每一个分析的主题形成一个OLAP应用,而所有的OLAP应用实际上只是数据仓库系统的一部分。
三、OLAP逻辑概念和典型操作OLAP展现在用户面前的是一幅幅多维视图。
维(Dimension):是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(时间维、地理维等)。
维的层次(Level):人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。
维的成员(Member):维的一个取值,是数据项在某维中位置的描述。
(“某年某月某日”是在时间维上位置的描述)。
度量(Measure):多维数组的取值。
(2000年1月,上海,笔记本电脑,0000)。
OLAP的基本多维分析操作有钻取(Drill-up和Drill-down)、切片(Slice)和切块(Dice)、以及旋转(Pivot)等。
钻取:是改变维的层次,变换分析的粒度。
它包括向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)。
Drill-up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而Drill-down则相反,它从汇总数据深入到细节数据进行观察或增加新维。
切片和切块:是在一部分维上选定值后,关心度量数据在剩余维上的分布。
如果剩余的维只有两个,则是切片;如果有三个或以上,则是切块。
旋转:是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。