数据仓库的构建与联机分析处理
基于数据仓库和联机分析处理的青少年同伴关系研究

【 键词 】数 据 仓 库 关
联机分析
同伴 关 系
文章 编 号 :O 8 1 3 ( O 0 O — 8 4 10 — 79 2 1 )5 6 —
中 图分 类 号 : P 1 文献 标 识 码 : T 31 A
R sa c nP e e t nhpo d lse t ae ee rho e 卜rl i s i f oecn sd a0 A B
研 究 内 容 做 出 完整 、 准确 、 理 的 分 析 和 预 测日 合 。
同 伴 关 系 会 引 发 如 抽 烟 、 酒 、 架 等 问 题 行 为 , 会 引发 抑 酗 打 还
郁、 退缩 、 孤独 感 等 消 极情 绪 。 研 究 主要 探 讨 性别 、 庭状 况 本 家 和父 母 教 育 程 度 对 青 少 年 同伴 关 系 的影 响 ,家 庭状 况 主要 包
o t a e o s n n Da a W r h u e a d 0LAP
LU i 1 B , AXi -u , I L一i AI XI a jn MA a , Yi o J i
( sa hC ne fr emigSine Suha ie i , nig i gu2 09 , ia Re r etro a n c c, o tes Un rt Naj a s 10 6 Ch ) ec L e t v sy n Jn n
Ke r s Da re o s ; y wo d  ̄ t wa h u e OL ; e r r lt n h p a AP P e — eai s o i
.
同 伴 关 系 (e r rl o si) 指 年 龄 相 同 或 相 近 的 青 p e — e t nhp 是 a i 少 年 由于共 同活 动 和 相 互 交 往 而形 成 的关 系或 者 主 要 指 同 龄
数据仓库的架构方式及其比较

数据仓库的架构方式及其比较数据仓库的架构方式及其比较传统的关系数据库一般采用二维数表的形式来表示数据,一个维是行,另一个维是列,行和列的交叉处就是数据元素。
关系数据的基础是关系数据库模型,通过标准的SQL语言来加以实现。
数据仓库是多维数据库,它扩展了关系数据库模型,以星形架构为主要结构方式的,并在它的基础上,扩展出理论雪花形架构和数据星座等方式,但不管是哪一种架构,维度表、事实表和事实表中的量度都是必不可少的组成要素。
下面解析由这些要素构成的数据仓库的架构方式。
1.星形架构星形模型是最常用的数据仓库设计结构的实现模式,它使数据仓库形成了一个集成系统,为最终用户提供报表服务,为用户提供分析服务对象。
星形模式通过使用一个包含主题的事实表和多个包含事实的非正规化描述的维度表来支持各种决策查询。
星形模型可以采用关系型数据库结构,模型的核心是事实表,围绕事实表的是维度表。
通过事实表将各种不同的维度表连接起来,各个维度表都连接到中央事实表。
维度表中的对象通过事实表与另一维度表中的对象相关联这样就能建立各个维度表对象之间的联系。
每一个维度表通过一个主键与事实表进行连接,如图3-10所示。
图3-10 星形架构示意图事实表主要包含了描述特定商业事件的数据,即某些特定商业事件的度量值。
一般情况下,事实表中的数据不允许修改,新的数据只是简单地添加进事实表中,维度表主要包含了存储在事实表中数据的特征数据。
每一个维度表利用维度关键字通过事实表中的外键约束于事实表中的某一行,实现与事实表的关联,这就要求事实表中的外键不能为空,这与一般数据库中外键允许为空是不同的。
这种结构使用户能够很容易地从维度表中的数据分析开始,获得维度关键字,以便连接到中心的事实表,进行查询,这样就可以减少在事实表中扫描的数据量,以提高查询性能。
在AdventureWorksDW数据仓库中,若以网络销售数据为事实表,把与网络销售相关的多个商业角度(如产品、时间、顾客、销售区域和促销手段等)作为维度来衡量销售状况,则这些表在数据仓库中的构成如图3-11所示,可见这几个表在数据仓库中是以星形模型来架构的。
基于HIS的数据仓库构建及多维分析

lb r tst ec n oai no a a e o s n n—l e a ay i r c si g tc n l g ,i t d c sd t r h u e a d mut —d me s n a o ae o n t t d t w r h u ea d o h o f a i n l ssp o e sn h oo y n r u e aawae o s n l n e o i i ni - o a n lsst c n lg no HI n a e n ,c n rt l e in h d la d fa w r S d t rh u e la ay i e h oo i t S ma g me t o c eey d sg st e mo a n r me o k o HI a wa e o s . y f a
数据 仓库 的建 立是 整 个 系 统发 挥 作 用 的关 键 ,包括
பைடு நூலகம்
察数 据 的特定 角 度 出发 ,根 据 考 虑 问题 时 的属性 进
行分类 ,同种属性集合构成一个维。例如 ,医院关
心就诊 患 者不 同 时 间段 的 就诊 情 况 ,这 是 以时 间分
上 。在医院工作中经常需要围绕一些特定管理需求 ,
随机地提出一些统计条件 ,这些需求却不能直接从 常规的报表中获得 。另外一方面 ,医院的业务运行
纪 8 年代 中期 ,是在支持管理决策过程 中,一个面 O 向主题 的、集 成 的、时 变 的、非 易 失 的 数 据 集 合 。它的信息源具有分布和异构的特点 。
JU N L F E I LNO AI 21, o3 ,N . O R A D A F M T S 01 V 1 2 o1 OM C I C . 1
BI

数据库处理作用
OLTP
发生了什么?
BI/DSS
为什么会发生? 将来会如何?
BI/DSS
DATA DATA DATA
DAT A
DATA DATA
INFORMATION
信
息
DATA DATA DATA DATA DATA
操作型环境——OLTP 操作型环境 全局级——数据仓库 全局级 数据仓库 部门级——局部仓库 部门级 局部仓库 个人级——个人仓库,用于启发式的分析 个人仓库, 个人级 个人仓库
数据库的体系化环境
数据库的体系化环境
数据集市( 数据集市(Data Mart) )
特定的, 特定的,面向部门的小型数据仓库 是为满足用户特定需求而创建的数据仓库 是数据仓库的子集
Operational Data Store
Data Warehouse
DSS, EIS, Reporting
Transaction Systems OLTP Extract Transform Load
Business Objects
OLAP Data Marts Populate DM
BrioQuery
商务智能 Business Intelligence
本章内容
什么是商务智能(BI) 什么是商务智能 数据仓库及其实现技术 数据分析及工具 数据挖掘及发展
数据库处理的两大应用
联机事务处理(OLTP)
操作型处理,为企业的特定应用服务 事务处理,对数据的查询和更新 响应时间,数据的安全性和完整性
商务智能(BI)
浅析数据仓库、联机分析处理和数据挖掘

、 指 主 题 的 、 成 的 、 易 失 的 、 随 时 间 变 化 的 数 据集 合 。 它 用 来 保 存 从 取 值 之 间 存 在 的某 种 规 律 性 )聚 类 ( 数据 库 中 的记 录可 被 化 分 为 一 集 非 且 聚类 技 术 主要 包 括 传统 的模 式 识 别方 法 和数 学 分 多 个 数 据 库 或 其 它 信息 源 选取 的 数 据 , 为 上 层 应 用 提 供 统 一 的 用 户 系 列 有 意 义 的 子集 . 并
D t Miig 简 a M) 21 据 仓 库 目前 .数 据 库技 术 及 其 应 用 已 从 关 系 模 型发 展 到 此提 出数 据 挖 掘 ( a nn , 称 D 。 由于 DM 是 从 关 系 数 据 库 、 .数 WE 规 面 向 对象 模 型 , 从单 机 应 用 发 展 到 分 布 式 应 用 , 局 域 网 数 据 库 应 用 数据 仓 库 、 B数 据 库 以 及 其 他 文 件 系 统 中发 现 重 要 的 数 据 模 式 、 从 K o ldeD s vr c n 发 展 到 We b数 据 库 应 用 , 联 机 事 务 处 理 发 展 到 联 机 分 析 处 理 , 数 律 的 过 程 ,所 以又 称 为 数 据 库 中 的 知识 发 现 ( nwe g i oeyi 从 从 a ae 简记 为 K D) 些 知 识是 隐含 的 、 先 未知 的 有用 信 息 , a D 。这 事 提 据 库 发展 到 数 据 仓 库 , 数 据 的 统 计 分 析 发 展 到数 据 挖 掘 。 由 于 以 前 D tbs, 从 规 模 规 以 面 向事 务 处 理 的传 统 数 据 库 系 统 不 再 适应 新形 势下 决 策 分析 的 需 要 . 取 的 知 识 表 现 为 概 念 、 则 、 式 、 律 等 形 式 , 帮 助 管 理 者 做 出 正 M L P的 高级 阶 段 。 比 如 对 响应 时间 的要 求 上 计 时 单 位 小 : 据结 构 只适 合操 作 计 算 而 不 确 的 决 策 。 可 以说 D 是 O A 数 数 据 挖 掘 通 过 预 测 未 来 趋 势 及 行 为 , 出前 摄 的 、 于 知 识 的 决 做 基 适 合 分析 ; 进 行 管 理 预 测 、 策 时 不 能 满 足 大 量 全 面 、 确 的 集 成 数 在 决 正 策 。 的 目标 是 从 数 据 库 中 发 现 隐 含 的 、 意义 的知 识 , 要 有 自动 预 它 有 主 据 等 。 因此 提 出数 据 仓 库 ( aaWahue 简 称 D ) Dt ros , W 。 例 、 指 W n n对 数 据 仓 库 的 定 义 : 一 个 用 于 支 持 管 理 决 策 , 向 测 趋 势 和 行 为 ( 如 市场 预 测 问 题 )关 联 分 析 ( 两 个 或 多 个 变 量 的 H Imo 是 面
基于数据仓库的数据挖掘及联机分析技术

策 。在 欧 美 发 达 国家 , 以数 据 仓 库 为 基 础 的在 线 分 析 处 理 和 数 据 挖 掘 应 用 ,首 先 在 金 融 、保 险 、证 券 、 电信 等 传 统 数 据 密 集 型 行 业 取 得 成 功 。BM 、 rce I oal、 T rdt、Mirsf、N tza和 S eaaa coot eez AS等 有 实 力 的 公 司 相 继 推 出 了数 据 仓 库 解 决 方 案 。 近 几 年 开 始 流 行 “ 布 式 数 据 仓 库 ” 是 在 多 个 分 ,
维普资讯
兵 工 自动 化
网络 与 售息 技 i I i
Ne wo k a d I f r ai nTe h o o y t r n n o m t c n l g o
0. . t ma i n I Au o to 2 08 V 1 2 , 0 , o . 7 No. 9
20 年第 2 08 7卷第 9期
文 章 编 号 : 10 — 5 6 ( Байду номын сангаас 8 90 5 — 2 0 6 1 7 2 0 )0 0 8 0
基 于 数 据 仓 库 的 数 据 挖 掘 及 联 机 分 析 技 术
张 晓 明 , 刘 萍 , 王 鹏
( 防科 技大 学 信 息 系统 与 管理 学 院 ,湖 南 长沙 4 0 7 ) 国 1 0 3
摘 要 :随 着数据 分 析 越 来越被 关注 , 为分析 数 据 , 多种 分析 技 术得 以应 用 ,主要 是 在数 据 仓库 领 域 的数据 挖掘 技 术和联 机 分析 技 术 。 然而数 据 仓库 包含 了大量 的基 于数 据 的基 础 观 点 ,该观 点 均 来 源 于分布 式 异构 数据 库 , 其 目 的是 通 过联机 分 析 查询 和数 据挖 掘 提供 有 效的 决策 支持 。
第4章 数据仓库和OLAP
4.1 数据仓库基本概念
中间层:OLAP服务器
11
– 联机分析处理(Online Analytical Processing, OLAP)是数据仓库系统前端分析服务
的分析工具,能快速汇总大量数据并进行高效查询分析,为分析人员提供决策支持。 • 使用OLAP相关模型将多维数据上的操作映射为标准的关系操作,或者直接实现多维 数据操作 • OLAP操作可以与关联、分类、预测、聚类等数据挖掘功能结合,以加强多维数据挖 掘
物理模型设计
– 需要在充分了解数据和硬件配置的基础上确定数据的存储结构、索引策略、 数据存放位置等信息
16
4.2 数据仓库设计
物理模型设计-存储结构
– 充分考虑所选择的存储结构是否适合数据的需要 – 考虑存储时间和存储空间的利用率
17
4.2 数据仓库设计
物理模型设计-存储结构
表4-4 销售事实表存储结构关系模型
城市 销售商类型
起始地区键 地区维表
地区代码 到达地区键 成本
所在省 所在城市 所在街道
图4-4 产品销售数据仓库的事实星座模型
4.2 数据仓库设计
逻辑模型设计
– 进一步的完善和详细化设计,扩展主题域 – 奠定数据仓库的物理设计的基础
12
– 通过实体和实体之间的关系勾勒出整个企业的数据蓝图和规划 • 分析主题域,确定要装载到数据仓库的主题 • 粒度层次划分,通过估计数据量和所需的存储设备确定粒度划分方案 • 确定数据分隔策略,将逻辑上整体的数据分割成较小的、可以独立管理 的物理单元进行存储 • 定义关系模式,概念设计阶段时基本的主题已经确定,逻辑模型设计阶 段要将主题划分成多个表以及确定表的结构
20
在不同的存储设备上
数据仓库与联机分析在高速公路收费系统中的应用
分析 比较 。多种 分析 方法 结 合在 一起 ,促成 了联机 分 析处 理 系统 强大 的 数
ห้องสมุดไป่ตู้据分析 功 能。 [ ] 5
的 情 况 ,如 可 以方 便 地 查看 各 种 车 辆 的 收 费情 况 如 正 常何 载 货 车 车 型收
费 ,超 限车 辆计 重 收 费, 以及利 用 切片 、切 块 、和 旋转 操 作能 更加 方 便的 分析 数据 ,从而 使 决策 者 能够根 据 各种 数据 的显示 做 出相 映 的决策 ,如何 控制 车 辆 的载重 情 况能 够及 时对 路 面进 行养 护 保证 措 施 ,还可 以根 据 每年
摘
0引言
车类 型描 述 );车辆 种类 维表 (E ILT P ) (d V HC EY E i车辆 种类 编号 ,nm 车 ae 辆 种类 描述 );计 重维表 (V REG T (X SN O O EW IH ) A IIF 轴重信 息 ,A IN M XSU 车
轴组数 ,O E L A R T 超 载率 ,W I H T L 计重 计算 金额 ,A I E C E W I V ROD AE EG TO L XSX EDE
好 地管 理数 据 ,保 持 数据 的一 致性 ,以及 企 业 的分析 数 据 的需 求 ,引 出 了 数 据 仓 库 的概 念 与 模 型 , 联机 分 析 处 理 ( LP OA )为 企 业 提供 联 机 数 据 访 问、处 理和 分析 ,通 过 直观 的方式 从 多个 维度 、多种 数据 综 合程 度将 系 统 的运 营情 况展 现给 使用 者 。 [,2 ] 1 ,3
1数据 仓库 的E L T 过程 数 据 仓 库 一 般 由三 个 主 要 的 部 分 组 成 :数 据 的提 取 一 转 换 一装 载 (T )、数据 仓 库 的基 本存 储数 据 、综 合 管理 / 机 分 析处 理 。它 按照 数 EL 联 据 处理 的流 程 ,从输 入 开始 组 织成 一定 的存 储 形式 ,并按 照 用户 要求 的形
大数据导论(4)——OLTP与OLAP、数据库与数据仓库
⼤数据导论(4)——OLTP与OLAP、数据库与数据仓库公司内部的数据⾃下⽽上流动,同时完成数据到信息、知识、洞察的转化过程。
⽽企业内部数据,从⽇常OLTP流程中产⽣,实时存储进不同的数据库中。
同时定期被提取、经格式转化、清洗和加载(ETL),以统⼀的格式存储进数据仓库,以供决策者进⾏OLAP处理,并将处理结果可视化。
OLTP & OLAP企业的数据处理可以分成两⼤类:联机事务处理OLTP、联机分析处理OLAP。
OLTP(On-Line Transaction Processing,联机事务处理)——数据库的增删查改。
是⾯向“事务”类型的操作。
有⼏个显著的特点:要求速度快/操作涉及的数据量不⼤/要求精准操作。
事物型数据⼤多都具有⾼度规范化。
因此OLTP系统是结构化数据的主要数据源。
OLAP(On-Line Analytical Processing,联机分析处理)——⽀持复杂的分析、查询操作,侧重决策⽀持,并且提供直观易懂的查询结果。
解决了涉及多维度数据的问题(传统数据库⽆法满⾜OLAP所需要的数据信息)。
数据库 & 数据仓库数据库的主要应⽤场景为联机事务处理(OLTP),数据仓库的主要应⽤场景为联机分析处理(OLAP)。
数据库(Database)——⽤于存储电⼦⽂件,⽤户可以对⽂件中的数据运⾏新增、截取、更新、删除等操作。
为对数据库进⾏管理,开发设计出数据库管理系统(Database Management System)。
数据仓库(DataWarehouse)——⽤于存储数据的中央、企业级系统,存储的数据多为历史数据。
特点:数据仓库中的数据围绕企业主题(Subject-Oriented )、经过集成(Integrated)、定期更新(Time-Variant)、具有⾮易失性(Non-Volatile,不可修改,多以只读格式返回给⽤户);结构:暂存层、集成层、访问层与OLAP的关系:数据仓库为OLAP解决了数据来源问题,并与OLAP互相促进发展,进⼀步驱动了商务智能的成熟。
《数据仓库与数据挖掘》教学大纲
《数据仓库与数据挖掘》教学大纲一、课程概述数据挖掘是一门新兴的交叉性学科,是在信息技术领域迅速兴起的决策支持新技术。
数据挖掘是数据库研究、开发、和应用最为活跃的分支之一。
本课程的先修课程为数据结构、高等数学、数据库技术等。
本课程标准适用于计算机科学与技术、信息管理与信息系统专业。
二、课程目标1.了解数据管理技术从数据库到数据仓库的发展过程。
2.掌握数据仓库的定义、特点和研究数据仓库的必要性。
3.掌握数据仓库的体系结构和联机分析处理的概念4.掌握数据仓库的数据组织、数据预处理与规划管理5.掌握数据仓库规划、设计、管理的基本方法6.掌握数据挖掘的基本概念及与数据仓库的关系7.熟悉聚类分析、分类发现和关联规则等数据挖掘算法的使用环境、算法特点,并能进行算法复杂性的分析。
8.认识数据挖掘的发展趋势和应用前景9.能够在科研实践中应用数据仓库技术和应用数据挖掘的方法。
三、课程内容和教学要求这门学科的知识与技能要求分为知道、理解、掌握、学会四个层次。
这四个层次的一般涵义表述如下:知道———是指对这门学科和教学现象的认知。
理解———是指对这门学科涉及到的概念、原理、策略与技术的说明和解释,能提示所涉及到的教学现象演变过程的特征、形成原因以及教学要素之间的相互关系。
掌握———是指运用已理解的教学概念和原理说明、解释、类推同类教学事件和现象。
学会———是指能模仿或在教师指导下独立地完成某些教学知识和技能的操作任务,或能识别操作中的一般差错。
教学内容和要求表中的“√”号表示教学知识和技能的教学要求层次。
本标准中打“*”号的内容可作为自学,教师可根据实际情况确定要求或不布置要求。
教学内容及教学要求表教学内容 知道 理解 掌握 学会 1 数据仓库概述1.1从数据库到数据仓库1.2 数据仓库的概念与特点1.3 数据仓库中的关键概念1.4 数据仓库的数据组织1.5 数据仓库与数据集市的关系 1.6 数据仓库体系结构1.7 操作数据存储ODS √√√√√√√2 联机分析处理2.1 联机分析处理的概念2.2 OLAP多维数据分析2.3 OLAP数据组织2.5 OLAP工具及评价 √ √√√3 数据仓库设计3.1 数据仓库中的数据模型概述 3.2概念模型设计3.3 逻辑模型设计3.4 物理模型设计3.5 元数据模型3.6 粒度模型 √√√√√√4 数据仓库的规划与开发4.1 数据仓库的投资分析4.2 数据仓库的开发方法 4.3 数据仓库的建立过程 4.4 数据仓库的维护4.5 提高数据仓库的性能 4.6 数据仓库的安全性 √√√√√√教学内容 知道 理解 掌握 学会4.7 分布式数据仓库 √5 数据仓库的工具5.1数据仓库的工具选择5.2 常用数据仓库产品介绍5.3 SQL Server 数据仓库的操作应用 √√√6 数据挖掘概述6.1 数据挖掘的定义对象 6.2 数据挖掘的分类6.3 数据挖掘系统6.4 数据预处理 √ √ √ √7 数据挖掘的算法7.1 分类规则挖掘7.2 预测分析与趋势分析规则7.3 数据挖掘的关联算法7.4 聚类分析7.5 神经网络算法 √ √ √ √ √8 数据挖掘新技术 √9 数据挖掘的工具及其应用9.1 国内外数据挖掘工具及评价9.2 SQL Server 2005数据挖掘工具应用 √√10基于数据挖掘的上市公司财务危机预警应用实例 √四、 课程实施数据仓库与数据挖掘为计算机类选修课程,对于本科生着重强调理解基本概念和掌握最基本的方法,一般情况下,每周安排2课时,共36课时。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验二 一、实验名称:数据仓库的构建与联机分析处理 二、实验日期:2011年11月11日
三、实验地点:经济管理系实验室 四、实验目的和要求 (一)实验目的 1.理解数据库与数据仓库之间的区别与联系; 2.掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法; 3.掌握数据仓库建立的基本方法及其相关工具的使用。 (二)实验要求 利用实验室提供的实验软件,认真完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。实验完成后,应根据实验情况写出实验报告。 五、实验设备及软件 基于NT的局域网络,服务器与客户端安装MS SQL Server 服务系统以及Analysis Services系统。 六、实验内容 以SQL Server为系统平台,设计、建立数据库,并以此为基础创建数据仓库。 七、实验步骤 1. 启动SQL Server 服务 启动 SQL Server 实例时即启动了 SQL Server 服务。启动 SQL Server 服务之后,用户便可与服务器建立新连接。SQL Server 服务可在本地或远程作为 Microsoft Windows NT® 4.0 或 Windows® 2000 服务启动和停止。SQL Server 服务若是默认实例,则被称为 MSSQLServer;若是命名实例,则被称为 MSSQL$instancename。 2. 注册服务器 ⑪ 右击一个服务器或服务器组,然后单击"新建 SQL Server 注册"命令。 ⑫ 在"服务器"框中,键入服务器名。 ⑬ 若要指定 SQL Server 企业管理器(作为客户端)与运行正在注册的 Microsoft® SQL Server™ 实例的服务器之间的连接,请执行下列操作之一: 单击"使用 Windows 身份验证" -或-单击"使用 SQL Server 身份验证" ⑭ 在"服务器组"列表中,单击一个服务器组。 ⑮ 执行下列一个或多个操作: a.选择"在控制台中显示 SQL Server 服务器的状态"复选框以打开服务轮询。 b选择"显示系统数据库和系统对象"复选框以显示所有系统数据库和对象。 c 选择"在连接时自动启动 SQL Server"复选框以自动启动 SQL Server 实例。 重复步骤 1 到 5,在"SQL Server 企业管理器"中注册每个服务器。 3. 设计表 设计数据库时,应先确定需要什么样的表,各表中都有哪些数据以及各个表的存取权限等等。在创建和操作表的过程中,将对表进行更为细致的设计。 设计时应注意: (1)表所包含的数据的类型。 (2)表的各列及每一列的数据类型(如果必要,还应注意列宽)。 (3)哪些列允许空值。 (4)是否要使用以及何时使用约束、默认设置或规则。 (5)所需索引的类型,哪里需要索引,哪些列是主键,哪些是外键。 4. 修改表 表创建之后可以修改许多已定义的选项,包括: 添加、修改、删除列。例如,列的名称、长度、数据类型、精度、小数位数以及为空性均可进行修改,不过有一些限制而已。注意: 可添加或删除 PRIMARY KEY 和 FOREIGN KEY 约束。 可添加或删除 UNIQUE 和 CHECK 约束及 DEFAULT 定义(对象)。 可使用 IDENTITY 或 ROWGUIDCOL 属性添加或删除标识符列。虽然 ROWGUIDCOL 属性也可添加至现有列或从现有列删除,但是任何时候在表中只能有一列可具有该属性。 表及表中所选定的列已注册为全文索引。 5.建立系统数据源连接 ⑪ Microsoft® Windows NT® 4.0 用户:单击“开始”按钮,指向“设置”,单击 “控制面板”,然后双击“数据源 (ODBC)”。 ⑫ Windows® 2000 用户:单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,再双击“数据源 (ODBC)”。 ⑬ 在“系统 DSN”选项卡上单击“添加”按钮。 ⑭ 选择“Microsoft Access 驱动程序 (*.mdb)”,然后单击“完成”按钮。 ⑮ 在“数据源名”框中,输入“教程”,然后在“数据库”下,单击“选择”。 ⑯ 在“选择数据库”对话框中,浏览到“C:\Program Files\Microsoft Analysis Services\Samples”,然后单击“FoodMart 2000.mdb”。单击“确定”按钮。 6.建立数据库和数据源 ⑪ 如何建立数据库结构 ① 在 Analysis Manager 树视图中展开“Analysis Servers”。 ② 单击服务器名称,即可建立与 Analysis Servers 的连接。 ③ 右击服务器名称,然后单击“新建数据库”命令。 ④ 在“数据库”对话框中的“数据库名称”框中,输入“教程”,然后单击“确定”按钮。 ⑤ 在 Analysis Manager 树窗格中展开服务器,然后展开刚才创建的“教程”数据库。 ⑫ 建立数据源 在 Analysis Manager 树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”命令。 在“数据链接属性”对话框中,单击“提供者”选项卡,然后单击“Microsoft OLE DB Provider for ODBC Drivers”。
① 单击“连接”选项卡,然后从“使用数据源名称”列表中单击“教程”。 ② 单击“测试连接”以确保一切工作正常。在“Microsoft 数据链接”对话框中应出现一条消息,说明连接成功。在消息框中单击“确定”按钮。 ③ 单击“确定”按钮关闭“数据链接属性”对话框。 7.建立多维数据集 您现在的身份是 FoodMart Corporation 的数据库管理员。FoodMart 是一家大型的连锁店,在美国、墨西哥和加拿大有销售业务。市场部想要按产品和顾客分析 1998 年进行的所有销售业务数据。使用存储在公司数据仓库中的数据,您就能建立多维数据结构(多维数据集),以便在市场分析人员查询数据库时获取快速的响应。建立一个多维数据集,用于进行销售分析。 ⑪ 打开多维数据集向导 在 Analysis Manager 树窗格中,“教程”数据库下,右击“多维数据集”文件夹,单击“新建多维数据集”菜单,然后单击“向导”命令。 ⑫ 向多维数据集添加度量值 度量值是要进行分析的数据库中的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。 ① 在多维数据集向导的“欢迎”步骤,单击“下一步”按钮。 ② 在“从数据源中选择事实数据表”步骤,展开“教程”数据源,然后单击“sales_fact_1998”。 ③ 单击“浏览数据”按钮可以查看“sales_fact_1998”表中的数据。数据浏览完毕后,关闭“浏览数据”窗口,然后单击“下一步”按钮。 ④ 若要定义多维数据集的度量值,在“事实数据表数据列”下,双击“store_sales”。对“store_cost”和“unit_sales”列重复此步骤,然后单击“下一步”按钮。 ⑬ 建立时间维度 在向导的“选择多维数据集的维度”步骤,单击“新建维度”命令。此操作将调用维度向导。
① 在“欢迎”步骤,单击“下一步”按钮。 ② 在“选择维度的创建方式”步骤,选择“星型架构:单个维度表”选项,然后单击“下一步”按钮。 ③ 在“选择维度表”步骤,单击“time_by_day”。单击“浏览数据”按钮可以查看包含在“time_by_day”表中的数据。 查看完“time_by_day”表后,单击“下一步”按钮。 ④ 在“选择维度类型”步骤,选择“时间维度”选项,然后单击“下一步”按钮。 ⑤ 接下来,将定义维度的级别。在“创建时间维度级别”步骤,单击“选择时间级别”,单击“年、季度、月”,然后单击“下一步”按钮。 ⑥ 在“选择高级选项”步骤,单击“下一步”按钮。 ⑦ 在向导的最后一步,输入“Time”作为新维度的名称。 ⑧ 单击“完成”返回到多维数据集向导。 ⑨ 在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Time”维度。 ⑭ 建立产品维度 ① 再次单击“新建维度”命令。在“欢迎进入维度向导”步骤,单击“下一步”按钮。 ② 在“选择创建维度的方式”步骤,选择“雪花架构: 多个相关维度表”选项,然后单击“下一步”按钮。 ③ 在“选择维度表”步骤,双击“Product”和“product_class”将它们添加到“选定的表”。单击“下一步”按钮。 ④ 在维度向导的“创建和编辑联接”步骤,显示在上一步选定的两个表以及它们之间的联接。单击“下一步”按钮。
若要定义维度的级别,在“可用的列”下,按顺序双击“product_category”、“product_subcategory”和“brand_name”。 双击每列后,其名称显示在“维度级别”下。在选择了所有三列后,单击“下一步”按钮。 在“指定成员键列”步骤,单击“下一步”按钮。 在“选择高级选项”步骤,单击“下一步”按钮。 在向导的最后一步,在“维度名称”框中,输入“Product”,并保持“与其它多维数据集共享此维度”复选框为选中状态。单击“完成”按钮。 现在应能在“多维数据集维度”列表中看到“Product”维度。 ⑮ 建立客户维度 ① 单击“新建维度”命令。 ② 在“欢迎”步骤,单击“下一步”按钮。 ③ 在“选择创建维度的方式”步骤,选择“星型架构: 单个维度表”选项,然后单击“下一步”按钮。 ④ 在“选择维度表”步骤,单击“Customer”,然后单击“下一步”按钮。 ⑤ 在“选择维度类型”步骤,单击“下一步”按钮。 ⑥ 若要定义维度的级别,在“可用列”下,按顺序双击“Country”、“State_Province”、“City”和“lname”列。双击每一列后,其名称将显示在“维度级别”下方。选择完所有四个列之后,单击“下一步”按钮。 ⑦ 在“指定成员键列”步骤,单击“下一步”按钮。 ⑧ 在“选择高级选项”步骤,单击“下一步”按钮。 ⑨ 在向导的最后一步,在“维度名称”框中,输入“Customer”。保持“与其它多维数据集共享此维度”复选框的选中状态。单击“完成”按钮。 ⑩ 在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Customer”维度。 ⑯ 完成多维数据集的生成 ① 在多维数据集向导中,单击“下一步”按钮。 ② 在“事实数据表行数”消息给出提示时,单击“是”按钮。
③ 在多维数据集向导的最后一步,将多维数据集命名为“Sales”,然后单击“完成”按钮。 ④ 向导将关闭并随之启动多维数据集编辑器,其中包含刚刚创建的多维数据集。单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子。