数据仓库与数据挖掘实验指导.

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据仓库与数据挖掘课程实验

本实验是《数据仓库与数据挖掘》课程的验证性实验环节。

课程共计8学时。

·实验目标:

1、掌握建立和配置数据仓库的基本操作技能。主要包括数据仓库系统的安装。

2、掌握数据仓库中数据的处理技术。主要包括数据仓库的建模、事务数据的转换、

备份数据的恢复。

3、掌握基于数据仓库的自动数据分析技术的基本操作技能。包括多维数据分析和

数据挖掘。

4、掌握一种专用数据挖掘软件,用以分析处理文本或电子表格的数据。

实验环境:

l Microsoft SQLServer2000

l Microsoft SQLServer2000 Analysis Servce

l DBMiner2.0

l Microsoft SQLServer2000 PACK4

l JAVA运行时环境:JRE5.0

l WEKA3.55

实验项目:

l实验1:安装数据仓库系统平台 1.5学时

l实验2:构建数据仓库数据环境 1.5学时

l实验3:多维数据分析 1.5学时

l实验4:基于数据仓库的数据挖掘实验 2.0学时

l实验5:数据挖掘平台应用实验 1.5学时

实验1:安装数据仓库系统平台

l实验任务:

1.掌握Microsoft Server2000 数据仓库系统的安装与配置

2.安装实验分析环境:

1安装Microsoft Server2000 analysis Service

2安装DBMiner2.0

3 安装Java运行时环境JRE5.0

4安装WEKA

l实验准备:

请从黑板或网上获取安装文件所在的网络地址。并记在下面:

网络资料的地址是:_____________________________________________ 本实验不得超过1.5学时。

l实验指导:

Lab1.1检查并安装Microsoft Server2000

单元目标:

确保完整正确的数据仓库实验环境

工作步骤:

1.检查你所使用的电脑上是否有Microsoft Server2000。如果有,启动并检查Microsoft Server2000 是否安装了Server Pack3以上的补丁文件。

2.如果以上都没问题,则本实验结束。

3.下载相应的系统文件安装。先安装Microsoft Server2000,再安装Server Pack3或Server Pack4。

Lab1.2检查并安装数据分析环境

单元目标:

确保安装了相应的数据分析软件

工作步骤:

1.检查你所使用的电脑是否安装了Microsoft Server2000 analysis

Service,DBMiner2.0, JRE5.0, WEKA3.5.5。如果都已安装且能正常

运行,则本实验结束。否则进入以下步骤。

2.如果没有安装以上软件。请按以下次序从网络资料地址上下载软件完成

安装。

完成Lab1.1 和Lab1,2后,本实验结束。

实验2:构建数据仓库数据环境

l实验任务:

本实验主要验证ETL的数据处理过程。主要实验任务有:

1.构建数据仓库模型,并在数据仓库系统中生成相应的数据表。

2.将事务数据库中的数据转入数据仓库中。

3.还原备份和还原的数据仓库中的数据。

l实验准备:

请从黑板或网上获取数据文件所在的网络地址。并记在下面:

数据文件的地址是:_____________________________________________ 本实验不得超过1.5学时。

本实验将使用Microsoft SQLserver的示例数据库:Northwind,这是一个商贸公司的销售数据库。我们将这个事务型的数据导入到分析型的数据仓库中去。

l实验指导:

Lab2.1用caseStudio2.15 建立数据仓库的星型模型

单元目标:

建立Northwind_DW的数据仓库模型。如下图所示。并根据该模型生成相应的数据仓库的维表和事实表的结构。

工作步骤:

1. 按下图样式建立Northwind_DW的昨型数据模型,请根据原事务数据库中

相应字段的数据类型和宽度,对应地设计相应字段的数据类型和宽度。

2. 安装并启动CaseStudio2.15,设计以上模型。

3. 运行生成脚本(Generate script生成相应的SQL代码。

Lab2.2将事务型数据加载到分析数据环境中

单元目标:

根据以上实验单元建立的数据模型,在MicrosoftSQL2000中建立相应的物理数据仓库。

工作步骤:

1. 请从教师课件中“数据仓库与数据挖掘”目录下的Lab2008中下载文档

“多维数据分析操作演练.pdf ”

2. 用Adobe reader打开该文档。

3. 在数据仓库创建部分,可以使用Lab2.1中的模型进行创建和转化。

4. 按照上面所列步骤进行操作。最终完成事实表和维表的数据转移。

Lab2.3数据仓库中数据的备份与恢复

单元目标:

1.将已生成的数据仓库的数据进行备份。

2.利用备份文件向新的数据库中还原数据仓库的数据。

工作步骤:

1、备份

打开Sqlserver企业管理器,在需要备份的数据库上点鼠标右键,所有任务中选备份数据库。

再从Sqlserver安装目录中的Data目录下,拷贝出要备份的数据库文件

*.mdf,*.ldf,并备份这两个文件

2、还原

将要还原的数据库文件*.mdf,*.ldf拷贝到Sqlserver安装目录下的Data目录下。打开Sqlserver企业管理器,新建一个数据库,在数据库这一项上点鼠标右键,在所有任务中选导入数据库,以拷贝到Data目录下的mdf恢复数据库。

还原过程中,如果有什么异常,请参考“数据仓库与数据挖掘技术\上机\”目录下的“数据仓库实习指导.pdf”中的还原部分的内容。

实验3:多维数据分析

l实验任务:

本实验主要验证OLAP多维分析的过程。主要包括完成OLAP数据库的创建,多维数据集的创建。存储和处理多维数据,浏览多维数据集等实验任务。

相关文档
最新文档