数据仓库与数据挖掘实验指导.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库与数据挖掘课程实验
本实验是《数据仓库与数据挖掘》课程的验证性实验环节。
课程共计8学时。
·实验目标:
1、掌握建立和配置数据仓库的基本操作技能。主要包括数据仓库系统的安装。
2、掌握数据仓库中数据的处理技术。主要包括数据仓库的建模、事务数据的转换、
备份数据的恢复。
3、掌握基于数据仓库的自动数据分析技术的基本操作技能。包括多维数据分析和
数据挖掘。
4、掌握一种专用数据挖掘软件,用以分析处理文本或电子表格的数据。
实验环境:
l Microsoft SQLServer2000
l Microsoft SQLServer2000 Analysis Servce
l DBMiner2.0
l Microsoft SQLServer2000 PACK4
l JAVA运行时环境:JRE5.0
l WEKA3.55
实验项目:
l实验1:安装数据仓库系统平台 1.5学时
l实验2:构建数据仓库数据环境 1.5学时
l实验3:多维数据分析 1.5学时
l实验4:基于数据仓库的数据挖掘实验 2.0学时
l实验5:数据挖掘平台应用实验 1.5学时
实验1:安装数据仓库系统平台
l实验任务:
1.掌握Microsoft Server2000 数据仓库系统的安装与配置
2.安装实验分析环境:
1安装Microsoft Server2000 analysis Service
2安装DBMiner2.0
3 安装Java运行时环境JRE5.0
4安装WEKA
l实验准备:
请从黑板或网上获取安装文件所在的网络地址。并记在下面:
网络资料的地址是:_____________________________________________ 本实验不得超过1.5学时。
l实验指导:
Lab1.1检查并安装Microsoft Server2000
单元目标:
确保完整正确的数据仓库实验环境
工作步骤:
1.检查你所使用的电脑上是否有Microsoft Server2000。如果有,启动并检查Microsoft Server2000 是否安装了Server Pack3以上的补丁文件。
2.如果以上都没问题,则本实验结束。
3.下载相应的系统文件安装。先安装Microsoft Server2000,再安装Server Pack3或Server Pack4。
Lab1.2检查并安装数据分析环境
单元目标:
确保安装了相应的数据分析软件
工作步骤:
1.检查你所使用的电脑是否安装了Microsoft Server2000 analysis
Service,DBMiner2.0, JRE5.0, WEKA3.5.5。如果都已安装且能正常
运行,则本实验结束。否则进入以下步骤。
2.如果没有安装以上软件。请按以下次序从网络资料地址上下载软件完成
安装。
完成Lab1.1 和Lab1,2后,本实验结束。
实验2:构建数据仓库数据环境
l实验任务:
本实验主要验证ETL的数据处理过程。主要实验任务有:
1.构建数据仓库模型,并在数据仓库系统中生成相应的数据表。
2.将事务数据库中的数据转入数据仓库中。
3.还原备份和还原的数据仓库中的数据。
l实验准备:
请从黑板或网上获取数据文件所在的网络地址。并记在下面:
数据文件的地址是:_____________________________________________ 本实验不得超过1.5学时。
本实验将使用Microsoft SQLserver的示例数据库:Northwind,这是一个商贸公司的销售数据库。我们将这个事务型的数据导入到分析型的数据仓库中去。
l实验指导:
Lab2.1用caseStudio2.15 建立数据仓库的星型模型
单元目标:
建立Northwind_DW的数据仓库模型。如下图所示。并根据该模型生成相应的数据仓库的维表和事实表的结构。
工作步骤:
1. 按下图样式建立Northwind_DW的昨型数据模型,请根据原事务数据库中
相应字段的数据类型和宽度,对应地设计相应字段的数据类型和宽度。
2. 安装并启动CaseStudio2.15,设计以上模型。
3. 运行生成脚本(Generate script生成相应的SQL代码。
Lab2.2将事务型数据加载到分析数据环境中
单元目标:
根据以上实验单元建立的数据模型,在MicrosoftSQL2000中建立相应的物理数据仓库。
工作步骤:
1. 请从教师课件中“数据仓库与数据挖掘”目录下的Lab2008中下载文档
“多维数据分析操作演练.pdf ”
2. 用Adobe reader打开该文档。
3. 在数据仓库创建部分,可以使用Lab2.1中的模型进行创建和转化。
4. 按照上面所列步骤进行操作。最终完成事实表和维表的数据转移。
Lab2.3数据仓库中数据的备份与恢复
单元目标:
1.将已生成的数据仓库的数据进行备份。
2.利用备份文件向新的数据库中还原数据仓库的数据。
工作步骤:
1、备份
打开Sqlserver企业管理器,在需要备份的数据库上点鼠标右键,所有任务中选备份数据库。
再从Sqlserver安装目录中的Data目录下,拷贝出要备份的数据库文件
*.mdf,*.ldf,并备份这两个文件
2、还原
将要还原的数据库文件*.mdf,*.ldf拷贝到Sqlserver安装目录下的Data目录下。打开Sqlserver企业管理器,新建一个数据库,在数据库这一项上点鼠标右键,在所有任务中选导入数据库,以拷贝到Data目录下的mdf恢复数据库。
还原过程中,如果有什么异常,请参考“数据仓库与数据挖掘技术\上机\”目录下的“数据仓库实习指导.pdf”中的还原部分的内容。
实验3:多维数据分析
l实验任务:
本实验主要验证OLAP多维分析的过程。主要包括完成OLAP数据库的创建,多维数据集的创建。存储和处理多维数据,浏览多维数据集等实验任务。