数据挖掘与数据仓库课程简介

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘与数据仓库课程简介

英文名:Data Mining and Data Warehouse

开课单位:计算机学院

课程编码:203086

学分学时:学分,学时32(含实验10)

授课对象:计算机科学与技术专业方向选修课

先修课程:数据库

课程目的和主要内容:

通过本课程的学习,学生应能理解数据库技术的发展为何导致需要数据挖掘,以及数据挖掘潜在应用的重要性;掌握数据仓库和多维数据结构,OLAP(联机分析处理)的实现以及数据仓库与数据挖掘的关系;熟悉数据挖掘之前的数据预处理技术;了解定义数据挖掘任务说明的数据挖掘原语;掌握数据挖掘技术的基本算法,为将来从事数据仓库的规划和实施以及数据挖掘技术的研究工作打下一定的基础。

主要内容包括数据仓库和数据挖掘的基本知识;数据清理、数据集成和变换、数据归约以及离散化和概念分层等数据预处理技术;DMQL数据挖掘查询语言;用于挖掘特征化和比较知识的面向属性的概化技术、用于挖掘关联规则知识的基本Apriori算法和它的变形、用于挖掘分类和预测知识的判定树分类算法和贝叶斯分类算法以及基于划分的聚类分析算法等;了解先进的数据库系统中的数据挖掘方法,以及对数据挖掘和数据仓库的实际应用问题展开讨论。

参考教材:

《数据挖掘概念与技术》,机械工业出版社,JiaWei Han,Micheline Kamber著,范明等译

参考和阅读书目:

《Data Mining: Concepts and Techniques》Jiawei Han and Micheline Kamber, Morgan Kaufmann, 2000

《机器学习》,Tom Mitchell著,曾华军等译

《SQLServer2000数据挖掘技术指南》,机械工业出版社,Claude Seidman著,刘艺等译

数据挖掘与数据仓库教学大纲

一、课程概况

英文名:Data Mining and Data Warehouse

开课单位:计算机学院

课程编码:203086

学分学时:学分,学时32(含实验10)

授课对象:

先修课程:数据库

课程目的和主要内容:

通过本课程的学习,学生应能理解数据库技术的发展为何导致需要数据挖掘,以及数据

挖掘潜在应用的重要性;掌握数据仓库和多维数据结构,OLAP(联机分析处理)的实现以及数据仓库与数据挖掘的关系;熟悉数据挖掘之前的数据预处理技术;了解定义数据挖掘任务说明的数据挖掘原语;掌握数据挖掘技术的基本算法,为将来从事数据仓库的规划和实施以及数据挖掘技术的研究工作打下一定的基础。

主要内容包括数据仓库和数据挖掘的基本知识;数据清理、数据集成和变换、数据归约以及离散化和概念分层等数据预处理技术;DMQL数据挖掘查询语言;用于挖掘特征化和比较知识的面向属性的概化技术、用于挖掘关联规则知识的基本Apriori算法和它的变形、用于挖掘分类和预测知识的判定树分类算法和贝叶斯分类算法以及基于划分的聚类分析算法等;了解先进的数据库系统中的数据挖掘方法,以及对数据挖掘和数据仓库的实际应用问题展开讨论。

二、课程内容

第1章(2学时)引言

1.1(1学时)数据挖掘技术兴起与概念

1.2(1学时)数据挖掘功能及主要问题

第2章(2学时)数据仓库和数据挖掘的OLAP技术

2.1(1学时)数据仓库概念及与多维数据模型

2.2(1学时)数据立方体技术、联机分析处理与联机分析挖掘

第3章(2学时)数据预处理

3.1(1学时)预处理原因及数据清理

3.2(1学时)数据集成和变换、归约及离散化和概念分层

第4章(4学时)概念描述:特征化和比较

4.1(2学时)概念描述概念和面向属性的归纳算法

4.2(2学时)面向属性归纳的有效实现及解析特征化

第5章(4学时)挖掘大型数据库中的关联规则

5.1(2学时)关联规则挖掘概念和基本Apriori算法

5.2(1学时)Apriori算法的变形算法

5.3(1学时)关联分析和相关分析

第6章(4学时)分类和预测

6.1(2学时)分类和预测概念及判定树归纳算法

6.2(2学时)贝叶斯分类算法及预测方法

第7章(2学时)聚类分析

7.1(1学时)聚类分析概念和划分方法

7.2(1学时)孤立点分析

第8章(2学时)数据挖掘的应用和发展趋势

8.1(1学时)复杂类型数据的挖掘介绍

8.2(1学时)应用和发展介绍

三、实践环节(详见实验教学大纲)

该课程配合理论教学开设了如下实验。共20学时,每个实验4学时。

1、数据仓库的建立;

2、多维数据集分析

3、数据挖掘实践

4、编程实现演示Apriori算法

5、编程实现演示决策树算法

在实验教学中,主要安排两个方面的实践环节,一是进一步巩固和加深理论教学的原理性实验;二是应用方面的实验。通过实践性教学,使学生加深了对理论知识的理解,有效地提高了学生的动手能力,独立分析问题、解决问题能力,协调能力和创造性思维能力。四、学时分配(小四号粗宋体)

五、附录

参考教材:

《数据挖掘概念与技术》,机械工业出版社,JiaWei Han,Micheline Kamber著,范明等译参考和阅读书目:

《Data Mining: Concepts and Techniques》Jiawei Han and Micheline Kamber, Morgan Kaufmann, 2000

《机器学习》,T om Mitchell著,曾华军等译

《SQLServer2000数据挖掘技术指南》,机械工业出版社,Claude Seidman著,刘艺等译

数据挖掘与数据仓库实验大纲

一、实验概况

实验学时:10学时

实验指导书名称:自设计

实验类型:设计性

实验目的和主要内容:通过实验来对所学的程序设计语法点的理论知识加以验证,进一步加深理论知识的理解,为今后从事数据仓库与数据挖掘技术的研究以及数据挖掘应用程序的开发打下必要的基础。主要内容包括熟悉与掌握Analysis Service数据挖掘产品的体系结构与编程接口,掌握Apriori算法、决策树算法以及贝叶斯分类算法及实现。

制定者:江南审校者:批准者:

二、实验项目、要求及安排方式

相关文档
最新文档