《数据挖掘》教学大纲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

河北经贸大学课程水平认定

《数据挖掘》学习大纲

一、学习性质

《数据挖掘》是大数据背景下现代统计数据分析不可缺少的重要工具。通过本课程的学习,培养学生的数据分析技能,熟悉和掌握大数据信息提取与结果分析,培养适应社会数据分析岗位需求的专业人才。

二、学习目的

本课程目的主要是让学生在学习期间掌握数据挖掘理论以及如何用数据挖掘来解决实际问题,了解某个数据挖掘解决方案对特定问题是否切实可行,学习知识发现的过程,利用基本的统计和非统计技术评估数据挖掘对话的结果等。

三、学习要求

重点掌握几种数据挖掘策略及每种策略的适用时机;如何通过几种数据挖掘技术建立模型来解决问题。

四、课程内容与学时分配

五、课程考核和成绩评定

课程考核为闭卷考试。

成绩评定:考试成绩实行百分制,其中基础知识测试题的分值掌握在40分左右;综合能力测试题的分值掌握在60分左右。60分为及格。

六、推荐教材和学习参考书

七、学习具体内容

第一章引言

一、基本要求

要求学生重点了解当今世界上流行数据挖掘技术的应用范围和流程,对数据挖掘有一个总体的认识;重点掌握Clementine基本功能和操作;海量数据的选择,会正确解释软件处理的结果,尤其掌握样本信息的解释。

二、授课方法

自学。

三、学习内容

(一)什么激发了数据挖掘以及它的重要性

(二)数据挖掘定义

(三)在何种数据上进行数据挖掘

1、关系数据库

2、数据仓库

3、事务数据库

4、高级数据库系统和高级数据库应用

(四)数据挖掘功能——可以挖掘什么类型的模式

1、关联分析

2、分类和预测

3、聚类分析

4、孤立点分析

5、演变分析

(五)数据挖掘软件Clementine的基本功能和操作

四、重点难点

数据挖掘的概念和基本功能

五、思考与讨论

1、什么是数据挖掘?

2、数据挖掘的对象是什么?

3、数据挖掘的主要功能有哪些?

4、Clementine的基本功能和操作。

第二章数据预处理

一、基本要求

要求学生重点掌握数据预处理的用途,能正确解释软件处理的结果,尤其是样本信息的解释;同时要求学生阅读一定数量的文献资料,加深理解如何对数据集进行合理的数据预处理。

二、授课方法

自学。

三、学习内容

(一)数据预处理的原因

(二)数据集成和变换

1、数据集成

2、数据变换

(三)缺失值处理的方法

1、处理带有缺失值的记录

2、处理带有缺失值的字段

3、归因或填充缺失值

4、用于缺失值的CLEM 函数

四、重点难点

数据集中缺失值的处理方法及Clementine软件实现。

五、思考与讨论

1、为什么进行数据预处理?

2、数据预处理的主要方法和适用范围是什么?

第三章分类和预测

一、基本要求

要求学生理解分类、预测的各种建模方法的基本思想,掌握分类、预测建模方法的软件实现,了解分类、预测方法的基本应用。

二、授课方法

自学。

三、学习内容

(一)什么是分类,什么是预测

(二)分类预测:决策树

1、决策树的基本思想

2、C5.0算法及软件实现

3、决策树的案例及分析

(三)分类预测:神经网络

1、神经网络的基本思想

2、神经网络的软件实现

3、神经网络的案例及分析

(四)预测

1、线性回归和多元回归

2、非线性回归

3、其他回归模型

(五)分类预测的准确性

1、评估分类法的准确率

2、提高分类法的准确率

3、准确率足够判定分类法吗

四、重点难点

分类、预测的各种建模方法、软件实现及应用

五、思考与讨论

1、分类预测的作用和基本思想是什么?

2、决策树的基本思想和软件实现。

3、神经网络的基本思想和软件实现。

4、分类预测模型的评估。

第四章复杂类型数据的挖掘一、基本要求

要求学生对复杂类型数据的挖掘方法有一个概括的认识,理解并掌握时间序列数据挖掘模型的构建方法及应用。

二、授课方法

自学。

三、学习内容

(一)复杂数据对象的多维分析和描述性挖掘

1、结构化数据的概化

2、空间和多媒体数据概化中的聚集和近似计算

3、对象标识符和类

4、类复合层次的概化

5、对象立方体的构造与挖掘

6、用分而治之方法对规则数据库进行基于概化的挖掘

(二)空间数据库挖掘

1、空间数据立方体构造和空间OLAP

2、空间关联分析

3、空间聚类方法

4、空间分类和空间趋势分析

5、光栅数据库挖掘

(三)时序数据和序列数据的挖掘

1、趋势分析

2、时序分析中的相似搜索

3、序列模式挖掘

4、周期分析

四、重点难点

时间序列数据挖掘模型的构建方法及应用

五、思考与讨论

1、什么是复杂类型数据?

2、复杂类型数据的数据挖掘模型主要有哪些?

3、时间序列数据挖掘模型的构建方法及软件实现。

相关文档
最新文档