数据挖掘数据挖掘实验教学大纲

合集下载

数据挖掘 教学大纲

数据挖掘 教学大纲

数据挖掘教学大纲数据挖掘教学大纲引言:数据挖掘作为一门应用于从大量数据中发现模式、规律和知识的技术,已经在各个领域得到广泛应用。

为了培养学生在这个领域的专业能力,制定一份完善的数据挖掘教学大纲是至关重要的。

本文将探讨数据挖掘教学大纲的设计和内容,以及培养学生的核心能力。

一、课程目标和背景数据挖掘教学的目标是培养学生具备深入理解数据挖掘原理和方法的能力,能够独立进行数据挖掘项目的设计、实施和评估。

此外,还要培养学生的数据分析和解决实际问题的能力,以及良好的团队合作和沟通能力。

二、课程内容1. 数据挖掘概述介绍数据挖掘的定义、发展历程、应用领域以及数据挖掘过程的基本步骤。

同时,引导学生了解数据挖掘的重要性和应用前景。

2. 数据预处理讲解数据预处理的目的和方法,包括数据清洗、数据集成、数据转换和数据规约。

通过实际案例,让学生了解如何处理现实中的脏数据和缺失数据。

3. 数据挖掘算法介绍常见的数据挖掘算法,包括分类、聚类、关联规则和异常检测。

详细讲解每种算法的原理、应用场景和实现方法,并通过实例演示学生如何选择合适的算法解决实际问题。

4. 特征选择和降维讲解特征选择和降维的概念和方法,以及它们在数据挖掘中的作用。

通过实践项目,引导学生掌握特征选择和降维技术的应用。

5. 模型评估和优化介绍模型评估的指标和方法,以及如何通过交叉验证和网格搜索等技术对模型进行优化。

培养学生对模型性能评估和调优的能力。

6. 数据可视化讲解数据可视化的原理和方法,引导学生学会使用可视化工具展示数据挖掘结果。

通过实践项目,培养学生的数据分析和表达能力。

三、教学方法1. 理论讲授与案例分析相结合通过理论讲授,学生可以了解数据挖掘的基本概念和方法;通过案例分析,学生可以将理论知识应用到实际问题中,提高解决问题的能力。

2. 实践项目与团队合作设计实践项目,让学生在实际情境中应用数据挖掘技术解决问题。

通过团队合作,培养学生的团队协作和沟通能力。

数据挖掘教学大纲(本科)

数据挖掘教学大纲(本科)

数据挖掘教学大纲一、基本信息英文名称:Data Mining课程编号:063211505课程类别:专业课课程性质:选修课学时:32 (理论学时:32)学分:2适用对象:软件工程专业先修课程:数据库、Java程序设计开课单位:计算机学院使用教材:[1] 王振武. 数据挖掘算法原理与实现. 北京:清华大学出版社,2017.主要参考书:[1] Jiawei Han. 数据挖掘概念与技术. 机械工业出版社2015[2] 林字. 数据仓库原理与实践. 北京:人民邮电出版社,2003二、教学目标《数据挖掘》是软件工程专业的一门具有重要工程价值的前沿专业课程,是人工智能研究方向的一个重要分支。

旨在让学生掌握大数据分析的常用方法,培养他们通过合适的数据分析方法,获取隐藏在数据深层次内部不易被察觉的某些数据之间关系的能力。

本课程的教学目的是使学生了解数据挖掘的基本概念和基础知识;掌握应用数据挖掘的基本原理、技术和方法;具备熟练使用数据挖掘方法进行问题分析和程序设计的能力;具备不同数据挖掘方法的性能评估能力;能够应用成熟的数据挖掘技术解决实际工程问题。

课程目标及能力要求具体如下:课程目标1:了解数据挖掘的基本概念以及其各种数据挖掘算法的基本原理;掌握常用的数据挖掘算法特点和使用场景;能够运用数据挖掘方法分析复杂软件工程问题,并建立解决问题的基本思路和方案。

课程目标2:能够使用数据挖掘的基本方法进行具体工程问题解决方案的分析;使用数据挖掘常用算法进行方案的实验设计,验证方案的可行性。

三、课程内容、教学要求及评价方式1.课程内容、要求与评价方式通过指导学生学习与课程目标相对应的课程内容,实现课程目标的达成。

评价方式包括:课后作业、专题、期末考试。

各课程目标的教学方式与评价方式详见表2。

授课方式:(1)讲授;(2)实验;(3)上机;(4)现场演示评价方式:(1)课后作业:包括学习、作业、纸质作业、电子作业等;(2)课堂测验:包括纸质、上机两种;(3)专题:包括报告、硬件设计、程序设计、算法设计、方案设计等;(4)期中考试:包括试卷、上机;(5)实验:有实验报告、实验过程考核(实践操作、原理提问)、实验结果;(6)期末考试:包括试卷、上机。

《数据挖掘》课程教学大纲

《数据挖掘》课程教学大纲

《数据挖掘》课程教学⼤纲《数据挖掘》课程教学⼤纲⼀、《数据挖掘》课程说明(⼀)课程代码:14132007(⼆)课程英⽂名称:Data Mining(三)开课对象:计算机与信息管理及其相关专业(四)课程性质:数据挖掘是信息与计算科学专业的专业课程,本课程以数据挖掘为主要内容,讲述实现数据挖掘的各主要功能、挖掘算法和应⽤,并通过对实际数据的分析更加深⼊地理解常⽤的数据挖掘模型。

掌握⼤型数据挖掘软件SAS Enterprise Miner的使⽤,培养学⽣数据分析和处理的能⼒。

先修课程:《数据库原理》、《概率论与数理统计》、《SAS软件基础》。

(五)教学⽬的:通过《数据挖掘》课程的教学,使学⽣理解数据挖掘的基本概念和⽅法,学习和掌握SAS Enterprise Miner中的数据挖掘⽅法。

学⽣能够借助SAS Enterprise Miner软件⼯具进⾏具体数据的挖掘分析。

(六)教学内容:本课程主要学习的内容包括数据预处理、分类与预测、聚类分析等内容。

(七)教学时数课程学时:48学分:3(⼋)教学⽅式以多媒体教学⼿段为主要形式的课堂教学(九)考核⽅式和成绩记载说明考核⽅式笔试加上机⼤作业,严格考核学⽣出勤情况,达到学籍管理规定的旷课量取消考试资格。

综合成绩根据平时成绩和期末成绩评定,平时成绩占40% ,期末成绩占60% 。

⼆、讲授⼤纲与各章的基本要求第⼀章数据挖掘导论教学要点:1、熟悉数据挖掘的基本概念和功能2、了解数据挖掘的系统分类教学时数:8学时教学内容:第⼀节数据挖掘发展概述2、基本应⽤概述第⼆节数据挖掘功能1、概念描述:定性与对⽐2、关联分析3、分类与预测4、聚类分析5、异类分析6、演化分析第三节数据挖掘系统1、系统分类2、系统应⽤3、数据挖掘在医学信息系统和社会保险领域的应⽤考核要求:1、数据挖掘发展概述1.1功能和基本应⽤概述(识记)2、数据挖掘功能2.1概念描述(识记)2.2关联分析(领会)2.3分类与预测 (领会)2.4聚类分析 (领会)2.5异类分析 (领会)2.6演化分析 (领会)3、数据挖掘系统(应⽤)第⼆章数据预处理教学要点:1.了解数据预处理的重要性2.熟悉数据预处理的⽅法教学时数:6学时教学内容:第⼀节数据清洗1、噪声数据处理2、不⼀致数据处理第⼆节数据集成与转换1、数据集成处理2、数据转换处理1、数据清洗1.1噪声数据处理(领会)1.2不⼀致数据处理(领会)2、数据集成与转换2.1数据集成处理(应⽤)2.2数据转换处理(应⽤)第三章分类与预测教学要点:1、掌握分类与预测基本知识2、了解各项分类和预测⽅法教学时数:12学时教学内容:第⼀节分类与预测基本知识1、分类基础2、预测基础第⼆节基于决策树的分类第三节贝叶斯分类第四节神经⽹络分类第五节预测⽅法1、线性与多变量回归2、⾮线性回归3、其他回归模型考核要求:1、分类与预测基本知识1.1分类基础(识记)1.2预测基础(识记)2、基于决策树的分类(领会)3、贝叶斯分类(领会)4、神经⽹络分类(领会)5、预测⽅法5.1线性与多变量回归(领会)5.2⾮线性回归(领会)5.3其他回归模型(领会)第四章聚类分析教学要点:1、掌握聚类分析基本概念2、了解聚类分析基本⽅法教学时数:12学时教学内容:1、基础知识2、聚类分析⽅法:K-MEANS算法等考核要求:1、基础知识(识记)2、聚类分析⽅法:K-MEANS算法等(应⽤)三、推荐教材和参考书⽬:1、《数据挖掘原理与技术》,张云涛、龚玲著,电⼦⼯业出版社,20042、《数据仓库与数据挖掘技术》,陈京民编著,电⼦⼯业出版社,20023、《数据挖掘与OLAP理论与实务》,林杰斌主编,清华⼤学出版社,2003.14、《数据挖掘》,朱明编著,中国科学技术⼤学出版社,2002.25、《数据挖掘教程》, Richard J. Roiger, Michael W. Geatz 著,翁敬农译,清华⼤学出版社,20036、《数据挖掘原理》,David Hand, Heikki Mannila, Padhraic Smyth著,张银奎、廖丽、宋俊等译,机械⼯业出版社,2003。

数据挖掘教学大纲

数据挖掘教学大纲

数据挖掘教学大纲引言概述:数据挖掘是一门涉及数据分析和模式识别的学科,它通过挖掘数据中的隐藏模式和关联性,帮助我们从大量的数据中提取有价值的信息。

因此,设计一份合理的数据挖掘教学大纲是非常重要的。

本文将从五个大点出发,详细阐述数据挖掘教学大纲的内容。

正文内容:1. 数据挖掘基础知识1.1 数据挖掘概述:介绍数据挖掘的定义、目标和应用领域。

1.2 数据挖掘过程:详细阐述数据挖掘的步骤和流程,包括数据预处理、特征选择、模型建立和评估等。

1.3 数据挖掘算法:介绍常用的数据挖掘算法,如分类、聚类、关联规则等,并分析它们的原理和适用场景。

2. 数据预处理2.1 数据清洗:讲解如何处理缺失值、异常值和重复值等数据问题。

2.2 数据集成:介绍如何将来自不同数据源的数据整合到一个数据集中。

2.3 数据变换:讲解如何对数据进行规范化、离散化和归一化等处理。

2.4 特征选择:详细介绍如何选择对数据挖掘任务有用的特征。

3. 数据挖掘算法3.1 分类算法:介绍常用的分类算法,如决策树、朴素贝叶斯和支持向量机等,并分析它们的原理和应用场景。

3.2 聚类算法:讲解聚类算法的原理和常用方法,如K-means和层次聚类等。

3.3 关联规则挖掘:详细介绍关联规则挖掘的原理和算法,如Apriori和FP-Growth等。

3.4 预测算法:介绍常用的预测算法,如线性回归和时间序列分析等。

4. 模型评估与选择4.1 模型评估指标:讲解常用的模型评估指标,如准确率、召回率和F1值等。

4.2 交叉验证:介绍交叉验证的原理和方法,如K折交叉验证和留一法等。

4.3 模型选择:详细阐述如何选择适合的模型,包括根据数据特点和任务需求进行选择。

5. 数据挖掘应用5.1 金融领域:介绍数据挖掘在风险评估、信用评分和欺诈检测等方面的应用。

5.2 健康领域:讲解数据挖掘在疾病预测、医疗决策和基因分析等方面的应用。

5.3 社交媒体:详细阐述数据挖掘在用户推荐、情感分析和舆情监测等方面的应用。

《数据挖掘》教学大纲

《数据挖掘》教学大纲

《数据挖掘》教学大纲一、课程的性质、目的与任务数据挖掘是综合了机器学习、统计和数据库的一门现代计算机技术,旨在发现海量数据中的模型与模式,具有巨大的应用前景。

在很多重要的领域,数据挖掘都发挥着积极的作用。

因此这门课程是计算机专业及相关专业的重要课程之一。

《数据挖掘》课程是计科专业与软工专业的专业任选课程,通过本课程的学习使学生掌握数据挖掘的基本概念,了解数据挖掘的定义和功能以及实现数据挖掘的主要步骤和具体实现方法,初步掌握数据挖掘的算法。

使同学们在学习本课程后,能实现简单的数据挖掘算法编程,了解实现数据挖掘的具体操作。

通过本课程的学习,要求学生达到:1.了解数据挖掘技术的整体概貌2.了解数据挖掘技术的主要应用及当前的研究热点问题和发展方向3.掌握最基本的概念、算法原理和技术方法二、课程教学基本内容与要求第一章引言(一)基本教学内容1.1什么激发了数据挖掘,为什么它是重要的1.2什么是数据挖掘1.3对何种数据进行挖掘1.4数据挖掘功能——可以挖掘什么类型的模式1.5所有模式都是有趣的吗1.6数据挖掘系统的分类1.9数据挖掘的主要问题(二)基本要求教学目的:掌握数据挖掘的基本概念、理解数据挖掘的形成与发展过程、了解数据挖掘的数据对象、了解数据挖掘所具有的功能。

教学重点:重点讲解数据挖掘的功能教学难点:数据挖掘功能第二章数据预处理(一)基本教学内容2.1 为什么要预处理数据2.2 描述性数据汇总2.3 数据清理2.4 数据集成和变换2.5 数据归约2.6 数据离散化和概念分层产生(二)基本要求教学目的:了解数据预处理的原因,掌握数据预处理的方法。

教学重点:数据清理、数据集成和变换、数据归约、数据离散化和概念分层教学难点:数据归约、数据离散化和概念分层第三章数据仓库与OLAP技术概述(一)基本教学内容3.1 什么是数据仓库3.2 多维数据模型3.3 数据仓库的系统结构3.4 数据仓库实现3.5 从数据仓库到数据挖掘(二)基本要求教学目的:理解数据仓库的概念,了解数据仓库的多维数据模型,理解数据仓库的系统结构,掌握数据立方体的有效计算。

《课程_数据挖掘》课程教学大纲

《课程_数据挖掘》课程教学大纲

数据挖掘DataMining一、课程基本信息学时:32(含实验20学时)学分,2考核方式:考查中文简介:《数据挖掘》是统计学专业的专业选修课。

从数据分析的角度看,统计学主要是通过机器学习来实现数据挖掘,大多数数据挖掘技术都源自机器学习领域,机器学习算法和数据库原理是数据挖掘的两大支撑技术。

本课程的学习目的在于使学生掌握数据挖掘的基本概念、基本原理,常用的机器学习算法与数据分析方法,以及它们在工程实践中的应用。

为从事数据挖掘、数据分析工作和实践打下必要的基础。

二、教学目的与要求数据挖掘作为统计学专业的一门专业选修课,其前续课程有《概率论与数理统计》、《经济预测与决策》、《数据库管理系统》和《统计软件应用》等。

本课程的教学目的在于使学生掌握对数据进行分析和软件应用的能力,培养学生分析数据、获取知识的基本能力。

重点掌握以下几个方面的知识:(1)数据挖掘基础知识;(2)分类、预测与回归;(3)聚类分析;(4)关联技术;(5)离群点挖掘;(6)数据挖掘的扩展与应用。

三、教学方法与手段1、教学方法数据挖掘理论性较强,涉及较强的理论知识及数学知识,是本专业的具有广阔应用前景的理论课程。

在课程的教学过程中,根据教学内容的不同,综合采用多种的教学方法,着重培养学生定性分析、定量估算和模拟实验研究的能力,以更好地完成教学任务。

(1)课堂讲授:在课堂讲学的内容方面既要保持理论的系统性,又要注意联系实际社会生产问题,同时将大问题分成几个小问题进行讲解,然后再把小问题组装成大问题让学生更好理解。

(2)编程教学:讲授过程中,对于某些算法,老师通过课堂软件操作进行详细讲解,让学生更好的理解和掌握相关技术。

(3)课堂讨论:可以对学生分组进行组内讨论,由于与数据挖掘竞赛息息相关,可以以2〜3位学生一组,通过组内队员分析与讲解,提高学生的学习与理解能力,同时培养学生的团队协作能力。

(4)启发式教学:在教学过程中以学生为中心进行引导,教师与学生进行互动探讨。

数据挖掘教学大纲

数据挖掘教学大纲

数据挖掘教学大纲标题:数据挖掘教学大纲引言概述:数据挖掘作为一门重要的数据分析技术,已经在各个领域得到广泛应用。

为了培养学生对数据挖掘的理解和应用能力,制定一份完善的数据挖掘教学大纲是非常必要的。

本文将从数据挖掘教学的基本概念、数据挖掘算法、数据预处理、模型评估和应用案例等方面进行详细介绍。

一、数据挖掘教学的基本概念1.1 数据挖掘的定义和作用数据挖掘是指从大量数据中发现实用信息和知识的过程,其作用在于匡助人们更好地理解数据,并从中获取有价值的信息。

1.2 数据挖掘的基本任务数据挖掘的基本任务包括分类、聚类、关联规则挖掘、异常检测等,通过这些任务可以实现对数据的分析和挖掘。

1.3 数据挖掘的应用领域数据挖掘技术已经在金融、医疗、电商等领域得到广泛应用,匡助企业做出更准确的决策和预测。

二、数据挖掘算法2.1 常见的数据挖掘算法常见的数据挖掘算法包括决策树、朴素贝叶斯、支持向量机、神经网络等,每种算法都有其适合的场景和特点。

2.2 算法的原理和实现数据挖掘算法的原理是通过对数据进行建模和训练,从而得到预测模型,然后对新数据进行预测和分类。

2.3 算法的优化和改进为了提高数据挖掘算法的效果和准确性,研究者们向来在不断地优化和改进算法,使其更适合于实际应用场景。

三、数据预处理3.1 数据清洗数据清洗是数据挖掘的第一步,包括缺失值处理、异常值处理、重复值处理等,保证数据的质量和完整性。

3.2 数据集成数据集成是将多个数据源的数据整合在一起,消除数据的冗余和冲突,为后续的数据挖掘分析做准备。

3.3 特征选择特征选择是选择对建模和预测实用的特征,去除无关特征和噪声,提高模型的准确性和泛化能力。

四、模型评估4.1 模型评估指标模型评估指标包括准确率、召回率、F1值等,用于评估模型的性能和效果。

4.2 交叉验证交叉验证是一种常用的模型评估方法,通过将数据集分为训练集和测试集,多次训练和测试模型,得到更准确的评估结果。

大数据分析与挖掘教学大纲

大数据分析与挖掘教学大纲

大数据分析与挖掘教学大纲一、课程简介1.1课程名称:大数据分析与挖掘1.2学时数:36学时1.3课程类型:专业选修课1.4先修课程:数据结构、计算机网络、数据库技术等1.5授课教材:《大数据分析与挖掘》(第三版)二、课程目标2.1理论目标:(1)了解大数据分析与挖掘的基本概念和原理;(2)掌握大数据分析与挖掘的基本方法和技术;(3)了解大数据分析与挖掘在实际应用中的特点和挑战。

2.2技能目标:(1)能够使用常见的大数据分析工具和软件进行数据挖掘;(2)能够分析大数据中的模式和趋势,并做出合理的预测和决策;(3)能够根据实际问题,设计并实施大数据分析和挖掘流程。

三、教学内容3.1数据挖掘概述(1)数据挖掘的定义与关键任务;(2)数据挖掘的过程与方法。

3.2数据预处理(1)数据清洗的概念与方法;(2)数据集成与变换的技术;(3)数据规约与选择的策略。

3.3数据挖掘模型与算法(1)分类与回归算法;(2)聚类算法;(3)关联规则挖掘算法;(4)时序模式挖掘算法。

3.4大数据分析与挖掘工具(1)Hadoop平台的基本原理与使用;(2)Spark平台的基本原理与使用;(3)Python和R语言在大数据分析与挖掘中的应用。

3.5大数据分析与挖掘的应用(1)电子商务领域的用户行为分析;(2)社交媒体数据的情感分析;(3)金融领域的风险预测与仿真;(4)医疗领域的疾病诊断与预测。

四、教学方法4.1理论课程采用传统讲授和案例分析相结合的方式进行。

4.2实验课程设置针对性的实际数据集进行分析和挖掘。

五、教学评价5.1平时成绩占总评成绩的40%,主要包括作业和小组项目。

5.2期末考试占总评成绩的60%。

六、参考资料6.1教材:《大数据分析与挖掘》(第三版),张三等著,清华大学出版社。

6.2参考书:《数据挖掘:方法与应用》,李四著,机械工业出版社。

6.3最新的相关学术论文和研究报告。

以上为大数据分析与挖掘教学大纲的初步设计,具体的教学内容和评价方法还需要根据实际情况进行调整和完善。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

集团标准化工作小组[Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]《数据挖掘》教学大纲课程类别:专业任选修课程挖掘开课单位:理学院课程名称:数据课程编号:B03081904总学时: 40 学分: 4合用专业:统计学专业先修课程:概率论、数理统计、多元统计分析等一、课程在教学计划中地位、作用数据挖掘是 20 世纪末刚刚兴起的数据智能分析技术,由于有广阔的应用前景而备受重视。

数据挖掘作为一门新兴的学科,在它的形成和发展过程中表现出了强大的生命力,泛博从事数据科学和统计科学的科研工作者和工程技术人员迫切需要了解和掌握它。

数据挖掘自产生以来就是以分析数据、理解数据的实际需求为推动力的,其研究发展也逐步渗透到工业、农业、医疗卫生和商业的实际需求之中。

数据挖掘涉及的内容较为广泛,已成为迅速发展并在信息社会中广泛应用的一门综合性学科。

数据挖掘已成为计算机、统计学专业的一门重要课程,也是从事相关研究和应用人员必须掌握的重要知识。

二、课程目标通过本课程的实验教学,使学生具备下列能力:(1)全面而深入地掌握数据挖掘的基本概念和原理,了解模型精度的评价方法。

(2)深入地掌握线性回归分析及模型的改进与评价,掌握各种分类方法以及对其进行比较。

能够对实际数据进行分类模型的建立,具有比较各方法的能力。

(3)通过学习关联分析、社交网络分析以及文本挖掘,能够对实际数据进行处理、分析,并建立解释合理的统计模型。

三、课程内容及基本要求第一章1、理解和掌握数据挖掘的基本概念、数据挖掘过程以及数据挖掘功能;2、了解数据挖掘的应用和面临的问题;3、对数据挖掘能够解决的问题和解决问题思路有清晰的认识。

1、了解数据的导入与导出;2、了解单变量数据的探索方法;3、了解多变量数据的探索方法;4、掌握图表的意义以及数据的描述统计。

1、理解多元线性回归模型的确定方法以及模型的检验方法;2、理解基于树的回归分析方法;3、了解非线性回归方法。

1、了解分类及预测的基本思想、概念和意义;2、掌握逻辑斯蒂回归,掌握线性判别分析,了解非线性判别分析;3、了解分类方法的比较。

1、了解聚类分析的基本思想、概念和意义;2、掌握相似度(或者相异度)的常用度量方法;3、掌握常用的聚类算法,包括 K-Means、SOM 、BIRCH、DBSCAN、STING;4、了解孤立点分析的三类方法;了解其它方法的内容;了解聚类分析的研究动态。

1、了解关联规则的基本思想、概念和意义;2、了解关联规则挖掘的应用背景;3、掌握常用的关联规则算法,包括 Apriori、GRI、Sequence Detection;4、了解关联规则挖掘的研究动态。

1、了解文本挖掘的基本思想、概念和意义;2、掌握常用的文本挖掘的软件包,了解分词方法,掌握词项-文档矩阵的建立方法。

3、能够进行词频统计分析以及词项聚类;3、能够利用文本挖掘工具对实际文本数据进行建模分析。

1、了解社交网络分析的基本思想、概念和意义;2、了解社交网络分析的应用背景;3、掌握社交网络分析方法。

1、了解数据挖掘课程所学内容,能够利用所学统计模型建立合适的回归方程;2、了解关联规则和社交网络分析在商品销售中应用;四、学时分配五、课程目标达成评价的途径和措施本课程通过“平时成绩”、“综合数据分析答辩成绩”两种方式对课程目标达成进行评价,考核成绩计算公式如下(本大纲中成绩均采用百分制):考核成绩 = 平时成绩 30% +综合数据分析答辩成绩 70%平时成绩 = 出勤成绩1.平时成绩平时成绩给定方法如下表所示:最高分 100 分计。

2、综合数据处理答辩成绩综合数据处理答辩成绩给定方法如下表所示:在课堂上能积极主动回答问题,并回答正确者每次加 10 分;能积极主动回答问题,但有缺陷者每次加 5 分,该成绩加入平时成绩中。

如平时成绩超过 100 分者,按综合数据处理答辩情况统计描述恰当、图表使用正确、统计方法正确,结论合理,检验有效统计描述和图表解释不详,统计模型正确,结论合理,检验有效成绩90-10080-89序号12出勤次数 20191817161514小于等于 13成绩10090-9580-8570-7560-6550-5540-45序号1 2 3 4 5 6 7 4 章节名称第一章数据挖掘概述第二章数据探索第三章回归分析第四章分类第五章聚类分析第六章关联规则第七章文本挖掘第八章社交网络分析第九章综合案例分析合计讲授(学时)22844464640实验(学时)小计22844464640统计描述恰当,图表合用正确,模型合理,结论合理,缺失模 型检验数据处理恰当,统计模型正确,结论较为合理,缺失模型检验 数据处理有错误,建立统计模型,结论没有有效分析 数据处理有错误,模型建立不合理译). R 语言与数据挖掘 最佳实践和经典案例. 机械工业出版社2. Luis Torgo (李洪成、陈道轮 吴立明译) . 数据挖掘与 R 语言. 机械工业出版 社3. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani( 王星译). 统计学习导论 基于 R 应用. 机械工业出版社 《数据挖掘实验》教学大纲实验类别:专业教育课程 实验学时: 24实验室名称:大学数学实验室 合用专业:统计学专业计一、实验在教学计划中地位、作用所属课程名称:数据挖掘实验 所属课程编码: B03081904S实验室类别:基础实验室教学中心 先修课程:多元统计、概率论、数理统本课程是统计学专业的专业教育实验课之一,是具有实际操作性和广阔应用前景的 专业实验课。

该课程要求学生掌握一种统计语言,通过编写程序,处理解决回归、分 类、聚类、社交网络、关联分析、文本挖掘等数据问题。

通过该课程的学习,使学生更 深刻地认识数据挖掘各模块的实际应用背景,处理方法,可以提高观察、解决问题、科 学思维以及从事科学研究的能力,养成严谨科学的作风和良好的实验习惯,为后续课程 的学习奠定必要的基础。

二、课程目标通过本课程的实验教学,学生应具备下列能力:1. 能够导入、输出各种类型的数据,并对数据进行简单描述统计2. 能够编写建立线性回归模型、非线性回归模型、树回归模型的程序,并能够通过 程序检验模型。

3. 能够对数据进行聚类分析、分类分析、关联分析、社交网络分析,并能够对文本 数据进行数据挖掘。

三、实验内容及基本要求六、主要参考书1. Yanchang Zhao (陈健 黄琰70-7960-69 31-59 0-3034 5 6实验一数据的输入与导出1.掌握 EXCEL 数据、 SAS 数据、 SPSS 数据、文本数据等数据类型的输入2.掌握其它从外部获取数据源的方法3.掌握对数据进行统计描述4.掌握 R 数据的导出方法,以及熟悉 R 语言的常用统计命令实验二多元线性回归分析1.了解多元线性回归模型的命令,能够解释回归模型的系数2. 掌握残差分析的方法3.了解 Vif、updata、fit、predict 等命令实验三局部多项式回归1.了解局部多项式回归的应用条件,使用背景2.掌握利用 lm 命令进行局部多项式回归3. 掌握局部多项式回归的评价方法实验四决策树回归1.了解决策树的基本原理2.掌握 tree、randomForest、gbm、Importance 等命令的使用方法3.能够利用决策树理论分析离线数据的回归问题实验五分类分析1.理解 Logistics 回归在二分类中的应用2.掌握 Logistics 回归命令 glm、线性判别命令 lda、二次判别命令 qda,以及其它的用于分类判别的 R 命令3.了解各种判别方法的比较方法实验六聚类分析1.了解聚类分析的基本思想2.掌握聚类分析的几种算法, K-means, k-medoids,系统聚类分,密度聚类法等,掌握 R 语言命令: Kmeans,hclust,cutree,pamk,dbscan 等命令3.能够利用各种聚类方法对实际数据 iries 进行聚类分析实验七关联分析1.了解关联规则的基本概念置信度、可信度、提升度,掌握关联规则的冗余消除方法。

2.掌握 apriori 算法,能够利用 arules 包对数据 Titanic 进行关联分析,挖掘出有效的关联规则。

3.了解 arulesviz 包的使用,能够对经过冗余处理和裁剪的关联规则进行可视化处理实验八文本挖掘1、了解文本挖掘的常用的 R 包 tm、jiebaR 等,并掌握它们的安装方法2. 掌握文本数据语料库的建立命令 Corpus,语料库的处理命令 tm_map;3、掌握分词命令,建立词项-文档矩阵。

4、能够进行词频统计分析以及词项聚类;5、利用词云命令 Wordcloud 画出词云,找出关键词。

实验九社交网络分析1、了解处理社交网络的常用 R 包 igraph;2、掌握社交网络中节点,中心点,社区的概念;3、掌握 igraph 包命令, simplify, V, degree,plot 的使用。

实验十综合案例分析 1 综合分析个案观察数据1、了解个案观测数据的变量分布特点,掌握描述统计方法;2、掌握建立回归方程的方法,比较各回归方程的优缺点;3、掌握模型检验的方法实验十一综合案例分析 2 综合分析大型超市零售记录数据1、了解大型超市零售记录数据的特点,进行描述统计2、掌握建立关联规则的方法和进行社交网络分析的方法四、学时分配实验项目名称实验性质实验(学时) 实验一数据的输入与导出验证性2实验二多元线性回归分析验证性2实验三局部多项式回归验证性2实验四决策树回归验证性2实验五分类分析验证性2实验六聚类分析验证性2实验七关联分析验证性2实验八文本挖掘综合性4实验九社交网络分析验证性2实验十综合案例分析 1 综合分析个案观测数据综合性 2实验十一综合案例分析 2 综合分析大型超市零售记录数据综合性 2五、课程目标达成评价的途径和措施本课程中每次实验均是考核内容,考核成绩将是每次实验成绩的均值。

每次实验成绩分为“平时成绩”、“实验报告成绩”两部份进行评价,考核成绩计 算公式如下(每次成绩采用百分制):考核成绩 = 平时成绩 30% + 实验报告成绩 70%平时成绩 = 出勤成绩1.平时成绩平时成绩给定方法如下表所示:最高分 100 分计。

在课堂上能积极主动回答问 题,并回答正确者每次加 10 分;能积极主动回答问题,但有缺陷者 每次加 5 分,该成绩加入平时成绩 中。

如平时成绩超过 100 分者,按2. 实验报告成绩:取所有实验报告成绩的平均值。

每次实验报告成绩给定方法如下表所示:课程目标达成度表明熟练掌握了课程知识点表明掌握了课程知识点表明掌握了课程的大部份知识点,但对较难或者 易混和知识点掌握存在不足表明掌握了课程部份知识点,对相当一部份知 识点掌握存在不足课程学习态度不端正,没有掌握所学内容课程学习态度不端正,没有掌握所学内容实验报告完成情况实验报告全部完成,正确率为 100%,能够 用较简单的命令或者方法解答实验内容实验报告全部完成,正确率为 100%实验报告全部完成,正确率大于 85%实验报告全部完成,正确率小于 85%完成实验报告任务量大于 50%,小于 100% 完成实验报告任务量小于 50%,或者有明显 抄袭现象成绩90-10080-8970-7960-6931-590-30序号123456出勤次数 20 19 18 17 16 15 14小于等于 13成绩 100 90-95 80-85 70-75 60-65 50-55 40-45 0序号 1 2 3 4 5 6 7 4合计 24。

相关文档
最新文档