数据挖掘与数据仓库课程简介

合集下载

数据仓库和数据挖掘

数据仓库和数据挖掘

编号:数据仓库和数据挖掘(Data Warehouse & Data Mining)一、课内学时:32 学分:2二、适用专业:计算机软件与理论、计算机应用等。

三、预修课程:数据库四、教学目的:通过数据仓库和数据挖掘的有关基础知识介绍,使学生对其含义、作用及发展有所了解,为进一步做有关的研究打下基础。

五、大纲内容:第一章引言1.1 概述1.2 体系化环境的早期演化1.3 从数据库到数据仓库1.4 自然演化体系结构的问题1.5 方式的变迁第二章数据仓库原理2.1 数据仓库定义2.2 数据集市2.3 数据仓库体系结构2.4 数据组织结构和形式2.5 数据抽取E、转换T和装载L(ETL)2.6 元数据管理第三章联机分析处理OLAP3.1 概述3.2 OLAP定义和基本概念3.3 OLAP的数据模型3.4 多维数据分析3.5 OLAP的结构与分析工具第四章数据仓库开发与设计4.1 数据仓库开发应用过程4.2 数据仓库的规划4.3 数据仓库的分析与设计4.4 数据仓库的实施4.5 数据仓库技术与开发的困难第五章范例第六章数据挖掘概述6.1 数据挖掘定义6.2数据挖掘原由6.3数据挖掘软件的现状6.4数据挖掘应用第七章概念描述:特征化和比较7.1什么是概念描述7.2面向属性的归纳7.3挖掘类比较:区分不同的类第八章关联规则的挖掘8.1关联规则挖掘的含义8.2关联规则挖掘算法第九章分类和预测9.1分类、预测9.2决策(判定)树归纳9.3贝叶斯分类9.4其它的一些分类方法9.5预测9.6评估分类法的准确率第十章第十章聚类分析10.1聚类分析含义10.2聚类分析中的数据类型及转换10.3划分方法10.4层次方法六、时间分配七、考核:考核方式采用平时成绩和期末考试或平时成绩和实验成绩综合。

八、教材及参考书1、数据仓库(美) W.H.Inmon著机械工业出版社2、数据挖掘-概念与技术(加)Jiawei Han Micheline Kamber 机械工业出版社八、大纲撰写人:徐建九、任课教师:徐建。

数据仓库与数据挖掘教学大纲

数据仓库与数据挖掘教学大纲

数据仓库与数据挖掘教学大纲一、课程简介数据仓库与数据挖掘是现代信息技术领域的重要学科,它涉及到数据的收集、存储、处理和分析等方面。

本课程旨在介绍数据仓库和数据挖掘的基本概念、原理、方法和应用,培养学生在数据分析和决策支持方面的能力。

二、课程目标1. 理解数据仓库和数据挖掘的基本概念和原理;2. 掌握数据仓库的设计与建模方法;3. 熟悉数据挖掘的常用算法和技术;4. 能够运用数据仓库和数据挖掘技术解决实际问题。

三、教学内容1. 数据仓库的基本概念和架构- 数据仓库的定义和特点- 数据仓库的组成和架构- 数据仓库与传统数据库的区别2. 数据仓库的设计与建模- 数据仓库的需求分析和规划- 数据仓库的物理设计和逻辑设计- 数据仓库的维度建模和事实表设计3. 数据仓库的ETL过程- ETL的定义和作用- 数据抽取、转换和加载的方法和技术- ETL工具的使用和案例分析4. 数据挖掘的基本概念和任务- 数据挖掘的定义和分类- 数据挖掘的常用任务:分类、聚类、关联规则挖掘等 - 数据挖掘的应用领域和案例分析5. 数据挖掘的算法和技术- 决策树算法- 神经网络算法- 支持向量机算法- 聚类算法- 关联规则挖掘算法- 时间序列分析算法6. 数据挖掘的工具和平台- 常用的数据挖掘工具和软件- 数据挖掘平台的选择和使用- 数据挖掘案例的实践和分析四、教学方法本课程采用理论讲授与实践操作相结合的教学方法,包括课堂讲解、案例分析、实验操作和课程设计等。

通过理论与实践相结合的教学方式,培养学生的数据分析和问题解决能力。

五、考核方式1. 平时成绩:包括课堂表现、课堂作业和实验报告等。

2. 期中考试:对课程的基本概念和原理进行考查。

3. 期末考试:对课程的设计方法、算法和工具进行考查。

4. 课程设计:学生根据所学知识完成一个数据仓库或数据挖掘的实际项目。

六、参考教材1. Jiawei Han, Micheline Kamber, Jian Pei. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2011.2. Ralph Kimball, Margy Ross. The Data Warehouse Toolkit: The Definitive Guideto Dimensional Modeling. Wiley, 2013.七、参考资源1. 数据挖掘实战网站:提供数据挖掘案例和实践操作的资源。

数据仓库与数据挖掘教学大纲

数据仓库与数据挖掘教学大纲

数据仓库与数据挖掘教学大纲1. 课程简介数据仓库与数据挖掘是现代信息技术领域中非常重要的研究方向。

本课程将介绍数据仓库和数据挖掘的基本概念、原理和应用技术。

通过本课程的学习,学生将掌握数据仓库和数据挖掘的基本理论和实践技能,为日后从事相关工作打下坚实基础。

2. 课程目标- 理解数据仓库和数据挖掘的基本概念和原理;- 掌握数据仓库和数据挖掘的常用技术和方法;- 能够运用数据仓库和数据挖掘技术解决实际问题;- 培养学生的数据分析和决策能力。

3. 课程大纲3.1 数据仓库概述- 数据仓库的定义和特点- 数据仓库架构和组成- 数据仓库的应用领域3.2 数据仓库建模- 数据仓库的数据模型- 维度建模和事实表设计- 数据仓库的数据抽取、转换和加载3.3 数据仓库查询与分析- 数据仓库查询语言- 多维数据分析和OLAP技术- 数据仓库的性能优化3.4 数据挖掘概述- 数据挖掘的定义和任务- 数据挖掘的基本过程- 数据挖掘的应用领域3.5 数据挖掘算法- 分类与预测算法- 聚类算法- 关联规则挖掘算法3.6 数据挖掘应用- 金融数据挖掘- 健康数据挖掘- 社交媒体数据挖掘4. 教学方法本课程将采用多种教学方法,包括理论讲授、案例分析、实践操作和小组讨论等。

通过理论与实践相结合的方式,帮助学生更好地理解和掌握数据仓库和数据挖掘的知识和技能。

5. 评估方式- 平时成绩(30%):包括课堂表现、作业完成情况等。

- 期中考试(30%):考察学生对数据仓库和数据挖掘的理论知识的掌握程度。

- 期末项目(40%):要求学生运用所学知识和技能,完成一个实际的数据仓库和数据挖掘项目。

6. 参考教材- Jiawei Han, Micheline Kamber, Jian Pei. "Data Mining: Concepts and Techniques", 3rd Edition.- Ralph Kimball, Margy Ross. "The Data Warehouse Toolkit: The Definitive Guideto Dimensional Modeling", 3rd Edition.7. 参考资源- 数据仓库与数据挖掘相关的学术论文和研究报告- 开源数据仓库和数据挖掘工具,如MySQL、RapidMiner等8. 注意事项本课程对学生的编程基础要求较高,建议学生提前学习数据库和编程相关知识,以便更好地理解和应用数据仓库和数据挖掘技术。

《数据挖掘与数据仓库》课程教学大纲

《数据挖掘与数据仓库》课程教学大纲
2.过程与方法目标:通过将理论与实践相结合,要求学生能够把所学知识与技术用于实际问题。在此基础上进行归纳和总结,逐步形成科学的学习观和方法论。(应用)
3.情感、态度与价值观发展目标:通过本课程的学习,培养作为一个信息技术人员必须具备的终身学习精神,严谨的科学态度和积极向上的价值观,为未来的学习、工作和生活奠定基础。(评价)
本课程与学生核心能力培养之间的关联(可多选):
□核心能力1.
■核心能力2.
□核心能力3.
□核心能力4.
□核心能力5.
□核心能力6.
□核心能力7.
□核心能力8.
理论教学进程表
周次
教学主题
教学时长
教学的重点与难点
教学方式
作业安排
1.
绪论
4
数据挖掘概念、背景、趋势
课堂讲授
2
数据
4
数据预处理,汇总统计,可视化
2、学生核心能力即毕业要求或培养要求,请任课教师从授课对象人才培养方案中对应部分复制(/)
3、教学方式可选:课堂讲授/小组讨论/实验/实训
4、若课程无理论教学环节或无实践教学环节,可将相应的教学进度表删掉。
10
关联分析
2
Apriori算法
课堂讲授
11
专题报告
4
数据挖掘其他主题
课堂讲授
12
专题报告
4
数据挖掘其他主题
课堂讲授
合计:
32
实践教学进程表
周次
实验项目名称
学时
重点与难点
项目类型(验证/综合/设计)
教学
方式
3
Matlab基础
2
熟悉matlab基本操作与矩阵运算
验证

数据仓库与数据挖掘教案

数据仓库与数据挖掘教案

数据仓库与数据挖掘教案教案:数据仓库与数据挖掘一、教学目标1. 理解数据仓库和数据挖掘的基本概念和作用;2. 掌握数据仓库的设计原则和构建过程;3. 了解数据挖掘的常见技术和应用领域;4. 能够利用数据仓库和数据挖掘技术进行数据分析和决策支持。

二、教学内容1. 数据仓库的概念和特点;2. 数据仓库的设计原则和构建过程;3. 数据挖掘的基本任务和流程;4. 数据挖掘的常见技术和应用案例;5. 数据仓库与数据挖掘在决策支持中的应用。

三、教学过程第一节:数据仓库的概念和特点(30分钟)1. 数据仓库的定义和作用;2. 数据仓库与传统数据库的区别;3. 数据仓库的特点和优势。

第二节:数据仓库的设计原则和构建过程(60分钟)1. 数据仓库的设计原则:一致性、稳定性、易用性等;2. 数据仓库的构建过程:需求分析、数据抽取、数据转换、数据加载等;3. 数据仓库的体系结构和组成要素。

第三节:数据挖掘的基本任务和流程(40分钟)1. 数据挖掘的概念和作用;2. 数据挖掘的基本任务:预测建模、分类、聚类、关联规则挖掘等;3. 数据挖掘的流程:数据清洗、特征选择、模型训练和评估等。

第四节:数据挖掘的常见技术和应用案例(60分钟)1. 数据挖掘的常见技术:决策树、神经网络、聚类分析、关联规则挖掘等;2. 数据挖掘在商业领域的应用案例:市场篮子分析、客户细分、欺诈检测等。

第五节:数据仓库与数据挖掘在决策支持中的应用(30分钟)1. 数据仓库与决策支持系统的关系;2. 数据仓库和数据挖掘在决策支持中的应用实例。

1. 讲授相结合的方式,通过概念讲解和实例分析,深入浅出地介绍数据仓库与数据挖掘的相关知识;2. 基于案例的学习,引导学生运用数据仓库和数据挖掘的技术进行实际问题的分析解决;3. 学生小组讨论和展示,促进学生的互动和合作。

五、教学评价1. 课堂参与度(10%):学生积极回答问题和提出自己的见解;2. 课堂练习与作业(30%):课堂练习和作业涵盖概念理解和应用实践;3. 课程设计项目(40%):小组合作设计一个数据仓库与数据挖掘的实际项目,包括需求分析、数据抽取、模型建立和结果评估等环节;4. 个人报告(20%):学生针对设计项目进行个人报告,展示理解和技术应用能力。

《数据仓库与数据挖掘》—教学大纲

《数据仓库与数据挖掘》—教学大纲

《数据仓库与数据挖掘》教学大纲一、课程概况课程名称:数据仓库与数据挖掘英文名称:Data warehousing and data mining课程性质:课程学时:课程学分:授课对象:开课时间:讲课方式:主讲老师:二、教学目的本课程把数据视为基础资源,根据软件工程的思想,总结了数据利用的历程,讲述了数据仓库的基础知识和工具,研究了数据挖掘的任务及其挑战,给出了经典的数据挖掘算法,介绍了数据挖掘的产品,剖析了税务数据挖掘的案例,探索了大数据的管理和应用问题。

三、教学任务完成《数据仓库与数据挖掘》教材内容,及教学计划中的互动实践内容,另有学生自主选题的大作业、选作的论文报告。

32学时:课堂24、实验2、课外2、研讨4学时。

四、教学内容的结构课程由9个教学单元组成,对应于《数据仓库与数据挖掘》的内容。

第1章数据仓库和数据挖掘概述1.1概述11.2数据中心41.2.1关系型数据中心1.2.2非关系型数据中心1.2.3混合型数据中心(大数据平台)1.3混合型数据中心参考架构第2章数据2.1数据的概念2.2数据的内容2.2.1实时数据与历史数据2.2.2时态数据与事务数据2.2.3图形数据与图像数据2.2.4主题数据与全部数据2.2.5空间数据2.2.6序列数据和数据流2.2.7元数据与数据字典2.3数据属性及数据集2.4数据特征的统计描述222.4.1集中趋势222.4.2离散程度232.4.3数据的分布形状252.5数据的可视化262.6数据相似与相异性的度量292.7数据质量322.8数据预处理322.8.1被污染的数据332.8.2数据清理352.8.3数据集成362.8.4数据变换372.8.5数据规约38第3章数据仓库与数据ETL基础39 3.1从数据库到数据仓库393.2数据仓库的结构393.2.1两层体系结构413.2.2三层体系结构413.2.3组成元素423.3数据仓库的数据模型433.3.1概念模型433.3.2逻辑模型433.3.3物理模型463.4 ETL463.4.1数据抽取473.4.2数据转换483.4.3数据加载493.5 OLAP493.5.1维493.5.2 OLAP与OLTP493.5.3 OLAP的基本操作503.6 OLAP的数据模型513.6.1 ROLAP523.6.2 MOLAP523.6.3 HOLAP53第四章数据仓库和ETL工具544.1 IBM DB2 V104.1.1自适应压缩544.1.2多温度存储554.1.3时间旅行查询564.1.4 DB2兼容性功能604.1.5工作负载管理614.1.6 PureXML624.1.7当前已落实634.1.8 DB2 PureScale Feature634.1.9 分区特性654.1.10并行技术674.1.11 SQW684.1.12 Cubing Services684.1.13 列式存储及压缩技术(BLU)70 4.2 InfoSphere Datastage714.2.1基于Information Server的架构72 4.2.2企业级实施和管理754.2.3高扩展的体系架构794.2.4具备线性扩充能力814.2.5 ETL元数据管理824.3 InfoSphere QualityStage82第5章数据挖掘基础845.1数据挖掘的起源845.2数据挖掘的定义855.3数据挖掘的任务865.3.1分类5.3.2回归分析5.3.3相关分析5.3.4聚类分析5.3.5关联规则5.3.6异常检测5.4数据挖掘标准流程5.4.1商业理解5.4.2数据理解5.4.3数据准备5.4.4建立模型5.4.5模型评估5.4.6结果部署5.5数据挖掘的十大挑战性问题5.5.1数据挖掘统一理论的探索5.5.2高维数据和高速数据流的研究与应用5.5.3时序数据的挖掘与降噪5.5.4从复杂数据中找寻复杂知识5.5.5网络环境中的数据挖掘5.5.6分布式数据挖掘5.5.7生物医学和环境科学数据挖掘5.5.8数据挖掘过程自动化与可视化5.5.9信息安全与隐私保护5.5.10动态、不平衡及成本敏感数据的挖掘第6章数据挖掘算法6.1算法概述6.1.1分类算法及评估指标6.1.2聚类算法及其评价指标6.2 C4.56.3 CART算法6.4 K-Means 算法6.5 SVM算法1216.6 Apriori算法6.7 EM算法6.8 PageRank6.9Adaboost算法6.10KNN算法6.11Naive Bayes第7章数据挖掘工具与产品7.1 数据挖掘工具概述7.2 商业数据挖掘工具IBM SPSS Modeler7.3 开源通用的数据挖掘工具WEKA第8章数据挖掘案例8.1概述8.2纳税评估示例8.3税收预测建模示例8.4税务行业纳税人客户细分探索8.5基于Hadoop平台的数据挖掘思考题第9章大数据管理9.1 什么是大数据9.2 Hadoop介绍9.3 NoSQL介绍9.4 InfoSphere BigInsights 3.0介绍五、教学活动以及教学方法上的基本要求课堂教学、实验、课外作业、自选题目的大作业、论文和报告结合,另有课外讨论环节。

136042-数据仓库与数据挖掘-专业课教学大纲

136042-数据仓库与数据挖掘-专业课教学大纲

菏泽学院计算机学院《数据仓库与数据挖掘》课程教学大纲课程编号:136042课程名称:数据仓库与数据挖掘/Data Warehouse and Data Mining Technology课程类别:专业方向课课程总学时/学分:80/4(实践80学时,任务驱动方式融入教学内容)适用对象:计算机科学技术.NET方向一、课程简介数据仓库与数据挖掘技术出现于20世纪80年代,90年代有了突飞猛进的发展,并可望在新的千年继续繁荣。

数据仓库与数据挖掘是一个多学科领域,从多个学科汲取营养。

这些学科包括数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高信能计算和数据可视化。

二、教学目的和任务根据学校“一体两翼,三经四纬,五个保障”的宏观人才培养模式,以及计算机类专业人才培养方案要求,通过本课程学习,使学生能对数据仓库和数据挖掘的基本方法和基本概念有整体的了解,掌握建立数据仓库的原理和方法,从理论上掌握数据仓库、OLAP联机分析的基本概念、原理、主要算法及应用系统解决方案,熟练掌握数据挖掘的关联规则,分类方法,聚类方法等算法,并能够在软件开发过程中熟练掌握这些方法加以应用。

三、教学基本要求本课程的内容从知识、素质、能力、德、智、体、美七个维度形成教学内容方阵,每一次课一般安排3-5个知识点,从七个维度组织内容,分课内、课外开展教学。

素质养成主要包括以下内容:1.思想政治素质具有中国特色社会主义共同理想,秉承社会主义核心价值观;具有爱国主义精神;具有责任心和社会责任感。

2.文化科技素质具有不断更新知识和自我完善的能力;具有持续学习和终身学习的能力;具有一定的创新意识、创新精神和创新能力;具有一定的人文和艺术素养;具有良好的人际沟通能力。

3.专业素质掌握数据仓库与数据挖掘基本知识;具有一定数据挖掘与数据分析能力,利用数据挖掘基本知识、基本技能,解决实际问题的能力。

4.职业素质具有良好的职业道德和职业操守;具有较强的组织观念和集体意识; 有耐心,精益求精,有着良好数据分析能力。

数据仓库与数据挖掘概述

数据仓库与数据挖掘概述

统计学与数据挖掘的比较
• 统计学主要是对数量数据(数值)或连续值数据 (如年龄、工资等),进行数值计算(如初等运 算)的定量分析,得到数量信息。
• 数据挖掘主要对离散数据(如职称、病症等)进 行定性分析(覆盖、归纳等),得到规则知识。
• 统计学与数据挖掘是有区别的。但是,它们之间 是相互补充的。
1.3 数据仓库和数据挖掘的结 合
2.联机分析处理(OLAP)
• E.F.Codd认为决策分析需要对多个关系数据库共同 进行大量的综合计算才能得到结果。
• E.F.Codd在1993年提出了多维数据库和多维分析的 概念,即联机分析处理(On Line Analytical Proces sing,OLAP)概念。
• 关系数据库是二维数据(平面),多维数据库是 空间立体数据。
• OLTP是事务处理从单机到网络环境地发展新阶段。
• OLTP的特点在于事务处理量大,应用要求多个并行处理,事务处理内容比较简单且重 复率高。
• 大量的数据操作主要涉及的是一些增加、删除、修改、查询等操作。每次操作的数据 量不大且多为当前的数据。
• OLTP处理的数据是高度结构化的,数据访问路径是已知的,至少是固定的。 • OLTP面对的是事务处理操作人员和低层管理人员。 • 但是,为高层领导者提供决策分析时, OLTP则显得力不从心。
Clementine 介绍
1999年SPSS公司收购了ISL公司,对Clementine产品进行 重新整合和开发,现在Clementine已经成为SPSS公司的又 一亮点。 作为一个数据挖掘平台, Clementine结合商业 技术可以快速建立预测性模型,进而应用到商业活动中, 帮助人们改进决策过程。强大的数据挖掘功能和显著的投 资回报率使得Clementine在业界久负盛誉。同那些仅仅着 重于模型的外在表现而忽略了数据挖掘在整个业务流程中 的应用价值的其它数据挖掘工具相比, Clementine其功能 强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终, 在缩短投资回报周期的同时极大提高了投资回报率。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘与数据仓库课程简介
英文名:Data Mining and Data Warehouse
开课单位:计算机学院
课程编码:203086
学分学时:学分,学时32(含实验10)
授课对象:计算机科学与技术专业方向选修课
先修课程:数据库
课程目的和主要内容:
通过本课程的学习,学生应能理解数据库技术的发展为何导致需要数据挖掘,以及数据挖掘潜在应用的重要性;掌握数据仓库和多维数据结构,OLAP(联机分析处理)的实现以及数据仓库与数据挖掘的关系;熟悉数据挖掘之前的数据预处理技术;了解定义数据挖掘任务说明的数据挖掘原语;掌握数据挖掘技术的基本算法,为将来从事数据仓库的规划和实施以及数据挖掘技术的研究工作打下一定的基础。

主要内容包括数据仓库和数据挖掘的基本知识;数据清理、数据集成和变换、数据归约以及离散化和概念分层等数据预处理技术;DMQL数据挖掘查询语言;用于挖掘特征化和比较知识的面向属性的概化技术、用于挖掘关联规则知识的基本Apriori算法和它的变形、用于挖掘分类和预测知识的判定树分类算法和贝叶斯分类算法以及基于划分的聚类分析算法等;了解先进的数据库系统中的数据挖掘方法,以及对数据挖掘和数据仓库的实际应用问题展开讨论。

参考教材:
《数据挖掘概念与技术》,机械工业出版社,JiaWei Han,Micheline Kamber著,范明等译
参考和阅读书目:
《Data Mining: Concepts and Techniques》Jiawei Han and Micheline Kamber, Morgan Kaufmann, 2000
《机器学习》,Tom Mitchell著,曾华军等译
《SQLServer2000数据挖掘技术指南》,机械工业出版社,Claude Seidman著,刘艺等译
数据挖掘与数据仓库教学大纲
一、课程概况
英文名:Data Mining and Data Warehouse
开课单位:计算机学院
课程编码:203086
学分学时:学分,学时32(含实验10)
授课对象:
先修课程:数据库
课程目的和主要内容:
通过本课程的学习,学生应能理解数据库技术的发展为何导致需要数据挖掘,以及数据
挖掘潜在应用的重要性;掌握数据仓库和多维数据结构,OLAP(联机分析处理)的实现以及数据仓库与数据挖掘的关系;熟悉数据挖掘之前的数据预处理技术;了解定义数据挖掘任务说明的数据挖掘原语;掌握数据挖掘技术的基本算法,为将来从事数据仓库的规划和实施以及数据挖掘技术的研究工作打下一定的基础。

主要内容包括数据仓库和数据挖掘的基本知识;数据清理、数据集成和变换、数据归约以及离散化和概念分层等数据预处理技术;DMQL数据挖掘查询语言;用于挖掘特征化和比较知识的面向属性的概化技术、用于挖掘关联规则知识的基本Apriori算法和它的变形、用于挖掘分类和预测知识的判定树分类算法和贝叶斯分类算法以及基于划分的聚类分析算法等;了解先进的数据库系统中的数据挖掘方法,以及对数据挖掘和数据仓库的实际应用问题展开讨论。

二、课程内容
第1章(2学时)引言
1.1(1学时)数据挖掘技术兴起与概念
1.2(1学时)数据挖掘功能及主要问题
第2章(2学时)数据仓库和数据挖掘的OLAP技术
2.1(1学时)数据仓库概念及与多维数据模型
2.2(1学时)数据立方体技术、联机分析处理与联机分析挖掘
第3章(2学时)数据预处理
3.1(1学时)预处理原因及数据清理
3.2(1学时)数据集成和变换、归约及离散化和概念分层
第4章(4学时)概念描述:特征化和比较
4.1(2学时)概念描述概念和面向属性的归纳算法
4.2(2学时)面向属性归纳的有效实现及解析特征化
第5章(4学时)挖掘大型数据库中的关联规则
5.1(2学时)关联规则挖掘概念和基本Apriori算法
5.2(1学时)Apriori算法的变形算法
5.3(1学时)关联分析和相关分析
第6章(4学时)分类和预测
6.1(2学时)分类和预测概念及判定树归纳算法
6.2(2学时)贝叶斯分类算法及预测方法
第7章(2学时)聚类分析
7.1(1学时)聚类分析概念和划分方法
7.2(1学时)孤立点分析
第8章(2学时)数据挖掘的应用和发展趋势
8.1(1学时)复杂类型数据的挖掘介绍
8.2(1学时)应用和发展介绍
三、实践环节(详见实验教学大纲)
该课程配合理论教学开设了如下实验。

共20学时,每个实验4学时。

1、数据仓库的建立;
2、多维数据集分析
3、数据挖掘实践
4、编程实现演示Apriori算法
5、编程实现演示决策树算法
在实验教学中,主要安排两个方面的实践环节,一是进一步巩固和加深理论教学的原理性实验;二是应用方面的实验。

通过实践性教学,使学生加深了对理论知识的理解,有效地提高了学生的动手能力,独立分析问题、解决问题能力,协调能力和创造性思维能力。

四、学时分配(小四号粗宋体)
五、附录
参考教材:
《数据挖掘概念与技术》,机械工业出版社,JiaWei Han,Micheline Kamber著,范明等译参考和阅读书目:
《Data Mining: Concepts and Techniques》Jiawei Han and Micheline Kamber, Morgan Kaufmann, 2000
《机器学习》,T om Mitchell著,曾华军等译
《SQLServer2000数据挖掘技术指南》,机械工业出版社,Claude Seidman著,刘艺等译
数据挖掘与数据仓库实验大纲
一、实验概况
实验学时:10学时
实验指导书名称:自设计
实验类型:设计性
实验目的和主要内容:通过实验来对所学的程序设计语法点的理论知识加以验证,进一步加深理论知识的理解,为今后从事数据仓库与数据挖掘技术的研究以及数据挖掘应用程序的开发打下必要的基础。

主要内容包括熟悉与掌握Analysis Service数据挖掘产品的体系结构与编程接口,掌握Apriori算法、决策树算法以及贝叶斯分类算法及实现。

制定者:江南审校者:批准者:
二、实验项目、要求及安排方式
(一)实验项目与要求:
1:数据仓库的建立
2:多维数据集分析
3:数据挖掘实践
4:编程实现演示Apriori算法
5:编程实现演示决策树算法
(二)实验安排方式
该课程配合理论教学开设实验共10学时,每个实验2学时。

三、场地与设备
1、实验地点:计算机学院机房
2、实验仪器设备:计算机
四、考核与成绩评定
1、考核内容:考勤情况、完成情况、实验报告书撰写情况
2、成绩评定方法:学生做完实验后,教师依据学生考勤情况、完成情况、实验报告书撰写情况,给出优、良、中、及格、不及格的等级成绩评定,并转换为平时成绩的一部分。

相关文档
最新文档