《文本数据挖掘》教学大纲

合集下载

数据挖掘 教学大纲

数据挖掘 教学大纲

数据挖掘教学大纲数据挖掘教学大纲引言:数据挖掘作为一门应用于从大量数据中发现模式、规律和知识的技术,已经在各个领域得到广泛应用。

为了培养学生在这个领域的专业能力,制定一份完善的数据挖掘教学大纲是至关重要的。

本文将探讨数据挖掘教学大纲的设计和内容,以及培养学生的核心能力。

一、课程目标和背景数据挖掘教学的目标是培养学生具备深入理解数据挖掘原理和方法的能力,能够独立进行数据挖掘项目的设计、实施和评估。

此外,还要培养学生的数据分析和解决实际问题的能力,以及良好的团队合作和沟通能力。

二、课程内容1. 数据挖掘概述介绍数据挖掘的定义、发展历程、应用领域以及数据挖掘过程的基本步骤。

同时,引导学生了解数据挖掘的重要性和应用前景。

2. 数据预处理讲解数据预处理的目的和方法,包括数据清洗、数据集成、数据转换和数据规约。

通过实际案例,让学生了解如何处理现实中的脏数据和缺失数据。

3. 数据挖掘算法介绍常见的数据挖掘算法,包括分类、聚类、关联规则和异常检测。

详细讲解每种算法的原理、应用场景和实现方法,并通过实例演示学生如何选择合适的算法解决实际问题。

4. 特征选择和降维讲解特征选择和降维的概念和方法,以及它们在数据挖掘中的作用。

通过实践项目,引导学生掌握特征选择和降维技术的应用。

5. 模型评估和优化介绍模型评估的指标和方法,以及如何通过交叉验证和网格搜索等技术对模型进行优化。

培养学生对模型性能评估和调优的能力。

6. 数据可视化讲解数据可视化的原理和方法,引导学生学会使用可视化工具展示数据挖掘结果。

通过实践项目,培养学生的数据分析和表达能力。

三、教学方法1. 理论讲授与案例分析相结合通过理论讲授,学生可以了解数据挖掘的基本概念和方法;通过案例分析,学生可以将理论知识应用到实际问题中,提高解决问题的能力。

2. 实践项目与团队合作设计实践项目,让学生在实际情境中应用数据挖掘技术解决问题。

通过团队合作,培养学生的团队协作和沟通能力。

《文本挖掘技术》课程教学大纲

《文本挖掘技术》课程教学大纲

《文本挖掘技术》课程教学大纲一、课程基本信息课程编号:12183课程名称:文本挖掘技术英文名称:Text mining technology课程类型:专业课课程要求:选修学时/学分:48/3(讲课学时:32 实验学时:16)先修课程:概率论与数理统计、线性代数理论与应用、Python语言程序设计、R语言与应用统计分析后续课程:毕业设计适用专业:数据科学与大数据技术二、课程描述“文本挖掘技术”是数据科学与大数据技术专业的选修课。

作为一种跨领域的应用,文本挖掘综合运用信息检索、信息提取、计算语言、自然语言处理、数据挖掘等多种技术,从非结构或半结构的文本中挖掘出先前未知、隐含而有用的信息。

本课程主要讲授文本挖掘中的关键技术,包括文本特征选择、信息采集、文本分类、文本聚类、情感分析、短文本计算、文本关联分析等。

以互联网上收集的数据为背景,引导学生利用Python语言和R语言编制程序在实务案例中进行文本挖掘。

通过本课程的学习,使学生能够了解文本挖掘技术的应用领域,掌握文本挖掘的基本处理和分析方法,进而为大数据领域的数据分析和数据挖掘应用打下坚实的基础。

三、课程教学目标1.了解文本挖掘的基本思想和基本技术,能够基于文本挖掘的原理并采用文本特征选择、文本分类、文本聚类、文本关联分析等一系列方法对复杂文本挖掘问题进行研究,包括算法设计、程序设计、分析与结果解释、并通过信息综合得到合理有效的结论。

(支持毕业能力要求2)2.掌握以Python语言和R语言为工具的数据分析与挖掘系统的开发和设计方法,并能够针对相对复杂的文本挖掘系统设计解决方案,编写程序进行求解。

(支持毕业能力要求1)四、教学内容、安排及教学目标得对应关系五、其他教学环节(课外教学环节、要求、目标)1.自学文本挖掘之爬虫在授课前自学授课内容,能够掌握Rfacebook、Rweibo、R Twitter基本功能。

2.运用在文本分类基于监督和半监督的文本情感分类、文本聚类、文本关联分析单元学习后,自行收集资料,阅读文献,分别对某个有实际工程背景的应用问题设计解决方案。

《数据挖掘》课程教学大纲

《数据挖掘》课程教学大纲

《数据挖掘》课程教学⼤纲《数据挖掘》课程教学⼤纲⼀、《数据挖掘》课程说明(⼀)课程代码:14132007(⼆)课程英⽂名称:Data Mining(三)开课对象:计算机与信息管理及其相关专业(四)课程性质:数据挖掘是信息与计算科学专业的专业课程,本课程以数据挖掘为主要内容,讲述实现数据挖掘的各主要功能、挖掘算法和应⽤,并通过对实际数据的分析更加深⼊地理解常⽤的数据挖掘模型。

掌握⼤型数据挖掘软件SAS Enterprise Miner的使⽤,培养学⽣数据分析和处理的能⼒。

先修课程:《数据库原理》、《概率论与数理统计》、《SAS软件基础》。

(五)教学⽬的:通过《数据挖掘》课程的教学,使学⽣理解数据挖掘的基本概念和⽅法,学习和掌握SAS Enterprise Miner中的数据挖掘⽅法。

学⽣能够借助SAS Enterprise Miner软件⼯具进⾏具体数据的挖掘分析。

(六)教学内容:本课程主要学习的内容包括数据预处理、分类与预测、聚类分析等内容。

(七)教学时数课程学时:48学分:3(⼋)教学⽅式以多媒体教学⼿段为主要形式的课堂教学(九)考核⽅式和成绩记载说明考核⽅式笔试加上机⼤作业,严格考核学⽣出勤情况,达到学籍管理规定的旷课量取消考试资格。

综合成绩根据平时成绩和期末成绩评定,平时成绩占40% ,期末成绩占60% 。

⼆、讲授⼤纲与各章的基本要求第⼀章数据挖掘导论教学要点:1、熟悉数据挖掘的基本概念和功能2、了解数据挖掘的系统分类教学时数:8学时教学内容:第⼀节数据挖掘发展概述2、基本应⽤概述第⼆节数据挖掘功能1、概念描述:定性与对⽐2、关联分析3、分类与预测4、聚类分析5、异类分析6、演化分析第三节数据挖掘系统1、系统分类2、系统应⽤3、数据挖掘在医学信息系统和社会保险领域的应⽤考核要求:1、数据挖掘发展概述1.1功能和基本应⽤概述(识记)2、数据挖掘功能2.1概念描述(识记)2.2关联分析(领会)2.3分类与预测 (领会)2.4聚类分析 (领会)2.5异类分析 (领会)2.6演化分析 (领会)3、数据挖掘系统(应⽤)第⼆章数据预处理教学要点:1.了解数据预处理的重要性2.熟悉数据预处理的⽅法教学时数:6学时教学内容:第⼀节数据清洗1、噪声数据处理2、不⼀致数据处理第⼆节数据集成与转换1、数据集成处理2、数据转换处理1、数据清洗1.1噪声数据处理(领会)1.2不⼀致数据处理(领会)2、数据集成与转换2.1数据集成处理(应⽤)2.2数据转换处理(应⽤)第三章分类与预测教学要点:1、掌握分类与预测基本知识2、了解各项分类和预测⽅法教学时数:12学时教学内容:第⼀节分类与预测基本知识1、分类基础2、预测基础第⼆节基于决策树的分类第三节贝叶斯分类第四节神经⽹络分类第五节预测⽅法1、线性与多变量回归2、⾮线性回归3、其他回归模型考核要求:1、分类与预测基本知识1.1分类基础(识记)1.2预测基础(识记)2、基于决策树的分类(领会)3、贝叶斯分类(领会)4、神经⽹络分类(领会)5、预测⽅法5.1线性与多变量回归(领会)5.2⾮线性回归(领会)5.3其他回归模型(领会)第四章聚类分析教学要点:1、掌握聚类分析基本概念2、了解聚类分析基本⽅法教学时数:12学时教学内容:1、基础知识2、聚类分析⽅法:K-MEANS算法等考核要求:1、基础知识(识记)2、聚类分析⽅法:K-MEANS算法等(应⽤)三、推荐教材和参考书⽬:1、《数据挖掘原理与技术》,张云涛、龚玲著,电⼦⼯业出版社,20042、《数据仓库与数据挖掘技术》,陈京民编著,电⼦⼯业出版社,20023、《数据挖掘与OLAP理论与实务》,林杰斌主编,清华⼤学出版社,2003.14、《数据挖掘》,朱明编著,中国科学技术⼤学出版社,2002.25、《数据挖掘教程》, Richard J. Roiger, Michael W. Geatz 著,翁敬农译,清华⼤学出版社,20036、《数据挖掘原理》,David Hand, Heikki Mannila, Padhraic Smyth著,张银奎、廖丽、宋俊等译,机械⼯业出版社,2003。

数据挖掘教学大纲

数据挖掘教学大纲

数据挖掘教学大纲一、课程简介数据挖掘是从大量数据中提取出实用信息的过程。

本课程旨在介绍数据挖掘的基本概念、方法和技术,培养学生的数据挖掘能力和解决实际问题的能力。

通过本课程的学习,学生将掌握数据挖掘的理论基础、常用算法和工具,能够应用数据挖掘技术解决实际问题。

二、课程目标1. 了解数据挖掘的基本概念和发展历程;2. 掌握数据挖掘的基本任务和常用方法;3. 熟悉数据预处理和特征选择的技术;4. 掌握常用的数据挖掘算法和模型,如分类、聚类、关联规则等;5. 学会使用数据挖掘工具进行实际数据挖掘项目的实施;6. 培养学生的数据分析和问题解决能力。

三、教学内容与安排1. 数据挖掘概述(2学时)1.1 数据挖掘的定义和发展历程1.2 数据挖掘的任务和应用领域1.3 数据挖掘的流程和方法2. 数据预处理(4学时)2.1 数据清洗2.2 数据集成2.3 数据变换2.4 数据规约3. 特征选择与降维(4学时) 3.1 特征选择的概念和方法 3.2 特征降维的概念和方法3.3 主成份分析(PCA)算法4. 分类与预测(6学时)4.1 分类与预测的概念和任务 4.2 决策树算法4.3 朴素贝叶斯算法4.4 支持向量机算法4.5 集成学习算法5. 聚类分析(4学时)5.1 聚类分析的概念和任务 5.2 K均值聚类算法5.3 层次聚类算法5.4 密度聚类算法6. 关联规则挖掘(4学时)6.1 关联规则挖掘的概念和任务6.2 Apriori算法6.3 FP-Growth算法7. 数据挖掘工具与实践(4学时)7.1 常用的数据挖掘工具介绍7.2 数据挖掘项目实施流程7.3 数据挖掘案例分析与实践四、教学方法与评价方式1. 教学方法本课程采用理论讲授和实践操作相结合的教学方法。

理论讲授部份通过课堂讲解、案例分析、小组讨论等方式进行;实践操作部份通过实验、项目实施等形式进行。

2. 评价方式本课程的评价方式包括平时成绩和期末考试。

数据挖掘教学大纲

数据挖掘教学大纲

数据挖掘教学大纲一、引言1.1 数据挖掘的定义和概述1.2 数据挖掘的应用领域1.3 数据挖掘的基本流程和方法二、数据预处理2.1 数据清洗2.1.1 缺失值处理2.1.2 异常值处理2.1.3 噪声数据处理2.2 数据集成2.2.1 数据冗余处理2.2.2 数据集成方法2.3 数据变换2.3.1 数据规范化2.3.2 数据离散化2.3.3 数据归约三、数据挖掘技术3.1 分类3.1.1 决策树3.1.1.1 ID3算法3.1.1.2 C4.5算法3.1.2 支持向量机3.1.3 朴素贝叶斯3.2 聚类3.2.1 K均值算法3.2.2 DBSCAN算法3.2.3 层次聚类算法3.3 关联规则挖掘3.3.1 Apriori算法3.3.2 FP-Growth算法3.4 预测与回归3.4.1 线性回归3.4.2 决策树回归3.4.3 神经网络回归四、模型评估与选择4.1 训练集与测试集划分4.2 交叉验证4.3 模型评估指标4.3.1 准确率4.3.2 召回率4.3.3 F1值4.4 模型选择方法4.4.1 基于经验的选择4.4.2 基于验证集的选择4.4.3 基于交叉验证的选择五、实践案例分析5.1 电商行为分析5.2 社交网络分析5.3 金融风控分析六、数据挖掘工具与平台6.1 Python与R语言6.2 Weka6.3 RapidMiner6.4 KNIME七、数据挖掘的伦理与隐私保护7.1 数据隐私保护的重要性7.2 数据脱敏技术7.3 数据共享与伦理问题八、数据挖掘的发展趋势8.1 深度学习与数据挖掘的结合8.2 大数据与数据挖掘8.3 数据挖掘在人工智能领域的应用以上为数据挖掘教学大纲的标准格式文本,包括引言、数据预处理、数据挖掘技术、模型评估与选择、实践案例分析、数据挖掘工具与平台、数据挖掘的伦理与隐私保护以及数据挖掘的发展趋势等内容。

每一个部份都详细描述了相关的概念、方法和应用,并提供了一些常用的算法和工具。

文本挖掘创新与实践教学大纲

文本挖掘创新与实践教学大纲

文本挖掘创新与实践教学大纲全文共四篇示例,供读者参考第一篇示例:文本挖掘是指从大规模的文本数据中提取有用信息和知识的过程。

随着信息技术的迅猛发展和大数据时代的到来,文本挖掘技术在各个领域得到了广泛应用,如搜索引擎、情感分析、舆情监测、智能问答等。

因此,文本挖掘的创新与实践教学已经成为高校教育中的热门课程之一。

本文将从课程设置、教学目标、教学方法和评价方式等方面,制定一份关于文本挖掘创新与实践教学大纲,以期为相关教学提供参考。

一、课程设置文本挖掘创新与实践教学课程可以分为学分课程和短期培训课程两种形式。

学分课程一般设定为3学分或4学分,包括理论讲解、案例分析、实践操作和项目设计等环节。

短期培训课程可以根据实际需要设定学时,注重实践操作和案例演练。

二、教学目标1、掌握文本挖掘的基本概念和技术原理,了解文本挖掘技术在不同领域的应用场景。

2、掌握文本预处理技术,包括文本清洗、分词、词性标注等,提高文本挖掘的数据质量。

3、掌握文本表示与特征提取技术,包括词袋模型、TF-IDF、Word2Vec等,提高文本数据的表征能力。

4、掌握文本分类、聚类、情感分析等文本挖掘任务的基本算法和实现方法,能够应用到实际项目中。

5、具备文本挖掘项目设计和实施的能力,能够独立完成文本挖掘任务,提高解决实际问题的能力。

三、教学方法1、理论讲解:通过教师授课,讲解文本挖掘的基本概念、技术原理和应用案例,引导学生了解文本挖掘技术的发展和应用。

2、案例分析:通过真实案例的分析,帮助学生理解文本挖掘技术在不同领域的应用,培养学生的分析和解决问题的能力。

3、实践操作:通过实验课和实践操作,让学生亲自动手处理文本数据,掌握文本挖掘的基本技术和方法,提高实践能力。

4、项目设计:组织学生开展文本挖掘项目设计和实施,通过实际项目锻炼学生的综合能力,提高解决实际问题的能力。

四、评价方式1、平时表现:包括课堂参与、实验成绩、作业完成情况等,评价学生的学习态度和实践能力。

数据挖掘教学大纲

数据挖掘教学大纲

数据挖掘教学大纲
标题:数据挖掘教学大纲
引言概述:
数据挖掘作为一门重要的数据分析技术,已经在各个领域得到广泛应用。

为了培养学生对数据挖掘的理解和实践能力,制定一份完善的数据挖掘教学大纲至关重要。

本文将详细介绍数据挖掘教学大纲的内容和结构,以便于教师在教学过程中有条不紊地进行教学。

一、数据挖掘基础知识
1.1 数据挖掘的定义和作用
1.2 数据挖掘的基本概念
1.3 数据挖掘的应用领域
二、数据挖掘算法
2.1 分类算法
2.2 聚类算法
2.3 关联规则挖掘算法
三、数据挖掘工具和技术
3.1 数据预处理技术
3.2 特征选择和降维技术
3.3 模型评估和优化技术
四、数据挖掘实践案例
4.1 金融领域的数据挖掘实践
4.2 医疗领域的数据挖掘实践
4.3 社交网络领域的数据挖掘实践
五、数据挖掘伦理和法律问题
5.1 数据隐私保护
5.2 数据挖掘的伦理问题
5.3 数据挖掘的法律规范
结论:
通过本文对数据挖掘教学大纲的详细介绍,可以看出数据挖掘教学内容的丰富和多样性。

教师在设计和实施数据挖掘课程时,应该根据学生的实际情况和需求,灵活调整教学内容,使学生能够全面掌握数据挖掘的理论和实践技能,为将来的工作和研究打下坚实基础。

同时,也要重视数据挖掘的伦理和法律问题,引导学生正确处理数据挖掘过程中可能涉及的隐私和道德问题,做到合法合规地开展数据挖掘工作。

数据挖掘教学大纲

数据挖掘教学大纲

数据挖掘教学大纲数据挖掘教学大纲数据挖掘是一门涉及从大量数据中提取有用信息的技术。

随着信息时代的到来,数据挖掘在各个领域中扮演着重要的角色。

为了培养学生对数据挖掘的理解和应用能力,制定一份全面而系统的数据挖掘教学大纲至关重要。

一、引言数据挖掘是一门交叉学科,融合了统计学、机器学习和数据库等领域的知识。

本节将介绍数据挖掘的概念、发展历程以及在现实生活中的应用。

二、数据预处理数据预处理是数据挖掘的第一步,旨在处理原始数据中的噪声、缺失值和异常值等问题。

本节将介绍数据清洗、数据集成、数据变换和数据规约等预处理技术,并通过实例演示其应用。

三、数据挖掘任务数据挖掘任务包括分类、聚类、关联规则挖掘和时序模式挖掘等。

本节将详细介绍每个任务的定义、算法原理和实际应用,并通过案例分析帮助学生理解和掌握这些任务的实现方法。

四、特征选择与降维特征选择和降维是数据挖掘中的重要技术,可以帮助减少数据维度和提高模型性能。

本节将介绍特征选择的方法、特征降维的技术以及它们在实际问题中的应用。

五、模型评估与选择模型评估和选择是数据挖掘中的关键环节,它们可以帮助判断模型的性能和选择最优的模型。

本节将介绍常用的模型评估指标、交叉验证和网格搜索等技术,并通过实例演示如何评估和选择模型。

六、数据挖掘工具与平台数据挖掘工具和平台可以帮助学生更高效地进行数据挖掘实验和应用。

本节将介绍常用的数据挖掘工具和平台,如Weka、RapidMiner和Python的Scikit-learn等,并通过实例展示它们的使用方法。

七、伦理与隐私问题数据挖掘涉及到大量的个人隐私信息,因此在进行数据挖掘时必须考虑伦理和隐私问题。

本节将介绍数据挖掘中的伦理和隐私问题,以及相应的法律法规和道德准则。

八、数据挖掘案例研究本节将通过一些真实的数据挖掘案例研究,帮助学生将所学知识应用到实际问题中。

这些案例研究可以涵盖不同领域,如金融、医疗和电子商务等,让学生更好地理解和掌握数据挖掘的实际应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文本数据挖掘教学大纲
课程名称:文本数据挖掘
学分:2
总学时:32 理论学时:24 实验学时:8
先修课程:数据库原理与应用、Python高级语言编程、数据结构
适用专业: 数据工程专业
开课学期:第六学期
01课程性质、定位和教学目标
课程性质:文本数据挖掘是数据工程专业的必修课程,本课程以文本数据挖掘为主要内容,讲述实现文本数据挖掘的各主要功能、挖掘算法和应用,并通过对实际数据的分析更加深入地理解常用的文本数据挖掘模型。

课程定位:“文本数据挖掘技术导论”是针对数据工程专业的专业技术课程,同时也是该专业的核心课程,也是本专业创业创新教育课程。

在学生专业培养中起到至关重要的作用。

教学目标:通过“文本数据挖掘技术导论”课程的教学,使学生理解文本数据挖掘的基本概念和方法,学习和掌握中的文本数据挖掘的经典方法。

使学生能够借助Python高级语言编程工具进行具体文本数据的挖掘分析。

02教学内容与要求
第一章绪论
【教学目的与要求】
了解文本挖掘研究背景、意义及国内外研究现状,掌握文本挖掘的概念,了解文本挖掘主要研究领域,了解文本挖掘在制药企业应用案例。

【教学内容】
1.1 文本挖掘研究背景及意义
1.2 文本挖掘的国内外研究现状
1.3 文本挖掘概述
1.4 文本挖掘的过程
1.5 文本挖掘在制药企业应用案例
【教学重点与难点】
重点:文本挖掘研究背景、意义国内外研究现状、文本挖掘概念
难点:文本挖掘的过程
【教学手段】
利用网络环境、多媒体课件,案例教学、实理一体化教学方法等
【课后作业】
1. 文本挖掘与数据挖掘有何联系和区别?
2. 目前文本挖掘的领域主要涉及到哪些?
第二章文本切分及特征词选择
【教学目的与要求】
掌握文本数据采集的常用方法、了解中文语料库与词典,熟练掌握文本切分和文本特征词选择的方法,熟练掌握Python Jieba分词模块及其用法。

【教学内容】
2.1 文本数据采集
2.2 语料库与词典简介
2.3 文本切分
2.4 文本特征词选择
2.5 Python Jieba分词模块及其用法
【教学重点与难点】
重点:文本切分、文本特征词选择、Python Jieba分词模块及其用法
难点:Python Jieba分词模块及其用法
【教学手段】
利用网络环境、多媒体课件,案例教学、实理一体化教学方法等
【课后作业】
1 利用现代汉语语料库进行一段中文文本的汉语分词、词性自动标注、字频统计和词频统计。

2 用Python实现双向最大匹配的算法。

3 利用jieba进行一段中文文本的三种模式的分词。

第三章文本表示模型
【教学目的与要求】
熟练掌握文本预处理的常用方法、掌握向量模型、概率模型和主题概率模型的概念及Python的实现。

【教学内容】
3.1 文本预处理
3.2 向量空间模型
3.3 概率模型
3.4 主题概率模型
【教学重点与难点】
重点:文本预处理、向量空间模型、概率模型、主题概率模型
难点:主题概率模型
【教学手段】
利用网络环境、多媒体课件,案例教学、实理一体化教学方法等
【课后作业】
1 给出一段中文文本,利用Python的re.split() 函数,分隔所有短句。

2 给出一段中文文本,去除停用词,完成操作后将结果读出来。

第四章文本分类
【教学目的与要求】
了解文本分类意义、国内外研究现状与发展趋势,掌握文本分类的定义,熟练掌握文本分类的流程和文本分类预处理。

掌握典型的常用文本分类器,了解分类模型的性能评估。

【教学内容】
4.1 文本分类概述
4.2 常用文本分类器
4.3 分类模型的性能评估
【教学重点与难点】
重点:常用文本分类器
难点:常用文本分类器
【教学手段】
利用网络环境、多媒体课件,案例教学、实理一体化教学方法等
【课后作业】
1 给定有类别标注的文本向量集,参考例4.2,对于一组待分类的文本,判断分别属于哪一类。

2 利用Python编程,对给定相关数据验证SVM算法。

3 Python编程,利用朴素贝叶斯分类器实现垃圾邮件过滤。

4 给定相关数据,利用Python编程,验证ID3和C4.5算法。

第五章文本聚类
【教学目的与要求】
了解文本聚类意义、国内外研究现状与发展趋势,掌握文本聚类的定义,熟练掌握文本聚类的流程和文本聚类预处理。

掌握典型的常用文本聚类器,了解聚类模型的性能评估。

【教学内容】
5.1 文本聚类概述
5.2 文本聚类原理与方法
5.3 文本聚类评估
【教学重点与难点】
重点:文本聚类原理与方法
难点:文本聚类原理与方法
【教学手段】
利用网络环境、多媒体课件,案例教学、实理一体化教学方法等
【课后作业】
1 描述基于划分的聚类方法,并分别验证例5.1和例5.2中的k-means、k-medoids聚类。

2 描述基于层次的聚类方法。

验证例5.6中AGNES算法。

3 参照例5.9 ,给定一组文档集的向量,利用python实现DBSCAN算法。

第六章文本关联分析
【教学目的与要求】
了解文本关联规则基本概念和意义,掌握关联规则分类和关联规则挖掘算法,熟练掌握Apriori 算法,了解FP-Growth算法。

【教学内容】
6.1 引言
6.2 文本关联规则
6.3 关联规则挖掘算法
【教学重点与难点】
重点:文本关联规则、关联规则挖掘算法
难点:关联规则挖掘算法
【教学手段】
利用网络环境、多媒体课件,案例教学、实理一体化教学方法等
【课后作业】
1 简述研究文本关联规则的意义。

2 根据例6.1,理解 Apriori算法的步骤。

第七章 Python处理文本数据简单应用
【教学目的与要求】
掌握文本集的情感分析、关键词和摘要自动生成的Python实现,掌握使用SnowNLP 进行商品评价的Python实现,掌握利用Python生成“词云”。

【教学内容】
7.1 情感分析
7.2自动生成关键词和摘要
7.3 使用 SnowNLP 进行商品评价
7.4 生成“词云”
【教学重点与难点】
重点:自动生成关键词和摘要、使用 SnowNLP 进行商品评价
难点:使用 SnowNLP 进行商品评价
【教学手段】
利用网络环境、多媒体课件,案例教学、实理一体化教学方法等
【课后作业】
1 利用TextRank算法的python算法仿照例7.3实现,创建中文文本文件,利用TextRank4Keyword将文本拆分成4种格式:sentences、words_no_filter、words_no_stop_words和words_all_filters。

2 创建中文文本文件,参照例7.4和例7.5生成关键字和摘要。

3 输入一段中文文本,利用7.3.1中的样例,验证 SnowNLP 的主要功能。

03
学时分配
04考核方式与评分标准
考核方式:闭卷考试或课程论文
评分标准:综合成绩=期末考试×70%+平时成绩×30% 05选用教材。

相关文档
最新文档