浙江大学数据挖掘在线作业答案

合集下载

《数据挖掘》试题与答案

《数据挖掘》试题与答案

一、解答题(满分30分,每小题5分)1. 怎样理解数据挖掘和知识发现的关系?请详细阐述之首先从数据源中抽取感兴趣的数据,并把它组织成适合挖掘的数据组织形式;然后,调用相应的算法生成所需的知识;最后对生成的知识模式进行评估,并把有价值的知识集成到企业的智能系统中。

知识发现是一个指出数据中有效、崭新、潜在的、有价值的、一个不可忽视的流程,其最终目标是掌握数据的模式。

流程步骤:先理解要应用的领域、熟悉相关知识,接着建立目标数据集,并专注所选择的数据子集;再作数据预处理,剔除错误或不一致的数据;然后进行数据简化与转换工作;再通过数据挖掘的技术程序成为模式、做回归分析或找出分类模型;最后经过解释和评价成为有用的信息。

2. 时间序列数据挖掘的方法有哪些,请详细阐述之时间序列数据挖掘的方法有:1)、确定性时间序列预测方法:对于平稳变化特征的时间序列来说,假设未来行为与现在的行为有关,利用属性现在的值预测将来的值是可行的。

例如,要预测下周某种商品的销售额,可以用最近一段时间的实际销售量来建立预测模型。

2)、随机时间序列预测方法:通过建立随机模型,对随机时间序列进行分析,可以预测未来值。

若时间序列是平稳的,可以用自回归(Auto Regressive,简称AR)模型、移动回归模型(Moving Average,简称MA)或自回归移动平均(Auto Regressive Moving Average,简称ARMA)模型进行分析预测。

3)、其他方法:可用于时间序列预测的方法很多,其中比较成功的是神经网络。

由于大量的时间序列是非平稳的,因此特征参数和数据分布随着时间的推移而变化。

假如通过对某段历史数据的训练,通过数学统计模型估计神经网络的各层权重参数初值,就可能建立神经网络预测模型,用于时间序列的预测。

3. 数据挖掘的分类方法有哪些,请详细阐述之分类方法归结为四种类型:1)、基于距离的分类方法:距离的计算方法有多种,最常用的是通过计算每个类的中心来完成,在实际的计算中往往用距离来表征,距离越近,相似性越大,距离越远,相似性越小。

数据挖掘考试题及答案

数据挖掘考试题及答案

数据挖掘考试题及答案### 数据挖掘考试题及答案#### 一、选择题(每题2分,共20分)1. 数据挖掘的目的是发现数据中的:- A. 错误- B. 模式- C. 异常- D. 趋势答案:B2. 以下哪项不是数据挖掘的常用算法:- A. 决策树- B. 聚类分析- C. 线性回归- D. 神经网络答案:C3. 关联规则挖掘中,Apriori算法用于发现:- A. 频繁项集- B. 异常值- C. 趋势- D. 聚类答案:A4. K-means算法是一种:- A. 分类算法- B. 聚类算法- C. 预测算法- D. 关联规则挖掘算法答案:B5. 以下哪个指标用于评估分类模型的性能:- A. 准确率- B. 召回率- C. F1分数- D. 所有以上答案:D#### 二、简答题(每题10分,共30分)1. 描述数据挖掘中的“过拟合”现象,并给出避免过拟合的策略。

答案:过拟合是指模型对训练数据拟合得过于完美,以至于失去了泛化能力。

避免过拟合的策略包括:使用交叉验证、正则化技术、减少模型复杂度、获取更多的训练数据等。

2. 解释什么是“数据清洗”以及它在数据挖掘中的重要性。

答案:数据清洗是指从原始数据中识别并纠正(或删除)错误、重复或不完整的数据的过程。

它在数据挖掘中至关重要,因为脏数据会导致分析结果不准确,影响最终的决策。

3. 描述“特征选择”在数据挖掘中的作用。

答案:特征选择是数据挖掘中用来降低数据维度、提高模型性能和减少计算成本的过程。

通过选择最有信息量的特征,可以去除冗余或无关的特征,从而提高模型的准确性和效率。

#### 三、应用题(每题25分,共50分)1. 假设你正在分析一个电子商务网站的用户购买行为,描述你将如何使用数据挖掘技术来识别潜在的营销机会。

答案:首先,我会使用聚类分析来识别不同的用户群体。

然后,通过关联规则挖掘来发现不同用户群体的购买模式。

接着,利用分类算法来预测用户可能感兴趣的产品。

数据挖掘试题参考答案

数据挖掘试题参考答案

大学课程《数据挖掘》试题参考答案范围:∙ 1.什么是数据挖掘?它与传统数据分析有什么区别?定义:数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。

数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。

区别:(1)数据挖掘的数据源与以前相比有了显著的改变;数据是海量的;数据有噪声;数据可能是非结构化的;(2)传统的数据分析方法一般都是先给出一个假设然后通过数据验证,在一定意义上是假设驱动的;与之相反,数据挖掘在一定意义上是发现驱动的,模式都是通过大量的搜索工作从数据中自动提取出来。

即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

在缺乏强有力的数据分析工具而不能分析这些资源的情况下,历史数据库也就变成了“数据坟墓”-里面的数据几乎不再被访问。

也就是说,极有价值的信息被“淹没”在海量数据堆中,领导者决策时还只能凭自己的经验和直觉。

因此改进原有的数据分析方法,使之能够智能地处理海量数据,即演化为数据挖掘。

∙ 2.请根据CRISP-DM(Cross Industry Standard Process for Data Mining)模型,描述数据挖掘包含哪些步骤?CRISP-DM 模型为一个KDD工程提供了一个完整的过程描述.该模型将一个KDD工程分为6个不同的,但顺序并非完全不变的阶段.1: business understanding: 即商业理解. 在第一个阶段我们必须从商业的角度上面了解项目的要求和最终目的是什么. 并将这些目的与数据挖掘的定义以及结果结合起来.2.data understanding: 数据的理解以及收集,对可用的数据进行评估.3: data preparation: 数据的准备,对可用的原始数据进行一系列的组织以及清洗,使之达到建模需求.4:modeling: 即应用数据挖掘工具建立模型.5:evaluation: 对建立的模型进行评估,重点具体考虑得出的结果是否符合第一步的商业目的.6: deployment: 部署,即将其发现的结果以及过程组织成为可读文本形式.(数据挖掘报告)∙ 3.请描述未来多媒体挖掘的趋势随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已满足不了应用的需要,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴涵于其中的有价值的知识。

数据挖掘习题答案

数据挖掘习题答案

数据挖掘习题答案数据挖掘习题答案数据挖掘作为一门重要的技术和方法,广泛应用于各个领域。

在学习数据挖掘的过程中,习题是不可或缺的一部分。

通过解答习题,我们可以更好地理解和掌握数据挖掘的原理和应用。

以下是一些常见的数据挖掘习题及其答案,供大家参考。

一、选择题1. 数据挖掘的目标是什么?A. 发现隐藏在大数据中的模式和关联B. 提供数据存储和管理的解决方案C. 分析数据的趋势和变化D. 优化数据的存储和传输速度答案:A. 发现隐藏在大数据中的模式和关联2. 下列哪个不是数据挖掘的主要任务?A. 分类B. 聚类C. 回归D. 排序答案:D. 排序3. 数据挖掘的过程包括以下几个步骤,哪个是第一步?A. 数据清洗B. 数据集成C. 数据转换D. 数据选择答案:B. 数据集成4. 下列哪个不是数据挖掘中常用的算法?A. 决策树B. 支持向量机C. 朴素贝叶斯D. 深度学习答案:D. 深度学习5. 下列哪个不是数据挖掘的应用领域?A. 金融B. 医疗C. 娱乐D. 政治答案:D. 政治二、填空题1. 数据挖掘是从大量数据中发现________和________。

答案:模式,关联2. 数据挖掘的主要任务包括分类、聚类、回归和________。

答案:预测3. 数据挖掘的过程包括数据集成、数据清洗、数据转换和________。

答案:模式识别4. 决策树是一种常用的________算法。

答案:分类5. 数据挖掘可以应用于金融、医疗、娱乐等多个________。

答案:领域三、简答题1. 请简要介绍数据挖掘的主要任务和应用领域。

答:数据挖掘的主要任务包括分类、聚类、回归和预测。

分类是将数据集划分为不同的类别,聚类是将数据集中相似的样本归为一类,回归是根据已有的数据预测未知数据的值,预测是根据已有的数据预测未来的趋势和变化。

数据挖掘的应用领域非常广泛,包括金融、医疗、娱乐等。

在金融领域,数据挖掘可以用于信用评估、风险管理等方面;在医疗领域,数据挖掘可以用于疾病诊断、药物研发等方面;在娱乐领域,数据挖掘可以用于推荐系统、用户行为分析等方面。

2015秋浙江大学网络学院《数据挖掘》在线作业及答案

2015秋浙江大学网络学院《数据挖掘》在线作业及答案

2015秋浙江大学网络学院《数据挖掘》在线作业及答案单选题1.置信度(confidence)是衡量兴趣度度量()的指标。

A 简洁性B 确定性C 实用性D 新颖性正确答案:B 单选题2.哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?A 上卷B 下钻C 切块D 转轴正确答案:A 单选题3.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:A 单选题4.下列哪个描述是正确的?A 分类和聚类都是有指导的学习B 分类和聚类都是无指导的学习C 分类是有指导的学习,聚类是无指导的学习D 分类是无指导的学习,聚类是有指导的学习正确答案:C单选题5.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?A 算术平均值B 截尾均值C 中位数D 众数正确答案:B 单选题6.规则:age(X,”19-25”) ∧buys(X, “popcorn”) => buys(X, “coke”)是一个()。

A 单维关联规则B 多维关联规则C 混合维关联规则D 不是一个关联规则正确答案:B 单选题7.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。

A 关联分析B 分类和预测C 孤立点分析D 演变分析 E概念描述正确答案:E 单选题8.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?A 数据清理B 数据集成C 数据变换D 数据归约正确答案:A 单选题9.进行数据规范化的目的是()。

A 去掉数据中的噪声B 对数据进行汇总和聚集C 使用概念分层,用高层次概念替换低层次“原始”数据D 将属性按比例缩放,使之落入一个小的特定区间正确答案:D 单选题10.平均值函数avg()属于哪种类型的度量?A 分布的B 代数的C 整体的D 混合的正确答案:B 单选题11.下面哪种分类方法是属于统计学的分类方法?A 判定树归纳B 贝叶斯分类C 后向传播分类D 基于案例的推理正确答案:B 单选题12.下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

大工20春《数据挖掘》课程大作业满分答案

大工20春《数据挖掘》课程大作业满分答案

大工20春《数据挖掘》课程大作业满分答案网络教育学院《数据挖掘》课程大作业题目:KNN算法原理及Python实现姓名:研究中心:第一大题:数据挖掘》是一门实用性非常强的课程,数据挖掘是大数据这门前沿技术的基础,拥有广阔的前景,在信息化时代具有非常重要的意义。

数据挖掘的研究领域非常广泛,主要包括数据库系统、基于知识的系统、人工智能、机器研究、知识获取、统计学、空间数据库和数据可视化等领域。

在研究过程中,我也遇到了不少困难,例如基础差,对于Python基础不牢,尤其是在进行这次课程作业时,显得力不从心;个别算法也研究的不够透彻。

在接下来的研究中,我仍然要加强理论知识的研究,并且在研究的同时联系实际,在日常工作中注意运用《数据挖掘》所学到的知识,不断加深巩固,不断发现问题,解决问题。

另外,对于自己掌握不牢的知识要勤复,多练,使自己早日成为一名合格的计算机毕业生。

第二大题:KNN算法介绍KNN算法,又叫K最邻近分类算法,是数据挖掘分类技术中最简单的方法之一。

所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。

KNN算法的基本思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

KNN算法流程1.计算测试数据与各个训练数据之间的距离;2.按照距离的递增关系进行排序;3.选取距离最小的K个点;4.确定前K个点所在类别的出现频率;5.返回前K个点中出现频率最高的类别作为测试数据的预测分类。

Python实现算法及预测在Python中,我们可以使用sklearn库来实现KNN算法。

具体实现代码如下:pythonfrom sklearn.neighbors import KNeighborsClassifierknn = KNeighborsClassifier(n_neighbors=k)knn.fit(X_train。

数据挖掘练习题附答案

数据挖掘练习题附答案

数据挖掘练习题A一、简答题1. 数据对象之间的相似性可用距离来衡量,常见的距离形式有哪些?答:曼哈顿距离,欧几里得距离,切比雪夫距离,闵可夫斯基距离,杰卡德距离2. 简述朴素贝叶斯分类的基本思想。

答:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个概率最大,就认为此待分类项属于哪个类别。

1)设x={a!,a",…,a#}为一个待分类项,a为x的特征属性;2)有类别集合C={y!,y",…,y$}3) 计算p(y!|x),p(y"|x),… p(y$|x)4) 如果p(y%|x)=max {p(y!|x),p(y"|x),…,p(y%|x)},则x∈y%3. 在做数据清洗时,如何处理缺失值?答:处理缺失值的方法有3种:1)忽略元组;2)数据补齐,包括人工填写、特殊值填充、平均值填充、使用最可能的值填充;3)不处理。

4. 简述K-means算法的基本步骤。

答:1)任意选择k个对象作为初始的簇中心;2)计算其它对象与这k个中心的距离,然后把每个对象归入离它“最近”的簇;3)计算各簇中对象的平均值,然后选择簇中心(离平均值“最近”的簇);4)重复第2步到第3步直到簇中心不再变化为止。

5. 在关联规则中,支持度(support)和置信度(confidence)的含义分别是什么?答:支持度support(x->y)=p(x,y),表示项集中同时含有x和y的概率。

置信度confidence(x->y)=p(y/x),表示在关联规则的先决条件x发生的条件下,关联结果y发生的概率,即含有x的项集中,同时含有y的可能性。

二、计算题1.假定属性A的取值x在[x_min,x_max]之间,其中x_min和x_max分别为属性A的最小值和最大值,请利用最小-最大规范化方法(也称离差标准化,是对原始数据的线性变化),将x转化到新的区间[y_min,y_max]中,结果用x’表示。

数据挖掘考试题库及答案

数据挖掘考试题库及答案

数据挖掘考试题库及答案一、选择题1. 数据挖掘是从大量数据中提取有价值信息的过程,以下哪项不是数据挖掘的主要任务?A. 预测B. 分类C. 聚类D. 数据可视化答案:D2. 以下哪种技术不属于数据挖掘的常用方法?A. 决策树B. 支持向量机C. 关联规则D. 数据仓库答案:D3. 数据挖掘中,以下哪项技术常用于分类和预测?A. 神经网络B. K-均值聚类C. 主成分分析D. 决策树答案:D4. 在数据挖掘中,以下哪个概念表示数据集中的属性?A. 数据项B. 数据记录C. 数据属性D. 数据集答案:C5. 数据挖掘中,以下哪个算法用于求解关联规则?A. Apriori算法B. ID3算法C. K-Means算法D. C4.5算法答案:A二、填空题6. 数据挖掘的目的是从大量数据中提取______信息。

答案:有价值7. 在数据挖掘中,分类任务分为有监督学习和______学习。

答案:无监督8. 决策树是一种用于分类和预测的树形结构,其核心思想是______。

答案:递归划分9. 关联规则挖掘中,支持度表示某个项集在数据集中的出现频率,置信度表示______。

答案:包含项集的记录中同时包含结论的记录的比例10. 数据挖掘中,聚类分析是将数据集划分为若干个______的子集。

答案:相似三、判断题11. 数据挖掘只关注大量数据中的异常值。

()答案:错误12. 数据挖掘是数据仓库的一部分。

()答案:正确13. 决策树算法适用于处理连续属性的分类问题。

()答案:错误14. 数据挖掘中的聚类分析是无监督学习任务。

()答案:正确15. 关联规则挖掘中,支持度越高,关联规则越可靠。

()答案:错误四、简答题16. 简述数据挖掘的主要任务。

答案:数据挖掘的主要任务包括预测、分类、聚类、关联规则挖掘、异常检测等。

17. 简述决策树算法的基本原理。

答案:决策树算法是一种自顶向下的递归划分方法。

它通过选择具有最高信息增益的属性进行划分,将数据集划分为若干个子集,直到满足停止条件。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

您的本次作业分数为:100分1.【第001章】孤立点挖掘适用于下列哪种场合?A 目标市场分析B 购物篮分析C 模式识别D 信用卡欺诈检测正确答案:D2.【第01章】根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。

A 关联分析B 分类和预测C 演变分析D 概念描述正确答案:B3.【第01章】数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。

A 所涉及的算法的复杂性B 所涉及的数据量C 计算结果的表现形式D 是否使用了人工智能技术正确答案:B4.【第01章】下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。

A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:D5.【第01章】下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:A6.【第01章】帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是()。

A 关联分析B 分类和预测C 聚类分析D 孤立点分析E 演变分析正确答案:C7.【第01章】下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。

A 选择任务相关的数据B 选择要挖掘的知识类型C 模式的兴趣度度量D 模式的可视化表示正确答案:B8.【第01章】假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()。

A 关联分析B 分类和预测C 孤立点分析D 演变分析E 概念描述正确答案:E9.【第02章】下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?A 空间填充曲线B 散点图矩阵C 平行坐标D 圆弓分割正确答案:B10.【第02章】计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?A 算术平均值B 截尾均值C 中位数D 众数正确答案:B11.【第02章】字段Size = {small, medium, large}属于那种属性类型?A 标称属性B 二元属性C 序数属性D 数值属性正确答案:C12.【第02章】字段Hair_color = {auburn, black, blond, brown, grey, red, white}属于那种属性类型?A 标称属性B 二元属性C 序数属性D 数值属性正确答案:A13.【第03章】哪种数据变换的方法将数据沿概念分层向上汇总?A 平滑B 聚集C 数据概化D 规范化正确答案:C14.【第03章】下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?A 数据清理B 数据集成C 数据变换D 数据归约正确答案:A15.【第03章】()通过将属性域划分为区间,从而减少给定连续值的个数。

A 概念分层B 离散化C 分箱D 直方图正确答案:B16.【第03章】数据的噪声是指()。

A 孤立点B 空缺值C 测量变量中的随即错误或偏差D 数据变换引起的错误正确答案:C17.【第03章】进行数据规范化的目的是()。

A 去掉数据中的噪声B 对数据进行汇总和聚集C 使用概念分层,用高层次概念替换低层次“原始”数据D 将属性按比例缩放,使之落入一个小的特定区间正确答案:D18.【第03章】数据归约的目的是()。

A 填补数据种的空缺值B 集成多个数据源的数据C 得到数据集的压缩表示D 规范化数据正确答案:C19.【第03章】下列哪些是数据变换可能涉及的内容?A 数据压缩B 数据概化C 维归约D 规范化正确答案:BD20.【第03章】数据清理的目的是处理数据中的()。

A 空缺值B 噪声数据C 不一致数据D 敏感数据正确答案:ABC21.【第03章】下面哪些问题是我们进行数据预处理的原因?A 数据中的空缺值B 噪声数据C 数据中的不一致性D 数据中的概念分层正确答案:ABC22.【第03章】以下哪些原因可能引起空缺值?A 设备异常B 命名规则的不一致C 与其他已有数据不一致而被删除D 在输入时,有些数据因为得不到重视而没有被输入正确答案:ACD23.【第04章】以下哪个范围是数据仓库的数据库规模的一个合理范围?A 1-100MB 100M-10GC 10-1000GD 100GB-数TB正确答案:D24.【第04章】下面的数据操作中,哪些操作不是多维数据模型上的OLAP操作?A 上卷(roll-up)B 选择(select)C 切片(slice)D 转轴(pivot)正确答案:B25.【第04章】平均值函数avg()属于哪种类型的度量?A 分布的B 代数的C 整体的D 混合的正确答案:B26.【第04章】存放最低层汇总的方体称为()。

A 顶点方体B 方体的格C 基本方体D 维正确答案:C27.【第04章】哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?A 上卷B 下钻C 切块D 转轴正确答案:A28.【第04章】从结构的角度看,数据仓库模型包括以下几类()。

A 企业仓库B 数据集市C 虚拟仓库D 信息仓库正确答案:ABC29.【第04章】以下哪些是数据仓库的主要应用?A 信息处理B 互联网搜索C 分析处理D 数据挖掘正确答案:ACD30.【第04章】OLAP系统和OLTP系统的主要区别包括()。

A OLTP系统主要用于管理当前数据,而OLAP系统主要存放的是历史数据B 在数据的存取上,OLTP系统比OLAP系统有着更多的写操作C 对OLTP系统上的数据访问量往往比对OLAP系统的数据访问量要大得多D OLAP系统中往往存放的是汇总的数据,而OLTP系统中往往存放详细的数据正确答案:ABD31.【第04章】数据仓库的三层架构主要包括以下哪三部分?A 数据源B 数据仓库服务器C OLAP服务器D 前端工具正确答案:BCD32.【第08章】下列哪个描述是正确的?A 分类和聚类都是有指导的学习B 分类和聚类都是无指导的学习C 分类是有指导的学习,聚类是无指导的学习D 分类是无指导的学习,聚类是有指导的学习正确答案:C33.【第08章】下面哪种分类方法是属于神经网络学习算法?A 判定树归纳B 贝叶斯分类C 后向传播分类D 基于案例的推理正确答案:C34.【第08章】下面哪种分类方法是属于统计学的分类方法?A 判定树归纳B 贝叶斯分类C 后向传播分类D 基于案例的推理正确答案:B35.【第10章】以下哪种聚类方法可以发现任意形状的聚类?A 划分的方法B 基于模型的方法C 基于密度的方法D 层次的方法正确答案:C36.【第10章】下面那种数据挖掘方法可以用来检测孤立点?A 概念描述B 分类和预测C 聚类分析D 演变分析正确答案:C37.【第10章】以下哪个指标不是表示对象间的相似度和相异度?A Euclidean距离B Manhattan距离C Eula距离D Minkowski距离正确答案:C38.【第6 7章】根据关联分析中所处理的值类型,可以将关联规则分类为()。

A 布尔关联规则和量化关联规则B 单维关联规则和多维关联规则C 单层关联规则和多层关联规则D 简答关联规则和复杂关联规则正确答案:A39.【第6 7章】支持度(support)是衡量兴趣度度量()的指标。

A 实用性B 确定性C 简洁性D 新颖性正确答案:A40.【第6 7章】下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

A 关联分析B 分类和预测C 聚类分析D 演变分析正确答案:A41.【第6 7章】规则:age(X,”19-25”) ∧buys(X, “popcorn”) => buys(X, “coke”)是一个()。

A 单维关联规则B 多维关联规则C 混合维关联规则D 不是一个关联规则正确答案:B42.【第6 7章】置信度(confidence)是衡量兴趣度度量()的指标。

A 简洁性B 确定性C 实用性D 新颖性正确答案:B43.【第6 7章】根据关联分析中所涉及的抽象层,可以将关联规则分类为()。

A 布尔关联规则B 单层关联规则C 多维关联规则D 多层关联规则正确答案:BD44.【第6 7章】根据关联分析中所涉及的数据维,可以将关联规则分类为()。

A 布尔关联规则B 单维关联规则C 多维关联规则D 多层关联规则正确答案:BC45.【第6 7章】Apriori算法所面临的主要的挑战包括()。

A 会消耗大量的内存B 会产生大量的候选项集C 对候选项集的支持度计算非常繁琐D 要对数据进行多次扫描正确答案:BCD加入错题集关闭窗体底端。

相关文档
最新文档