最新数据挖掘第三版第十章课后习题答案
10.1 简略介绍如下聚类方法:划分方法、层次方法。每种给出两个例子。
(1)划分方法:给定一个有N个对象的集合,划分方法构造数据的K个分区,每一个分区表示一个簇,且K≤N。而且这K个分组满足下列条件:第一,每一个分组至少包含一条记录;第二,每一条记录属于且仅属于一个分组(注意:这个要求在某些模糊聚类算法中可以放宽);对于给定的K,算法首先给出一个初始的分组方法,以后通过反复迭代的方法改变分组,使得每一次改进之后的分组方案都较前一次好,而所谓好的标准就是:同一分组中的记录越近越好,而不同分组中的记录越远越好。
使用这个基本思想的算法有:K-MEANS 算法、K-MEDOIDS 算法、CLARANS 算法。
(2)层次方法:这种方法对给定的数据集进行层次似的分解,直到某种条件满足为止。具体又可分为“自底向上”和“自顶向下”两种方案。例如在“自底向上”方案中,初始时每一个数据记录都组成一个单独的组,在接下来的迭代中,它把那些相互邻近的组合并成一个组,直到所有的记录组成一个分组或者某个条件满足为止。
代表算法有:BIRCH 算法、CURE 算法、CHAMELEON 算法等。
10.2 假设数据挖掘的任务是将如下的8个点(用(x, y)代表位置)聚类为3个簇。
A1(2,10), A2(2,5), A3(8,4), B1(5,8), B2(7,5), B3(6,4), C1(1,2), C2(4,9)
距离函数是欧氏距离。假设初始我们选择A1、B1和C1分别为每个簇的中心,用k-均值算法给出:
(a)在第一轮执行后的3个簇中心。
(b)最后的3个簇。
(a)第一轮后, 三个新的簇为(1){A1}
(2){B1,A3,B2,B3,C2}
(3){C1,A2}
簇中心分别为(1) (2, 10), (2) (6, 6), (3) (1.5, 3.5).
(b)最后3个簇为(1) {A1,C2,B1}, (2) {A3,B2,B3}, (3) {C1,A2}.
10.6 k-均值和k-中心点算法都可以进行有效的聚类。
(a)概述k-均值和k-中心点相比较的优缺点。
(b)概述这两种方法与层次聚类方法(如AGNES)相比有何优缺点。
(a)当存在噪声和离群点时, k-中心点算法比k-均值具有更强的鲁棒性。因为在中心点不像均值那样容易受离群值或其他极端值影响。但是, 它的计算开销更大。
(b)k-均值和k-中心点都是划分方法。这种划分方法分优点是,可以撤销之前的聚类步骤(通过迭代迁移), 不像层次方法, 一旦执行了拆分或合并, 就不能做出调整。层次方法的这种弱点可能使产生的聚类的质量受到影响。
划分方法找球形簇的效果很好。一般来说,对于中小型数据库, 结果聚类的质量很好。他们需要提前知道簇的数量可以被认为是一个弱点。层次聚类方法可以自动确定集群的数量。然而,他们难以扩展,因为每个分裂或合并的决定可能要求大量对象或集群的检查和评价。然而, 层次方法可以与其他聚类方法集成, 改进聚类, 如BIRCH, ROCK, 和Chameleon.
10.14 聚类已经被认为是一种具有广泛应用的、重要的数据挖掘任务。对如下每种情况给出一个应用实例:
(a)把聚类作为主要的数据挖掘功能的应用。
(b)把聚类作为预处理工具,为其他数据挖掘任务作数据准备的应用。
(a)如电子商务网站中的客户群划分。根据客户的个人信息、消费习惯、浏览行为等信息,计算客户之间的相似度,然后采用合适的聚类算法对所有客户进行类划分;基于得到的客户群信息,相关的店主可以制定相应的营销策略,如交叉销售,根据某个客户群中的其中一个客户的购买商品推荐给另外一个未曾购买此商品的客户。
(b)如电子商务网站中的推荐系统。电子商务网站可以根据得到的客户群,采用关联规则或者隐马尔科夫模型对每个客户群生成消费习惯规则,检测客户的消费模式,这些规则或模式可以用于商品推荐。其中客户群可以通过聚类算法来预先处理获取得到。编号:710
章节实验二试题:
实验中芦丁和槲皮素的层析检识选用了何种担体?分离原理是什么?
此种担体较常用的移动相是什么?
为何选用AlCl3作显色剂?
写出槲皮素结构式。
【答案】
1.聚酰胺
2.原理是氢键吸附。
3.常用水—乙醇不同比例为移动相。
4.芦丁与槲皮素为黄酮类,且都有5-OH、邻二酚羟基,槲皮素还有3-OH,与AlCl3反应可显黄绿色荧光。编号:716
章节2.1试题:
简述中药化学成分划分概况。(写出五种类型)
题号868
【答案】
一.按物质基本类型:有无机成分、有机成分。
二.按化学结构母核或骨架:甙、黄酮、甾类、萜类、醌类等。
三.按酸碱性:酸性、中性、碱性成分。
四.按极性程度:亲脂性(非极性)、中等极性、亲水性(极性)。
五.有无活性:有效(有活性)成分、无效成分。
六.按物质代谢有一级代谢产物、二级代谢产物。
编号:718
章节2.2试题:
某氯仿或乙醚中含有机酸、酚性成分、中性成分、碱性成分,如何用萃取法将它们分离。可用流程表示。
编号:722
章节4.3试题:
在羟基蒽醌中,羟基位置与酸性强弱有何关系?为什么?对碱的溶解性有何不同?
题号874
【答案】
β-OH酸性较强,α-OH酸性较弱。
1.受羰基及p-π共轭效应的影响使β-OH酸性增强可溶于Na2CO3;
2.与羰基形成分子内氢键使α-OH酸性降低,不溶于Na2CO3,可溶于NaOH。
编号:723
章节4.6试题:
羟基蒽醌乙酰化时,乙酰化试剂有哪些种?欲保护α-OH,须用什么方法?为什么?
题号875
【答案】
1.有冰乙酸、醋酐、醋酐+硼酸、醋酐+硫酸、醋酐+吡啶。
2.可用醋酐/硼酸作为乙酰化试剂。
3.硼酸可与α-OH络合形成络合物,并且该络合物不稳定,加水可分解,恢复原结构。
编号:725
章节4.3试题:
羟基蒽醌的酸性与结构有什么关系?