《数据挖掘》练习题(第6章)

《数据挖掘》练习题(第6章)
《数据挖掘》练习题(第6章)

一、填空题

1、关联规则挖掘的目的是。2

项集{的支持数为,支持度为。

3、在第2题的事务数据集中,如果将最小支持数定为3,则数据集中的频繁项集有。

4、在第2题的事务数据集中,规则

{牛奶,尿布}→{啤酒}

的支持度为,置信度为。

5、满足最小支持度和最小信任度的关联规则称为。

6、给定一个事务数据库,关联规则挖掘间题就是通过用户指定的和

来寻找强关联规则的过程。

7、关联规则挖掘问题可以划分成和两个子问题。

8、可以降低产生频繁项集的计算复杂度两种方法为:

和。

9、k-候选集

C产生的方法有:、和。

k

10、Apriori算法有两个致命的性能瓶颈。它们分别是:

(1)

(2)

二、多项选择题

^

1、设有项目集

,X X是X的一个子集,则下列结论中成立的是( )

1

A、如果X如果频繁项目集,则

X也是频繁项目集;

1

B、如果

X如果频繁项目集,则X也是频繁项目集;

1

C、如果X如果非频繁项目集,则

X也是非频繁项目集;

1

C、如果

X如果非频繁项目集,则X也是非频繁项目集;

1

E、如果X如果频繁项目集,则

X可能是频繁项目集也可能是非频繁项目集。

1

2、设3-项集{}

a b c是频繁项目集,则下列1-项集和2-项集中,( )是频

,,

繁项目集。

A、{},a b

B、{},b c

C、{},a c

D、{}a

E、{}b

3、设事务数据库D具有项集{}

→不是强关联规则时,

=,已知BC AD

,,,

I A B C D

则下列关联规则中,( )一定不是强关联规则。

A、B ACD

→E、AD BC

→D、ABC D

→B、CD AB

→C、C ABD

*

4、设事务数据库D具有项集{}

→不是强关联规则时,

=,已知BC AD

,,,

I A B C D

则下列关联规则中,( )一定不是强关联规则。

A、B ACD

→E、AD BC

→D、ABC D

→B、CD AB

→C、BCD A

5、假设关联规则{}{}

bed a

→具有低可置信度,则在关联规则生成算法中,规则( )应该被丢弃(剪枝)。

A、{}{}

be ad

cd ab

→C、{}{}

→B、{}{}

ad bc

D、{}{}

bd ae

d abc

→E、{}{}

三、问答题

1、进行关联分析时,需要处理的两个关键问题是什么

2

]

四、求解题

1

(1),利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。

(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。2

(1)设minsupport=40%

的最大频繁项目集。

(

(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。3

(1)设

的最大频繁项目集。

(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。

相关主题
相关文档
最新文档