《数据挖掘》练习题(第6章)
一、填空题
1、关联规则挖掘的目的是。2
项集{的支持数为,支持度为。
3、在第2题的事务数据集中,如果将最小支持数定为3,则数据集中的频繁项集有。
4、在第2题的事务数据集中,规则
{牛奶,尿布}→{啤酒}
的支持度为,置信度为。
,
5、满足最小支持度和最小信任度的关联规则称为。
6、给定一个事务数据库,关联规则挖掘间题就是通过用户指定的和
来寻找强关联规则的过程。
7、关联规则挖掘问题可以划分成和两个子问题。
8、可以降低产生频繁项集的计算复杂度两种方法为:
和。
9、k-候选集
C产生的方法有:、和。
k
10、Apriori算法有两个致命的性能瓶颈。它们分别是:
(1)
(2)
二、多项选择题
^
1、设有项目集
,X X是X的一个子集,则下列结论中成立的是( )
1
A、如果X如果频繁项目集,则
X也是频繁项目集;
1
B、如果
X如果频繁项目集,则X也是频繁项目集;
1
C、如果X如果非频繁项目集,则
X也是非频繁项目集;
1
C、如果
X如果非频繁项目集,则X也是非频繁项目集;
1
E、如果X如果频繁项目集,则
X可能是频繁项目集也可能是非频繁项目集。
1
2、设3-项集{}
a b c是频繁项目集,则下列1-项集和2-项集中,( )是频
,,
繁项目集。
A、{},a b
B、{},b c
C、{},a c
D、{}a
E、{}b
3、设事务数据库D具有项集{}
→不是强关联规则时,
=,已知BC AD
,,,
I A B C D
则下列关联规则中,( )一定不是强关联规则。
A、B ACD
→E、AD BC
→
→D、ABC D
→B、CD AB
→C、C ABD
*
4、设事务数据库D具有项集{}
→不是强关联规则时,
=,已知BC AD
,,,
I A B C D
则下列关联规则中,( )一定不是强关联规则。
A、B ACD
→E、AD BC
→
→D、ABC D
→B、CD AB
→C、BCD A
5、假设关联规则{}{}
bed a
→具有低可置信度,则在关联规则生成算法中,规则( )应该被丢弃(剪枝)。
A、{}{}
be ad
cd ab
→C、{}{}
→
→B、{}{}
ad bc
D、{}{}
→
bd ae
d abc
→E、{}{}
三、问答题
1、进行关联分析时,需要处理的两个关键问题是什么
2
]
四、求解题
1
(1),利用Apriori算法求出所有的频繁项目集,指出其中的最大频繁项目集。
(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。2
(1)设minsupport=40%
的最大频繁项目集。
(
(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。3
(1)设
的最大频繁项目集。
(2)设minconfidence=60%,利用Apriori算法生成找出所有的强关联规则。