CPDA考试真题与答案 1

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、单选题

1.“大数据”是指规模超过1000TB的数据集。

正确答案:×

2.概率为0的事件是不可能事件,概率为1的事件是必然事件。

正确答案:×

3.将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽样。正确答案:√

4.统计图中的散点图主要用来观察变量之间的相关关系。

正确答案:√

5.抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。

正确答案:×

6.Datahoop1.2版中K-means聚类分析要求输入的数据必须是数值型数据。

正确答案:√

7.如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。

正确答案:×

8. SQL中删除表的命令是“DELETE TABLE”。

正确答案:×

9.聚类分析中,各变量的取值在数量级上不能有过大的差异。

正确答案:√

10.如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。

正确答案:×

11.需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高

价格。

正确答案:×

12.使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。

正确答案:√

13.线性回归模型的拟合优度可采用可决系数进行评判。可决系数越高,模型拟合效果越好;

可决系数越小,模型拟合效果越差。

正确答案:×

14.一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一

一分解之后进行分析。

正确答案:×

15.决策树中包含根结点、叶结点、内部结点和外部结点。

正确答案:×

二、单选题

1. 检查异常值常用的统计图形是()

A、柱状图

B、箱线图

C、帕累托图

D、气泡图

正确答案:B

2. 什么是KDD?()

A、数据挖掘与知识发现

B、领域知识发现

C、文档知识发现

D、动态知识发现

正确答案:A

3. 东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"以上对话体现了数据分析方法中的()

A、关联

B、聚类

C、分类

D、自然语言处理

正确答案:A

4. 假设检验中显著性水平是()

A、推断时犯取伪错误的概率

B、推断时取伪弃真的概率

C、正确推断的概率

D、是推断的可信度

正确答案:B

5. 矩估计的基本原理是()

A、用样本矩估计总体矩

B、使得似然函数达到最大

C、使得似然函数达到最小

D、小概率事件在一次试验中是不可能发生的

正确答案:A

6. SQL查询语句中HAVING子句的作用是()

A、指出分组查询的范围

B、指出分组查询的值

C、指出分组查询的条件

D、指出分组查询的内容

正确答案:C

7. 以下哪项关于决策树的说法是错误的()

A、冗余属性不会对决策树的准确率造成不利的影响

B、子树可能在决策树中重复多次

C、决策树算法对于噪声的干扰非常敏感

D、寻找最佳决策树是NP完全问题

正确答案:C

8. 以下哪种方法不属于于监督学习模型()

A、决策树

B、线性回归

C、关联分析

D、判别分析

正确答案:C

9考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,若采用合并策略,则由候选产生过程得到4-项集不包含()

A、1,2,3,4

B、1,2,3,5

C、1,2,4,5

D、1,3,4,5

正确答案:C

10. 下列不属于原始数据来源的是()

A、行政记录

B、统计调查

C、统计年鉴

D、实验

正确答案:C

11. 下列不属于分类算法的是()

A、C4.5算法

B、逻辑回归

C、KNN算法

D、TF-TDF算法

正确答案:D

12. 相关分析与回归分析的一个重要区别是()

A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示

B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度

C、两者都研究变量间的变动关系

D、两者都不研究变量间的变动关系

正确答案:A

13. 数据仓库是随着时间变化的,下面的描述不正确的是()

A、数据仓库随时间的变化不断增加新的数据内容

B、捕捉到的新数据会覆盖原来的快照

C、数据仓库随时间变化不断删去旧的数据内容

D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合正确答案:C

14. 资金的时间价值是()

A、同一资金在同一时点上价值量的差额

B、同一资金在不同时点上价值量的差额

C、不同资金在同一时点上价值量的差额

D、不同资金在不同时点上价值量的差额

正确答案:B

15. 描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是()

A、极差

B、标准差

C、均值

D、变异系数

正确答案:B

16. 下列有关Apriori算法的说法中不正确的是()

相关文档
最新文档