CPDA考试真题含答案.docx

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

精品文档

一、判断题

1.样本容量是指从总体中抽取的个体。

正确答案:×

2.品质数据既可以用整数值表示,也可以用连续值表示。

正确答案:√

3.需求弹性大的产品价格与销售收入反向变化。

正确答案:√

4.一般而言,定量预测方法在满足下列三个条件时才能使用:一是能够知道待测变量的过去

值,二是信息可以量化,三是过去的变动形式将持续到未来是一个合理的假设。

正确答案:√

5.在对不同项目进行风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。正确答案:×

6.在一定时期和一定产销量范围内,固定成本与产品的产销量多少没有关系,只有可变成

本才与产品产销量的增减变化发生关系。

正确答案:√

7.如果两个变量不独立,那这两者的相关系数必然不等于0 。

正确答案:×

8.数据库类型是按照数据存取的方法来划分的。

正确答案:×

9.SQL 语言中,条件年龄 BETWEEN 15 AND 35,表示年龄在 15 至 35 之间,且包括 15 岁但不包括 35 岁。

正确答案:×

10.资本成本就是资金的时间价值。

正确答案:×

精品文档

11.一组数据排序后处于25%和 75%位置上的值称为四分位数。

正确答案:√

12.企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。

正确答案:×

13.内部收益率考虑了资金时间价值,受折现率高低的影响。

正确答案:×

14.边际收入是指每增加 1 单位销量所带来的总收入的增加额度。

正确答案:√

15.分类预测时,准确率和召回率存在矛盾关系,不能同时增大,所以要考虑他们的综合影

响,即 F1-Score 。

正确答案:×

二、单选题

1.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为()

A、1

B、 -1

C、 +1 或 -1

D、0

正确答案:C

2.表示职称为副教授、性别为男的表达式为()

A、职称 =' 副教授 ' OR 性别 =' 男 '

B、职称 =' 副教授 ' AND性别='男'

C、 BETWEEN '副教授 ' AND ' 男'

D、IN (' 副教授 ','男 ')

正确答案:B

3.对于下列实验数据: 1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11,描述其集中趋势用()最为适宜,其值是()。

A、平均数, 14.4

B、中位数, 8.5

C、众数,8

D、以上都可以

正确答案:C

4.()是进行项目投资效益评价的最终依据。

A、现金流量

B、盈亏平衡点

C、净现金流量

D、现金流入量

正确答案:C

5.有一组数据其均值是20 ,对其中的每一个数据都加上10 ,那么得到的这组新数据的均值是()。

A、20

B、 10

C、 15

D、30

正确答案:D

6.分类变量使用以下哪个统计量进行缺失值填补较合适

A、均值

B、最大值

C、众数

D、中位数

正确答案:C

7.假设 {BCE}为一频繁项目集 (Frequent Itemset) ,则根据 Apriori Principle 以下何者不是子频繁项目?

A、BC

B、 CE

C、 C

D、CD

正确答案:D

8.请问以下何者属于时间序列的问题?

A、信用卡发卡银行侦测潜在的卡奴

B、基金经理人针对个股做出未来价格预测

C、电信公司将人户区分为数个群体

D、以上均不是

正确答案:B

9.数据正规化 (Data Normalization) 是在知识发掘处理 (Knowledge Discovery Process)中的哪一个阶段进行?

A、数据清洗

B、数据选择

C、数据编码

D、数据扩充

正确答案:C

10.已知事件 A 的概率 P(A)= 0.6, U 为必然事件,则P(A+U) = 1,P(AU )= _______

A、0.4

B、 0.6

C、 0

D、1

正确答案:B

11.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型()

A、直线

B、二次抛物线

C、三次抛物线

D、指数曲线

正确答案:A

12.变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响()

A、方差分析

B、回归分析

C、聚类分析

D、主成分分析

正确答案:C

13.若数据量较大 ,下面哪种方式比较适合()

A、系统聚类

B、快速聚类(k-means )

C、 A 和 B 都可以

D、A 和 B 都不可以

正确答案:B

14.在建立线性回归 (Linear Regression) 之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度?

A、皮尔森相关系数

B、卡方检定

C、 T- 检定

D、Z-Score

正确答案:A

15.ROC 曲线凸向哪个角,代表模型越理想?

A、左上角

B、右上角

C、左下角

D、右下角

正确答案:A

16.决策树中的Information Gain的计算是用来?

A、剪枝

B、使树成长

C、处理缺失值和异常值

D、砍树

正确答案:B

17.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数

据相分离?

A、分类

B、聚类

C、关联分析

相关文档
最新文档