CPDA考试真题与答案2

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

判断题

1.数据根据计量尺度不同可以分为分类数据和数值型数据。

正确答案:X

2.多次抛一枚硬币,正面朝上的频率是1/2。正确答案:X

3•归纳法是一种从个别到一般的推理方法。

正确答案:V

4.datahoop 中输入的数据必须是数值型的。

正确答案:X

5.置信水平是假设检验中犯第一类错误的概率。

正确答案:X

6.当两种产品为互补品时,其交叉弹性小于零。正确答案:X

正确答案:V

7.时间序列分解法可以有乘法模型和加法模型两种表示方式,其中乘法模型都是相对值来表示预测值的,加法模型都是用绝对值来表示预测值的。

正确答案:X

8•需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。

正确答案:X

9.盈亏平衡分析是静态分析,不考虑资金的时间价值和项目寿命周期内的现金流量的变化。

正确答案:V

10.决策树算法易于理解好实现,且对缺失值、异常值和共线性都不敏感,是做分类预测的首选算正确答案:X

法。

正确答案:X

11.随机森林中的每棵树都不进行剪枝,因此过拟合的风险很高。

正确答案:X

12.当倒传递神经网络(BP神经网络)无隐藏层,输出层个数只有一个的时候,也可以看做是逻辑回归模型。

正确答案:V

13.维规约即事先规定所取模型的维数,可以认为是降维的一种。

正确答案:X

14.标准差越小,表示离散程度越小,风险越大;反之离散程度越大,风险越小。

正确答案:X

15.离群点是一个实际观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产

生的。

单选题

正确答案:V

1.SQL语言中,删除一个表中所有数据,但保留表结构的命令是()

A、DELETE

B、DROP

C、CLEAR

D、REMORE

正确答案:A

2.数据库系统是由()组成的

A、数据库、数据库管理系统和用户

B、数据文件、命令文件和报表

C、数据库文件结构和数据

D、常量、变量和函数

正确答案:A

3.假如学生考试成绩以“优”.“良”.“及格”和“不及格”为了记录明全班同学考试成绩的水平高低,其集中趋势的测度()

A、可以采用算术平均数

B、可以采用众数或中位数

C、只能采用众数

D、只能采用四分位数

正确答案:C

4.以下哪个变量可以反映客户的忠诚度?()

A、购买频次

B、购买金额

C、最后一次购买时间

D、购买金额波动率

正确答案:A

5.以下哪个类型的变量在作预测客户流失的模型中最有解释力度?

A、人口基本数据,比如年龄和性别

B、基本社会状态数据,比如收入和职业

C、业务数据,比如消费频次

D、业务数据的衍生变量,比如最近3个月消费频次的变化情况

正确答案:D

6.下面关于聚类分析说法错误的是()

A、一定存在一个最优的分类

B、聚类分析是无监督学习

C、聚类分析可以用于判断异常值

D、聚类分析即:物以类聚,人以群分

正确答案:A

7.某小区60 %居民订晚报,45 %订青年报,30 %两报均订,随机抽一户。则至少订一种报

的概率为()

A、0.82

B、0.85

C、0.80

D、0.75

正确答案:D

8.在Excel工作表中,在某单元格内输入数值

123,不正确的输入形式是()

A、123

B、=123

C、+123

D、*123

正确答案:D

9.在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么

A、违反了建模的假设条件

B、加大了处理的难度

C、无法针对分区后各个数据集的特征分别做数据清洗

D、无法对不同数据清理的方法进行比较,以选择最优方法

正确答案:D

10.当一个连续变量的缺失值占比在85%左右时,以下哪种方式最合理()

A、直接使用该变量

B、根据是否缺失,生成指示变量,仅使用指示变量作为解释变量

C、使用多重插补的方法进行缺失值填补

D、直接删除该变量

正确答案:B

11.Naive Bayes 是属于数据挖掘中的什么方法?

A、聚类

B、分类

C、时间序列

D、关联规则

正确答案:B

12.有一条关联规则为A T B,此规则的信心水平(confidence)为60%,则代表()

A、买B商品的顾客中,有60%的顾客会同时购买A

B、同时购买A,B两商品的顾客,占所有顾客的60%

C、买A商品的顾客中,有60%的顾客会同时购买B

D、两商品A,B在交易数据库中同时被购买的机率为60%

正确答案:C

13.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是(

A、数据越多越好

B、尽可能多的适合的数据

C、数据越少越好

D、以上三条都不正确

正确答案:B

14.在有指导的数据挖掘中,有关测试集的说法错误的是()

A、测试集和训练集是相互联系的

B、测试集是用以测试模型的数据集

C、通常测试集大约占总样本的三分之一

D、K-次交叉验证中,测试集只有1个,训练集有K-1个

正确答案:A

15.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低

50%,则样本容量需

要扩大到原来的()

B、3倍

C、4倍

相关文档
最新文档