CPDA考试真题含答案.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精品文档
一、判断题
1.样本容量是指从总体中抽取的个体。
正确答案:×
2.品质数据既可以用整数值表示,也可以用连续值表示。
正确答案:√
3.需求弹性大的产品价格与销售收入反向变化。
正确答案:√
4.一般而言,定量预测方法在满足下列三个条件时才能使用:一是能够知道待测变量的过去
值,二是信息可以量化,三是过去的变动形式将持续到未来是一个合理的假设。
正确答案:√
5.在对不同项目进行风险衡量时,可以用标准差作为标准,标准差越大,方案风险水平越高。正确答案:×
6.在一定时期和一定产销量范围内,固定成本与产品的产销量多少没有关系,只有可变成
本才与产品产销量的增减变化发生关系。
正确答案:√
7.如果两个变量不独立,那这两者的相关系数必然不等于0 。
正确答案:×
8.数据库类型是按照数据存取的方法来划分的。
正确答案:×
9.SQL 语言中,条件年龄 BETWEEN 15 AND 35,表示年龄在 15 至 35 之间,且包括 15 岁但不包括 35 岁。
正确答案:×
10.资本成本就是资金的时间价值。
正确答案:×
精品文档
11.一组数据排序后处于25%和 75%位置上的值称为四分位数。
正确答案:√
12.企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。
正确答案:×
13.内部收益率考虑了资金时间价值,受折现率高低的影响。
正确答案:×
14.边际收入是指每增加 1 单位销量所带来的总收入的增加额度。
正确答案:√
15.分类预测时,准确率和召回率存在矛盾关系,不能同时增大,所以要考虑他们的综合影
响,即 F1-Score 。
正确答案:×
二、单选题
1.当所有观测值都落在回归直线上,则这两个变量之间的相关系数为()
A、1
B、 -1
C、 +1 或 -1
D、0
正确答案:C
2.表示职称为副教授、性别为男的表达式为()
A、职称 =' 副教授 ' OR 性别 =' 男 '
B、职称 =' 副教授 ' AND性别='男'
C、 BETWEEN '副教授 ' AND ' 男'
D、IN (' 副教授 ','男 ')
正确答案:B
3.对于下列实验数据: 1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11,描述其集中趋势用()最为适宜,其值是()。
A、平均数, 14.4
B、中位数, 8.5
C、众数,8
D、以上都可以
正确答案:C
4.()是进行项目投资效益评价的最终依据。
A、现金流量
B、盈亏平衡点
C、净现金流量
D、现金流入量
正确答案:C
5.有一组数据其均值是20 ,对其中的每一个数据都加上10 ,那么得到的这组新数据的均值是()。
A、20
B、 10
C、 15
D、30
正确答案:D
6.分类变量使用以下哪个统计量进行缺失值填补较合适
A、均值
B、最大值
C、众数
D、中位数
正确答案:C
7.假设 {BCE}为一频繁项目集 (Frequent Itemset) ,则根据 Apriori Principle 以下何者不是子频繁项目?
A、BC
B、 CE
C、 C
D、CD
正确答案:D
8.请问以下何者属于时间序列的问题?
A、信用卡发卡银行侦测潜在的卡奴
B、基金经理人针对个股做出未来价格预测
C、电信公司将人户区分为数个群体
D、以上均不是
正确答案:B
9.数据正规化 (Data Normalization) 是在知识发掘处理 (Knowledge Discovery Process)中的哪一个阶段进行?
A、数据清洗
B、数据选择
C、数据编码
D、数据扩充
正确答案:C
10.已知事件 A 的概率 P(A)= 0.6, U 为必然事件,则P(A+U) = 1,P(AU )= _______
A、0.4
B、 0.6
C、 0
D、1
正确答案:B
11.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型()
A、直线
B、二次抛物线
C、三次抛物线
D、指数曲线
正确答案:A
12.变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响()
A、方差分析
B、回归分析
C、聚类分析
D、主成分分析
正确答案:C
13.若数据量较大 ,下面哪种方式比较适合()
A、系统聚类
B、快速聚类(k-means )
C、 A 和 B 都可以
D、A 和 B 都不可以
正确答案:B
14.在建立线性回归 (Linear Regression) 之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度?
A、皮尔森相关系数
B、卡方检定
C、 T- 检定
D、Z-Score
正确答案:A
15.ROC 曲线凸向哪个角,代表模型越理想?
A、左上角
B、右上角
C、左下角
D、右下角
正确答案:A
16.决策树中的Information Gain的计算是用来?
A、剪枝
B、使树成长
C、处理缺失值和异常值
D、砍树
正确答案:B
17.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数
据相分离?
A、分类
B、聚类
C、关联分析