南开《数据科学导论》20春期末考核答案
[南开]-《大数据导论》20春期末考核-辅导资料答案
![[南开]-《大数据导论》20春期末考核-辅导资料答案](https://img.taocdn.com/s3/m/dbab5daae87101f69f319599.png)
南开大学《大数据导论》20春期末考核注:请认真核对以下题目,确定是您需要的科目在下载!!!
一、单选题 (共 10 道试题,共 20 分)
1.大数据的特点不包含
/A/.数据体量大
/B/.价值密度高
/C/.处理速度快
/D/.数据不统一
[解析]本题为必答题,请参考课本资料,分析作答
【参考答案是】:D
2.PaaS是()的简称
/A/.软件即服务
/B/.平台即服务
/C/.基础设施即服务
/D/.硬件即服务
[解析]本题为必答题,请参考课本资料,分析作答
【参考答案是】:B
3.IaaS是()的简称
/A/.软件即服务
/B/.平台即服务
/C/.基础设施即服务
/D/.硬件即服务
[解析]本题为必答题,请参考课本资料,分析作答
【参考答案是】:C
4.购物篮问题是##的典型案例
/A/.数据变换
/B/.关联规则挖掘
/C/.数据分类
[解析]本题为必答题,请参考课本资料,分析作答
【参考答案是】:B
5.基础设施即服务的英文简称是
/A/.IaaS
/B/.PaaS
/C/.SaaS
[解析]本题为必答题,请参考课本资料,分析作答
【参考答案是】:A。
奥鹏南开20春学期《数据科学导论》在线作业标准答案

24. Apriori 算法的计算复杂度受()影响。 【选项】: A 支持度阈值 B 项数 C 事务数 D 事务平均宽度
【答案】:A.B.C.D
25. 距离度量中的距离可以是() 【选项】: A 欧式距离 B 曼哈顿距离 C Lp 距离 D Minkowski 距离
【答案】:A.B.C.D
【答案】:C
14. 层次聚类对给定的数据进行()的分解。 【选项】: A 聚合 B 层次 C 分拆 D 复制
【答案】:B
15. 层次聚类适合规模较()的数据集 【选项】: A大 B中 C小 D 所有
【答案】:C
16. 通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能 存在窃漏电等异常行为属于数据变换中的()
【答案】:D
21. 数据科学具有哪些性质() 【选项】: A 有效性 B 可用性 C 未预料 D 可理解
【答案】:A.B.C.D
22. 下列选项是 BFR 的对象是() 【选项】: A 废弃集 B 临时集 C 压缩集 D 留存集
【答案】:A.C.D
23. 多层感知机的学习过程包含()。 【选项】: A 信号的正向传播 B 信号的反向传播 C 误差的正向传播 D 误差的反向传播
【答案】:A.B.C
31. 利用 K 近邻法进行分类时,k 值过小容易发生过拟合现象。 【选项】: T对 F错
【答案】:A
32. Apriori 算法是一种典型的关联规则挖掘算法。 【选项】: T对 F错
【答案】:A
33. 贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布 有关。 【选项】: T对 F错
【选项】: A 简单函数变换 B 规范化 C 属性构造 D 连续属性离散化
2020年奥鹏南开大学 20春学期《数据

南开大学20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业试题参考答案相关题目如下1.实体识别的常见形式()【选项】:A 同名异义B 异名同义C 单位不统一D 属性不同【答案】:D2.例如将工资收入属性值映射到[-1,1]或者[0,1]内属于数据变换中的()【选项】:A 简单函数变换B 规范化C 属性构造D 连续属性离散化【答案】:B3.单层感知机模型属于()模型。
【选项】:A 二分类的线性分类模型B 二分类的非线性分类模型C 多分类的线性分类模型D 多分类的非线性分类模型【答案】:A4.通过变量标准化计算得到的回归方程称为()。
【选项】:A 标准化回归方程B 标准化偏回归方程C 标准化自回归方程D 标准化多回归方程【答案】:A5.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()【选项】:A 异常值B 缺失值C 不一致的值D 重复值【答案】:C6.以下哪些不是缺失值的影响()A 数据建模将丢失大量有用信息B 数据建模的不确定性更加显著C 对整体总是不产生什么作用D 包含空值的数据可能会使建模过程陷入混乱,导致异常的输出【答案】:C7.层次聚类适合规模较()的数据集【选项】:A 大B 中C 小D 所有【答案】:C8.以下哪个不是处理缺失值的方法()【选项】:A 删除记录B 按照一定原则补充C 不处理D 随意填写【答案】:D9.聚类的最简单最基本方法是()。
A 划分聚类B 层次聚类C 密度聚类D 距离聚类【答案】:A10.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。
【选项】:A 1,线性B 2,线性C 1,非线性D 2,非线性【答案】:A11.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()【选项】:A 1,2,3,4B 1,2,3,5C 1,2,4,5D 1,3,4,512.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。
数据科学导论----20

最新奥鹏远程南开大学《数据科学导论》20春期末考核-参考答案 - 百度文库《数据科学导论》 20 春期末考核1. 下面不是分类的常用方法的有 ()【选项】:A K 近邻法B 朴素贝叶斯C 决策树D 条件随机场【答案】: D 条件随机场 |2. BFR 聚类用于在 () 欧氏空间中对数据进行聚类【选项】:A 高维B 中维C 低维D 中高维【答案】: A 高维 |3. 聚类是一种 () 。
【选项】:A 有监督学习B 无监督学习C 强化学习D 半监督学习【答案】: B 无监督学习 |4. 数据库中相关联的两张表都存储了用户的个人信息 , 但在用户的个人信息发生改变时只更新了一张表中的数据 , 这时两张表中就有了不一致的数据 , 这属于 ()【选项】:A 异常值B 缺失值C 不一致的值D 重复值【答案】: C 不一致的值 |5. 某商品的产量 (X, 件 ) 与单位成本 (Y, 元 / 件 ) 之间的回归方程为 ^Y=100-1.2X, 这说明 () 。
【选项】:A 产量每增加一台,单位成本增加 100 元B 产量每增加一台,单位成本减少 1.2 元C 产量每增加一台,单位成本平均减少 1.2 元D 产量每增加一台,单位平均增加 100 元【答案】: C 产量每增加一台,单位成本平均减少 1.2 元 |6. 在 k 近邻法中 , 选择较小的 k 值时 , 学习的“ 近似误差” 会(),“ 估计误差” 会 () 。
【选项】:A 减小,减小B 减小,增大C 增大,减小D 增大,增大【答案】: B 减小,增大 |7. 在回归分析中 , 自变量为 (), 因变量为 () 。
【选项】:A 离散型变量,离散型变量B 连续型变量,离散型变量C 离散型变量,连续型变量D 连续型变量,连续型变量【答案】: D 连续型变量,连续型变量 |8. 手肘法的核心指标是 () 。
【选项】:A SESB SSEC RMSED MSE【答案】: B SSE |9. 特征选择的四个步骤中不包括 ()。
南开《数据科学导论》20春期末考核-00001参考答案

B.1,2,3,5
C.1,2,4,5
D.1,3,4,5
答案:C
15.单层感知机模型属于()模型。
A.二分类的线性分类模型
B.二分类的非线性分类模型
C.多分类的线性分类模型
D.多分类的非线性分类模型
答案:A
二、多选题(共5道试题,共10分)
16.系统日志收集的基本特征有()
A.高可用性
C.对整体总是不产生什么作用
D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出
答案:C
13.下列两个变量之间的关系中,哪个是函数关系()。
A.人的性别和他的身高
B.人的工资与年龄
C.正方形的面积和边长
D.温度与湿度
答案:C
14.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
C.子集搜索
D.子集验证
答案:C
10.一元线性回归中,真实值与预测值的差称为样本的()。
A.误差
B.方差
C.测差
D.残差
答案:D
11.K-means聚类适用的数据类型是()。
A.数值型数据
B.字符型数据
C.语音数据
D.所有数据
答案:A
12.以下哪些不是缺失值的影响()
A.数据建模将丢失大量有用信息
B.数据建模的不确定性更加显著
B.无监督学习
C.强化学习
D.半监督学习
答案:B
4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
南开大学《计算机科学导论》20春期末考核答卷

南开⼤学《计算机科学导论》20春期末考核答卷南开⼤学《计算机科学导论》20春期末考核注:请认真核对以下题⽬,确定是您需要的科⽬在下载⼀、单选题 (共 15 道试题,共 30 分)1.E中的任⼀实体可以通过R与F中的⾄多⼀个实体联系则R叫做E到F的()A.⼀对⼀联系B.多对⼀联系C.多对多联系D.⾮法联系解析:参看教材183,并认真复习,完成以上题⽬参考标准答案:B2.数据库中的元祖是指A.关系中除含有属性名所在⾏以外的其他⾏B.关系中包含属性名所在⾏在内的所有⾏C.关系中的任意⼀列D.关系中的所有列解析:参看教材183,并认真复习,完成以上题⽬参考标准答案:A3.打印机属于哪⼀种计算机硬件设备A.输⼊设备B.输出设备C.存储设备D.系统接⼝解析:参看教材183,并认真复习,完成以上题⽬参考标准答案:B4.哪种关系操作不要求参与运算的两个关系具有相同的属性集合A.并B.交C.差D.笛卡尔积解析:参看教材183,并认真复习,完成以上题⽬参考标准答案:D5.法国⼈Blaise Pascal建造了()A.齿轮驱动机械B.四则运算器C.织布机6.3度布尔函数共有多少个A.3B.8C.27D.256解析:参看教材183,并认真复习,完成以上题⽬参考标准答案:D7.下列哪种语⾔是⾯向对象的编程语⾔A.PascalB.BASICC.CD.C++解析:参看教材183,并认真复习,完成以上题⽬参考标准答案:D8.以下哪个选项⽤于实现SQL语⾔的查询功能A.seleceB.insertC.deleteD.update解析:参看教材183,并认真复习,完成以上题⽬参考标准答案:A9.以下哪项不属于冯诺依曼体系结构的核⼼部件A.运算器B.存储器C.输⼊输出设备D.控制器解析:参看教材183,并认真复习,完成以上题⽬参考标准答案:C10.RGB表⽰法中某种颜⾊的份额通常在以下哪对数字之间A.0-255B.0-256C.128-25511.下列哪种存储器的读取速度最快?A.主存储器B.CPU寄存器。
南开20春学期(1709、1803、1809、1903、1909、2003)《数据科学导论》在线作业答案

A.1,2,3,4
B.1,2,3,5
C.1,2,4,5
D.1,3,4,5
A.最小-最大规范化
B.零-均值规范化
C.小数定标规范化
D.中位数规范化
答案:D
3.实体识别属于以下哪个过程()
A.数据清洗
B.数据集成
C.数据规约
D.数据变换
答案:B
4.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。
A.1,线性
B.2,线性
C.1,非线性
D.2,非线性
答案:A
答案:D
8.BFR聚类用于在()欧氏空间中对数据进行聚类
A.高维
B.中维
C.低维
D.中高维
答案:A
9.只有非零值才重要的二元属性被称作:( ),其中购物篮数据就属于这种属性。
A.计数属性
B.离散属性
C.非对称的二元属性#对称属性
答案:C
10.为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。
C.组合方法
D.比较方法
答案:AB
25.相关性的分类,按照相关的方向可以分为()。
A.正相关
B.负相关
C.左相关
D.右相关
答案:AB
26.数据科学具有哪些性质()
A.有效性
B.可用性
C.未预料
D.可理解
答案:ABCD
27.k近邻法的基本要素包括()。
《数据科学导论》20春期末考核答卷

《数据科学导论》20春期末考核-00001
试卷总分:100 得分:70
一、单选题(共15 道试题,共30 分)
1.下面不是分类的常用方法的有()
A.K近邻法
B.朴素贝叶斯
C.决策树
D.条件随机场
标准答案:D
2.BFR聚类用于在()欧氏空间中对数据进行聚类
A.高维
B.中维
C.低维
D.中高维
标准答案:A
3.聚类是一种()。
A.有监督学习
B.无监督学习
C.强化学习
D.半监督学习
标准答案:B
4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
A.异常值
B.缺失值
C.不一致的值
D.重复值
标准答案:C
5.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。
A.产量每增加一台,单位成本增加100元
B.产量每增加一台,单位成本减少1.2元
C.产量每增加一台,单位成本平均减少1.2元
D.产量每增加一台,单位平均增加100元
标准答案:C
6.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。
A.减小,减小
B.减小,增大
C.增大,减小
D.增大,增大。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数据科学导论》20春期末考核-00001
试卷总分:100 得分:70
一、单选题(共15 道试题,共30 分)
1.下面不是分类的常用方法的有()
A.K近邻法
B.朴素贝叶斯
C.决策树
D.条件随机场
答案:D
2.BFR聚类用于在()欧氏空间中对数据进行聚类
A.高维
B.中维
C.低维
D.中高维
答案:A
3.聚类是一种()。
A.有监督学习
B.无监督学习
C.强化学习
D.半监督学习
答案:B
4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()
A.异常值
B.缺失值
C.不一致的值
D.重复值
答案:C
5.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这说明()。
A.产量每增加一台,单位成本增加100元
B.产量每增加一台,单位成本减少1.2元
C.产量每增加一台,单位成本平均减少1.2元
D.产量每增加一台,单位平均增加100元
答案:C
6.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。
A.减小,减小
B.减小,增大
C.增大,减小
D.增大,增大
答案:B
7.在回归分析中,自变量为(),因变量为()。
A.离散型变量,离散型变量
B.连续型变量,离散型变量
C.离散型变量,连续型变量
D.连续型变量,连续型变量
答案:D
8.手肘法的核心指标是()。
A.SES
B.SSE
C.RMSE
D.MSE
答案:B
9.特征选择的四个步骤中不包括()
A.子集产生
B.子集评估
C.子集搜索
D.子集验证
答案:C
10.一元线性回归中,真实值与预测值的差称为样本的()。
A.误差
B.方差
C.测差
D.残差
答案:D
11.K-means聚类适用的数据类型是()。
A.数值型数据
B.字符型数据
C.语音数据
D.所有数据
答案:A
12.以下哪些不是缺失值的影响()
A.数据建模将丢失大量有用信息
B.数据建模的不确定性更加显著
C.对整体总是不产生什么作用
D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出答案:C。