大数据复习题(答案)

合集下载

大数据应用基础复习题答案

大数据应用基础复习题答案

大数据应用基础复习题答案一、选择题1. 大数据的5V特性包括:A. 体积大(Volume)、速度高(Velocity)、多样性(Variety)、价值(Value)、真实性(Veracity)B. 体积大(Volume)、速度高(Velocity)、多样性(Variety)、价值(Value)、可视化(Visualization)C. 体积大(Volume)、速度高(Velocity)、多样性(Variety)、价值(Value)、易用性(Usability)D. 体积大(Volume)、速度高(Velocity)、多样性(Variety)、价值(Value)、可扩展性(Scalability)答案:A2. 在大数据中,Hadoop生态系统中的核心组件是:A. HBaseB. HiveC. SparkD. HDFS答案:D3. 以下哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C(注:实际上大数据应用已经涵盖了教育领域,但根据题目要求,选择一个不是大数据应用领域的选项,这里假设教育不是)二、简答题1. 简述大数据与传统数据仓库的区别。

答:大数据与传统数据仓库的区别主要体现在以下几个方面:- 数据类型:大数据支持结构化、半结构化和非结构化数据,而传统数据仓库主要处理结构化数据。

- 存储能力:大数据技术如Hadoop可以处理PB级别的数据,而传统数据仓库通常处理TB级别的数据。

- 处理速度:大数据技术通常采用分布式计算,能够快速处理大量数据,而传统数据仓库处理速度相对较慢。

- 成本效益:大数据技术通常使用廉价的硬件资源,成本较低;传统数据仓库可能需要昂贵的专用硬件。

- 可扩展性:大数据技术具有良好的可扩展性,可以根据需要轻松扩展;传统数据仓库的扩展性相对较差。

2. 描述Hadoop生态系统中MapReduce的工作流程。

答:MapReduce的工作流程包括以下几个步骤:- Map阶段:输入数据被分割成多个数据块,每个数据块由一个Map任务处理。

大数据专业考试题及答案

大数据专业考试题及答案

大数据专业考试题及答案一、选择题(每题2分,共20分)1. 大数据的“4V”特征不包括以下哪一项?A. Volume(体量)B. Velocity(速度)B. Variety(多样性)D. Visibility(可见性)答案:D2. 在大数据技术中,Hadoop生态系统中的核心组件是:A. SparkB. HBaseC. HiveD. HDFS答案:D3. 以下哪个不是大数据存储技术?A. NoSQL数据库B. 关系型数据库C. 分布式文件系统D. 内存数据库答案:B4. 以下哪个是大数据分析的关键技术?A. 数据清洗B. 数据可视化C. 数据挖掘D. 所有选项都是答案:D5. 大数据平台中,用于实时数据处理的技术是:A. MapReduceB. StormC. HadoopD. Cassandra答案:B...(此处省略其他选择题)二、简答题(每题10分,共30分)1. 简述大数据与传统数据仓库的主要区别。

答案:大数据与传统数据仓库的主要区别在于:大数据处理的数据量更大、数据类型更多样化、处理速度更快,并且大数据技术更倾向于分布式存储和计算,而传统数据仓库通常采用集中式存储和处理。

2. 解释什么是数据挖掘,并举例说明其应用场景。

答案:数据挖掘是从大量数据中通过算法自动或半自动地发现有趣模式和知识的过程。

例如,在零售业中,数据挖掘可以用来分析顾客的购买行为,从而进行个性化推荐和库存管理。

3. 描述Hadoop生态系统中MapReduce的工作流程。

答案:MapReduce的工作流程包括Map阶段和Reduce阶段。

在Map 阶段,输入数据被分割成多个小块,每个小块由一个Map任务处理,生成中间键值对。

在Reduce阶段,中间键值对根据键进行分组,并传递给Reduce任务,Reduce任务对每个键对应的所有值进行处理,生成最终的输出结果。

三、计算题(每题15分,共30分)1. 假设有一个大数据集,需要使用MapReduce进行处理。

大数据考试试题及答案

大数据考试试题及答案

大数据考试试题及答案1. 选择题1) 大数据的关键特征是什么?A. 数据的规模巨大B. 数据的多样性C. 数据的高速产生和流转D. 数据的价值潜力答案:A、B、C、D 全部都是2) 大数据技术的基本架构包括以下哪些层次?A. 数据采集与清洗层B. 数据存储与管理层C. 数据分析与挖掘层D. 数据展示与应用层答案:A、B、C、D 全部都有3) 大数据分析的主要方法包括以下哪些?A. 关联分析B. 聚类分析C. 回归分析D. 时间序列分析答案:A、B、C、D 全部都有2. 填空题1) 大数据的三个V分别代表什么?(简写形式即可)答案:V(Volume)代表数据规模,V(Velocity)代表数据高速产生和流转,V(Variety)代表数据多样性2) 大数据技术的核心是____和____。

答案:存储与计算3) 大数据分析的关键是____和____。

答案:数据挖掘和模型建立3. 简答题1) 请简述大数据的应用领域。

答案:大数据在各行各业都有广泛的应用。

例如,电商领域可以通过大数据分析用户消费行为,进行个性化推荐;物流领域可以利用大数据优化配送路径,提高效率;医疗领域可以通过大数据分析患者病历,辅助疾病诊断等。

2) 大数据分析的方法有哪些?答案:大数据分析的方法包括关联分析、聚类分析、分类与预测、异常检测、文本分析等。

4. 计算题1) 如果一家公司的服务器每天产生1TB(1TB = 1024GB)的数据,假设这些数据需要保存1年,计算一共需要多少存储空间?答案:1TB * 365天 = 365TB2) 某电商网站每天访问量为1000万人次,每个访问用户产生平均10个点击行为数据,假设每条点击行为数据大小为1KB,计算每天需要存储多少数据?答案:1000万人次 * 10个 = 1亿个点击行为数据1亿个 * 1KB = 100TB总结:大数据的考试试题主要包括选择题、填空题、简答题和计算题。

选择题涵盖大数据的特征、技术架构和分析方法。

完整版)大数据复习题(答案)

完整版)大数据复习题(答案)

完整版)大数据复习题(答案)1.大数据的起源是互联网。

2.大数据的最明显特点是数据规模大。

3.大数据时代,数据使用的最关键是数据再利用。

4.云计算分层架构不包括Yaas。

5.大数据技术是由___首先提出来的。

6.数据的精细化程度是指颗粒度,越细化的数据,价值越高。

7.数据清洗的方法不包括重复数据记录处理。

8.智能手环的应用开发,体现了传感器的数据采集技术的应用。

9.下列关于数据重组的说法中,错误的是数据的重新生产和采集。

10.美国海军军官___通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中在分析方法上更注重相关分析而不是因果分析。

11.下列关于含___对大数据特点的说法中,错误的是价值密度高。

12.当前社会中,最为突出的大数据环境是互联网。

13.在数据生命周期管理实践中,数据管理和维护是执行方法。

14.下列关于网络用户行为的说法中,错误的是数字轨迹用完即自动删除。

15.下列关于聚类挖掘技术的说法中,错误的是要求同类数据的内容相似度尽可能小。

1.大数据最初来源于互联网。

2.大数据最显著的特点就是数据规模庞大。

3.在大数据时代,数据再利用是最关键的。

4.云计算分层架构不包括Yaas。

5.___首先提出了大数据技术。

6.数据精细化程度指的是颗粒度,数据越精细,价值越高。

7.数据清洗的方法不包括重复数据记录处理。

8.智能手环的应用开发体现了传感器的数据采集技术的应用。

9.数据重组的说法中,错误的是数据的重新生产和采集。

10.美国海军军官___通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中更注重相关分析而不是因果分析。

11.___对大数据特点的说法中,错误的是价值密度高。

12.当前社会中,互联网是最为突出的大数据环境。

13.在数据生命周期管理实践中,数据管理和维护是执行方法。

14.关于网络用户行为的说法中,错误的是数字轨迹用完即自动删除。

大数据考试题目及答案

大数据考试题目及答案

大数据考试题目及答案一、单项选择题(每题2分,共20分)1. 大数据技术的核心目标是处理哪种类型的数据?A. 结构化数据B. 半结构化数据B. 非结构化数据D. 所有上述数据类型答案:D2. 在大数据分析中,以下哪个算法主要用于聚类分析?A. 决策树B. 神经网络C. K-meansD. 线性回归答案:C3. Hadoop的核心组件包括以下哪个?A. SparkB. HiveC. HBaseD. MapReduce答案:D4. 数据挖掘中的“关联规则”通常与哪位学者的名字联系在一起?A. 马斯洛B. 纳维斯C. 阿普拉姆D. 汉斯答案:B5. 大数据的“4V”特性不包括以下哪一项?A. 体量大B. 速度快C. 价值高D. 成本高答案:D6. 在大数据架构中,数据湖主要用于存储什么类型的数据?A. 仅结构化数据B. 仅非结构化数据C. 结构化和非结构化数据D. 仅半结构化数据答案:C7. 下列哪项不是大数据分析的常见应用场景?A. 市场分析B. 风险管理C. 客户细分D. 纸质文档打印答案:D8. 大数据技术可以有效地处理“数据孤岛”问题,这主要是指:A. 数据的物理隔离B. 数据的逻辑隔离C. 数据的格式不统一D. 数据的存储位置分散答案:B9. 在大数据环境下,以下哪个数据库更适合处理非关系型数据?A. MySQLB. OracleC. MongoDBD. SQL Server答案:C10. 大数据的实时分析通常依赖于哪种技术?A. 数据仓库B. 批处理C. 流处理D. 数据挖掘答案:C二、多项选择题(每题3分,共15分)11. 大数据的存储技术包括以下哪些选项?(多选)A. 云存储B. 分布式文件系统C. 关系型数据库D. NoSQL数据库答案:A B D12. 在大数据的生态系统中,以下哪些组件是常见的?(多选)A. HadoopB. SparkC. MongoDBD. Excel答案:A B C13. 大数据的分析过程通常包括哪些步骤?(多选)A. 数据采集B. 数据清洗C. 数据可视化D. 数据丢弃答案:A B C14. 以下哪些因素会影响大数据的性能?(多选)A. 数据的规模B. 数据的处理速度C. 数据的存储格式D. 数据的来源答案:A B C15. 在大数据安全领域,以下哪些措施是重要的?(多选)A. 数据加密B. 访问控制C. 数据备份D. 系统防火墙答案:A B C D三、简答题(每题10分,共20分)16. 请简述大数据的“4V”特性是什么?答案:大数据的“4V”特性指的是体量大(Volume)、速度快(Velocity)、类型多(Variety)、价值高(Value)。

大数据考试题目及答案

大数据考试题目及答案

大数据考试题目及答案一、单选题(每题2分,共10分)1. 大数据的“4V”特征不包括以下哪一项?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Visualization(可视化)答案:D2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. MapReduceD. YARN答案:A3. 以下哪个不是大数据技术?A. SparkB. HadoopC. MongoDBD. MySQL答案:D4. 大数据的分析处理通常不包括以下哪个阶段?A. 数据收集B. 数据清洗C. 数据存储D. 数据展示答案:D5. 下列哪个选项不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C二、多选题(每题4分,共20分)1. 大数据技术可以应用于以下哪些行业?A. 电子商务B. 物流C. 制造业D. 教育答案:A、B、C、D2. 以下哪些是Hadoop生态系统的组成部分?A. HDFSB. MapReduceC. SparkD. HBase答案:A、B、C、D3. 大数据的分析方法包括哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:A、B、C、D4. 大数据的挑战包括哪些?A. 数据安全B. 数据隐私C. 数据存储D. 数据处理答案:A、B、C、D5. 以下哪些是大数据分析工具?A. RB. PythonC. SASD. Excel答案:A、B、C三、判断题(每题2分,共10分)1. 大数据技术只能用于处理非结构化数据。

()答案:错误2. Hadoop可以处理PB级别的数据。

()答案:正确3. 大数据技术不需要考虑数据的实时性。

()答案:错误4. 大数据技术可以提高决策的效率和准确性。

()答案:正确5. 大数据技术无法应用于个人隐私保护。

()答案:错误四、简答题(每题10分,共20分)1. 简述大数据的“4V”特征。

大数据试题及答案

大数据试题及答案

第一组试题一、选择题1、以下哪个不是大数据的特征( C )A。

价值密度低B。

数据类型繁多C。

访问时间短D。

处理速度快2、当前大数据技术的基础是由( C )首先提出的。

(单选题,本题2 分)A:微软B:百度C:谷歌D:阿里巴巴3、大数据的起源是( C )。

(单选题,本题2 分)A:金融B:电信C:互联网D:公共管理4、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C )。

(单选题,本题 2 分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师5、( C )反映数据的精细化程度,越细化的数据,价值越高。

(单选题,本题2 分)A:规模B:活性C:颗粒度D: 关联度6、智能健康手环的应用开发,体现了(C )的数据采集技术的应用。

(单选题,本题2 分)A:统计报表B:网络爬虫C:传感器D:API 接口7、下列关于数据重组的说法中,错误的是(C )。

(单选题,本题2 分)A:数据重组实现的关键在于多源数据融合和数据集成B:数据重组能够使数据焕发新的光芒C:数据重组是数据的重新生产和重新采集D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C )。

(单选题,本题2 分)A:数字城市B:物联网C:联网监控D:云计算9、当前社会中,最为突出的大数据环境是(C )。

(单选题,本题2 分)A: 综合国力B:物联网C:互联网D:自然资源二、判断题1。

对于大数据而言,最基本。

最重要的是要求就是减少错误、保证质量.因此,大数据收集的信息要尽量精确。

()2. 对于大数据而言,在数据规模上强调相对数据而不是绝对数据。

()3.基于大数据的营销模式和传统营销模式,传统营销模式比大数据营销模式投入更小。

()4。

大数据具有体量大、结构单一、时效性强的特征.( )三、简答题1.大数据发展过程中遇到的问题有哪些?解析:(1)大数据是全数据,忽视甚至蔑视抽样;(2)连续数据就是大数据;(3)数据量级大是大数据;(4)数据量大好于量小。

大数据试题及答案

大数据试题及答案

大数据试题及答案1. 选择题:1. 下列哪项不属于大数据的四个"V"特点?A. Volume(数据量大)B. Value(数据价值高)C. Velocity(数据处理速度快)D. Variety(数据类型多样)答案:B. Value(数据价值高)2. 下列哪个不是大数据的常见来源?A. 传感器数据B. 金融交易数据C. 社交媒体数据D. 游戏排行榜数据答案:D. 游戏排行榜数据3. 大数据技术中,下列哪个属于数据存储和处理工具?A. Apache HadoopB. Apache SparkC. TableauD. Python答案:A. Apache Hadoop4. 在大数据处理中,下列哪项不属于数据清洗和预处理的步骤?A. 数据收集B. 数据分析C. 数据转换D. 数据集成答案:B. 数据分析2. 填空题:1. 大数据中,_______ 指的是数据的速率和延迟,即数据的产生和消耗速度之间的平衡。

答案:Velocity(数据处理速度快)2. 大数据技术中,________________ 是一种用于处理大规模数据计算的开源集群处理框架。

答案:Apache Hadoop3. 大数据分析常用的编程语言包括____________ 和____________。

答案:Python 和 R4. 在大数据清洗和预处理过程中,数据转换的步骤包括数据筛选、数据归一化和_____________。

答案:数据聚合3. 简答题:1. 请简述大数据的定义和特点。

答:大数据是指数据量庞大、类型多样、处理速度快且具有高价值的数据集合。

大数据的特点主要可以归纳为四个"V",即Volume(数据量大)、Velocity(数据处理速度快)、Variety(数据类型多样)和Value(数据价值高)。

大数据具有海量的数据量,数据来源广泛,包括传感器数据、社交媒体数据等;处理速度快,需要使用专门的大数据技术和工具进行高效的数据存储、处理和分析;数据类型多样,包括结构化数据和非结构化数据;数据具有高价值,可以帮助企业做出更准确的决策和预测。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、单选题1、大数据的起源是(B)。

A:金融B:互联网C:电信D:公共管理2、大数据的最明显特点是(B)。

A:数据类型多样B:数据规模大C:数据价值密度高D:数据处理速度快3、大数据时代,数据使用的最关键是(D)。

A:数据收集B:数据存储C:数据分析D:数据再利用4、云计算分层架构不包括(D)。

A: Iaas B: Paas C: Saas D: Yaas5、大数据技术是由(C)公司首先提出来的。

A:阿里巴巴B:百度C:谷歌D:微软6、数据的精细化程度是指(C),越细化的数据,价值越高。

A:规模B:活性C:颗粒度D:关联性7、数据清洗的方法不包括(C)A:噪声数据清除B:一致性检查C:重复数据记录处理D:缺失值处理智能手环的应用开发,体现了(C)的数据采集技术的应用。

A:网络爬虫B:API接口C:传感器D:统计报表9、下列关于数掲重组的说法中,错误的是(A)。

A:数据的重新生产和采集B:能使数据焕发新的光芒C:关键在于多源数据的融合和集成D:有利于新的数据模式创新10、美国海军军官莫里通过对前人航海日志的分析,绘制考了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B)。

A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于含思伯格对大数据特点的说法中,错误的是(D)A:数据规模大B:数据类型多C:处理速度快D:价值密度高12、当前社会中,最为突出的大数据环境是(A)A:互联网B:自然环境C:综合国力D:物联网13、在数据生命周期管理实践中,(B)是执行方法。

A:数据存储和各份规范B:数据管理和维护C:数据价值发觉和利用D:数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是(C)。

A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互痕迹能够为企业提升服务质量提供参C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、下列关于聚类挖报技术的说法中,错误的是(B)。

A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B:要求同类数据的内容相似度尽可能小C:要求不同类数据的内容相仪度尽可能小D:与分类挖据技术相似的是,都是要对数据进行分类处理16、下列国家的大数据发展行动中,集中体现“重视基础都先行”的国家是(D)A美国B:中国C:日本D:韩国17、万维网之父是(C)A彼得·德鲁克B:杨振宁c:蒂姆伯纳斯-李D:钱学森18、下列关于数掲交易市场的说法中,错误的是(C)A:数据交易市场是大数据产业发展到一定程度的产物B:商业化的数据交易活动催生了多方参与的第三方数据交易市场C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D:数据交易市场是大数据资源化的必然产物下列论据中,能够支掉“大数据无所不能”的观点是(A)A:互联网金融打破了传统的观念和行为B:大数据具有非常高的成本C:大数据存在泡沫D:个人隐私泄露与信息安全担忧20、数据仓库的最终目的是(D)A开发数据仓库的应用分析B:收集业务需求C:建立数据仓库逻辑模型D:为用户和业务部门提供决策支持21、信息时代的三大定律不包括(A)A:牛顿定理B:摩尔定律C:麦特卡尔夫定律D:吉尔德定律22、信息技术(IT)不包括(D)A:计算机技术B:通信技术C:传感技术D:新材料技术23、云计算的特点不包括(D)。

A:高性价比B:服务可计算C:服务可租用D:低使用度24、关于大数据在社会综合治理中的作用,以下描述不正确的是(C)A:大数据的运用有利于走群众路线B:大数据的运用能够维护社会治安C:大数据的运用能社绝抗生素的滥用D:大数据的运用能够加强交通管理A:身份假冒B:隐私露C:商业问课D:以上都有大数据的利用过程是(D)A:果集-挖提-清洗-统计B:果集一统计-清洗一挖据C:采集-清洗一挖据-统计D:采集一清洗--统计-挖据26、大数据的本质是(A)A:洞察B:采集C:统计D:联系27、大数据元年是(D)A:2010年B:2011年C:2012年D:2013年28、(B)提供的支撑技术,有效的解决了大数据分析、研发的问题,比如:虚拟化技术、并行计算、海量存储及管理等。

A:点计算B:云计算C:面计算D:线计算29、(D)提出在今后的十几年里,半导体处理器的性能,每18个月左右可以翻一番。

A:牛顿B:爱因斯坦C:比尔盖茨D:戈登摩尔30、从社会稳定角度看,信息安全主要包括造成重大社会影南,产生重大经济损失的信息安会事件,具体包括(D)方面31、从信息安全涉及内容来看,一般物理安全不包括(A)方面。

A:备份与恢复B:环境安全C:设备安全D:媒体安全32、大数据方法的不准确性,根本原因是(D)。

A:数据量大B:算法变化C:信息遗渴D:以上都正确33、当今时代步入了一个信息化助力社会全方位创新的重要时期,具体包括(D)。

A:云计算B:物联网C:移动互联和人工智能D:以上都是34、互联网新生业态中新兴经济形态包括(B)。

A:网红经济B:平台经济C:粉丝经济D:生态经济以下哪些可以属于智慧城市的范畴(E)。

A:智慧政务B:智慧交通C:智慧医疗D:智慧公共安全E:以上都是36、人类的思维模式不包括哪一种(C)A逻辑思维B:.直观思维C:胡乱思维D:顿悟思维37、信息素养不包括(A)。

A:信息体系B:信息能力C:信息意识D:信息道德38、信息的碎片化导致了(E)的碎片化。

A:时间B:空间C:资源D:结构E:以上都有39、新体采用的技术不包括(D)。

A:数字技术B:网络技术C:移动通信技术D:碎片技术40、曾经,绝大多数的网络设备都来自于思科,同时几乎所有的(E)都由思科掌握。

A:超级核心节点B:国际交换节点C:国际汇聚节点D:互联互通节点E:以上都包括41、下面哪个(C)程序通常与Namenode A在ー个节点启动A: TasktrackerB: DatanodeC: JobtrackerD: secondarynamenode42、Hadoop的作者是(C)A: Martin Fowler B: Kent Beck C: Doug cutting DBILL43、HDFS默认Block Size(C)。

A:16MB:32MC:64MD:128M44、下列哪项通常是集群的最主要瓶颈(D)。

A:内存B:CPUC:网络D:磁盘1/045、发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备:给定最小支持度和(D),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则。

A:最小兴趣度B:最小置信度C:最大支持度D:最小可信度46、个性化推荐系统是建立在海量数据挖据基础上的一种高级商务智能平台,以帮助(C)为其顾客购物提供完全个性化的决策支持和信息服务。

A:公司B:单位C:电子商务网站D:跨国企业47、云计算是对(D)技术的发展与运用。

A:并行计算B:分布式计算C:网格计算D:以上都是48、(B)是[gl提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。

A:GFS B: Mapreduce C: Bittable D: Chubby49、在Bigtable中,(A)主要用来存储子表数据以及一些日志文件。

A: GFS B: Mapreduce C: Sstable D: Chubby50、躁声数据的产生原因主要有(D)A:采集设备有问题B:数据录入过程中产生错误C:数据传输过程出现错误D:以上都有51、下面属于数据集的一般特性的有(D)。

A:维度B:稀疏性C:分辨率D:以上都有52、噪声数据处理的方法主要有(D)。

A:分类B:聚类C:回归D:以上都有53、如下哪些不是最近邻分类器的特点(C)A:它使用具体的训练实例进行预测,不必维护源自数据的模型B:分类一个测试样例开销很大C:最近邻分类器基于全局信息进行预测D:可以生产任意形状的决策边界54、数据挖据的挖据方法包括(乙)A:聚类分析B:回归分析C:神经网络D:决策树算法E:以上都是55、推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(B),推测客户将来可能的购买行为。

A:客户的朋友B:客户过去的购买行为和购买记录C:客户的兴趣爱好D:客户的个人信息56、数据预处理方法主要有(E)A:数据清洗B:数据集成C:数据归约D:数据交换E:以上都是57、大数据环境下的隐私担忧,主要表现为(A)A:个人信息的被识别与暴露B:用户画像的生成C:恶意广告的推送D:病毒入侵58、对线下零售而言,做好大数据分析应用的前提是(C)A:增加统计种类B:扩大营业面积C:增加数据来源D:开展优惠促销59、一切可连,任何数据之间逗辑上都有可能存在联系,这体现了大数据思雄中的(A)A:相关思维B:因果思维C:定量思维D:实验思维60、一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证,这体现了大数据思维维度中的(D)A:相关思维B:因果思维C:定量思维D:实验思维61、下列企业中,最有可能成为典型的数据资产动营商的是(B)A:云计算企业B:电信运营商C:互联网企业D:物联网企业62、下列关于云计算和数据库的说法中,错误的是(A):A:获取样本的代价很高B:获取足够大的样本数据乃至全体数据非常容易C:比抽样调查数据更全面D:比抽样调查更能反映整个群体的特征与规律63、大数据的低耗能存储及高效率计算的要求,需要以下多种技术协同合作(E)A:分布式云存错技术B:高性能并行计算C:多源数据清洗及数据整合技木D:分布式文件系统及分布式并行数据库E:以上都有64、下列演示方式中,不属于传统统计图方式的是(D)A:柱状图B:饼状图C:曲线图D:同络图65、数据、信息、知识三者之同的变化趋势是(B)A:价值递减B:价值递增C:价值先增后减D:价值不交66、下列说法错误的是(C)。

A大数据是一种思维B:大数据不仅仅是数的体量大C:大数据的英文1 arge data D:大数据会带来机器智能67、ENIAC误生于哪一年(A)。

A:1946年B:1938年C:1940年D:1942年68、美特卡尔夫定律主要是将信息网络,指出网终的价值在于网络的互联,联网的节点数与其价值星现(B)方式,联网越多,系统的价值越大A:正比B:指数C:对数D:反比69、下面有关分类算法的准确率,召回率,F1值的描述,错误的是(C)A:准确率是检索出相关文档数与检京出的文档总数的比率,衡量的是检索系统的查准率B:召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率C:正确率、召回率和F值取值都在0和1之间,数值越接近0,查准率或查全率就越高D:为了解决准确率和召回率冲突问题,引入了F1分数70、以下几种模型方法属于判别式模型(Discriminative Model)的有()1)混合高斯模型2)条件随机场模型3)区分度训练)4)隐马尔科夫模型(A)A:2,3B:1,4在HM中,如果已知观察序列和产生观察序列的状态序列,那么可用以下哪种方法直接进行参数估计(D)。

相关文档
最新文档