大数据试卷试题及含答案

合集下载

大数据中级试题及答案

大数据中级试题及答案

大数据中级试题及答案一、单选题(每题2分,共10分)1. 大数据的4V特征不包括以下哪一项?A. Volume(体量大)B. Velocity(速度快)C. Variety(种类多)D. Visibility(可视化)答案:D2. 下列哪个不是Hadoop生态系统的组件?A. HDFSB. HBaseC. SparkD. MongoDB答案:D3. 在大数据技术中,用于实时处理数据的框架是?A. HadoopB. SparkC. HiveD. Pig答案:B4. 下列哪个不是大数据的存储技术?A. NoSQLB. RDBMSC. HDFSD. Cloud Storage答案:B5. 大数据的分析方法中,以下哪项不是常用的分析方法?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:B二、多选题(每题3分,共15分)1. 下列哪些属于大数据的来源?A. 社交媒体B. 传感器数据C. 传统数据库D. 电子邮件答案:A, B, C, D2. 大数据技术可以应用于以下哪些领域?A. 金融分析B. 医疗健康C. 教育D. 交通管理答案:A, B, C, D3. 下列哪些是大数据处理的挑战?A. 数据隐私B. 数据整合C. 数据存储D. 数据分析答案:A, B, C, D4. 以下哪些是大数据的分析工具?A. RB. PythonC. SASD. Excel答案:A, B, C5. 大数据的安全性问题包括哪些?A. 数据泄露B. 数据篡改C. 数据丢失D. 数据滥用答案:A, B, C, D三、判断题(每题1分,共5分)1. 大数据技术可以完全替代传统数据库技术。

(错误)2. 大数据的分析结果可以用于指导决策。

(正确)3. 大数据技术只适用于大规模数据集。

(错误)4. 大数据技术可以提高数据的准确性。

(正确)5. 大数据技术可以完全避免数据隐私问题。

(错误)四、简答题(每题5分,共20分)1. 请简述大数据的4V特征。

大数据试题及答案

大数据试题及答案

大数据试题及答案1、当前大数据技术的基础是由(C)首先提出的。

(单选题,本题2分)2、大数据的起源是(C)。

(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。

(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D)反映数据的精细化程度,越细化的数据,价值越高。

(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。

(单选题,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。

(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。

(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组可以使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C)。

(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算9、大数据的最显著特征是(A)。

(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官XXX通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B)。

(单选题,此题2分)A:在数据基础上倾向于部分数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、以下关于XXX对大数据特点的说法中,错误的是(D)。

(单选题,此题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。

大数据试题及答案

大数据试题及答案

大数据试题及答案一、选择题1. 大数据的定义是什么?A. 数据量大B. 数据类型多样C. 数据处理速度快D. 以上答案都正确答案:D2. 大数据的特点包括以下哪些?A. 高速B. 多样C. 值低廉D. 以上答案都正确答案:D3. 大数据的主要应用领域是什么?A. 金融B. 医疗C. 汽车D. 以上答案都正确答案:D4. 大数据技术的核心是什么?A. 数据分析B. 数据存储C. 数据传输D. 以上答案都正确答案:A5. 大数据技术中的Hadoop是指什么?A. 数据存储系统B. 数据处理框架C. 数据传输协议D. 以上答案都正确答案:B二、填空题1. 大数据的“3V”指的是什么?A. 速度、结构、验证B. 速度、多样性、价值C. 速度、规模、价值D. 速度、多样性、验证答案:C2. 大数据处理中常用的编程语言是什么?答案:Python3. 大数据分析常用的统计方法是什么?答案:回归分析4. 大数据技术中的“MapReduce”指的是什么?答案:数据处理模型5. 大数据技术中的“数据挖掘”是指什么?答案:从大量数据中发现隐藏的模式和关联三、简答题1. 请简要介绍大数据的发展历程。

答案:大数据的发展历程可以分为三个阶段。

第一阶段是数据集中存储和处理,通过数据库管理系统来解决大规模数据的存储和处理问题。

第二阶段是数据分布处理,通过并行计算来解决数据量大的问题。

第三阶段是以Hadoop等为代表的分布式计算技术,通过云计算和分布式存储来解决大数据的处理问题。

2. 请简要介绍大数据技术的应用领域。

答案:大数据技术在金融、医疗、电商、物流等领域都有广泛的应用。

在金融领域,大数据可以用于风险评估、交易分析等方面;在医疗领域,大数据可以用于疾病预测、医疗资源分配等方面;在电商领域,大数据可以用于用户行为分析、商品推荐等方面;在物流领域,大数据可以用于路径规划、货物跟踪等方面。

3. 请简要介绍大数据技术的挑战和未来发展方向。

大数据专业考试题及答案

大数据专业考试题及答案

大数据专业考试题及答案一、选择题(每题2分,共20分)1. 大数据的“4V”特征不包括以下哪一项?A. Volume(体量)B. Velocity(速度)B. Variety(多样性)D. Visibility(可见性)答案:D2. 在大数据技术中,Hadoop生态系统中的核心组件是:A. SparkB. HBaseC. HiveD. HDFS答案:D3. 以下哪个不是大数据存储技术?A. NoSQL数据库B. 关系型数据库C. 分布式文件系统D. 内存数据库答案:B4. 以下哪个是大数据分析的关键技术?A. 数据清洗B. 数据可视化C. 数据挖掘D. 所有选项都是答案:D5. 大数据平台中,用于实时数据处理的技术是:A. MapReduceB. StormC. HadoopD. Cassandra答案:B...(此处省略其他选择题)二、简答题(每题10分,共30分)1. 简述大数据与传统数据仓库的主要区别。

答案:大数据与传统数据仓库的主要区别在于:大数据处理的数据量更大、数据类型更多样化、处理速度更快,并且大数据技术更倾向于分布式存储和计算,而传统数据仓库通常采用集中式存储和处理。

2. 解释什么是数据挖掘,并举例说明其应用场景。

答案:数据挖掘是从大量数据中通过算法自动或半自动地发现有趣模式和知识的过程。

例如,在零售业中,数据挖掘可以用来分析顾客的购买行为,从而进行个性化推荐和库存管理。

3. 描述Hadoop生态系统中MapReduce的工作流程。

答案:MapReduce的工作流程包括Map阶段和Reduce阶段。

在Map 阶段,输入数据被分割成多个小块,每个小块由一个Map任务处理,生成中间键值对。

在Reduce阶段,中间键值对根据键进行分组,并传递给Reduce任务,Reduce任务对每个键对应的所有值进行处理,生成最终的输出结果。

三、计算题(每题15分,共30分)1. 假设有一个大数据集,需要使用MapReduce进行处理。

大数据考试试题及答案

大数据考试试题及答案

大数据考试试题及答案1. 选择题1) 大数据的关键特征是什么?A. 数据的规模巨大B. 数据的多样性C. 数据的高速产生和流转D. 数据的价值潜力答案:A、B、C、D 全部都是2) 大数据技术的基本架构包括以下哪些层次?A. 数据采集与清洗层B. 数据存储与管理层C. 数据分析与挖掘层D. 数据展示与应用层答案:A、B、C、D 全部都有3) 大数据分析的主要方法包括以下哪些?A. 关联分析B. 聚类分析C. 回归分析D. 时间序列分析答案:A、B、C、D 全部都有2. 填空题1) 大数据的三个V分别代表什么?(简写形式即可)答案:V(Volume)代表数据规模,V(Velocity)代表数据高速产生和流转,V(Variety)代表数据多样性2) 大数据技术的核心是____和____。

答案:存储与计算3) 大数据分析的关键是____和____。

答案:数据挖掘和模型建立3. 简答题1) 请简述大数据的应用领域。

答案:大数据在各行各业都有广泛的应用。

例如,电商领域可以通过大数据分析用户消费行为,进行个性化推荐;物流领域可以利用大数据优化配送路径,提高效率;医疗领域可以通过大数据分析患者病历,辅助疾病诊断等。

2) 大数据分析的方法有哪些?答案:大数据分析的方法包括关联分析、聚类分析、分类与预测、异常检测、文本分析等。

4. 计算题1) 如果一家公司的服务器每天产生1TB(1TB = 1024GB)的数据,假设这些数据需要保存1年,计算一共需要多少存储空间?答案:1TB * 365天 = 365TB2) 某电商网站每天访问量为1000万人次,每个访问用户产生平均10个点击行为数据,假设每条点击行为数据大小为1KB,计算每天需要存储多少数据?答案:1000万人次 * 10个 = 1亿个点击行为数据1亿个 * 1KB = 100TB总结:大数据的考试试题主要包括选择题、填空题、简答题和计算题。

选择题涵盖大数据的特征、技术架构和分析方法。

大数据考试题目及答案

大数据考试题目及答案

大数据考试题目及答案一、单项选择题(每题2分,共20分)1. 大数据技术的核心目标是处理哪种类型的数据?A. 结构化数据B. 半结构化数据B. 非结构化数据D. 所有上述数据类型答案:D2. 在大数据分析中,以下哪个算法主要用于聚类分析?A. 决策树B. 神经网络C. K-meansD. 线性回归答案:C3. Hadoop的核心组件包括以下哪个?A. SparkB. HiveC. HBaseD. MapReduce答案:D4. 数据挖掘中的“关联规则”通常与哪位学者的名字联系在一起?A. 马斯洛B. 纳维斯C. 阿普拉姆D. 汉斯答案:B5. 大数据的“4V”特性不包括以下哪一项?A. 体量大B. 速度快C. 价值高D. 成本高答案:D6. 在大数据架构中,数据湖主要用于存储什么类型的数据?A. 仅结构化数据B. 仅非结构化数据C. 结构化和非结构化数据D. 仅半结构化数据答案:C7. 下列哪项不是大数据分析的常见应用场景?A. 市场分析B. 风险管理C. 客户细分D. 纸质文档打印答案:D8. 大数据技术可以有效地处理“数据孤岛”问题,这主要是指:A. 数据的物理隔离B. 数据的逻辑隔离C. 数据的格式不统一D. 数据的存储位置分散答案:B9. 在大数据环境下,以下哪个数据库更适合处理非关系型数据?A. MySQLB. OracleC. MongoDBD. SQL Server答案:C10. 大数据的实时分析通常依赖于哪种技术?A. 数据仓库B. 批处理C. 流处理D. 数据挖掘答案:C二、多项选择题(每题3分,共15分)11. 大数据的存储技术包括以下哪些选项?(多选)A. 云存储B. 分布式文件系统C. 关系型数据库D. NoSQL数据库答案:A B D12. 在大数据的生态系统中,以下哪些组件是常见的?(多选)A. HadoopB. SparkC. MongoDBD. Excel答案:A B C13. 大数据的分析过程通常包括哪些步骤?(多选)A. 数据采集B. 数据清洗C. 数据可视化D. 数据丢弃答案:A B C14. 以下哪些因素会影响大数据的性能?(多选)A. 数据的规模B. 数据的处理速度C. 数据的存储格式D. 数据的来源答案:A B C15. 在大数据安全领域,以下哪些措施是重要的?(多选)A. 数据加密B. 访问控制C. 数据备份D. 系统防火墙答案:A B C D三、简答题(每题10分,共20分)16. 请简述大数据的“4V”特性是什么?答案:大数据的“4V”特性指的是体量大(Volume)、速度快(Velocity)、类型多(Variety)、价值高(Value)。

大数据考试题目及答案

大数据考试题目及答案

大数据考试题目及答案一、单选题(每题2分,共10分)1. 大数据的“4V”特征不包括以下哪一项?A. Volume(体量)B. Velocity(速度)C. Variety(多样性)D. Visualization(可视化)答案:D2. Hadoop生态系统中,用于数据存储的是以下哪个组件?A. HBaseB. HiveC. MapReduceD. YARN答案:A3. 以下哪个不是大数据技术?A. SparkB. HadoopC. MongoDBD. MySQL答案:D4. 大数据的分析处理通常不包括以下哪个阶段?A. 数据收集B. 数据清洗C. 数据存储D. 数据展示答案:D5. 下列哪个选项不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C二、多选题(每题4分,共20分)1. 大数据技术可以应用于以下哪些行业?A. 电子商务B. 物流C. 制造业D. 教育答案:A、B、C、D2. 以下哪些是Hadoop生态系统的组成部分?A. HDFSB. MapReduceC. SparkD. HBase答案:A、B、C、D3. 大数据的分析方法包括哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:A、B、C、D4. 大数据的挑战包括哪些?A. 数据安全B. 数据隐私C. 数据存储D. 数据处理答案:A、B、C、D5. 以下哪些是大数据分析工具?A. RB. PythonC. SASD. Excel答案:A、B、C三、判断题(每题2分,共10分)1. 大数据技术只能用于处理非结构化数据。

()答案:错误2. Hadoop可以处理PB级别的数据。

()答案:正确3. 大数据技术不需要考虑数据的实时性。

()答案:错误4. 大数据技术可以提高决策的效率和准确性。

()答案:正确5. 大数据技术无法应用于个人隐私保护。

()答案:错误四、简答题(每题10分,共20分)1. 简述大数据的“4V”特征。

大数据试题及答案

大数据试题及答案

大数据试题及答案1. 选择题:1. 下列哪项不属于大数据的四个"V"特点?A. Volume(数据量大)B. Value(数据价值高)C. Velocity(数据处理速度快)D. Variety(数据类型多样)答案:B. Value(数据价值高)2. 下列哪个不是大数据的常见来源?A. 传感器数据B. 金融交易数据C. 社交媒体数据D. 游戏排行榜数据答案:D. 游戏排行榜数据3. 大数据技术中,下列哪个属于数据存储和处理工具?A. Apache HadoopB. Apache SparkC. TableauD. Python答案:A. Apache Hadoop4. 在大数据处理中,下列哪项不属于数据清洗和预处理的步骤?A. 数据收集B. 数据分析C. 数据转换D. 数据集成答案:B. 数据分析2. 填空题:1. 大数据中,_______ 指的是数据的速率和延迟,即数据的产生和消耗速度之间的平衡。

答案:Velocity(数据处理速度快)2. 大数据技术中,________________ 是一种用于处理大规模数据计算的开源集群处理框架。

答案:Apache Hadoop3. 大数据分析常用的编程语言包括____________ 和____________。

答案:Python 和 R4. 在大数据清洗和预处理过程中,数据转换的步骤包括数据筛选、数据归一化和_____________。

答案:数据聚合3. 简答题:1. 请简述大数据的定义和特点。

答:大数据是指数据量庞大、类型多样、处理速度快且具有高价值的数据集合。

大数据的特点主要可以归纳为四个"V",即Volume(数据量大)、Velocity(数据处理速度快)、Variety(数据类型多样)和Value(数据价值高)。

大数据具有海量的数据量,数据来源广泛,包括传感器数据、社交媒体数据等;处理速度快,需要使用专门的大数据技术和工具进行高效的数据存储、处理和分析;数据类型多样,包括结构化数据和非结构化数据;数据具有高价值,可以帮助企业做出更准确的决策和预测。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、目前大数据技术的基础是由( C )第一提出的。

(单项选择题,此题 2 分)A:微软 B :百度 C:谷歌 D:阿里巴巴2、大数据的发源是( C )。

(单项选择题,此题 2 分)A:金融 B :电信 C:互联网 D:公共管理3、依据不一样的业务需求来成立数据模型,抽取最存心义的向量,决定选用哪一种方法的数据剖析角色人员是( C )。

(单项选择题,此题 2 分)A:数据管理人员 B :数据剖析员 C:研究科学家 D:软件开发工程师4、( D )反应数据的精美化程度,越细化的数据,价值越高。

(单项选择题,此题 2 分)A:规模 B :活性 C:关系度 D:颗粒度5、数据冲洗的方法不包含(D)。

(单项选择题,此题 2 分)A:缺失值办理 B :噪声数据消除C:一致性检查 D:重复数据记录办理6、智能健康手环的应用开发,表现了( D )的数据采集技术的应用。

(单项选择题,此题 2分)A:统计报表 B :网络爬虫 C:API 接口 D :传感器7、以下对于数据重组的说法中,错误的选项是( A )。

(单项选择题,此题 2 分)A:数据重组是数据的从头生产和从头采集 B :数据重组能够使数据焕发新的光辉C:数据重组实现的要点在于多源数据交融和数据集成 D :数据重组有利于实现新奇的数据模式创新8、智慧城市的建立,不包含(C)。

(单项选择题,此题 2 分)A:数字城市 B :物联网 C :联网监控 D :云计算9、大数据的最明显特色是( A )。

(单项选择题,此题 2 分)A:数据规模大 B :数据种类多样C:数据办理速度快 D :数据价值密度高10、美国海军军官莫里经过对古人航海日记的剖析,绘制了新的航海路线图,标了然狂风与洋流可能发生的地址。

这表现了大数据剖析理念中的(B )。

(单项选择题,此题 2 分)A:在数据基础上偏向于全体数据而不是抽样数据B:在剖析方法上更着重有关剖析而不是因果剖析C:在剖析成效上更追查效率而不是绝对精确D:在数据规模上重申相对数据而不是绝对数据11、以下对于舍恩伯格对大数据特色的说法中,错误的选项是(D )。

(单项选择题,此题 2 分)A:数据规模大 B :数据种类多样 C:数据办理速度快 D :数据价值密度高12、目前社会中,最为突出的大数据环境是( A )。

(单项选择题,此题 2 分)A:互联网 B :物联网 C:综合国力 D:自然资源13、在数据生命周期管理实践中,( B )是履行方法。

(单项选择题,此题 2 分)A:数据储存和备份规范 B :数据管理和保护C:数据价值觉察和利用 D :数据应用开发和管理14、以下对于网络用户行为的说法中,错误的选项是(C)。

(单项选择题,此题 2 分)A:网络公司能够捕获到用户在其网站上的全部行为B:用户失散的交互印迹能够为公司提高服务质量供给参照C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、以下对于计算机储存容量单位的说法中,错误的选项是(C)。

(单项选择题,此题 2 分)A: 1KB<1MB<1GB B:基本单位是字节( Byte )C:一个汉字需要一个字节的储存空间 D :一个字节能够容纳一个英文字符,16、以下对于聚类发掘技术的说法中,错误的选项是( B )。

(单项选择题,此题 2 分)A:不早先设定数据归类类目,完好依据数据自己性质将数据聚合成不一样类型B:要求同类数据的内容相像度尽可能小C:要求不一样类数据的内容相像度尽可能小D:与分类发掘技术相像的是,都是要对数据进行分类办理17、以下国家的大数据发展行动中,集中表现“重视基础、国都先行”的国家是( D )。

(单项选择题,此题 2 分)A:美国 B :日本 C:中国 D:韩国18、以下对于大数据的剖析理念的说法中,错误的选项是(D )。

(单项选择题,此题 2 分)A:在数据基础上偏向于全体数据而不是抽样数据B:在剖析方法上更着重有关剖析而不是因果剖析C:在剖析成效上更追查效率而不是绝对精确D:在数据规模上重申相对数据而不是绝对数据19、万维网之父是(C)。

(单项选择题,此题 2 分)A:彼得·德鲁克 B :舍恩伯格 C :蒂姆·伯纳斯-李 D :斯科特·布朗20、 Mac OS 系统的开发者是( C )。

(单项选择题,此题 2 分)A:微软公司 B :惠普公司 C:苹果公司 D:IBM 公司21、大数据时代,数据使用的要点是(D)。

(单项选择题,此题 2 分)A:数据采集 B :数据储存 C:数据剖析 D:数据再利用22、以下对于数据交易市场的说法中,错误的选项是(C)。

(单项选择题,此题 2 分)A:数据交易市场是大数据家产发展到必定程度的产物B:商业化的数据交易活动催生了多方参加的第三方数据交易市场C:数据交易市场经过生产数据、研发和剖析数据,为数据交易供给帮助D:数据交易市场是大数据资源化的必定产物23、以下论据中,能够支撑“大数据无所不可以”的看法的是( A )。

(单项选择题,此题2 分)A:互联网金融打破了传统的看法和行为 B :大数据存在泡沫C:大数据拥有特别高的成本 D:个人隐私泄漏与信息安全担忧24、数据库房的最后目的是( D )。

(单项选择题,此题 2 分)A:采集业务需求 B :成立数据库房逻辑模型C:开发数据库房的应用剖析 D:为用户和业务部门供给决议支持25、支撑大数据业务的基础是( B )。

(单项选择题,此题 2 分)A:数据科学 B :数据应用 C:数据硬件 D:数据人材26、在网络爬虫的爬行策略中,应用最为基础的是(AB )。

(多项选择题,此题 3分)A:深度优先遍历策略 B :广度优先遍历策略C:高度优先遍历策略 D:反向链接策略 E :大站优先策略27、目前,大数据家产发展的特色是(ACE )。

(多项选择题,此题 3 分)A:规模较大 B :规模较小 C:增速很快 D:增速迟缓 E :多家产交错交融28、以下对于数据生命周期管理的核心认识中,正确的选项是(ABC )。

(多项选择题,此题3 分)A:数据从产生到被删除销毁的过程中,拥有多个不一样的数据存在阶段B:在不一样的数据存在阶段,数据的价值是不一样的C:依据数据价值的不一样应当对数据采纳不一样的管理策略D:数据生命周期管理旨在产奏效益的同时,降低生产成本E:数据生命周期管理最后关注的是社会效益29、以下对于鉴于大数据的营销模式和传统营销模式的说法中,错误的选项是(AB)。

答案选 C 更正选题,此题 3分)A:传统营销模式比鉴于大数据的营销模式投入更小B:传统营销模式比鉴于大数据的营销模式针对性更强C:传统营销模式比鉴于大数据的营销模式转变率低D:鉴于大数据的营销模式比传统营销模式及时性更强E:鉴于大数据的营销模式比传统营销模式精确性更强(多30、以下对于脏数据的说法中,正确的选项是(ABCDE)。

(多项选择题,此题 3 分)A:格式不规范 B :编码不一致 C :意义不明确 D:与实质业务关系不大 E :数据不完好31、数据再利用的意义在于( ABC)。

(多项选择题,此题 3 分)A:发掘数据的潜伏价值 B :实现数据重组的创新价值C:利用数据可扩展性拓宽业务领域 D:优化储存设施,降低设施成本E:提高社会效益,优化社会管理32、依据波及自变量的多少,能够将回归剖析分为( CD )。

(多项选择题,此题 3分)A:线性回归剖析 B :非线性回归剖析 C :一元回归剖析D:多元回归剖析 E :综合回归剖析33、传统数据密集型行业踊跃探究和布局大数据应用的表现是( BCE)。

(多项选择题,此题 3 分) A :投资入股互联网电商行业 B :打通多源跨域数据C:提高剖析发掘能力D:自行开发数据产品E:实现科学决议与营运34、大数据人材整体上需要具备(ABE )等核心知识。

(多项选择题,此题3 分)A:数学与统计知识 B :计算机有关知识C:马克思主义哲学知识 D :市场营运管理知识E:在特定业务领域的知识35、以下对于大数据的说法中,错误的选项是(AD )。

(多项选择题,此题 3 分)A:大数据拥有体量大、构造单调、时效性强的特色B:办理大数据需采用新式计算架构和智能算法等新技术C:大数据的应用着重有关剖析而不是因果剖析D:大数据的应用着重因果剖析而不是有关剖析E:大数据的目的在于发现新的知识与洞察并进行科学决议36、在噪声数据中,颠簸数据比离群点数据偏离整体水平更大。

( F )(判断题,此题 2 分)是否37、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。

所以,大数据采集的信息量要尽量精确。

( F )(判断题,此题 2 分)是否38、一般而言,散布式数据库是指物理上分别在不一样地址,但在逻辑上是一致的数据库。

所以散布式数据库拥有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特色。

( T )(判断题,此题 2 分)是否39、具备很强的报告撰写能力,能够把剖析结果经过文字、图表、可视化等多种方式清楚地展现出来,能够清楚地阐述剖析结果及可能产生的影响,进而说服决议者服气并采用其建议,是数据分析能力对大数据人材的基本要求。

( F )(判断题,此题 2 分)是否40、谷歌流感趋向充足表现了数据重组和扩展对数据价值的重要意义。

( F )(判断题,此题2 分)是否41、决议树是一种鉴于树形构造的展望模型,每一个树形分叉代表一个分类条件,叶子节点代表最后的分类结果,其长处在于易于实现,决议时间短,并且合适办理非数值型数据。

( T )(判断题,此题 2 分)是否42、信息生命周期管理是据生命周期管理的根源,最早由英国公司提出。

( F )(判断题,本题 2 分)是否43、简单随机抽样,是从整体N个对象中任意抽取n 个对象作为样本,最后以这些样本作为调核对象。

在抽取样本时,整体中每个对象被抽中为检查样本的概率可能会有差别。

( F )(判断题,此题 2 分)是否44、啤酒与尿布的经典事例,充足表现了实验思想在大数据剖析理念中的重要性。

( F )(判断题,此题 2 分)是否45、对于公司来说,给用户进行各样促销或许实行营运策略的机遇也比较重要,并且对不一样兴趣偏好的用户最好集中办理。

( F )(判断题,此题 2 分)是否46. 以下对于舍恩伯格对大数据特色的说法中,错误的选项是(D)A。

数据规模大 B 。

数据种类多样C。

数据办理速度快D。

数据价值密度高47. 以下对于大数据的剖析理念的说法中,错误的选项是(D)A. 在数据基础上偏向于全体数据而不是抽样数据 B。

在剖析方法上更着重有关剖析而不是因果剖析C。

在剖析成效上更追求效率而不是绝对精确 D。

在数据规模上重申相对数据而不是绝对数据49.以下对于普查的弊端的说法中,正确的选项是( A)A. 工作量较大,简单致使检查内容有限、产生重复和遗漏现象 B。

相关文档
最新文档