2021大学《大数据分析及应用》章节测试答案
大数据学试题库及答案2021

大数据学试题库及答案2021试题11、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C)。
(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D)反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。
(单选题,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C)。
(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算9、大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B)。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。
大数据基础与应用_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

大数据基础与应用_北京理工大学中国大学mooc课后章节答案期末考试题库2023年1.大数据的特性不包括答案:分布地域广2.Kafka 是一个高吞吐、分布式、基于发布订阅的消息系统,利用Kafka技术可在廉价PC Server上搭建起大规模消息系统。
答案:正确3.网络和层次化数据可视化的主要技术有力导图和TreeMap。
答案:正确4.如下关于大数据分析流程的哪一项是正确的?答案:数据采集、数据清洗、数据管理、数据分析、数据呈现5.大数据分析与传统的数据分析的区别主要在于:答案:大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。
_传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。
_大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。
6.1、大数据主要是由于数据规模巨大、来源分散、格式多样,所以需要新的体系架构、技术、算法和分析方法来对这些数据进行采集、存储和关联分析,以期望能够从中抽取出隐藏的有价值的信息。
答案:正确7.数据科学家主要负责开发、构建、测试和维护系统,比如数据库和大规模处理系统答案:错误8.大数据分析的目的是从类型多样的海量数据中挖掘出隐藏的有价值的信息。
答案:正确9.大数据分析能够应用在哪些领域?答案:交通医疗足球零售天文政治10.Hive的数据模型主要包括:答案:表(Tables)_桶(Buckets)_分区(Partitions)11.NoSQL数据库的主要类型包括:答案:图形数据库_键值数据库_文档数据库_列族数据库12.下列数据类型中,不属于Python内置数据类型的是:答案:dtype13.以下不属于高维数据可视化技术的是.答案:词云14.以下哪个是常见的大数据处理流程.答案:数据获取、数据清洗、数据分析、数据可视化15.测得一组身高(cm)数据如下:176、165、173、168、176、180、177、168、174、176,则其众数和中位数分别是:答案:176, 17516.数据清洗的方法不包括答案:数据可视化17.以下哪个不属于分布式文件系统HDFS的特有特性答案:随机读写18.以下哪种方法不属于预测性(有监督学习)模型答案:关联分析19.Apriori算法的加速过程依赖于以下哪个策略答案:剪枝20.Spark是使用以下哪种编程语言实现的?答案:Scala21.大数据分析与传统数据分析的不同之处在于答案:大数据分析是预测性分析22.对字符串中某一子串执行replace()操作后,再次对其进行一次输出,则输出结果与原字符串答案:一定相同23.请计算下列数据{10,12,16,18,22,35,45,50,90,100}的p=40%的截断均值_____答案:3124.过拟合指的是()答案:模型在训练集上表现的很好,但是在交叉验证集合测试集上表现一般25.决策树的生成由两个阶段组成:_____、______答案:判定树构建树剪枝26.假设有四个样本分布在坐标系中,已知A区两点分别(2,5)和(1,4),B区(8,1)和(9,2),若使用KNN算法(距离使用欧氏距离【图片】),求M(4,3)属于哪一区?答案:A27.以下关于日志采集工具Flume的说法不正确的是:答案:Flume适用于大量数据的实时数据采集28.以下关于数据分发中间件Kafka的说法不正确的是:答案:Kafka主要是使用c++、Java语言实现的29.以下关于分布式文件系统HDFS的说法不正确的是:答案:HDFS支持多用户写入,任意修改文件30.HDFS集群中管理文件系统的元数据、负责客户端请求响应的节点是:答案:NameNode31.HDFS(Hadoop 1.X版本中)默认的块大小是:答案:64 MB32.以下关于分布式数据库HBase的说法不正确的是:答案:HBase比传统关系数据库系统具有更加丰富的数据类型33.已知p = np.arange(20).reshape((4,5)),则p[3][2]的值是。
大数据导论单元测试题及答案

大数据导论单元测试题及答案一、单选题(每题2分,共20分)1. 大数据的“4V”特征不包括以下哪一项?A. Volume(体量)B. Velocity(速度)B. Variety(多样性)D. Value(价值)2. 以下哪个技术不是大数据处理框架?A. HadoopB. SparkC. MySQLD. Hive3. 在大数据中,数据挖掘的目的是?A. 存储数据B. 清洗数据C. 发现数据模式D. 备份数据4. 以下哪项不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业5. 大数据技术可以支持以下哪种类型的分析?A. 描述性分析B. 诊断性分析C. 预测性分析D. 所有上述选项二、多选题(每题3分,共15分)6. 大数据的存储技术包括哪些?A. 云存储B. 分布式文件系统C. 传统关系型数据库D. NoSQL数据库7. 以下哪些是大数据分析的挑战?A. 数据的隐私和安全B. 数据的集成和清洗C. 数据的实时处理D. 数据的可视化8. 大数据技术可以应用于以下哪些领域?A. 社交媒体分析B. 供应链管理C. 客户关系管理D. 风险管理三、简答题(每题5分,共20分)9. 简述大数据与传统数据仓库的主要区别。
10. 解释什么是数据湖,并说明其与数据仓库的区别。
11. 描述大数据在医疗领域的一个具体应用案例。
四、论述题(每题15分,共30分)12. 论述大数据在商业智能中的作用及其对企业决策的影响。
13. 讨论大数据技术在处理大规模数据集时的优势和局限性。
五、案例分析题(15分)14. 假设你是一家电子商务公司的数据分析团队成员,公司希望通过分析用户行为数据来优化产品推荐系统。
请描述你会如何使用大数据技术来实现这一目标。
答案:一、单选题1. D2. C3. C4. C5. D二、多选题6. A, B, D7. A, B, C, D8. A, B, C, D三、简答题9. 大数据与传统数据仓库的主要区别在于:大数据通常指的是非结构化或半结构化的数据,而传统数据仓库主要处理结构化数据;大数据技术可以处理更大规模的数据,具有更高的扩展性和灵活性;大数据技术通常采用分布式计算框架,而传统数据仓库则依赖于单一的数据库系统。
大数据考试题目及答案

大数据考试题目及答案一、单项选择题(每题2分,共20分)1. 大数据技术的核心目标是处理哪种类型的数据?A. 结构化数据B. 半结构化数据B. 非结构化数据D. 所有上述数据类型答案:D2. 在大数据分析中,以下哪个算法主要用于聚类分析?A. 决策树B. 神经网络C. K-meansD. 线性回归答案:C3. Hadoop的核心组件包括以下哪个?A. SparkB. HiveC. HBaseD. MapReduce答案:D4. 数据挖掘中的“关联规则”通常与哪位学者的名字联系在一起?A. 马斯洛B. 纳维斯C. 阿普拉姆D. 汉斯答案:B5. 大数据的“4V”特性不包括以下哪一项?A. 体量大B. 速度快C. 价值高D. 成本高答案:D6. 在大数据架构中,数据湖主要用于存储什么类型的数据?A. 仅结构化数据B. 仅非结构化数据C. 结构化和非结构化数据D. 仅半结构化数据答案:C7. 下列哪项不是大数据分析的常见应用场景?A. 市场分析B. 风险管理C. 客户细分D. 纸质文档打印答案:D8. 大数据技术可以有效地处理“数据孤岛”问题,这主要是指:A. 数据的物理隔离B. 数据的逻辑隔离C. 数据的格式不统一D. 数据的存储位置分散答案:B9. 在大数据环境下,以下哪个数据库更适合处理非关系型数据?A. MySQLB. OracleC. MongoDBD. SQL Server答案:C10. 大数据的实时分析通常依赖于哪种技术?A. 数据仓库B. 批处理C. 流处理D. 数据挖掘答案:C二、多项选择题(每题3分,共15分)11. 大数据的存储技术包括以下哪些选项?(多选)A. 云存储B. 分布式文件系统C. 关系型数据库D. NoSQL数据库答案:A B D12. 在大数据的生态系统中,以下哪些组件是常见的?(多选)A. HadoopB. SparkC. MongoDBD. Excel答案:A B C13. 大数据的分析过程通常包括哪些步骤?(多选)A. 数据采集B. 数据清洗C. 数据可视化D. 数据丢弃答案:A B C14. 以下哪些因素会影响大数据的性能?(多选)A. 数据的规模B. 数据的处理速度C. 数据的存储格式D. 数据的来源答案:A B C15. 在大数据安全领域,以下哪些措施是重要的?(多选)A. 数据加密B. 访问控制C. 数据备份D. 系统防火墙答案:A B C D三、简答题(每题10分,共20分)16. 请简述大数据的“4V”特性是什么?答案:大数据的“4V”特性指的是体量大(Volume)、速度快(Velocity)、类型多(Variety)、价值高(Value)。
电大《大数据技术》2021秋形考作业1

试卷总分:100 得分:95
1.当今世界四大趋势指的是经济全球化、全球城市化、全球信息化、信息智慧化。
【答案】:正确
2.物联网的处理技术应用于农业上,可以对动物疾病、植物病虫害,通过传感器进行远程诊断。
【答案】:正确
3.大数据的价值重在挖掘,而挖掘就是分析。
【答案】:正确
4.摩尔定律指出,当价格不变时,集成电路上可容纳的晶体管数目,约每隔()便会增加一倍,性能也将提升一倍。
A.12个月
B.24个月
C.6个月
D.18个月
【答案】:D
5.以下说法错误的是哪项()?
A.大数据不仅仅是讲数据的体量大
B.大数据会带来机器智能
C.大数据的英文名称是large data
D.大数据是一种思维方式
【答案】:C
6.对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。
因此,大数据收集的信息量要尽量精确。
(F)
【答案】:错误
7.
A.
B.
C.
D.
【答案】:
8.一个网络信息系统最重要的资源是{图} )。
A.计算机硬件
B.数据库
C.数据库管理系统
D.网络设备
【答案】:B。
2021年公需科目《大数据前沿技术及应用》参考答案(适用于华医网

2021年公需科目《大数据前沿技术及应用》参考答案(适用于华医网2021年公需科目《大数据前沿技术及应用》参考答案(适用于华医网)大数据概述及基本概念(一)c以下哪个数据单位最大()c大数据技术的战略意义是()c信息技术是指有关信息的收集、b\\美国哈佛大学的研究小组得出了知名的资源三角形,不包含()d\\哪种不属于互联网上发生的海量信息()大数据概述及基本概念(二)b()主要分担了构建大数据平台上层建筑的任务。
b()主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等。
b大数据技术的发生同时实现了非常大的社会价值,以下哪项不属于产生的社会价值()c大数据平台的三个重要的技术部分不包括()d下列哪项不属于商业大数据的类型()大数据详述及基本概念(三)d以下那个观点就是错误的()d企业大数据分析不包括()d维度上的分析市场需求,主要须要三方面的数据分析技术,不包含()a()所指的就是数据本身所贯穿的信息内容大数据体系结构(一)d\\物理资源实体的提供更多层包含()d\\saas模式的优点存有()d\\云计算的优势包含下面哪几个方面()b\\提供资源的网络被称为()a\\()就是通过并使排序原产在大量的分布式计算机上,大数据体系结构(二)d分布式数据库的特点不包含()b下面哪点不是hdfs优点()c大数据的分析挖掘是(),需要巨大的计算能力d计算任务容错的关键问题不包括()d下面哪点不是hdfs缺点()大数据体系结构(三)c大数据处理框架-spark的优点不包括()c\\spark的核心组件有几个部分()b\\小数据处理框架-spark最小的集群源自()dhadoop的缺点不包括()a\\小数据处理框架-spark问世于()大数据分析与数据挖掘(一)b()就从大量的、不全然的、存有噪声的、模糊不清的、随机的实际应用领域数据中,抽取暗含在其中的、人们事先无人知晓数据分析主要促进作用不包含()功能设备建立或分解成的数据被称作()a用户评论文本数据以及客服系统的语音数据和评价文本数据,可以统称为()a数据挖掘须要的人员不包含()大数据分析与数据挖掘(二)d用户属性分析不从以下哪方面展开分析()c大数据的真正意义就是()c商业智能技术提供使企业迅速分析数据的技术和方法,不包括()d参与度分析的指标包括()b\\商业智能的概念在()年最早由加特纳集团(gartnergroup)明确提出大数据分析与数据挖掘(三)b中国的电子商务已经逐渐吻合美国,不管从线上的总销售额,还是线上销售在全社会零售的比重b大数据具备能够提高特定类型的企业及众多不同部门内部工作效率并改进运营的潜力。
智慧树知到《大数据工具应用》章节测试答案
1、2011 年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和()能力的数据集。
A:计算B: 访问C: 应用D: 分析答案: 分析2、用4V 来概括大数据的特点的话,一般是指:Value 、Velocity 、Volume 和()。
A:VarietyB:VainlyC:VagaryD:Valley答案: Variety3、大数据分析四个方面的工作主要是:数据分类、()、关联规则挖掘和时间序列预测。
A: 数据统计B: 数据计算C: 数据聚类D: 数据清洗答案: 数据聚类4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。
A: 对B:错5、目前的大数据处理技术只能处理结构化数据。
A: 对B: 错答案: 错第二章1、我们常用的微软Office 套件中的Access 数据库软件的数据库文件格式后缀名是()。
A:mdfB:mdbC:dbfD:xls答案: mdb2、大多数日志文件的后缀名是()。
A:txtB:csvC:xmlD:log答案: log3、本课程重点介绍的weka 软件的专有文件格式是()。
A:MongoDBB:ARFFC:valueD:key map4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和()。
A: 专业性B: 排他性C: 一致性D: 共享性答案: 一致性5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个()来作为采集的目标。
A: 电话号码B: 关键词C: 网页地址D: 用户名答案: 网页地址6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是()。
A:otdB:jpgC:pngD:gif答案: otd7、Excel 可以通过“数据有效性”按钮操作来规范数据输入的范围。
A:对B: 错8、Excel 不能导入txt 或csv 格式的文件。
A: 对B: 错答案: 错9、八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。
智慧树知到《大数据工具应用》章节测试答案
绗竴绔?1銆?011骞撮害鑲敗鐮旂┒闄㈡彁鍑虹殑澶ф暟鎹畾涔夋槸锛氬ぇ鏁版嵁鏄寚鍏跺ぇ灏忚秴鍑轰簡甯歌鏁版嵁搴撳伐鍏疯幏鍙栥€佸偍瀛樸€佺鐞嗗拰锛? 锛夎兘鍔涚殑鏁版嵁闆嗐€?A:璁$畻B:璁块棶C:搴旂敤D:鍒嗘瀽绛旀: 鍒嗘瀽2銆佺敤4V鏉ユ鎷ぇ鏁版嵁鐨勭壒鐐圭殑璇濓紝涓€鑸槸鎸囷細Value銆乂elocity 銆乂olume鍜岋紙锛夈€?A:VarietyB:VainlyC:VagaryD:Valley绛旀: Variety3銆佸ぇ鏁版嵁鍒嗘瀽鍥涗釜鏂归潰鐨勫伐浣滀富瑕佹槸锛氭暟鎹垎绫汇€侊紙锛夈€佸叧鑱旇鍒欐寲鎺樺拰鏃堕棿搴忓垪棰勬祴銆?A:鏁版嵁缁熻B:鏁版嵁璁$畻C:鏁版嵁鑱氱被D:鏁版嵁娓呮礂绛旀: 鏁版嵁鑱氱被4銆佹柊娴拰浜笢鑱斿悎鎺ㄥ嚭鐨勫ぇ鏁版嵁鍟嗗搧鎺ㄨ崘锛屾槸鐢变含涓滅洸鐩帹閫佸埌褰撳墠娴忚鏂版氮缃戠珯鐨勭敤鎴风殑椤甸潰涓婄殑銆?A:瀵?B:閿?绛旀: 閿?5銆佺洰鍓嶇殑澶ф暟鎹鐞嗘妧鏈彧鑳藉鐞嗙粨鏋勫寲鏁版嵁銆?A:瀵?B:閿?绛旀: 閿?绗簩绔?1銆佹垜浠父鐢ㄧ殑寰蒋Office濂椾欢涓殑Access鏁版嵁搴撹蒋浠剁殑鏁版嵁搴撴枃浠舵牸寮忓悗缂€鍚嶆槸锛? 锛夈€?A:mdfB:mdbC:dbfD:xls绛旀: mdb2銆佸ぇ澶氭暟鏃ュ織鏂囦欢鐨勫悗缂€鍚嶆槸锛? 锛夈€?A:txtB:csvC:xmlD:log绛旀: log3銆佹湰璇剧▼閲嶇偣浠嬬粛鐨剋eka杞欢鐨勪笓鏈夋枃浠舵牸寮忔槸锛? 锛夈€?A:MongoDBB:ARFFC:valueD:key map绛旀: ARFF4銆佹暟鎹竻娲楀伐浣滅殑鐩殑涓昏鏄瑙e喅鏁版嵁鐨勫畬鏁存€с€佸敮涓€鎬с€佸悎娉曟€у拰锛? 锛夈€?A:涓撲笟鎬?B:鎺掍粬鎬?C:涓€鑷存€?D:鍏变韩鎬?绛旀: 涓€鑷存€?5銆佸叓鐖奔杞欢鐨勨€滆嚜瀹氫箟閲囬泦鈥濆伐浣滄柟寮忎笅锛岄渶瑕佸湪杞欢閲岃緭鍏ヤ竴涓紙锛夋潵浣滀负閲囬泦鐨勭洰鏍囥€?A:鐢佃瘽鍙风爜B:鍏抽敭璇?C:缃戦〉鍦板潃D:鐢ㄦ埛鍚?绛旀: 缃戦〉鍦板潃6銆佸叓鐖奔杞欢鐨勯噰闆嗚鍒欏彲浠ラ€氳繃鏂囦欢鐨勫舰寮忔潵瀵煎叆鎴栬€呭鍑猴紝杩欑鏂囦欢鐨勫悗缂€鍚嶆槸锛? 锛夈€?A:otdB:jpgC:pngD:gif绛旀: otd7銆丒xcel鍙互閫氳繃鈥滄暟鎹湁鏁堟€р€濇寜閽搷浣滄潵瑙勮寖鏁版嵁杈撳叆鐨勮寖鍥淬€?A:瀵?B:閿?绛旀: 瀵?8銆丒xcel涓嶈兘瀵煎叆txt鎴朿sv鏍煎紡鐨勬枃浠躲€?A:瀵?B:閿?绛旀: 閿?9銆佸叓鐖奔杞欢鍙兘瀵硅蒋浠跺唴寤轰簡鈥滅畝鏄撻噰闆嗏€濊鍒欑殑缃戠珯閲囬泦鏁版嵁銆?A:瀵?B:閿?绛旀: 閿?10銆佸叓鐖奔杞欢杩涜鑷畾涔夐噰闆嗘椂锛岄渶瑕佷簡瑙e缃戦〉鐨勯〉闈㈢粨鏋勩€?A:瀵?B:閿?绛旀: 瀵?绗笁绔?1銆佷娇鐢―BSCAN绠楁硶瀵归涪灏捐姳鏁版嵁闆嗭紙Iris.arff锛夎繘琛岃仛绫伙紝灏唀psilon鍙傛暟璁剧疆涓?.2锛? minPoints鍙傛暟璁剧疆涓?锛屽拷鐣lass灞炴€э紝閭d箞灏嗗舰鎴愶紙锛変釜绨囥€?A: 1B: 2C: 3D: 4绛旀: 32銆佷娇鐢‥M绠楁硶瀵瑰ぉ姘旀暟鎹泦锛坵eather.numeric.arff锛夎繘琛岃仛绫伙紝灏唍umClusters璁剧疆涓?锛屽嵆绨囨暟涓?锛屽叾浠栧弬鏁颁繚鎸侀粯璁ゅ€硷紝蹇界暐class灞炴€э紝浠庣粨鏋滀腑鍙煡锛屼笅鍒楅€夐」涓紝锛? 锛夋槸閿欒鐨勩€?A: 妯″瀷鐨勬渶澶т技鐒朵及璁″€兼槸-7.18B: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠?5娆?C: 绗洓涓皣鐨勫厛楠屾鐜囨槸0.14D: 绗洓涓皣鐨勫疄渚嬫暟涓?绛旀: 绗洓涓皣鐨勫疄渚嬫暟涓?3銆佷娇鐢⊿impleKMeans绠楁硶瀵瑰ぉ姘旀暟鎹泦锛坵eather.numeric.arff锛夎繘琛岃仛绫伙紝淇濇寔榛樿鍙傛暟锛屽嵆3涓皣浠ュ強娆ф皬璺濈銆傞€夋嫨play灞炴€т负蹇界暐灞炴€э紝浠庣粨鏋滀腑鍙煡锛屼笅鍒楅€夐」涓紝锛? 锛夋槸閿欒銆?A: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠e洓娆?B: 浜х敓浜嗕笁涓腑蹇冪偣C: 鑱氬悎涓?涓皣锛屽垎鍒湁7锛?锛?涓疄渚?D: 骞虫柟鍜岃宸负8.928绛旀: 杩欑粍鏁版嵁鐢ㄧ畻娉曡凯浠e洓娆?4銆佷娇鐢ㄧ嚎鎬у洖褰掞紙LinearRegression锛夊垎绫诲櫒鍜岀敤M5P鍒嗙被鍣ㄥcpu.arff鍒嗗埆杩涜鍒嗙被锛岀敱鍏惰緭鍑虹殑璇樊鎸囨爣鍙煡锛? 锛夈€?A: LinearRegression鐨勬爣鍑嗚宸瘮M5P鐨勬爣鍑嗚宸皬B: LinearRegression鐨勫钩鍧囩粷瀵硅宸瘮M5P鐨勫钩鍧囩粷瀵硅宸皬C: LinearRegression鐨勭浉瀵硅宸瘮M5P鐨勭浉瀵硅宸皬D: LinearRegression鐨勫钩鍧囨柟鏍硅宸瘮M5P鐨勫钩鍧囨柟鏍硅宸ぇ绛旀: LinearRegression鐨勫钩鍧囨柟鏍硅宸瘮M5P鐨勫钩鍧囨柟鏍硅宸ぇ5銆佸垹鍘籧pu.arff鏁版嵁鏂囦欢涓殑CACH灞炴€у悗锛屼娇鐢∕5P鍒嗙被鍣ㄦ瀯寤烘柟妗堬紝鍦ㄧ粨鏋滀腑锛屽埌杈綥M2鐨勫疄渚嬫暟鏈夛紙锛変釜銆?A: 165B: 21C: 23D: 30绛旀: 216銆佹牴鎹甁48鍒嗙被鍣ㄨ缁僿eather.nominal.arff鎵€鐢熶骇鐨勫喅绛栨爲锛屽綋outlook=sunny锛泃emperature=cool锛沨umidity =high锛泈indy=TRUE鏃讹紝鍒嗙被鐨勭粨鏋滄槸锛?锛夈€?A: YesB: NoC: 娌℃湁缁撴灉D: 鏃犳硶鍒嗙被绛旀: No7銆佹牴鎹甁48鍒嗙被鍣ㄨ缁僫ris.arff鎵€鐢熶骇鐨勫喅绛栨爲锛屽綋sepallength=4.4锛泂epalwidth=3.0锛沺etallength=1.3锛沺etalwidth=0.2鏃讹紝鍒嗙被鐨勭粨鏋滄槸锛? 锛夈€?A: Iris-setosaB: Iris-versicolorC: Iris-virginicaD: 鏃犳硶鍒嗙被绛旀: Iris-setosa8銆佸叧浜嶹eka绂绘暎鍖栬鏄庢纭殑鏄紙锛夈€?A: 绂绘暎鍖栨槸灏嗘暟鍊煎睘鎬ц浆鎹负瀛楃涓插瀷灞炴€?B: 鏈夌洃鐫g鏁e寲鏈変袱绉嶇瓑瀹藉拰绛夐鏂规硶C: 绛夊绂绘暎鍖栨槸浣垮疄渚嬪垎甯冨潎鍖€鐨?D: 绂绘暎鍖栧寘鎷棤鐩戠潱绂绘暎鍖栧拰鏈夌洃鐫g鏁e寲绛旀: 绂绘暎鍖栧寘鎷棤鐩戠潱绂绘暎鍖栧拰鏈夌洃鐫g鏁e寲9銆佷互涓嬶紙锛変笉鏄疻eka鐨勬暟鎹被鍨嬨€?A: numericB: nominalC: stringD: decimal绛旀: decimal10銆佸叧浜嶹eka鐨勬枃浠剁被鍨嬫弿杩伴敊璇殑鏄紙锛夈€?A: Weka鍙互鎵撳紑鏂囦欢鏍煎紡鏈?arff銆?csv銆?xlsxB: Weka澶勭悊鐨勬暟鎹泦绫讳技浜庡叧绯绘暟鎹簱妯瀹炰緥锛岀珫琛屽睘鎬?C: arff鏄疉SCII鏂囦欢锛屽彲浠ョ敤Word绛夋枃鏈紪杈戝櫒鎵撳紑鏌ョ湅D: @relation 瀹氫箟鏁版嵁闆嗗悕绉帮紝@data涔嬪悗鍛堢幇瀹炰緥锛屾瘡涓€琛屽氨鏄竴涓疄渚?绛旀: Weka鍙互鎵撳紑鏂囦欢鏍煎紡鏈?arff銆?csv銆?xlsx11銆佷互涓嬪睘浜庡叧鑱斿垎鏋愮殑鏄紙锛夈€?A: CPU鎬ц兘棰勬祴B: 璐墿绡垎鏋?C: 鑷姩鍒ゆ柇楦㈠熬鑺辩被鍒?D: 鑲$エ瓒嬪娍寤烘ā绛旀: 璐墿绡垎鏋?12銆佸ぇ鏁版嵁鏃朵唬鐨勫埌鏉ワ紝浣挎垜浠棤娉曚汉涓哄湴鍘诲彂鐜版暟鎹腑鐨勫ゥ濡欙紝涓庢鍚屾椂锛屾垜浠洿搴旇娉ㄩ噸鏁版嵁涓殑鐩稿叧鍏崇郴锛岃€屼笉鏄洜鏋滃叧绯汇€傚叾涓紝鏁版嵁涔嬮棿鐨勭浉鍏冲叧绯诲彲浠ラ€氳繃浠ヤ笅锛? 锛夌畻娉曠洿鎺ユ寲鎺樸€?A: K-meansB: Bayes NetworkC: C4.5D: Apriori绛旀: Apriori13銆佹煇瓒呭競鐮旂┒閿€鍞邯褰曟暟鎹悗鍙戠幇锛屼拱鍟ら厭鐨勪汉寰堝ぇ姒傜巼涔熶細璐拱灏垮竷锛岃繖绉嶅睘浜庢暟鎹寲鎺樼殑锛? 锛夐棶棰樸€?A: 鍏宠仈瑙勫垯鍙戠幇B: 鑱氱被C: 鍒嗙被D: 鑷劧璇█澶勭悊绛旀: 鍏宠仈瑙勫垯鍙戠幇14銆佸湪杩涜鑷姩閫夋嫨灞炴€ф椂锛屽繀椤昏绔嬩袱涓璞★紝鍏朵腑纭畾浣跨敤浠€涔堟柟娉曚负姣忎釜灞炴€у瓙闆嗗垎閰嶄竴涓瘎浼板€肩殑瀵硅薄鏄笅闈㈢殑锛? 锛夈€?A: 鎼滅储鏂规硶B: 灞炴€ц瘎浼板櫒C: 鍏冨垎绫诲櫒D: 瑙勫垯鎸栨帢绛旀: 灞炴€ц瘎浼板櫒15銆佷互涓嬪睘浜庡睘鎬х┖闂寸殑鎼滅储鏂规硶鐨勬槸锛?锛夈€?A: GainRatioAttributeEvalB: BestFirstC: PrincipalComponentsD: SymmetricalUncertAttributeEval绛旀: BestFirst16銆佸湪weka杞欢鎺㈢储鑰呯晫闈腑锛屽埄鐢╒isualize鏍囩椤甸€氳繃鏇存敼鍚勪釜鍙傛暟鏉ヨ繘琛屾暟鎹泦鐨勫彲瑙嗗寲灞炴€ц缃悗锛岄渶瑕佸崟鍑讳互涓嬶紙锛夋寜閽紝鎵€鏈夋洿鏀规墠浼氱敓鏁堛€?A: Select AttributeB: SubSampleC: UpdateD: Fast scrolling绛旀: Update17銆佺粰瀹氬叧鑱旇鍒橝B锛屾剰鍛崇潃锛氳嫢A鍙戠敓锛孊涔熶細鍙戠敓銆?A:瀵?B:閿?绛旀: 閿?18銆佹敮鎸佸害鏄閲忓叧鑱旇鍒欓噸瑕佹€х殑涓€涓寚鏍囥€?A:瀵?B:閿?绛旀: 瀵?19銆丷anker鏂规硶鏃㈠彲浠ョ敤浜庡崟涓睘鎬ц瘎浼板櫒锛屽張鍙互鐢ㄤ簬灞炴€у瓙闆嗚瘎浼板櫒銆?A:瀵?B:閿?绛旀: 閿?20銆佸埄鐢╳eka杞欢杩涜鏁版嵁鍙鍖栨椂锛岀敤鎴峰彲浠ラ€夋嫨绫诲埆灞炴€у鏁版嵁鐐圭潃鑹诧紝濡傛灉绫诲埆灞炴€ф槸鏍囩О鍨嬶紝鍒欐樉绀轰负褰╄壊鏉°€?A:瀵?B:閿?绛旀: 閿?绗洓绔?1銆佽礉鍙舵柉缃戠粶涓殑鑺傜偣浠h〃锛? 锛夈€?A:鍙橀噺B:闅忔満杩囩▼C:闅忔満鍙橀噺D:闅忔満鍑芥暟绛旀: 闅忔満鍙橀噺2銆佽礉鍙舵柉缃戠粶涓紝鑺傜偣闇€缁欏嚭姒傜巼鍒嗗竷鎻忚堪锛屽浜庣鏁e瀷闅忔満鍙橀噺鑰岃█锛屽彲浠ョ敤锛? 锛夌殑褰㈠紡琛ㄧず銆?A:鏉′欢姒傜巼瀵嗗害鍑芥暟B:姝f€佸垎甯?C:鏉′欢姒傜巼琛?D: 鍧囧寑鍒嗗竷绛旀: 鏉′欢姒傜巼琛?3銆佽礉鍙舵柉缃戠粶涓妭鐐逛箣闂寸殑杈逛唬琛紙锛夈€? A:闅忔満鍏崇郴B:姒傜巼鍥犳灉C:缁勫悎鍏崇郴D:闅忔満缁撴灉绛旀: 闅忔満鍏崇郴4銆佽礉鍙舵柉缃戠粶淇濆瓨鐨勬枃浠舵牸寮忔槸( )銆?A:XML BIFB:DOCXC: TXTD:XLS绛旀: XML BIF5銆佷笅闈紙锛変笉鏄弽鍚戜紶鎾缁忕綉缁滅殑缁撴瀯銆? A:杈撳叆灞?B:闅愬惈灞?C:璁$畻灞?D:杈撳嚭灞?绛旀: 璁$畻灞?6銆佺缁忕綉缁滀腑鐨勮妭鐐逛唬琛紙锛夈€?A:婵€鍔卞彉閲?B:婵€鍔卞嚱鏁?C:闅忔満鍙橀噺D:闅忔満鍑芥暟绛旀: 婵€鍔卞嚱鏁?7銆佷笅鍒楋紙锛変笉鏄父瑙佺殑婵€鍔卞嚱鏁般€?A:绾挎€у嚱鏁?B:Sigmoid鍑芥暟C:闃堝€煎嚱鏁?D:姝e鸡鍑芥暟绛旀: 姝e鸡鍑芥暟8銆佸湪璐濆彾鏂綉缁滅紪杈戠晫闈㈡椂锛屽鏋滆妭鐐圭殑鍚嶇О娌℃硶瀹屽叏鏄剧ず锛岄渶瑕佷粠锛? 锛夎彍鍗曢」杩涜璋冩暣銆?A:Tools|SetDataB:View|Zoom OutC:View|Zoom InD:Tools|Layout绛旀: Tools|Layout9銆乄EKA涓€夋嫨绁炵粡缃戠粶鍒嗙被鍣ㄦ搷浣滄椂锛屽簲璇ラ€夋嫨锛? 锛夈€?A:rules鏉$洰涓嬬殑PARTB:functions鏉$洰涓嬬殑SGD鍒嗙被鍣?C:functions鏉$洰涓嬬殑MultilayerPerceptron鍒嗙被鍣?D:榛樿鐨勫垎绫诲櫒绛旀: functions鏉$洰涓嬬殑MultilayerPerceptron鍒嗙被鍣?10銆佷笅闈㈠叧浜嶱ackage Manager瀹夎鍚庣殑鐩綍璇存槑涓嶆纭殑鏄紙锛夈€?A:doc瀛愮洰褰曞瓨鏀続PI鏂囨。
大数据处理与分析考试试题及答案
大数据处理与分析考试试题及答案一、选择题1. 大数据的定义是以下哪一项?A. 数据量超过1TB的数据B. 数据量超过100TB的数据C. 数据量超过1PB的数据D. 数据量超过1EB的数据答案:C. 数据量超过1PB的数据2. 大数据处理的特点是以下哪一项?A. 数据量大B. 处理速度快C. 数据种类繁多D. 数据质量高答案:A. 数据量大3. 下列哪项属于大数据处理的挑战?A. 存储问题B. 安全问题C. 隐私问题D. 数据质量问题答案:B. 安全问题4. Hadoop是以下哪一个大数据处理框架的代表?A. Apache SparkB. Apache CassandraC. MapReduceD. Apache Kafka答案:C. MapReduce5. 大数据分析的目的是以下哪一项?A. 提高数据存储能力B. 增加数据处理速度C. 发现潜在的业务机会D. 优化数据传输效率答案:C. 发现潜在的业务机会二、填空题1. 关系数据库一般使用______作为数据查询语言。
(SQL)2. 数据治理是保证数据______、______、______和______的一种管理方式。
(准确性、可用性、完整性、安全性)3. 在大数据处理中,______是指对数据进行有效的汇总和调整,以适应分析或查询的需要。
(数据聚合)4. ______是一种数据存储和访问模式,能够有效地存储和查询大规模分布式数据。
(分布式文件系统)5. 大数据分析的常用技术包括______、______和______等。
(机器学习、数据挖掘、自然语言处理)三、简答题1. 请简述大数据处理的四个V特点。
答:大数据处理的四个V特点分别是:Volume(数据量大)、Velocity(处理速度快)、Variety(数据种类繁多)和Value(价值密度低)。
Volume表示大数据的特点是数据量巨大,超出了传统数据库的处理能力;Velocity表示大数据处理需要在短时间内进行高速处理;Variety表示大数据包括结构化数据、非结构化数据和半结构化数据等多种数据类型;Value表示大数据中包含了大量的背景信息和潜在的商业价值。
大数据应用与分析技术考试 选择题 61题
1题1. 大数据的“4V”特性不包括以下哪一项?A. 容量(Volume)B. 速度(Velocity)C. 多样性(Variety)D. 价值(Value)答案:D2. Hadoop生态系统中,用于数据处理的核心组件是?A. HBaseB. HiveC. MapReduceD. Pig答案:C3. 以下哪种数据存储技术最适合处理非结构化数据?A. SQL数据库B. NoSQL数据库C. 文件系统D. 内存数据库答案:B4. 在数据分析中,K-means算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:B5. 数据仓库的主要目的是什么?A. 实时数据处理B. 数据分析和报告C. 在线事务处理D. 数据备份答案:B6. 以下哪个工具不是用于大数据分析的?A. RB. PythonC. ExcelD. Tableau答案:C7. 在Hadoop中,哪个组件负责存储数据?A. HDFSB. YARNC. MapReduceD. Hive答案:A8. 数据挖掘的主要任务不包括以下哪一项?A. 分类B. 聚类C. 数据清洗D. 关联规则发现答案:C9. 以下哪种技术用于实时数据流处理?A. Apache KafkaB. Apache SparkC. Apache FlinkD. 以上都是答案:D10. 在数据可视化中,哪种图表最适合展示时间序列数据?A. 饼图B. 条形图C. 折线图D. 散点图答案:C11. 以下哪个不是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 数据备份答案:D12. 在数据分析中,PCA(主成分分析)主要用于什么?A. 数据降维B. 数据分类C. 数据聚类D. 数据关联答案:A13. 以下哪个是NoSQL数据库的例子?A. MySQLB. PostgreSQLC. MongoDBD. Oracle答案:C14. 在Hadoop中,哪个组件负责资源管理和作业调度?A. HDFSB. YARNC. MapReduceD. Hive答案:B15. 数据湖和数据仓库的主要区别是什么?A. 数据湖存储原始数据,数据仓库存储结构化数据B. 数据湖存储结构化数据,数据仓库存储原始数据C. 数据湖和数据仓库都存储原始数据D. 数据湖和数据仓库都存储结构化数据答案:A16. 以下哪个工具最适合用于大数据的实时分析?A. Apache HiveB. Apache SparkC. Apache PigD. Apache Flink答案:D17. 在数据分析中,决策树算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A18. 以下哪个是大数据处理框架?A. TensorFlowB. HadoopC. Scikit-learnD. Keras答案:B19. 在数据分析中,SVM(支持向量机)主要用于什么?A. 数据降维B. 数据分类C. 数据聚类D. 数据关联答案:B20. 以下哪个不是数据可视化工具?A. TableauB. Power BIC. QlikViewD. TensorFlow答案:D21. 在数据分析中,Apriori算法主要用于什么?A. 数据降维B. 数据分类C. 数据聚类D. 关联规则发现答案:D22. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据分析D. 以上都是答案:D23. 在数据分析中,随机森林算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A24. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 以上都是答案:D25. 在数据分析中,线性回归算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:C26. 以下哪个是大数据分析的工具?A. RB. PythonC. TableauD. 以上都是答案:D27. 在数据分析中,KNN算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A28. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据分析D. 以上都是答案:D29. 在数据分析中,朴素贝叶斯算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A30. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 以上都是答案:D31. 在数据分析中,逻辑回归算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A32. 以下哪个是大数据分析的工具?A. RB. PythonC. TableauD. 以上都是答案:D33. 在数据分析中,DBSCAN算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:B34. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据分析D. 以上都是答案:D35. 在数据分析中,EM算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:B36. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 以上都是答案:D37. 在数据分析中,CART算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A38. 以下哪个是大数据分析的工具?A. RB. PythonC. TableauD. 以上都是答案:D39. 在数据分析中,AdaBoost算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A40. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据分析D. 以上都是答案:D41. 在数据分析中,Gradient Boosting算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A42. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 以上都是答案:D43. 在数据分析中,XGBoost算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A44. 以下哪个是大数据分析的工具?A. RB. PythonC. TableauD. 以上都是答案:D45. 在数据分析中,LightGBM算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A46. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据分析D. 以上都是答案:D47. 在数据分析中,CatBoost算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A48. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 以上都是答案:D49. 在数据分析中,AutoML算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A50. 以下哪个是大数据分析的工具?A. RB. PythonC. TableauD. 以上都是答案:D51. 在数据分析中,Deep Learning算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A52. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据分析D. 以上都是答案:D53. 在数据分析中,Neural Networks算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A54. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 以上都是答案:D55. 在数据分析中,Convolutional Neural Networks算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A56. 以下哪个是大数据分析的工具?A. RB. PythonC. TableauD. 以上都是答案:D57. 在数据分析中,Recurrent Neural Networks算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A58. 以下哪个是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据分析D. 以上都是答案:D59. 在数据分析中,Generative Adversarial Networks算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A60. 以下哪个是大数据分析的挑战?A. 数据质量B. 数据安全C. 数据存储D. 以上都是答案:D61. 在数据分析中,Reinforcement Learning算法属于哪一类算法?A. 分类算法B. 聚类算法C. 回归算法D. 关联规则算法答案:A答案列表:1. D2. C3. B4. B5. B6. C7. A8. C9. D10. C11. D12. A13. C14. B15. A16. D17. A18. B19. B20. D21. D22. D23. A24. D25. C26. D27. A28. D29. A30. D31. A32. D33. B34. D35. B36. D37. A38. D39. A40. D41. A42. D43. A44. D45. A46. D47. A48. D49. A50. D51. A52. D53. A54. D55. A56. D57. A58. D59. A60. D61. A。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章单元测试
1、单选题:
大数据的英文描述是()
选项:
A:Big data
B:Great data
C:Large data
D:Heavy data
答案: 【Big data】
2、单选题:
下面最大的储存单位是()
选项:
A:PB
B:TB
C:KB
D:GB
答案: 【PB】
3、单选题:
大数据之父是()
选项:
A:维克托·迈尔-舍恩伯格
B:詹姆斯·高斯林
C:姚期智
D:查尔斯·巴赫曼
答案: 【维克托·迈尔-舍恩伯格】
4、多选题:
大数据的特点包括()
选项:
A:Value
C:Volume
D:Variety
答案: 【Value;Velocity;Volume;Variety】
5、多选题:
第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()
选项:
A:Science
B:Cell
C:Nature
D:PNAS
答案: 【Science;Nature】
6、判断题:
大数据是只和互联网相关的计算机技术。
选项:
A:对
B:错
答案: 【错】
7、判断题:
企业中大部分的数据都是非结构化数据。
选项:
A:错
B:对
答案: 【对】
8、判断题:
大数据技术的基础是由阿里巴巴首先提出的。
选项:
A:对
B:错
答案: 【错】
大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。
选项:
A:对
B:错
答案: 【对】
10、判断题:
大数据对网络安全没有威胁。
选项:
A:对
B:错
答案: 【错】
第二章单元测试
1、单选题:
目前,企业的数据架构存在的最大比例问题是()
选项:
A:运营成本高
B:拓展性差
C:资源利用率低
D:高耗能
答案: 【拓展性差】
2、判断题:
目前,企业数据分析处理面临的主要问题是缺少数据全方位分析方法。
选项:
A:错
B:对
答案: 【对】
地图导航根据以往的行程记录,绘制了最优路程,标明了可能堵车的地点,这表现了大数据分析理念中的()
选项:
A:注重相关性而不是因果性
B:注重相对性而不是绝对性
C:注重全体而不是局部
D:注重效率而不是准确
答案: 【注重相关性而不是因果性】
4、单选题:
最早提出大数据研发计划的国家是()
选项:
A:日本
B:法国
C:中国
D:美国
答案: 【美国】
5、多选题:
大数据可能被运用的行业有()
选项:
A:农业
B:医疗
C:教育
D:金融
答案: 【农业;医疗;教育;金融】
6、判断题:
2015年9月18日云南省启动我国首个大数据综合试验区的建设工作。
选项:
A:对
B:错
答案: 【错】
大数据的价值密度很高。
选项:
A:对
B:错
答案: 【错】
8、判断题:
日本政府将IT产业,尤其是大数据及云计算作为促进经济增长,解决内部矛盾一个关键。
选项:
A:对
B:错
答案: 【对】
9、判断题:
非结构化数据对企业也富有价值。
选项:
A:对
B:错
答案: 【对】
10、判断题:
企业的日数据生成量可达到1TB。
选项:
A:错
B:对
答案: 【对】。