大数据知识竞赛试题

合集下载

大数据知识竞赛试题

大数据知识竞赛试题

大数据知识竞赛试题学院队名一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?姓名性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、BeansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.Hadoop1.0平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。

大数据考试题

大数据考试题

大数据考试题一、选择题1.大数据是指()。

A.海量数据存储B.海量数据处理C.海量数据分析D.以上皆是2.以下哪个行业中不适合应用大数据技术()。

A.金融B.教育C.医疗D.制造3.大数据技术的主要特点包括()。

A.高速B.大容量C.多样性D.以上皆是4.数据挖掘是大数据技术中的一种()。

A.数据收集方法B.数据处理方法C.数据分析方法D.数据存储方法5.以下哪种技术不属于大数据技术中的数据存储方法()。

A.关系数据库B.分布式文件系统C.非关系型数据库D.数据仓库二、填空题1.大数据技术的核心是()。

答:数据分析2.大数据处理能力的衡量指标是()。

答:吞吐量3.数据清洗是大数据处理过程中的()。

答:第一步4.大数据技术广泛应用于()行业。

答:金融、电商、物流等5.数据挖掘的目标是()。

答:发现隐藏在大数据中的有价值信息三、简答题1.请简述大数据的三个V特点。

答:大数据的三个V特点是:高速(Velocity)、大容量(Volume)和多样性(Variety)。

高速指的是数据的快速产生和传输速度,要求系统能够实时处理大量的数据;大容量意味着大数据处理系统需要具备海量数据存储和处理的能力;多样性指的是大数据来源的多样性,包括结构化数据和非结构化数据等。

2.数据挖掘是什么?简要介绍其在大数据领域的应用。

答:数据挖掘是通过自动或半自动的方式,在大数据中发现模式、关联、异常等有价值的信息的过程。

在大数据领域,数据挖掘技术被广泛应用于市场分析、用户画像、推荐系统等方面。

通过数据挖掘,企业可以挖掘出用户的偏好、需求,从而优化产品设计和营销策略,提升竞争力。

3.请简述大数据技术在金融行业中的应用。

答:大数据技术在金融行业中的应用广泛,包括风险管理、反欺诈、营销分析等方面。

在风险管理方面,大数据技术可以通过对大量的交易数据进行实时监控和分析,及时发现异常交易和风险事件,并采取相应措施预防风险。

在反欺诈方面,大数据技术可以对用户的行为数据进行分析,建立起用户画像,准确识别风险,防止欺诈行为的发生。

最新精编《大数据》完整考试题库500题(含标准答案)

最新精编《大数据》完整考试题库500题(含标准答案)

最新精编《大数据》完整考试题库500题(含标准答案)大数据考试试题题库500题[含答案]一、选择题1.20世纪中后期至今的媒介革命,以(acd )的出现为标志。

(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化2.宁家骏委员指出,我国民生领域信息化服务水平显著提升。

(判断题1分)分.1分正确1 错误3.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。

(判断题1分)得分.1分正确1 错误4.习近平总书记指出,网信事业代表着新的生产力.新的发展方向,应该也能够在践行新发展理念上先行一步。

(判断题1分)得分.1分正确1 错误5.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。

(判断题1分)得分.0分正确1 错误6.2000年,全国涉农网站超过6000家。

(判断题1分)得分.0分正确1 错误7.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度.扁平化.相互竞合的方式进行。

(判断题1分)得分.1分正确1 错误8.当今世界四大趋势指的是经济全球化.全球城市化.全球信息化.信息智慧化。

(判断题1分)得分.1分正确1 错误9.2012年,我国农村居民家庭每百户拥有移动电话197.8部。

(判断题1分)分.1分正确1 错误10.2015年,阿里平台完成农产品销售达到6000多亿元。

(判断题1分)1分正确错误111.大数据仅仅是指数据的体量大。

(判断题1分)正确错误1 得分.1分12.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。

(判断题1分)得分.1分正确1 错误13.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。

(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理14.大数据正快速发展为对数量巨大.来源分散.格式多样的数据进行采集.存储和关联分析,从中发现新知识.创造新价值.提升新能力的(b)。

(完整版)大数据考试题

(完整版)大数据考试题

《大数据》试题单选题1、大数据的核心就是(B)A、告知与许可B、预测C、匿名化D、规模化2、大数据不是要教机器像人一样思考。

相反,它是(A)A、把数学算法运用到海量的数据上来预测事情发生的可能性。

B、被视为人工智能的一部分。

C、被视为一种机器学习。

D、预测与惩罚。

3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。

A、降低B、不变C、提高D、无关4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法A、所有数据B、绝大部分数据C、适量数据D、少量数据5、大数据的简单算法与小数据的复杂算法相比(A)A、更有效B、相当C、不具备可比性D、无效6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。

A、安全性B、完整性C、混杂性D、完整性和混杂性7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)A、信息B、数字C、文字D、方位8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B)A、原因B、是什么C、关联物D、预测的关键9、建立在相关关系分析法基础上的预测是大数据的(C)A、基础B、前提C、核心D、条件10、(C)下列说法正确的是A、有价值的数据是附属于企业经营核心业务的一部分数据;B、数据挖掘它的主要价值后就没有必要再进行分析了;C、所有数据都是有价值的;D、在大数据时代,收集、存储和分析数据非常简单;11、关于数据创新,下列说法正确的是(D)A、多个数据集的总和价值等于单个数据集价值相加;B、由于数据的再利用,数据应该永久保存下去;C、相同数据多次用于相同或类似用途,其有效性会降低;D、数据只有开放价值才能得到真正释放。

12、关于数据估值,下列说法错误的是(B)A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴;B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的;C、数据的价值可以通过授权的第三方使用来实现D、目前可以通过数据估值模型来准确的评估数据的价值评估13、在大数据时代,下列说法正确的是(B)。

大数据知识竞赛题库

大数据知识竞赛题库

大数据知识竞赛题库
以下是一些大数据知识竞赛的题目,仅供参考:
1.什么是大数据?大数据有哪些特征?
2.大数据与传统的数据处理相比有哪些不同之处?
3.大数据技术包括哪些方面?它们各自的作用是什么?
4.请简述Hadoop分布式文件系统(HDFS)的主要特点。

5.请简述MapReduce的主要思想。

6.请简述Spark的主要特点。

7.请简述Kafka的主要应用场景。

8.请简述HBase的主要应用场景。

9.请简述Elasticsearch的主要应用场景。

10.请简述Redis的主要应用场景。

以上题目涵盖了大数据的基本概念、技术、应用等方面,可以作为大数据知识竞赛的题库。

当然,具体题目的难易程度、涉及领域、题目形式等还需要根据具体的竞赛要求进行设计。

大数据的考试题目和答案

大数据的考试题目和答案

大数据的考试题目和答案一、单项选择题(每题2分,共20分)1. 大数据的核心特征不包括以下哪一项?A. 体量大B. 速度快C. 价值密度高D. 多样性答案:C2. Hadoop的核心组件不包括以下哪一项?A. HDFSB. MapReduceC. HiveD. Spark答案:D3. 在大数据时代,以下哪种技术不是处理数据的关键技术?A. 数据挖掘B. 机器学习C. 云计算D. 传统数据库答案:D4. 下列哪个不是大数据应用的领域?A. 金融B. 医疗C. 教育D. 农业答案:C5. 以下哪个不是大数据的存储技术?A. NoSQL数据库B. 云存储C. 传统关系型数据库D. 分布式文件系统答案:C6. 大数据的4V特性中,哪个代表数据的准确性?A. VolumeB. VelocityC. VarietyD. Veracity答案:D7. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据解释答案:D8. 以下哪个不是大数据的来源?A. 社交媒体B. 传感器数据C. 传统数据库D. 纸质文档答案:D9. 在大数据技术中,以下哪个不是数据挖掘的算法?A. 决策树B. 聚类分析C. 线性回归D. 神经网络答案:C10. 大数据的实时处理技术不包括以下哪一项?A. StormB. FlinkC. HadoopD. Spark Streaming答案:C二、多项选择题(每题3分,共15分)11. 大数据技术可以应用于以下哪些行业?A. 零售B. 交通C. 教育D. 娱乐答案:ABCD12. 大数据的挑战包括以下哪些方面?A. 数据安全B. 数据隐私C. 数据存储D. 数据分析答案:ABCD13. 以下哪些是大数据的存储解决方案?A. 数据仓库B. 数据湖C. 云存储D. 传统数据库答案:ABC14. 以下哪些是大数据处理框架?A. HadoopB. SparkC. StormD. TensorFlow答案:ABC15. 大数据的分析方法包括以下哪些?A. 描述性分析B. 诊断性分析C. 预测性分析D. 规范性分析答案:ABCD三、判断题(每题2分,共10分)16. 大数据技术只能用于处理结构化数据。

(完整版)大数据复习题(答案)

(完整版)大数据复习题(答案)

一、单选题1、大数据的起源是(B)。

A:金融B:互联网C:电信D:公共管理2、大数据的最明显特点是(B)。

A:数据类型多样B:数据规模大C:数据价值密度高D:数据处理速度快3、大数据时代,数据使用的最关键是(D)。

A:数据收集B:数据存储C:数据分析D:数据再利用4、云计算分层架构不包括(D)。

A: Iaas B: Paas C: Saas D: Yaas5、大数据技术是由(C)公司首先提出来的。

A:阿里巴巴B:百度C:谷歌D:微软6、数据的精细化程度是指(C),越细化的数据,价值越高。

A:规模B:活性C:颗粒度D:关联性7、数据清洗的方法不包括(C)A:噪声数据清除B:一致性检查C:重复数据记录处理D:缺失值处理智能手环的应用开发,体现了(C)的数据采集技术的应用。

A:网络爬虫B:API接口C:传感器D:统计报表9、下列关于数掲重组的说法中,错误的是(A)。

A:数据的重新生产和采集B:能使数据焕发新的光芒C:关键在于多源数据的融合和集成D:有利于新的数据模式创新10、美国海军军官莫里通过对前人航海日志的分析,绘制考了新的航海路线图,标明了大风与洋流可能发生的地点。

这体现了大数据分析理念中的(B)。

A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于含思伯格对大数据特点的说法中,错误的是(D)A:数据规模大B:数据类型多C:处理速度快D:价值密度高12、当前社会中,最为突出的大数据环境是(A)A:互联网B:自然环境C:综合国力D:物联网13、在数据生命周期管理实践中,(B)是执行方法。

A:数据存储和各份规范B:数据管理和维护C:数据价值发觉和利用D:数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是(C)。

A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互痕迹能够为企业提升服务质量提供参C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、下列关于聚类挖报技术的说法中,错误的是(B)。

试卷题(大数据知识竞赛)

试卷题(大数据知识竞赛)

2018年度一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、B eansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据知识竞赛试题
学院队名
一、单选题(每题1分)
1、小米摄像头记录下来的10分钟视频属于哪类数据:
A、结构化数据
B、半结构化数据
C、非结构化数据
2、结构化数据具备哪种特征:
A、具备明确逻辑关系
B、不具备明确逻辑关系
C、不一定具备明确逻辑关系
3、指纹打卡的数据属于哪些数据:
A、传感数据
B、交互数据
C、交易数据
4、大数据擅长处理哪个级别的数据?
A、MB
B、GB
C、TB
D、PB
5、电子邮件是什么类型数据:
A、非结构化数据
B、结构化数据
C、半结构化数据
6、网络新闻是什么类型数据:
A、非结构化数据
B、结构化数据
C、半结构化数据
7、下列属于结构化数据的是:
A、图片
B、一卡通学生信息
C、简历
8、表1属于几维列表?
姓名性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60
表1
A、二维
B、三维
C、四维
D、五维
9、图1中的警衔级别属于哪种属性?
图1
A、标称属性
B、二元属性
C、序数属性
D、数值属性
10、关系型数据库中所谓的“关系”是指什么
A、数据库中的数据彼此间存在任意关联
B、数据模型满足一定条件的二维表格式
C、两个数据库之间有一定的关联
11、下列哪种数据类型不适合MySQL存储:
A、EXCEL报表
B、图片和声音
C、数据库里的财务数据
12、以下不属于ACID原则的是:
A、原子性
B、相对性
C、隔离性
D、持久性
13、淘宝自主设计的自动化分布式存储系统是:
A、MongoDB
B、HBase
C、Oceanbase
14、BeansDB 是一个由我国哪个公司网站自主开发的:
A、淘宝
B、豆瓣社区
C、优酷
D、视觉中国
15、下列不是NewSQL数据库的是:
A、Sybase
B、MemSQL
C、TokuDB
16、下列不是NoSQL数据库的是:
A、Bigtable
B、Dynamo
C、DB2
17、下列不是传统关系型数据库的是:
A、MySQL
B、HBase
C、Sybase
18、下面关于数据挖掘的说法哪些是错误的:
A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容
B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据
C、所有发现的知识都是绝对的
19、下列不属于数据挖掘知识的方法
A、数学方法
B、归纳方法
C、实验方法
20、一般情况下,舆情监测内容不包含:
A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计
C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计
21、科学可视化、信息可视化和可视分析三者之间如何区分:
A、三者从属关系
B、三者属于递进关系
C、三者之间没有清晰边界
22、下列哪个不属于可视化的作用:
A、信息传播与协调
B、支持对信息的推理和分析
C、对信息进行筛选和储存
23、下图为百度地图显示某地区的加油站,此图为哪类可视化:
A、层次与网络可视化
B、时空数据可视化
C、多变量数据可视化
24、下图为伦敦地铁图,此图为哪类可视化:
A、层次与网络可视化
B、时空数据可视化
C、多变量数据可视化
25、下图为大数据标签云,此图为哪类可视化:
A、多变量数据可视化
B、时空数据可视化
C、非结构化数据可视化
26、目前在全球云计算市场份额占有率最高的公司是:
A、谷歌
B、亚马逊
C、微软
D、IBM
27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:
A、电子商务营销精准化和实时化
B、产品和服务高度差异化和个性化
C、价值链上企业运作差异化和静态化
D、新型增值服务模式不断涌现
28、下列哪个不是大数据下互联网广告的特点
A、广告内容更有针对性
B、提高广告决策效率
C、广告以平面媒体为主
D、广告传播模式的改变
29、微信朋友圈的FEED流广告的推广更为准确描述是:
A、大数据会使受众与产品的距离更贴近
B、对于目标受众的划分更加精细
C、大数据最本质的应用就在于预测
D、随意投放的广告
30、啤酒与尿布的营销案例应用了零售行业的哪种方法:
A、发现关联购买行为
B、客户群体细分
C、供应链管理
二、多选题(每题2分)
1.Hadoop1.0平台最核心的两个项目(组件)是:
A、HDFS
B、HIVE
C、HBase
D、MapReduce
2.以下平台属于Apache软件基金会项目的是:
A、Hadoop
B、Spark
C、Storm
D、MongoDB
3.以下属于大数据挖掘算法的是:
A、决策树
B、支持向量机
C、极差规格化
D、朴素贝叶斯
4.以下属于Spark平台特点的是:
A、共享变量
B、离线处理
C、内存计算
D、弹性分布式数据集
5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:
A、28M
B、64M
C、100M
D、128M
三、判断题(每题1分)
1.Newsql是一种新兴的非关系型数据库。

()
2.数据分析主要是指对过去的数据进行分析总结可视化,而数据科学主要是通过数据模型
指对将来的发展趋势进行预测。

()
3.Python是一种跨平台语言,可以安装在Linux,MacOS和Windows操作系统中。

()
4.数据ETL属于数据分析和挖掘的范畴。

()
5.MapReduce的输入是基于Key-Value键值对。

()
6.云计算提供的三种服务形式中,Iaas是指客户通过Internet即可使用租用商提供的软
件。

()
7.Hadoop主要用于离线大数据分析,而Storm主要用于在线实时大数据分析。

()
8.商务智能(BI)的基本体系结构包括数据仓库、联机分析处理和数据挖掘。

()
9.R语言只能用作数据分析,而Python语言既可以用作数据分析也可以用作数据可视化。

()
10.HDFS的主服务器名称叫做DataNode。

()。

相关文档
最新文档