大数据知识竞赛试题

合集下载

大数据知识竞赛试题

大数据知识竞赛试题

大数据知识竞赛试题学院队名一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?姓名性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、BeansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.Hadoop1.0平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。

大数据考试题

大数据考试题

大数据考试题一、选择题1.大数据是指()。

A.海量数据存储B.海量数据处理C.海量数据分析D.以上皆是2.以下哪个行业中不适合应用大数据技术()。

A.金融B.教育C.医疗D.制造3.大数据技术的主要特点包括()。

A.高速B.大容量C.多样性D.以上皆是4.数据挖掘是大数据技术中的一种()。

A.数据收集方法B.数据处理方法C.数据分析方法D.数据存储方法5.以下哪种技术不属于大数据技术中的数据存储方法()。

A.关系数据库B.分布式文件系统C.非关系型数据库D.数据仓库二、填空题1.大数据技术的核心是()。

答:数据分析2.大数据处理能力的衡量指标是()。

答:吞吐量3.数据清洗是大数据处理过程中的()。

答:第一步4.大数据技术广泛应用于()行业。

答:金融、电商、物流等5.数据挖掘的目标是()。

答:发现隐藏在大数据中的有价值信息三、简答题1.请简述大数据的三个V特点。

答:大数据的三个V特点是:高速(Velocity)、大容量(Volume)和多样性(Variety)。

高速指的是数据的快速产生和传输速度,要求系统能够实时处理大量的数据;大容量意味着大数据处理系统需要具备海量数据存储和处理的能力;多样性指的是大数据来源的多样性,包括结构化数据和非结构化数据等。

2.数据挖掘是什么?简要介绍其在大数据领域的应用。

答:数据挖掘是通过自动或半自动的方式,在大数据中发现模式、关联、异常等有价值的信息的过程。

在大数据领域,数据挖掘技术被广泛应用于市场分析、用户画像、推荐系统等方面。

通过数据挖掘,企业可以挖掘出用户的偏好、需求,从而优化产品设计和营销策略,提升竞争力。

3.请简述大数据技术在金融行业中的应用。

答:大数据技术在金融行业中的应用广泛,包括风险管理、反欺诈、营销分析等方面。

在风险管理方面,大数据技术可以通过对大量的交易数据进行实时监控和分析,及时发现异常交易和风险事件,并采取相应措施预防风险。

在反欺诈方面,大数据技术可以对用户的行为数据进行分析,建立起用户画像,准确识别风险,防止欺诈行为的发生。

大数据考核试题

大数据考核试题

大数据基础考核题姓名:考核得分:一、选择题(共11题,共40分)1、大数据的起源是()。

(单选题3分)A .金融 B.电信 C.互联网 D.公共管理2、数据清洗的方法不包括()。

(单选题3分)A.缺失值处理B.垃圾数据清除C.一致辞性检查 D重复数据记录处理3、大数据的最显著特征是()。

(单选题3分)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高4、当前社会中,最为突出的大数据环境()。

(单选题3分)A.互联网B.物联网C.综合国力D.自然资源5、在数据生命周期管理实践中,()是执行方法。

(单选题3分)A.数据存储和备份规范B.数据管理和维护C.数据价值发觉和利用D.数据应用开发和管理6、第一个提出大数据概念的公司是()。

(单选题2分)A. 微软公司B.谷歌公司C.脸谱公司D.麦肯锡公司7、以下选项中不属于大数据对人才能力的要求是()。

(单选题3分)A.业务能力B.数据统计能力C.IT技术能力D.逻辑思维能力8、大数据处理流程可以概括为以下哪几步?()(多选题5分)A. 挖掘B. 采集C.统计和分析 D导入和预处理9、大数据作为一种数据集合,它的含义包括()。

(多选题5分)A. 数据很大B. 很有价值C.构成复杂D.变化很快10、以下选项中,属于大数据对人才能力的要求是()。

(多选题5分)A.业务能力B.数据统计能力C.IT技术能力D.逻辑思维能力11、大数据的主要特征表现为()。

(多选题5分)A.数据容量大B.商业价值高C.处理速度快D.数据类型多二、简答题(每题12分,共40分)1.大数据的简介,描述一下个人对大数据的理解?2.大数据测试的流程有哪些?3.大数据对测试人员人才的技能要求有哪些?4.大数据的处理流程有哪些?5.大数据测试方法的有哪些?。

最新精编《大数据》考试题库500题(含答案)

最新精编《大数据》考试题库500题(含答案)

大数据考试试题题库500题[含答案]一、选择题1.下列选项中,属于贵州发展大数据的先天优势的是(abcd)。

(多选题3分)得分.3分A.空气清新B.远离地震带C.气候凉爽D.电力资源充沛2.“(b)阿里巴巴·贵州年货节”销售额突破8.5亿元,促进了贵州电子商务加快发展。

(单选题1分)得分.1分A.2015B.2016C.2013D.20143.2015年,阿里平台完成农产品销售达到6000多亿元。

(判断题1分)1分正确错误14.大数据仅仅是指数据的体量大。

(判断题1分)正确错误1 得分.1分5.2010年“中央1号文件”指出.要推进农村信息化。

(判断题1分)得分.0分正确错误16.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。

(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理7.建立大数据需要设计一个什么样的大型系统?abcd(多选题3分)得分.3分A.能够把应用放到合适的平台上B.能够开发出相应应用C.能够处理数据D.能够存储数据8.20世纪中后期至今的媒介革命,以(acd )的出现为标志。

(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化9.2012年“中央1号文件”提出,要全面推进农业农村信息化,着力提高(abd)的信息服务水平。

(多选题3分)得分.3分A.农业生产经营B.质量安全控制C.文化交流D.市场流通10.医疗领域如何利用大数据?acd(多选题3分)得分.0分A.临床决策支持B.个性化医疗C.社保资金安全D.用户行为分析11.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?abcd(多选题3分)得分.3分A.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测12.贵州发展大数据的“八个一”建议包括(abcd)。

大数据知识竞赛试题

大数据知识竞赛试题

大数据知识竞赛试题学院队名一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?姓名性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、BeansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.Hadoop1.0平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。

2021大数据知识竞赛考试题及答案

2021大数据知识竞赛考试题及答案

2021大数据知识竞赛考试题及答案1、以下哪项不属于大数据的特征?数据量大数据类型复杂单位处理数据的速度高数据价值密度高【正确答案】2、以下哪项不属于大数据流式处理典型业务应用场景?实时营销实时服务实时监控用户画像【正确答案】3、以下不属于Hadoop内核的组成部分的是HDFSMapReduceHbase【正确答案】YARN4、HDFS默认的当前工作目录是/user/$USER,的值需要在下列哪一个配置文件内说明?mapred-site.xmlcore-site.xml【正确答案】hdfs-site.xml以上均不是5、下列哪一项不属于HDFS相对于分布式系统而言特有的特性?高容错大文件存储大量的随机读应用【正确答案】高吞吐量6、下列存储HDFS某一时段NameNode内存元数据信息的是hdfs-site.xmlfsimage【正确答案】editsfstime7、以下哪个不是HDFS的守护进程?secondarynamenodedatanodemrappmaster/yarnchild【正确答案】namenode8、关于 SecondaryNameNode 哪项是正确的?它是 NameNode 的热备它是内存没有要求它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间【正确答案】SecondaryNameNode 应与 NameNode 部署到一个节点9、以下哪一项不属于HDFS集群中的namenode职责维护HDFS集群的目录树结构维护HDFS集群的所有数据块的分布、副本数和负载均衡负责保存客户端上传的数据【正确答案】响应客户端的所有读写数据请求10、以下哪一项属于SecondaryNamenode的作用监控Namenode管理Datanode合并fsimage和editlogs【正确答案】支持Namenode HA11、下面哪个程序负责 HDFS 中实际数据的存储NameNodeJobtrackerDatanode【正确答案】secondaryNameNode12、关于HDFS集群中的DataNode的描述不正确的是DataNode之间不是独立的,相互之间会有通信和数据传输存储客户端上传的数据的数据块一个DataNode上存储的所有数据块可以有相同的【正确答案】响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑13、如果我们现有一个hadoop集群,默认存储文件3份,并且大文件会按照128M 的数据块大小进行切割分散存储,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?200400004001200【正确答案】14、下列选项中,哪一项是存储HDFS某一时段NameNode内存元数据信息?hdfs-site.xmlfsimage【正确答案】editsfstime15、HBase底层依靠什么进行数据的存储HDFS【正确答案】HiveMemoryMapReduce16、下列选项中,哪个选项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构?GFSMapReduce【正确答案】ChubbyBitTable17、Mapreduce擅长哪个领域的计算离线批处理【正确答案】DAG计算流式计算实时计算18、在MapReduce中哪一个阶段,把Mapper的输出数据归并整理后分发给Reducer处理Shuffle【正确答案】MapReduceSort19、关于MapReduce原理,下面说法错误的是分为Map和Reduce两个阶段Map阶段由一系列Map任务组成Reduce阶段由一系列Reduce任务组成Map阶段与Reduce阶段没有任何依赖关系【正确答案】20、下列哪个程序通常与NameNode 在同一个节点启动TaskTrackerDataNodeSecondaryNameNodeJobtracker【正确答案】21、MapReduce的Map函数产生很多的keyvalue<key,value>【正确答案】Hash22、下面关于Hive,说法错误的是Hive支持所有标准SQL语法【正确答案】Hive底层采用的计算引擎是MapReduceHive提供的HQL语法,与传统SQL很类似Hive Server可采用MySQL存储元数据信息23、下列哪项通常是Hadoop中MapReduce集群的最主要瓶颈CPU网络磁盘【正确答案】内存24、Hadoop框架的缺陷不包括MR编程框架的限制过多的磁盘操作,缺乏对分布式内存的支持无法高效低支持迭代式计算海量的数据存储【正确答案】25、YARN的调度算法不包括以下哪种FIFO SchedulerFair SchedulerCapacity SchedulerStack Scheduler【正确答案】26、YARN和MapReduce的关系是MapReduce是一个计算框架,可运行在YARN之上【正确答案】YARN是一个计算框架,可运行在MapReduce之上MapReduce和YARN无直接关系以上回答均不正确27、下列选项中,哪个是用来将Hadoop和关系型数据库中的数据相互转移的工具?ZookeeperSqoop【正确答案】HIVESpark28、Hadoop 大数据平台在整个数据挖掘的过程中,起到的作用是数据源处理数据清洗和装载【正确答案】数据展现CUBE生成29、以下哪一项是大数据的核心告知与许可预测【正确答案】匿名化规模化30、以下哪一项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。

大数据考试题含答案

大数据考试题含答案

1 多选传统大数据质量清洗的特点有:A. 确定性B. 强类型性C. 协调式的D. 非确定性2 多选以下选项中属于数据的作用的是()。

A. 沟通B. 验证假设C. 建立信心D. 欣赏3 多选数据建立信心的作用需具备的条件包括()。

A. 可靠数据源B. 多方的数据源C. 合适的数据分析D. 信得过的第三方单位4 多选数据只有在与()的交互中才能发挥作用。

A. 人B. 物C. 消费者D. 企业5 单选大数据可能带来(),但未必能够带来()。

A. 精确度;准确度B. 准确度;精确度C. 精确度;多样性D. 多样性;准确度6 多选大数据的定义是:A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合B. 任何超过了一台计算机处理能力的数据量C. 技术D. 商业7 多选大数据五大类应用方向是:A. 查询B. 触达C. 统计D. 预警E. 预测8 多选以下哪些指标是衡量大数据应用成功的标准?A. 成本更低B. 质量更高C. 速度更快D. 风险更低9 多选大数据有哪些价值?A. 用户身份识别B. 描述价值C. 实时价值D. 预测价值E. 生产数据的价值10 多选大数据的预测价值体现在:A. 预测用户的偏好、流失B. 预测热卖品与交易额C. 预测经营趋势D. 评价11 单选什么是大数据使用的最可靠方法?A. 大数据源B. 样本数据源C. 规模大D. 大数据与样本数据结合12 多选大数据是描述()所发生的行为。

A. 未来B. 现在C. 过去D. 实时13 多选传统研究中数据采集的方法包括:A. 网络监测B. 电话访谈C. 对面访谈D. 线上互动14 单选大数据整合要保证各个数据源之间的()。

A. 一致性、协调性B. 差异性、协调性C. 一致性、差异性D. 一致性、相容性15 单选分类变量使用()建立预测模型。

A. 决策树B. 分类树C. 离散树D. 回归树16 多选()是大数据应用的步骤。

A. 数据输入B. 建模分析C. 使用决策支持工具输出结果D. 验证假设17 多选避免“数据孤岛”的方法包括:A. 关键匹配变量B. 数据融合C. 数据输入D. 利用样本框18 多选以下属于机器学习的是:A. 监督式学习B. 非监督式学习C. 半监督式学习D. 强化学习19 多选机器学习的四大类分析技术的主要算法包括()A. 描述性统计B. 聚类分析C. 关联分析D. 分类与预测20 单选购物篮分析属于()。

最新精编《大数据》完整考试题库500题(含标准答案)

最新精编《大数据》完整考试题库500题(含标准答案)

最新精编《大数据》完整考试题库500题(含标准答案)大数据考试试题题库500题[含答案]一、选择题1.20世纪中后期至今的媒介革命,以(acd )的出现为标志。

(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化2.宁家骏委员指出,我国民生领域信息化服务水平显著提升。

(判断题1分)分.1分正确1 错误3.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。

(判断题1分)得分.1分正确1 错误4.习近平总书记指出,网信事业代表着新的生产力.新的发展方向,应该也能够在践行新发展理念上先行一步。

(判断题1分)得分.1分正确1 错误5.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。

(判断题1分)得分.0分正确1 错误6.2000年,全国涉农网站超过6000家。

(判断题1分)得分.0分正确1 错误7.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度.扁平化.相互竞合的方式进行。

(判断题1分)得分.1分正确1 错误8.当今世界四大趋势指的是经济全球化.全球城市化.全球信息化.信息智慧化。

(判断题1分)得分.1分正确1 错误9.2012年,我国农村居民家庭每百户拥有移动电话197.8部。

(判断题1分)分.1分正确1 错误10.2015年,阿里平台完成农产品销售达到6000多亿元。

(判断题1分)1分正确错误111.大数据仅仅是指数据的体量大。

(判断题1分)正确错误1 得分.1分12.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。

(判断题1分)得分.1分正确1 错误13.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。

(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理14.大数据正快速发展为对数量巨大.来源分散.格式多样的数据进行采集.存储和关联分析,从中发现新知识.创造新价值.提升新能力的(b)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据知识竞赛试题
学院队名
一、单选题(每题1分)
1、小米摄像头记录下来的10分钟视频属于哪类数据:
A、结构化数据
B、半结构化数据
C、非结构化数据
2、结构化数据具备哪种特征:
A、具备明确逻辑关系
B、不具备明确逻辑关系
C、不一定具备明确逻辑关系
3、指纹打卡的数据属于哪些数据:
A、传感数据
B、交互数据
C、交易数据
4、大数据擅长处理哪个级别的数据?
A、MB
B、GB
C、TB
D、PB
5、电子邮件是什么类型数据:
A、非结构化数据
B、结构化数据
C、半结构化数据
6、网络新闻是什么类型数据:
A、非结构化数据
B、结构化数据
C、半结构化数据
7、下列属于结构化数据的是:
A、图片
B、一卡通学生信息
C、简历
8、表1属于几维列表?
性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60
表1
A、二维
B、三维
C、四维
D、五维
9、图1中的警衔级别属于哪种属性?
图1
A、标称属性
B、二元属性
C、序数属性
D、数值属性
10、关系型数据库中所谓的“关系”是指什么
A、数据库中的数据彼此间存在任意关联
B、数据模型满足一定条件的二维表格式
C、两个数据库之间有一定的关联
11、下列哪种数据类型不适合MySQL存储:
A、EXCEL报表
B、图片和声音
C、数据库里的财务数据
12、以下不属于ACID原则的是:
A、原子性
B、相对性
C、隔离性
D、持久性
13、淘宝自主设计的自动化分布式存储系统是:
A、MongoDB
B、HBase
C、Oceanbase
14、BeansDB 是一个由我国哪个公司网站自主开发的:
A、淘宝
B、豆瓣社区
C、优酷
D、视觉中国
15、下列不是NewSQL数据库的是:
A、Sybase
B、MemSQL
C、TokuDB
16、下列不是NoSQL数据库的是:
A、Bigtable
B、Dynamo
C、DB2
17、下列不是传统关系型数据库的是:
A、MySQL
B、HBase
C、Sybase
18、下面关于数据挖掘的说法哪些是错误的:
A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容
B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据
C、所有发现的知识都是绝对的
19、下列不属于数据挖掘知识的方法
A、数学方法
B、归纳方法
C、实验方法
20、一般情况下,舆情监测内容不包含:
A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计
C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计
21、科学可视化、信息可视化和可视分析三者之间如何区分:
A、三者从属关系
B、三者属于递进关系
C、三者之间没有清晰边界
22、下列哪个不属于可视化的作用:
A、信息传播与协调
B、支持对信息的推理和分析
C、对信息进行筛选和储存
23、下图为百度地图显示某地区的加油站,此图为哪类可视化:
A、层次与网络可视化
B、时空数据可视化
C、多变量数据可视化
24、下图为伦敦地铁图,此图为哪类可视化:
A、层次与网络可视化
B、时空数据可视化
C、多变量数据可视化
25、下图为大数据标签云,此图为哪类可视化:
A、多变量数据可视化
B、时空数据可视化
C、非结构化数据可视化
26、目前在全球云计算市场份额占有率最高的公司是:
A、谷歌
B、亚马逊
C、微软
D、IBM
27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:
A、电子商务营销精准化和实时化
B、产品和服务高度差异化和个性化
C、价值链上企业运作差异化和静态化
D、新型增值服务模式不断涌现
28、下列哪个不是大数据下互联网广告的特点
A、广告内容更有针对性
B、提高广告决策效率
C、广告以平面媒体为主
D、广告传播模式的改变
29、微信朋友圈的FEED流广告的推广更为准确描述是:
A、大数据会使受众与产品的距离更贴近
B、对于目标受众的划分更加精细
C、大数据最本质的应用就在于预测
D、随意投放的广告
30、啤酒与尿布的营销案例应用了零售行业的哪种方法:
A、发现关联购买行为
B、客户群体细分
C、供应链管理
二、多选题(每题2分)
1.Hadoop1.0平台最核心的两个项目(组件)是:
A、HDFS
B、HIVE
C、HBase
D、MapReduce
2.以下平台属于Apache软件基金会项目的是:
A、Hadoop
B、Spark
C、Storm
D、MongoDB
3.以下属于大数据挖掘算法的是:
A、决策树
B、支持向量机
C、极差规格化
D、朴素贝叶斯
4.以下属于Spark平台特点的是:
A、共享变量
B、离线处理
C、内存计算
D、弹性分布式数据集
5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:
A、28M
B、64M
C、100M
D、128M
三、判断题(每题1分)
1.Newsql是一种新兴的非关系型数据库。

()
2.数据分析主要是指对过去的数据进行分析总结可视化,而数据科学主要是通过数据模型
指对将来的发展趋势进行预测。

()
3.Python是一种跨平台语言,可以安装在Linux,MacOS和Windows操作系统中。

()
4.数据ETL属于数据分析和挖掘的范畴。

()
5.MapReduce的输入是基于Key-Value键值对。

()
6.云计算提供的三种服务形式中,Iaas是指客户通过Internet即可使用租用商提供的软
件。

()
7.Hadoop主要用于离线大数据分析,而Storm主要用于在线实时大数据分析。

()
8.商务智能(BI)的基本体系结构包括数据仓库、联机分析处理和数据挖掘。

()
9.R语言只能用作数据分析,而Python语言既可以用作数据分析也可以用作数据可视化。

()
10.HDFS的主服务器名称叫做DataNode。

()。

相关文档
最新文档