大数据知识竞赛试题

合集下载

最新精编《大数据》考试题库500题(含答案)

最新精编《大数据》考试题库500题(含答案)

大数据考试试题题库500题[含答案]一、选择题1.下列选项中,属于贵州发展大数据的先天优势的是(abcd)。

(多选题3分)得分.3分A.空气清新B.远离地震带C.气候凉爽D.电力资源充沛2.“(b)阿里巴巴·贵州年货节”销售额突破8.5亿元,促进了贵州电子商务加快发展。

(单选题1分)得分.1分A.2015B.2016C.2013D.20143.2015年,阿里平台完成农产品销售达到6000多亿元。

(判断题1分)1分正确错误14.大数据仅仅是指数据的体量大。

(判断题1分)正确错误1 得分.1分5.2010年“中央1号文件”指出.要推进农村信息化。

(判断题1分)得分.0分正确错误16.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。

(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理7.建立大数据需要设计一个什么样的大型系统?abcd(多选题3分)得分.3分A.能够把应用放到合适的平台上B.能够开发出相应应用C.能够处理数据D.能够存储数据8.20世纪中后期至今的媒介革命,以(acd )的出现为标志。

(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化9.2012年“中央1号文件”提出,要全面推进农业农村信息化,着力提高(abd)的信息服务水平。

(多选题3分)得分.3分A.农业生产经营B.质量安全控制C.文化交流D.市场流通10.医疗领域如何利用大数据?acd(多选题3分)得分.0分A.临床决策支持B.个性化医疗C.社保资金安全D.用户行为分析11.郭永田副主任指出,物联网在大田作物生产中的应用体现在以下哪些方面?abcd(多选题3分)得分.3分A.农作物病虫害监测B.农业精准生产控制C.农田环境监测D.农作物长势苗情监测12.贵州发展大数据的“八个一”建议包括(abcd)。

大数据知识竞赛试题

大数据知识竞赛试题

大数据知识竞赛试题学院队名一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?姓名性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、BeansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.Hadoop1.0平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。

大数据考试题含答案

大数据考试题含答案

1 多选传统大数据质量清洗的特点有:A. 确定性B. 强类型性C. 协调式的D. 非确定性2 多选以下选项中属于数据的作用的是()。

A. 沟通B. 验证假设C. 建立信心D. 欣赏3 多选数据建立信心的作用需具备的条件包括()。

A. 可靠数据源B. 多方的数据源C. 合适的数据分析D. 信得过的第三方单位4 多选数据只有在与()的交互中才能发挥作用。

A. 人B. 物C. 消费者D. 企业5 单选大数据可能带来(),但未必能够带来()。

A. 精确度;准确度B. 准确度;精确度C. 精确度;多样性D. 多样性;准确度6 多选大数据的定义是:A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合B. 任何超过了一台计算机处理能力的数据量C. 技术D. 商业7 多选大数据五大类应用方向是:A. 查询B. 触达C. 统计D. 预警E. 预测8 多选以下哪些指标是衡量大数据应用成功的标准?A. 成本更低B. 质量更高C. 速度更快D. 风险更低9 多选大数据有哪些价值?A. 用户身份识别B. 描述价值C. 实时价值D. 预测价值E. 生产数据的价值10 多选大数据的预测价值体现在:A. 预测用户的偏好、流失B. 预测热卖品与交易额C. 预测经营趋势D. 评价11 单选什么是大数据使用的最可靠方法?A. 大数据源B. 样本数据源C. 规模大D. 大数据与样本数据结合12 多选大数据是描述()所发生的行为。

A. 未来B. 现在C. 过去D. 实时13 多选传统研究中数据采集的方法包括:A. 网络监测B. 电话访谈C. 对面访谈D. 线上互动14 单选大数据整合要保证各个数据源之间的()。

A. 一致性、协调性B. 差异性、协调性C. 一致性、差异性D. 一致性、相容性15 单选分类变量使用()建立预测模型。

A. 决策树B. 分类树C. 离散树D. 回归树16 多选()是大数据应用的步骤。

A. 数据输入B. 建模分析C. 使用决策支持工具输出结果D. 验证假设17 多选避免“数据孤岛”的方法包括:A. 关键匹配变量B. 数据融合C. 数据输入D. 利用样本框18 多选以下属于机器学习的是:A. 监督式学习B. 非监督式学习C. 半监督式学习D. 强化学习19 多选机器学习的四大类分析技术的主要算法包括()A. 描述性统计B. 聚类分析C. 关联分析D. 分类与预测20 单选购物篮分析属于()。

大数据应用竞赛复习题7

大数据应用竞赛复习题7

大数据应用竞赛复习题7301电网大数据中输变配电数据日均产生数据超过()TB。

[单选题] *A、10B、20(正确答案)C、30D、40302典型的数据分析系统分层结构不包括下面哪层? [单选题] *A、数据缓冲层B、数据集市层C、数据筛选层(正确答案)D、数据仓库303当前大数据技术的基础是由()首先提出的。

[单选题] *A、微软B、百度C、谷歌(正确答案)D、阿里巴巴304当代社会中,最为突出的大数据环境是() [单选题] *A、互联网(正确答案)B、物联网C、综合国力D、自然资源305当存在异方差现象时,估计模型参数的适当方法是()。

[单选题] *A、加权最小二乘法(正确答案)B、工具变量法C、广义差分法D、使用非样本先验信息306当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?() [单选题] *A、分类B、聚类(正确答案)C、关联分析D、隐马尔可夫链307大数据最显著的特征是() [单选题] *A、数据类型多样B、数据处理速度快C、数据价值密度高D、数据规模大(正确答案)308大数据指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并()成为帮助企业经营决策更积极目的的信息。

[单选题] *A、收集B、整理(正确答案)C、规划D、聚集309大数据应用需依托的新技术有() [单选题] *A、大规模存储与计算B、数据分析处理C、智能化D、三个选项都是(正确答案)310大数据应用需求来源于(),其成果应用于()。

[单选题] *A、数据、业务B、业务、业务(正确答案)C、数据、数据D、业务、数据311大数据业务场景数据获取路线需从系统数据主题和()两个角度开展。

[单选题] *A、数据分析主题B、业务分析主题(正确答案)C、系统分析主题D、业务数据主题312大数据未来的趋势是大数据与()、物联网和移动互联网的深度融合。

(完整版)大数据考试题

(完整版)大数据考试题

《大数据》试题单选题1、大数据的核心就是(B)A、告知与许可B、预测C、匿名化D、规模化2、大数据不是要教机器像人一样思考。

相反,它是(A)A、把数学算法运用到海量的数据上来预测事情发生的可能性。

B、被视为人工智能的一部分。

C、被视为一种机器学习。

D、预测与惩罚。

3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。

A、降低B、不变C、提高D、无关4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法A、所有数据B、绝大部分数据C、适量数据D、少量数据5、大数据的简单算法与小数据的复杂算法相比(A)A、更有效B、相当C、不具备可比性D、无效6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。

A、安全性B、完整性C、混杂性D、完整性和混杂性7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A)A、信息B、数字C、文字D、方位8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B)A、原因B、是什么C、关联物D、预测的关键9、建立在相关关系分析法基础上的预测是大数据的(C)A、基础B、前提C、核心D、条件10、(C)下列说法正确的是A、有价值的数据是附属于企业经营核心业务的一部分数据;B、数据挖掘它的主要价值后就没有必要再进行分析了;C、所有数据都是有价值的;D、在大数据时代,收集、存储和分析数据非常简单;11、关于数据创新,下列说法正确的是(D)A、多个数据集的总和价值等于单个数据集价值相加;B、由于数据的再利用,数据应该永久保存下去;C、相同数据多次用于相同或类似用途,其有效性会降低;D、数据只有开放价值才能得到真正释放。

12、关于数据估值,下列说法错误的是(B)A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴;B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的;C、数据的价值可以通过授权的第三方使用来实现D、目前可以通过数据估值模型来准确的评估数据的价值评估13、在大数据时代,下列说法正确的是(B)。

最新版精选《大数据》完整考题库500题(含参考答案)

最新版精选《大数据》完整考题库500题(含参考答案)

大数据考试试题题库500题[含答案]一、选择题1.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。

(判断题1分)得分.1分正确1 错误2.习近平总书记在2016年几月主持召开了网络安全和信息化工作座谈会?A(单选题1分)分.得1分A.4月B.2月C.3月D.5月3.根据周琦老师所讲,高德地图使用大数据能进行小路的识别。

(判断题1分)得分.1分正确1 错误4.2016年9月,国务院印发《促进大数据发展行动纲要》,10月,十八届六中全会将大数据上升为国家战略。

(判断题1分)得分.0分正确1 错误5.我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应用。

(判断题1分)得分.1分正确1 错误6.宁家骏委员指出,我国民生领域信息化服务水平显著提升。

(判断题1分)分.1分正确1 错误7.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。

(判断题1分)得分.1分正确1 错误8.习近平总书记指出,网信事业代表着新的生产力.新的发展方向,应该也能够在践行新发展理念上先行一步。

(判断题1分)得分.1分正确1 错误9.依据黑龙江大农场的应用,精准农业技术能够将产量提高5%-10%。

(判断题1分)得分.0分正确1 错误10.根据周琦老师所讲,进入了阿里巴巴集团之后,高德对大数据的处理和基础架构的能力得到了提升。

(判断题1分)得分.1分正确1 错误11.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。

(判断题1分)得分.0分正确1 错误12.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度.扁平化.相互竞合的方式进行。

(判断题1分)得分.1分正确1 错误13.根据涂子沛先生所讲,数据就是简单的数字。

(判断题1分)得分.1分正确错误114.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是abcd(多选题3分)得分.3分从柜台式管理走向全天候管理B.从粗放化管理走向精细化管理C.从被动反应走向主动预见型管理D.从单兵作战走向联合共享型管理15.大数据仅仅是指数据的体量大。

试卷题(大数据知识竞赛)

试卷题(大数据知识竞赛)

2018年度一、单选题(每题1分)1、小米摄像头记录下来的10分钟视频属于哪类数据:A、结构化数据B、半结构化数据C、非结构化数据2、结构化数据具备哪种特征:A、具备明确逻辑关系B、不具备明确逻辑关系C、不一定具备明确逻辑关系3、指纹打卡的数据属于哪些数据:A、传感数据B、交互数据C、交易数据4、大数据擅长处理哪个级别的数据?A、MBB、GBC、TBD、PB5、电子邮件是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据6、网络新闻是什么类型数据:A、非结构化数据B、结构化数据C、半结构化数据7、下列属于结构化数据的是:A、图片B、一卡通学生信息C、简历8、表1属于几维列表?表1A、二维B、三维C、四维D、五维9、图1中的警衔级别属于哪种属性?图1A、标称属性B、二元属性C、序数属性D、数值属性10、关系型数据库中所谓的“关系”是指什么A、数据库中的数据彼此间存在任意关联B、数据模型满足一定条件的二维表格式C、两个数据库之间有一定的关联11、下列哪种数据类型不适合MySQL存储:A、EXCEL报表B、图片和声音C、数据库里的财务数据12、以下不属于ACID原则的是:A、原子性B、相对性C、隔离性D、持久性13、淘宝自主设计的自动化分布式存储系统是:A、MongoDBB、HBaseC、Oceanbase14、B eansDB 是一个由我国哪个公司网站自主开发的:A、淘宝B、豆瓣社区C、优酷D、视觉中国15、下列不是NewSQL数据库的是:A、SybaseB、MemSQLC、TokuDB16、下列不是NoSQL数据库的是:A、BigtableB、DynamoC、DB217、下列不是传统关系型数据库的是:A、MySQLB、HBaseC、Sybase18、下面关于数据挖掘的说法哪些是错误的:A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据C、所有发现的知识都是绝对的19、下列不属于数据挖掘知识的方法A、数学方法B、归纳方法C、实验方法20、一般情况下,舆情监测内容不包含:A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计21、科学可视化、信息可视化和可视分析三者之间如何区分:A、三者从属关系B、三者属于递进关系C、三者之间没有清晰边界22、下列哪个不属于可视化的作用:A、信息传播与协调B、支持对信息的推理和分析C、对信息进行筛选和储存23、下图为百度地图显示某地区的加油站,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化24、下图为伦敦地铁图,此图为哪类可视化:A、层次与网络可视化B、时空数据可视化C、多变量数据可视化25、下图为大数据标签云,此图为哪类可视化:A、多变量数据可视化B、时空数据可视化C、非结构化数据可视化26、目前在全球云计算市场份额占有率最高的公司是:A、谷歌B、亚马逊C、微软D、IBM27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:A、电子商务营销精准化和实时化B、产品和服务高度差异化和个性化C、价值链上企业运作差异化和静态化D、新型增值服务模式不断涌现28、下列哪个不是大数据下互联网广告的特点A、广告内容更有针对性B、提高广告决策效率C、广告以平面媒体为主D、广告传播模式的改变29、微信朋友圈的FEED流广告的推广更为准确描述是:A、大数据会使受众与产品的距离更贴近B、对于目标受众的划分更加精细C、大数据最本质的应用就在于预测D、随意投放的广告30、啤酒与尿布的营销案例应用了零售行业的哪种方法:A、发现关联购买行为B、客户群体细分C、供应链管理二、多选题(每题2分)1.平台最核心的两个项目(组件)是:A、HDFSB、HIVEC、HBaseD、MapReduce2.以下平台属于Apache软件基金会项目的是:A、HadoopB、SparkC、StormD、MongoDB3.以下属于大数据挖掘算法的是:A、决策树B、支持向量机C、极差规格化D、朴素贝叶斯4.以下属于Spark平台特点的是:A、共享变量B、离线处理C、内存计算D、弹性分布式数据集5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:A、28MB、64MC、100MD、128M三、判断题(每题1分)1.Newsql是一种新兴的非关系型数据库。

大数据基础理论知识考核试题题库及答案

大数据基础理论知识考核试题题库及答案

大数据基础理论知识考核一、选择题1.下列说法正确的是()[单选题] *A.在使用KNN算法时.B.KNN是有监督学习算法√C.在使用KNN算法时.上取值越大.模型越容易过拟合D.KNN和K-means都是无监督学习算法2.下列关于决策树的说法错误的是()。

[单选题] *A.冗余属性不会对决策树的准确率造成不利的影响B.子树可能在决策树中重复多次C.决策树算法对于噪声的干扰非常敏感√D.寻找最佳决策树是NP完全问题3.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法,下列不属于相关性分析方法的是()。

[单选题] *A.Pearson相关系数B.Spearman秩相关系数C.Kendall相关系数D.傅里叶系数√4.信息增益、增益率分别对可取值数目()的属性有所偏好。

[单选题] *A.较高.较高B.较高.较低√C.较低.较高D.较低.较低5. LSTM中,()的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。

[单选题] *A.输入门√B.遗忘门C.输出门D.更新门6.傅里叶变换得到的频谱中,低频系数对应于()o[单选题] *A.物体边缘B.噪声C.变化平缓部分√D.变化剧烈部分7.数据科学基本原则中,基于数据的智能的主要特点是()。

[单选题] *A.数据简单,但算法简单B.数据复杂,但算法简单√C.数据简单,但算法复杂D.数据复杂,但算法复杂8. Sigmoid函数作为神经元激活函数的特点是()。

[单选题] *A.连续但不光滑B.不连续但光滑C.连续且光滑√D.不连续且不光滑9.离散程度的测度值愈大,则()。

[单选题] *A.反映变量值愈分散.算术平均数代表性愈差√B.反映变量值愈集中.算术平均数代表性愈差C.反映变量值愈分散.算术平均数代表性愈好D.反映变量值愈集中.算术平均数代表性愈好10.当构建一个神经网络进行图片的语义分割时,通常采用的顺序是()o[单选题] *A. 先用卷积神经网络处理输入,再用反卷积神经网络得到输出√A. 先用反卷积神经网络处理输入,再用卷积神经网络得到输出A. 不能确定11.给定词汇表如下:(Bob, ok, likes, football, car}o 则下面句子Bob likes football的词袋模型表示为()o[单选题] *A. [1 1 1 00]B. [1 0 1 1 0]√C. [100 10]D. [0 1 1 0 1]12.BASE原则的含义不包括()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据知识竞赛试题
学院队名
一、单选题(每题1分)
1、小米摄像头记录下来的10分钟视频属于哪类数据:
A、结构化数据
B、半结构化数据
C、非结构化数据
2、结构化数据具备哪种特征:
A、具备明确逻辑关系
B、不具备明确逻辑关系
C、不一定具备明确逻辑关系
3、指纹打卡的数据属于哪些数据:
A、传感数据
B、交互数据
C、交易数据
4、大数据擅长处理哪个级别的数据?
A、MB
B、GB
C、TB
D、PB
5、电子邮件是什么类型数据:
A、非结构化数据
B、结构化数据
C、半结构化数据
6、网络新闻是什么类型数据:
A、非结构化数据
B、结构化数据
C、半结构化数据
7、下列属于结构化数据的是:
A、图片
B、一卡通学生信息
C、简历
8、表1属于几维列表?
姓名性别学号年级成绩张三男2016130133 2016 80 李四女2016131038 2016 60
表1
A、二维
B、三维
C、四维
D、五维
9、图1中的警衔级别属于哪种属性?
图1
A、标称属性
B、二元属性
C、序数属性
D、数值属性
10、关系型数据库中所谓的“关系”是指什么
A、数据库中的数据彼此间存在任意关联
B、数据模型满足一定条件的二维表格式
C、两个数据库之间有一定的关联
11、下列哪种数据类型不适合MySQL存储:
A、EXCEL报表
B、图片和声音
C、数据库里的财务数据
12、以下不属于ACID原则的是:
A、原子性
B、相对性
C、隔离性
D、持久性
13、淘宝自主设计的自动化分布式存储系统是:
A、MongoDB
B、HBase
C、Oceanbase
14、BeansDB 是一个由我国哪个公司网站自主开发的:
A、淘宝
B、豆瓣社区
C、优酷
D、视觉中国
15、下列不是NewSQL数据库的是:
A、Sybase
B、MemSQL
C、TokuDB
16、下列不是NoSQL数据库的是:
A、Bigtable
B、Dynamo
C、DB2
17、下列不是传统关系型数据库的是:
A、MySQL
B、HBase
C、Sybase
18、下面关于数据挖掘的说法哪些是错误的:
A、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容
B、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据
C、所有发现的知识都是绝对的
19、下列不属于数据挖掘知识的方法
A、数学方法
B、归纳方法
C、实验方法
20、一般情况下,舆情监测内容不包含:
A、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
B、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计
C、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计
21、科学可视化、信息可视化和可视分析三者之间如何区分:
A、三者从属关系
B、三者属于递进关系
C、三者之间没有清晰边界
22、下列哪个不属于可视化的作用:
A、信息传播与协调
B、支持对信息的推理和分析
C、对信息进行筛选和储存
23、下图为百度地图显示某地区的加油站,此图为哪类可视化:
A、层次与网络可视化
B、时空数据可视化
C、多变量数据可视化
24、下图为伦敦地铁图,此图为哪类可视化:
A、层次与网络可视化
B、时空数据可视化
C、多变量数据可视化
25、下图为大数据标签云,此图为哪类可视化:
A、多变量数据可视化
B、时空数据可视化
C、非结构化数据可视化
26、目前在全球云计算市场份额占有率最高的公司是:
A、谷歌
B、亚马逊
C、微软
D、IBM
27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:
A、电子商务营销精准化和实时化
B、产品和服务高度差异化和个性化
C、价值链上企业运作差异化和静态化
D、新型增值服务模式不断涌现
28、下列哪个不是大数据下互联网广告的特点
A、广告内容更有针对性
B、提高广告决策效率
C、广告以平面媒体为主
D、广告传播模式的改变
29、微信朋友圈的FEED流广告的推广更为准确描述是:
A、大数据会使受众与产品的距离更贴近
B、对于目标受众的划分更加精细
C、大数据最本质的应用就在于预测
D、随意投放的广告
30、啤酒与尿布的营销案例应用了零售行业的哪种方法:
A、发现关联购买行为
B、客户群体细分
C、供应链管理
二、多选题(每题2分)
1.Hadoop1.0平台最核心的两个项目(组件)是:
A、HDFS
B、HIVE
C、HBase
D、MapReduce
2.以下平台属于Apache软件基金会项目的是:
A、Hadoop
B、Spark
C、Storm
D、MongoDB
3.以下属于大数据挖掘算法的是:
A、决策树
B、支持向量机
C、极差规格化
D、朴素贝叶斯
4.以下属于Spark平台特点的是:
A、共享变量
B、离线处理
C、内存计算
D、弹性分布式数据集
5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:
A、28M
B、64M
C、100M
D、128M
三、判断题(每题1分)
1.Newsql是一种新兴的非关系型数据库。

()
2.数据分析主要是指对过去的数据进行分析总结可视化,而数据科学主要是通过数据模型
指对将来的发展趋势进行预测。

()
3.Python是一种跨平台语言,可以安装在Linux,MacOS和Windows操作系统中。

()
4.数据ETL属于数据分析和挖掘的范畴。

()
5.MapReduce的输入是基于Key-Value键值对。

()
6.云计算提供的三种服务形式中,Iaas是指客户通过Internet即可使用租用商提供的软
件。

()
7.Hadoop主要用于离线大数据分析,而Storm主要用于在线实时大数据分析。

()
8.商务智能(BI)的基本体系结构包括数据仓库、联机分析处理和数据挖掘。

()
9.R语言只能用作数据分析,而Python语言既可以用作数据分析也可以用作数据可视化。

()
10.HDFS的主服务器名称叫做DataNode。

()。

相关文档
最新文档