大数据时代试题综合题库
《我们的大数据时代》考试题目及答案

我们的大数据时代(一)单选题(每题2分)1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高2. 下列关于大数据的分析理念的说法中,错误的是(D)A. 在数据基础上倾向于全体数据而不是抽样数据B. 在分析方法上更注重相关分析我不是因果分析C. 在分析效果上更追究效率而不是绝对精确D. 在数据规模上强调相对数据而不是绝对数据3. 万维网之父是(C)A. 彼得·德鲁克B. 舍恩伯格C. 蒂姆·伯纳斯—李D. 斯科特·布朗4. 下列关于普查的缺点的说法中,正确的是(A)。
A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象B. 误差不易被控制C. 对样本的依赖性比较强D. 评测结果不够稳定5.下列关于聚类挖掘技术的说法中,错误的是(B)。
A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B. 要求同类数据的内容相似度尽可能小C. 要求不同类数据的内容相似度尽可能小D. 与分类挖掘技术相似的是,都是要对数据进行分类处理6. 智慧城市的构建,不包含(C)。
A. 数字城市B. 物联网C. 联网监控D. 云计算7.大数据的起源是(C)。
A. 金融B. 电信C. 互联网D. 公共管理8. 智慧城市的智慧之源是(C)。
A. 数字城市B. 物联网C. 大数据D. 云计算9. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。
A. 因果;相关B. 相关;因果C. 并列;相关D. 因果;并列10. 下列关于数据交易市场的说法中,错误的是(C)。
A. 数据交易市场是大数据产业发展到一定程度的产物B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D. 数据交易市场是大数据资源化的必然产物11. 下列关于计算机存储容量单位的说法中,错误的是(C)。
04_大数据综合练习

[单选题]1.大数据公司的多样性表明了()A、数据作用的体现B、数据价值的转移C、数据技术的发展D、数据思维的创新答案: B2.以下哪种说法是错误的()A、将罪犯的定罪权放在数据手中,借以表达对数据和分析结果的崇尚,这实际上是一种滥用。
B、随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私。
C、采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,比如网页和智能手机应用程序。
D、预测与惩罚,不是因为所做,而是因为将做。
答案: B3.只要得到了合理的利用,而不单纯只是为了“数据”而“数据”,大数据就会变成()A、强大的威胁B、强大的武器C、预测工具D、分析工具答案: B4.在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于()为其行为承担责任A、数据使用者B、数据提供者C、个人许可D、数据分析者答案: A5.对大数据使用进行正规评测及正确引导,可以为数据使用者带来什么切实的好处()A、他们无须再取得个人的明确同意,就可以对个人数据进行二次利用。
B、数据使用者不需要为敷衍了事的评测和不达标准的保护措施承担法律责任。
C、数据使用者的责任不需要强制力规范就能确保履行到位。
D、所有项目,管理者必须设立规章,规定数据使用者应如何评估风险、如何规避或减轻潜在伤害。
答案: A6.促进隐私保护的一种创新途径是():故意将数据模糊处理,促使对大数据库的查询不能显示精确的结果A、匿名化B、信息模糊化C、个人隐私保护D、差别隐私答案: D7.大数据可能带来(),但未必能够带来()。
A、精确度;准确度B、准确度;精确度C、精确度;多样性D、多样性;准确度答案: A8.什么是大数据使用的最可靠方法?A、大数据源B、样本数据源C、规模大D、大数据与样本数据结合答案: D9.大数据整合要保证各个数据源之间的()。
A、一致性、协调性B、差异性、协调性C、一致性、差异性D、一致性、相容性答案: D10.分类变量使用()建立预测模型。
大数据时代题目及答案

1、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)A:微软 B:百度 C:谷歌 D:阿里巴巴2、大数据的起源是(C )。
(单选题,本题2分)A:金融 B:电信 C:互联网 D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模 B:活性 C:关联度 D:颗粒度5、数据清洗的方法不包括( D)。
(单选题,本题2分)A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表 B:网络爬虫 C:API接口 D:传感器7、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含( C)。
(单选题,本题2分)A:数字城市 B:物联网 C:联网监控 D:云计算9、大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。
(单选题,本题2分)A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。
大数据时代题目及答案(三套试题仅供参考)

第一套试题1、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C)。
(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D)反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。
(单选题,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C)。
(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算9、大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B)。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。
最新精编《大数据》完整考试题库500题(含标准答案)

最新精编《大数据》完整考试题库500题(含标准答案)大数据考试试题题库500题[含答案]一、选择题1.20世纪中后期至今的媒介革命,以(acd )的出现为标志。
(多选题3分)分.得3分A.互联网B.自动化C.计算机D.数字化2.宁家骏委员指出,我国民生领域信息化服务水平显著提升。
(判断题1分)分.1分正确1 错误3.根据周琦老师所讲,高德交通报告针对全国38个城市交通状态进行挖掘分析。
(判断题1分)得分.1分正确1 错误4.习近平总书记指出,网信事业代表着新的生产力.新的发展方向,应该也能够在践行新发展理念上先行一步。
(判断题1分)得分.1分正确1 错误5.根据涂子沛先生所讲,现在非结构化数据已经占人类数据总量的25%。
(判断题1分)得分.0分正确1 错误6.2000年,全国涉农网站超过6000家。
(判断题1分)得分.0分正确1 错误7.林雅华博士指出,网络时代的国家治理必须要借鉴互联网多元向度.扁平化.相互竞合的方式进行。
(判断题1分)得分.1分正确1 错误8.当今世界四大趋势指的是经济全球化.全球城市化.全球信息化.信息智慧化。
(判断题1分)得分.1分正确1 错误9.2012年,我国农村居民家庭每百户拥有移动电话197.8部。
(判断题1分)分.1分正确1 错误10.2015年,阿里平台完成农产品销售达到6000多亿元。
(判断题1分)1分正确错误111.大数据仅仅是指数据的体量大。
(判断题1分)正确错误1 得分.1分12.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。
(判断题1分)得分.1分正确1 错误13.大数据的应用能够实现一场新的革命,提高综合管理水平的原因是(abcd )。
(多选题3分)得分.3分A.从被动反应走向主动预见型管理B.从粗放化管理走向精细化管理C.从单兵作战走向联合共享型管理D.从柜台式管理走向全天候管理14.大数据正快速发展为对数量巨大.来源分散.格式多样的数据进行采集.存储和关联分析,从中发现新知识.创造新价值.提升新能力的(b)。
《我们的大数据时代》考试题目及答案

我们的大数据时代(一)单选题(每题2分)1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高2. 下列关于大数据的分析理念的说法中,错误的是(D)A. 在数据基础上倾向于全体数据而不是抽样数据B. 在分析方法上更注重相关分析我不是因果分析C. 在分析效果上更追究效率而不是绝对精确D. 在数据规模上强调相对数据而不是绝对数据3. 万维网之父是(C)A. 彼得·德鲁克B. 舍恩伯格C. 蒂姆·伯纳斯—李D. 斯科特·布朗4. 下列关于普查的缺点的说法中,正确的是(A)。
A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象B. 误差不易被控制C. 对样本的依赖性比较强D. 评测结果不够稳定5.下列关于聚类挖掘技术的说法中,错误的是(B)。
A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B. 要求同类数据的内容相似度尽可能小C. 要求不同类数据的内容相似度尽可能小D. 与分类挖掘技术相似的是,都是要对数据进行分类处理6. 智慧城市的构建,不包含(C)。
A. 数字城市B. 物联网C. 联网监控D. 云计算7.大数据的起源是(C)。
A. 金融B. 电信C. 互联网D. 公共管理8. 智慧城市的智慧之源是(C)。
A. 数字城市B. 物联网C. 大数据D. 云计算9. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。
A. 因果;相关B. 相关;因果C. 并列;相关D. 因果;并列10. 下列关于数据交易市场的说法中,错误的是(C)。
A. 数据交易市场是大数据产业发展到一定程度的产物B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D. 数据交易市场是大数据资源化的必然产物11. 下列关于计算机存储容量单位的说法中,错误的是(C)。
《我们的大数据时代》考试题目及答案

我们的大数据时代(一)单选题(每题2分)1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高2. 下列关于大数据的分析理念的说法中,错误的是(D)A. 在数据基础上倾向于全体数据而不是抽样数据B. 在分析方法上更注重相关分析我不是因果分析C. 在分析效果上更追究效率而不是绝对精确D. 在数据规模上强调相对数据而不是绝对数据3. 万维网之父是(C)A. 彼得·德鲁克B. 舍恩伯格C. 蒂姆·伯纳斯—李D. 斯科特·布朗4. 下列关于普查的缺点的说法中,正确的是(A)。
A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象B. 误差不易被控制C. 对样本的依赖性比较强D. 评测结果不够稳定5.下列关于聚类挖掘技术的说法中,错误的是(B)。
A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B. 要求同类数据的内容相似度尽可能小C. 要求不同类数据的内容相似度尽可能小D. 与分类挖掘技术相似的是,都是要对数据进行分类处理6. 智慧城市的构建,不包含(C)。
A. 数字城市B. 物联网C. 联网监控D. 云计算7.大数据的起源是(C)。
A. 金融B. 电信C. 互联网D. 公共管理8. 智慧城市的智慧之源是(C)。
A. 数字城市B. 物联网C. 大数据D. 云计算9. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。
A. 因果;相关B. 相关;因果C. 并列;相关D. 因果;并列10. 下列关于数据交易市场的说法中,错误的是(C)。
A. 数据交易市场是大数据产业发展到一定程度的产物B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D. 数据交易市场是大数据资源化的必然产物11. 下列关于计算机存储容量单位的说法中,错误的是(C)。
大数据试题与答案--最全

1、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C )。
(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。
(单,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C)。
(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《大数据》题目一、单选题1)大数据的 4V特点:Volume Velocity、Variety、Veracity,其中他们的含义分别是(1DBCA_________ 、( 2 )、( 3 )、(4 ____________________________ ))A. 价值密度低B.处理速度快C.数据类型繁多D.数据体量巨大2)大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行(5 B )。
A. 数据信息B.专业化处理C.速度处理D.内容处理3)随着谷歌(6 )和(7 )的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的(8 )0 DCB6: A.M ap B.Docs C. YouTube D. Map Reduce7: A. Google Mobile B. iGoogle C. GoogleFile System D.Google Docs8: A.质量 B.速度 C.精度 D.进度4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的 2.5米口径望远镜进行的红移巡天项目,2012年4月发布的关于Quasar spectra的数据为(9 )o BA.932,891,133B. 228,468C. 1,457,002D. 668,054 5)下列哪一项不属于大数据的治理:(10 ) CA.安全问题B.成本问题C.针对大用户D.信息生命周期管理6)IBM的大数据战略以其在2012年5月发布智慧分析洞察“ 3A5步”动态路线图作为基础,指的是在(11 )的基础上( 12 )、进而(13 ),优化决策策划能够救业务绩效。
CBAA.采取行动(Act)B.获取洞察(Anticipate )C.掌握信息(Align )D.应用管理(managemenj7)在云生态环境中,用户需求相当于(14 ),云数据中心相当于(15 ),云服务相当于(16 )。
DCBA.降水B.水滴C.水库D.阳光8)尿布啤酒是大数据分析的(17 ) CA. A/B测试B.分类C.关联规则挖掘D.数据聚类9)在 GAPMINDE的 Wealth & Health of Nations 中,中国在什么区域(18 ) BA.黄色B.红色C.绿色D.蓝色10)舆情研判,信息科学侧重(19 ),社会和管理科学侧重突发群体事件管理中的群体心理行为及(20 ),新闻传播学侧重对(21 )。
CBAA.舆论的本体进行规律性的探索和研究B.舆论控制研究C.互联网文本挖掘和分析技术11)物联网是在计算机的(22 )基础上,利用(23 )、(24 )等技术,构造一个覆盖世界上万事万物的“ In ternet ofThings ”。
在这个网络中,物品(商品)能够彼此进行“交流”,而无需人的干预。
DCBA. 有线数据通信B. 无线数据通信C. RFIDD. 互联网12)数据挖掘工作的四个阶段,数据挖掘占总时间的百分比%( 25 ),对于成功重要性的百分比 %( 26 )CBA. 50B. 20C.80D. 60佝Map Reduct勺Map函数产生很多的(27 ) CA. keyB. valueC. <key,value>D. Hash14)PageRank是一个函数,它对Web中的每个网页赋予一个实数值。
它的意图在于网页的PageRank越高,那么它就(28 )。
DA.相关性越高B.越不重要C.相关性越低D.越重要15)购物篮模型(market-basket model):用于描述两类对象之间的一种常见形式的( 29 )关系。
CA. 一对一B. 一对多C.多对多D.多对一16)AdWords 是一种快速简单的购买广告服务的方式,这种广告服务的针对性强,无论您的预算是多少,它都按( 30 )。
BA. 每个广告计费B. 每次点击计费C.每显示一次计费D.每浏览一次计费17)协同过滤分析用户兴趣,在用户群中找到指定用户的(31 )用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( 32 ),并将这些用户喜欢的项推荐给有相似兴趣的用户。
ADA.相似B.相同C.推荐D.预测18)2012年 12 月 28 日,全国人大三次会议通过的( 33 )CA. 《互联网行业的自律公约》B. 《治安管理处罚条例》C. 《关于加强网络信息保护的决定》D. 《信息安全保护条例》19)Google 收集的信息不包括(34 )CA. 日志信息B. 位置信息C.你的家庭成员D. Cookie和匿名标识符20)大数据的取舍与( 35 )不相关。
BA. 易于提取B.家庭信息C. 数字化D. 廉价的存储器21)IBM智慧地球中 Smart Work 指( 36 ) BA. 新锐洞察B. 智慧运作C. 动态架构D. 绿色未来22)根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB, 而这个数值还在以每两年翻一番的速度增长,预计到 2020年全球将总共拥有的数据量( 37 ),增长近( 38 )倍。
CBA. 10B. 20C. 35ZBD. 20ZB23)2012年 3月 29日奥巴马政府公布了(39 )。
该计划的目标是改进现有人们从海量和复杂的数据中获取知识的能力,从而加速美国在科学与工程领域发明的步伐,增强国家安全,转变现有的教学和学习方式。
首批共有 6 个联邦部门宣布投资(40 )美元,共同提高收集、储存、保留、管理、分析和共享海量数据所需核心技术的先进性,并形成合力;扩大大数据技术开发和应用所需人才的供给。
CDA. 全民健康计划B. 5 亿C. 大数据研发计划D. 2 亿4欢迎。
下载24) 大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并( 41 )成 为帮助企业经营决策更积极目的的信息。
B A.收集B.整理C.规划D.聚集28) 社交网络产生了海量用户以及实时和完整的数据, 同时社交网络也记录了用户群体的( 45 ),通过深入挖掘这些数据来了解用户,然后将这些 分析后的数据信息推给需要的品牌商家或是微博营销公司。
C A.地址B.行为C.情绪D.来源29) IBM 的 “3A5步”除 Align 、Anticipate 、Act 夕卜,还需要不断地(46 )从每一次业务结果中获得反馈,改善基于信息的决策流程,从而实现 (47)。
CB C. Learn D. Modify25) 大数据工程指大数据的( 42A. 大数据网络发展和运营过程 C. 规律和验证26) 大数据科学关注大数据网络发展和运营过程中()的系统工程。
BB. 规划建设运营管理 D. 发现和验证43)大数据的规律及其与自然和社会活动之间的关系 A. 大数据网络发展和运营过程 C. 规律和验证27) 大数据的价值是通过数据共享、 (A .算法共享B .共享应用DB. 规划建设运营管理 D. 发现和验证44 )后获取最大的数据价值 D C. 数据交换D. 交叉复用B. TransformA. Create30)IBM 大数据平台和应用程序框架,( 48 )以经济高效的方式分析 PB 级的结构化和非结构化信息 BA.流计算B. HadoopC.数据仓库D.语境搜索31)临床决策支持系统通过电子病历、医学指导的比较等提高手术质量,降低错误治疗和(49 )0 CA.医疗事故B.病患投诉C.民事诉讼D.手术费用32)《数据新闻学手册》的作者们认为,通过数据的使用,记者工作的重点从“第一个报道者”转化成为对特定事件的影响的( 50 )0 DA.拍摄者B.知情者C.记录者D.阐释者33)通过( 51 )和展示数据背后的( 52 ),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻0 BDA.数据收集B.数据挖掘C.真相D.关联与模式34)CRISP-DM模型中Evaluation表示对建立的模型进行评估,重点具体考虑得出的结果是否符合( 53 )的商业目的0 CA. 第二步B. 第三步C. 第一步D. 最后一步35)发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备;给定( 54 )和(55 ),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则CD54:A. 最大兴趣度 B. 最小置信度 C. 最小支持度 D. 最大可信度55:A. 最小兴趣度 B. 最小置信度 C. 最大支持度 D. 最小可信度36)规则 I->j, “有可能”,等于所有包含 I 的购物篮中同时包含 J 的购物篮的比例,为(56 )。
BA. 置信度B. 可信度C. 兴趣度D. 支持度37)如果一个匹配中,任何一个节点都不同时是两条或多条边的端点,也称作( 57 ) CA.极大匹配B.二分匹配C完美匹配 D.极小匹配38)国防部高级研究计划局(DARPA的网络内部威胁(CINDER计划,旨在开发新的方法来检测军事计算机网络与( 58 )。
作为一种揭露隐藏操作的手段,CINDER各适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。
BA. 内部网络活动B. 网络间谍活动C. 网络威胁检测D.网络漏洞检测39)只要具有适当的政策推动,大数据的使用将成为未来提高竞争力、生产力、创新能力以及( 59 )的关键要素。
D40)A.提高消费 B.提高GDP C.提高生活水平 D.创造消费者盈余41)个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助( 60 )为其顾客购物提供完全个性化的决策支持和信息服务。
DA.公司B.各单位C.跨国企业D.电子商务网站二、多选题42) 大数据的治理包括( 1 ABCD )A. 容量问题延迟问题 C. 安全问题 D. 成本问题B.43) Hadoop项目包括( 2 ABD )A. Hadoop Distributed FileSystem (HDF$ B. HadoopMapReduc編程模型C. HadoopStreamingD. Hadoop Common44) 基于“ 3A5步”动态路线图,IBM提出了“大数据平台”架构。
该平台的核心能力包括( 3 ABCD )A. Hadoop 系统B. 流计算( StreamComputing)C.数据仓库(Data Warehouse)D.信息整合与治理(InformationIntegration and Governance )45) 大数据在医疗与健康的临床应用包括( 4 ABC )A. 疗效比较研究方案 CERB. 临床决策支持系统C. 远程患者监测系统D. 患者家庭情况分析46) 《数据新闻学手册》为我们提供了一些简单的搜索建议。