《探索大数据与人工智能》习试题库完整

合集下载

中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案

中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案

中国移动网络大学全员5G+通用知识《探索大数据与人工智能》题库答案一、单选题1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。

A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A. 数量越多处理时间越长B. 数量越多处理时间越短C. 数量越小处理时间越短D. 没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。

中国移动探索大数据与人工智能试题

中国移动探索大数据与人工智能试题

(一)大数据基本(二)人工智能(三)大数据技术简介1、MapReduce是一个线性可扩展模型,请问服务器数量与解决时间是什么关系? OA. 数量越多解决时间越长B.数量越多解决时间越短OC. 数星越小解决时间越短0 D. 没什么关系2、下列选项中,不是kafka适合旳应用场景是?()A.日记收集B.消息系统C.业务系统0 D. 流式解决1、大数据特性有几种(不涉及IBM提出旳新特性) ? OA.1O B.2O C.3D.42、目前电信运营商大数据发展仍处在什么阶段?A.摸索O B.应用OC.成熟OD.扩展3.下列选项中,不是大数据旳-部分旳是?OA.海量计算:O B. 大量数据管理O C. 数据分析◎D. 单机计算1、数据真实性具有哪两种特质?V A. 精确性口B. 不拟定性口C. 可信赖度口D. 杂乱性2.电信行业旳公司运营:理中。

经营分析和市场监测中。

我们可以通过数据分析对业务和市场经营状况进行总结和分析。

重要分为哪些种类?A日报口B.周报C月报口0.专暨分析1。

EMC World是哪年在拉斯维加聯出名旳威尼斯人店开畔旳?口A。

B.◎C.◎D.2.随着闭源软件在数据分析领域旳地盘不断缩小,老牌T厂高正在变化商业模式,向着什么靠拢?OA团源◎B.开源OC开放OD.封闭3.下列造项中正情阐明价已度低旳是?。

A. 100万数据中有50万有效数据。

B.1TB数据中有1KB有效数据。

C. 100万0数据中南100万有效数据◎D. 10万条数据中有1万有效数据1.语音辨认产品体系有四部分,下列哪项不是体系之- ?◎A.语音合成◎B.请音擴放◎C. 语音识剔0 D.適义理解2. IBM旳深蓝在1997年旳决定胜负旳第六个回台中,用了多少步迫使和斯帕罗夫投子认输OA.15◎B.22◎C.30◎D.283. BP神经网络旳学习规则是?O A梯度上升法。

B.梯度下降法。

C梯度提高法。

D.梯度曲线法、下列选项中,寒项是分布式文献存储系统?o A HDFSO B Flume0 c Katla◎D. Zokeepe2. mapreduceit算模型近用于哪种任务?( ) A. 多线程解决◎B. 有关联旳行解决。

大数据与人工智能试题及答案

大数据与人工智能试题及答案

大数据与人工智能试题及答案下列数据中不属于大数据的是() [单选题] *A.某同学网上高考报名的数据(正确答案)B.电商平台的用户浏览、交易时产生的数据C.全体手机用户的联网信息、实时定位数据D.各地交通摄像头记录的全部数据下列不属于大数据的特征是() [单选题] *A.数据规模大B.数据类型多样C.数据迅变性D.数据价值密度高(正确答案)答案:D监控不间断地录制视频产生了大量的视频数据,而有价值的数据仅有十几秒,这主要体现了大数据的( )特征。

[单选题] *A.价值密度低(正确答案)B.数据体量大C.数据变化速度快D.数据类型多对于大数据特征的描述,错误的是()。

[单选题] *A.价值性(价值密度低)B.海量的数据规模(巨量性)C.快速的数据变化(迅变性)D.单一的数据类型(单一性)(正确答案)大数据的特征有() [单选题] *①价值性②巨量性③迅变性④多样性A.①②③B.①②④C.①③④D.①②③④(正确答案)下列大数据服务中,没有应用电商大数据的是() [单选题] *A.农业灾害预警(正确答案)B.商品精准营销C.商品自动补货D.商品智能推荐以下说法正确的是() [单选题] *大数据技术可以优化社会管理模式②大数据技术创新可以提升服务质量③大数据技术可以开辟科学研究的新途径④通过时大数据的挖掘以及对分析结果的应用,可以给生活带来便利A.①②④.B.①②③C.②③④D.①②③④(正确答案)大数据在我们的生活中无处不在,下列说法正确的是() [单选题] *A.大数据带给我们的全部都是正面的影响B.大数据给我们的生活带来便捷的同时也会产生负面影响(正确答案)C.大数据可能会带来个人信息泄露,我们应该全盘否定D.大数据只会给我们带来信息伤害与诈骗答案:B电商网站收集客户的个人数据,通过分析,根据客户的喜好推荐不同的商品属于大数据的哪一种典型应用() [单选题] *A.医疗健康B.社区管理C.智慧城市D.生活服务(正确答案)人工智能的英文缩写是( ) [单选题] *A.ATC.ITD.AI(正确答案)人工智能的目的是让机器能够( ),以实现某些脑力劳动的机械化. [单选题] *A.完全代替人的大脑B.模拟、延伸和扩展人的智能(正确答案)C.完全代替人的工作D.具有像人一样的高级智能“ 测试”是测试机器智能的一种方法() [单选题] *A.冯•诺侬曼B.明斯基C.麦卡锡D.图灵(正确答案)进行身份认证的技术手段很多,下列属于生物特征识别认证方式的是() [单选题] *A. USB KeyU证B.账号加密码认证C.短信验证码认证D.指纹识别认证(正确答案)下列应用,没有体现人工智能技术的是() [单选题] *A.通过指纹识别打开智能门锁B.无人驾驶汽车实现自动驾驶C.使用Word “自动更正”功能(正确答案)D.停车收费系统扫描识别车牌生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术。

《探索大数据与人工智能》习试题库完整

《探索大数据与人工智能》习试题库完整

《探索大数据与人工智能》习题库单选1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、20xx5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、20xx7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立<>一职,负责全面推进"数据分享平台"战略,并推出大型的数据分享平台。

A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是? A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做<>A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、<>?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术与应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.T orch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。

《探索大数据与人工智能》习题库

《探索大数据与人工智能》习题库

探索大数据与人工智能》习题库单选1、 Spark Streaming 是什么软件栈中的流计算 ? A. Spark B. Storm C. Hive D. Flume2、下列选项中 ,不是大数据发展趋势的是 ?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、 2011 年 5 月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation,competition and productivity 》研究报告中指出 ,数据已经渗透到每一个行业和业务职能之中 逐渐成为重要的生产因素的 ?A.比尔•恩门B.麦肯锡C.扎克伯格D.乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用 ? A. 精准广告 B. 网络管理 C. 网络优化 D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用 ?A. 数据商业化B. 物流网络C. 企业运营D. 客户关系管理 6、2012 年 7 月,为挖掘大数据的价值 ,阿里巴巴集团在管理层设立 ()一职 ,负责全面推进 “数据分享平台 ”战略 ,并推出大型的数据分享平台。

A. 首席数据官B. 首席科学家C. 首席执行官D. 首席架构师 7、下列选项中 ,不是 kafka 适合的应用场景是 ? A.日志收集B.消息系统C.业务系统D.流式处理 &下列选项中,哪个不是HBASE 的特点? A. 面向行 B. 多版本 C. 扩展性 D. 稀疏性 ,MapReduce 是一个线性可扩展模型 ,请问服务器数量与处理时间是什么关系?10、在Spark 的软件栈中,用于机器学习的是A. Spark StreamingB. MllibC. GraphXD.SparkSQL 11、Spark 是在哪一年开源的? A. 1980 B. 2010 C. 1990 D. 200012、大数据的多样性使得数据被分为三种数据结构 ,那么以下不是三种数据结构之一的是A 结构化数据B.非结构化数据 C.半结构化数据 D.全结构化数据13、 自然语言处理难点目前有四大类,下列选项中不是其中之一的是 ?9、在数据量一定的情况下 A. 数量越多处理时间越长 B.数量越小处理时间越短 B. 数量越多处理时间越短 D •没什么关系A.机器性能B.语言歧义性C.知识依赖D.语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B.拨号C.导航D.设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B.对抗学习C.强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表17、总体来说,人工智能发展的未来趋势是?A.上升B.下降C.不动D.大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC.移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB.B、KB MBC. KB ZB PBD.B MB、KB20、以下数据单位换算错误的是?A. 1KB=1024BB. 1GB=1024MB C/IT B=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频22、整个MapReduce 的过程大致分为Map、Shuffle、Combine、()?A. ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A. AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A. KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C.梯度提升法D.梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A. TezB. SparkC. Pig DMapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。

大数据与人工智能试卷 带答案

大数据与人工智能试卷 带答案

大数据与人工智能试卷带答案1、当前大数据技术的基础是由(C)首先提出的。

A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C )。

A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。

A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、数据清洗的方法不包括(D)。

A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理5、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。

A:统计报表B:网络爬虫C:API接口D:传感器6、智慧城市的构建,不包含(C)。

A:数字城市B:物联网C:联网监控D:云计算7、大数据的最显著特征是(A)。

A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高8、Mac OS系统的开发者是(C )。

(A:微软公司B:惠普公司C:苹果公司D:IBM公司9、大数据时代,数据使用的关键是(D)。

A:数据收集B:数据存储C:数据分析D:数据再利用10、基础设施即服务的英文简称是(A)A、IaaSB、PaaSC、SaaS二、填空题(本大题共10小题,每题2分,共20分)1、语⾳识别是指识别语⾳(说出的语⾳)并将其转换成对应⾳本的技术。

2、机器翻译(MT)是利⾳机器的⾳量⾳动将⾳种⾳然语⾳(源语⾳)的⾳本翻译成另⾳种语⾳(⾳标语⾳)。

3、机器⾳学(Robotics)研究的是机器⾳的设计、制造、运作和应⾳,以及控制它们的计算机系统、传感反馈和信息处理。

4、机器学习是从数据中⾳动分析获得模型,并利⾳模型对未知数据进⾳预测。

5、数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。

6、元数据被定义为:描述数据的数据,对数据及信息资源的描述性信息。

7、数据的存储是借助存储工具或者媒介,对数据进行永久性存储。

8、关系型数据库,是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,以便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。

中国移动探索大数据与人工智能试题

中国移动探索大数据与人工智能试题

中国移动探索大数据与人工智能试题嘿,伙计们!今天我们要聊聊一个非常热门的话题——大数据与人工智能。

你们知道吗?这两者可是当今科技界的两大宠儿,它们的力量可是无穷无尽哦!让我们一起来揭开它们神秘的面纱吧!让我们来聊聊大数据。

大数据,顾名思义,就是指那些量大、种类繁多的数据。

这些数据就像是一座座金矿,等待着我们去挖掘。

而人工智能,就像是一位聪明绝顶的矿工,它可以帮助我们从这些金矿中提炼出宝贵的财富。

大数据和人工智能究竟是如何相互配合的呢?其实,它们之间的关系就像是一对默契的搭档。

大数据就像是原材料,而人工智能则是加工这些原材料的工具。

在大数据的基础上,人工智能可以通过各种算法和模型,为我们提供各种各样的解决方案。

比如说,我们可以通过大数据分析出某个地区的人口密度、消费水平等信息,然后利用人工智能技术,为这个地区的商家提供更加精准的广告投放策略。

这样一来,商家就可以更加有效地吸引顾客,提高销售额了。

大数据和人工智能的结合并不仅仅局限于商业领域。

在医疗、教育、交通等各个方面,它们都有着广泛的应用前景。

比如说,在医疗领域,大数据可以帮助医生分析患者的病历、基因等信息,从而为患者提供更加个性化的治疗方案。

而人工智能则可以通过模拟人类的思维过程,帮助医生更快地做出判断。

这样一来,患者就可以得到更加精准的治疗,提高了治愈率。

不过,大数据和人工智能的发展也面临着一些挑战。

随着数据的不断积累,如何保证数据的安全和隐私成为了一个亟待解决的问题。

人工智能虽然可以帮助我们解决很多问题,但它毕竟还是一种工具,它的决策并不总是完全正确的。

因此,在使用人工智能的时候,我们还需要保持谨慎的态度。

大数据和人工智能作为当今科技领域的两大宠儿,它们的发展前景是非常广阔的。

只要我们善于利用它们的力量,相信未来一定会有更多的惊喜等待着我们。

今天的分享就到这里啦!希望大家能够从中受益匪浅,也期待大家在未来的日子里,能够见证大数据和人工智能带来的更多奇迹!再见啦!。

探索大数据和人工智能-1107

探索大数据和人工智能-1107

单选题1、 HDFS中Namenode的Metadata的作用是?2、2012年7月,为挖掘大数据的价值、阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”3、以下哪个场景可以称为大数据场景?4、2011年5月是哪家全球知名咨询公司在《Big data:The next frontier,competitionandproductivity》5、下列选项中、不是Flume的特点的是?7、下列选项中,哪项是分布式文件存储系统?8、下列选项中,正确描述Flume对数据源的支持的是?9、以下哪个不是语音识别的范畴?11、机器学习研究如何通过计算的手段利用经验来改善系统自身的性能,请问机器学习利用数12、下列选项中,不是人工智能的算法中的学习方法的是?13、语言识别产品体系有四部分,下列哪项不是体系之一-?14、今年,大数据分析将出现革新性新办法,从前的很多算法和基础理论可能会产生理论级别的突破。

而15、以下哪个不属于大数据在电信行业的数据商业化方面的应用?17、下列选项中,不是大数掘的一部分的是?18、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()1、mapreduce计算模型适用于哪种任务?3、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率9、在Spark的软件栈中,用于图计算的是10、在Spark的软件栈中、用于流计算的是?13、BP神经网络的学习规则是?15、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技17、自然语言处理难点目前有四大类,下列选项中不是其中之一的是1、MPP是指?2、随着闭源软件在数据分析领域的地盘不断缩小,老牌T厂商正在改变商业模式、向着什么靠拢?3、以下应用没有使用你的地理位置信息的是?4、Hadoop是()年诞生的?6、以下数据单位换算错误的是?8在HDFS中存在NameNode、DataNode、Cient、而NameNode是管理者、DataNode是文件存储者,那么Client9、Flume采用了三层架构,分别为agent,collector和()10、Hadoop2系列版本中默认的HDFS的block是多大?11、在Spark的软件栈中,于流计算的是?12、工信部育网正式发布大数据产业”十三五“发展规划是在哪一年?13、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务14、人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?16、AlphaGo是第-一个击败人类职业()选手的人工智能程序。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《探索大数据与人工智能》习题库单选1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。

A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是? A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.T orch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。

需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;A.内存B. 硬盘C. 磁带D. 显卡29、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年?A.1987B. 1997C.2007D. 201731、学习没有标签的数据集的机器学习方法是?A.监督学习B. 无监督学习C. 半监督学习D. 强化学习32、当前世界产生的数据总量的单位是?A.KBB. ZBC. GBD. TB33、下列选项中正确说明价值密度低的是?A.100TB数据中有50TB有效数据B. 1TB数据中有1KB有效数据C.100PB数据中有100PB有效数据D. 10EB数据中有10EB有效数据34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。

A.精灵B. 阿尔法蛋C. 小度D. 移娃35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。

A.AlphaGoB. 深蓝C. 图灵机模型D. 深度学习机器人36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode 是文件存储者,那么Client是什么呢?A.连接器B. 客户端C. 接口提供者D. 数据采集37、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理38、大数据特征有几种(不包括IBM提出的新特征)?A.1B.2C.3D.439、Hadoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201640、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A.精准广告B.网络管理C.营销洞察D.大数据检测和决策41、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。

请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归42、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式43、IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A.更有效B.更大(Volume)C.更充分D.更直观44、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D.单机计算45、Flume采用了三层架构,分别为agent,collector和()A.MapB.storageC.ShuffleD.Hash46、HBASE的特点不包括?A.面向列B.稀疏性C.多版本D.低可靠性47、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D.实时数据变化处理48、最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A.谷歌B. 百度C. 360D. bing49、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。

而哪项技术将继续成为大数据智能分析的核心技术?A.机器学习B. 智能物流C. 脑科学D. 智能终端50、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B. 可以配置数据源C. 不能使用文件系统D. 不能使用目录方式51、HBASE的特点不包括哪些?A.面向行B. 稀疏性C. 多版本D. 高可靠性52、下列选项中,不是用于数据存储的技术是哪一个?A.MongoDBB. MySQLC. HDFSD. Java53、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()A. 高人工智能B. 低人工智能C. 强人工智能D. 弱人工智能54、下列选项中,不是人工智能的基础设施的是?A. CPU服务器B. GPU服务器C. 专用芯片D. 游戏显卡54、以下不是大数据特征的是?A.数据体量大B. 数据种类多C. 价值密度高D. 处理速度快55、以下应用没有使用你的地理位置信息的是?A.美团B. 滴滴C. 高德地图D. word56、下列选项中,不是Flume的特点的是?A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性57、在Spark的软件栈中,用于交互式查询的是A.SparkSQLB. MllibC. GraphXD. Spark Streaming58、下列选项中,不是大数据的一部分的是?A.海量计算B. 大量数据管理C. 数据分析D单机计算59、人工智能、机器学习、深度学习的包含关系是()A.机器学习>深度学习>人工智能B. 人工智能>深度学习>机器学习C.人工智能>机器学习>深度学习D. 深度学习>人工智能>机器学习60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A. 机器性能B. 语言歧义性C. 知识依赖D. 语境61、BP神经网络模型拓扑结构不包括A.输入层B. 隐层C. 输出层D. 显层62、以下哪个不是语音识别的范畴?A.语音听写B. 语音合成C. 语音转写D. 语音唤醒63、Alpha Go是第一个击败人类职业()选手的人工智能程序。

A. 国际象棋B. 围棋C. 中国象棋D. 五子棋64、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B. 开源C. 独立D. 封闭65、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。

A. 海量B. 少数C. 小量D. 结构化66、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume67、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。

相关文档
最新文档