《探索大数据与人工智能》习题库
探索大数据和人工智能题库

序号题型试题参考答案1单选以下哪个属于大数据在电信行业的数据商业化方面的应用?A. 精准广告B. 网络管理C. 网络优化D. 客服中心优化A2单选IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)。
A, 更有效B. 更大(Volume)C. 更充分D. 更直观B3单选下列选项中能够正确说明大数据价值密度低的是()?A. 100TB数据中有50TB有效数据B. 1TB数据中有1KB有效数据C. 100PB数据中有100PB有效数据B4多选电信行业的网络管理和优化包含了两部分的优化,这两项优化是下列选项中的哪两个?A. 网络速度的优化B. 基础设施建设的优化C. 网络运营管理和优化D. 并发性的优化BC5多选世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?A. 推动经济发展B. 改善公共服务C. 增进人民福祉ABCD6单选中国移动自主研发、发布的首个人工智能平台叫做()A. 九天B. OneNETC. 移娃A7单选自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A. 机器性能B. 语言歧义性C. 知识依赖D. 语境A8单选Alpha Go是第一个击败人类职业()选手的人工智能程序。
A. 国际象棋B. 围棋C. 中国象棋D. 五子棋B9多选人工智能目前在以下哪三个领域有了长足的发展?A. 健康B. 教育C. 探索太空ABD10多选人工智能关键技术的基础设施中包含下面哪两项?A. 算法框架B. 基础硬件C. 人员AB11单选下列选项中,不是kafka适合的应用场景是?A. 日志收集B. 消息系统C. 业务系统D. 流式处理C12单选下列选项中,不是Flume的特点的是?A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性B13单选MPP是指?A. 大规模并行处理系统B. 受限的分布式计算模型C. 集群计算资源管理框架D. 分布式计算编程框架A14多选下列选项中,哪两项是可以用于数据采集的技术?A. FlumeB. HiveC. KafkaAC15多选HBASE的应用场景有哪些?A. 半结构化或非结构化数据B. 记录非常稀疏C. 结构化数据D. 超大数据量ABD16单选mapreduce计算模型适用于哪种任务?A. 多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理C17单选以下不是大数据特征的是()?A. 数据体量大B. 数据种类多C. 价值密度高D. 处理速度快C18单选最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A. 谷歌B. 百度C. 360A19单选大数据的数据来源于方方面面,下列不可以作为数据源的是?A. APP应用B. 地理信息C. 一块石头D. 商店订单C20单选2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
人工智能基础(习题卷52)

人工智能基础(习题卷52)第1部分:单项选择题,共50题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]容栅传感器是根据电容的工作原理来工作的( )。
A)变极距B)变面积C)变介质答案:B解析:2.[单选题]DSSM使用()个全连接层A)两B)一C)三D)四答案:A解析:DSSM使用两个全连接层3.[单选题]每一棵决策树拟合的是之前迭代得到的模型的()A)标准差B)均方差C)残差D)方差答案:C解析:每一棵决策树拟合的是之前迭代得到的模型的残差4.[单选题]( )通过群体中粒子间的合作与竞争产生的群体智能指导优化搜索。
A)粒子群优化B)遗传算法C)局部搜索D)全局搜索答案:A解析:5.[单选题]传统机器学习和深度学习是人工智能核心技术,在工程流程上略有差别,以下步骤在深度学习中不需要做的是A)模型评估B)特征工程C)数据清洗D)模型构建答案:B解析:6.[单选题]对于navigate(self, url, *, wait=True, timeout=100),下列说法正确的是?A)在原网页的页面跳转到一个链接B)从一个网页跳转到另一个已经打开的网页链接D)和catch一样捕获一个网页答案:A解析:7.[单选题]( )是指允许点云在一条轨迹中扫过模型表面的面积。
A)点云碰撞个数阈值B)碰撞面积阈值C)点云精度D)点云分辨率答案:A解析:8.[单选题]关于Topic通信的描述,正确的选项有( )。
A)Topic是一种同步通信机制B)一个Topic至少要有一个发布者和一个接收者C)查看当前活跃的Topic可以通过rostopic list命令D)一个Node最多只能发布一个Topic答案:A解析:9.[单选题]假定你在神经网络中的隐藏层中使用激活函数X。
在特定神经元给定任意输入,你会得到输出「-0.0001」。
X可能是以下哪一个激活函数?A)ReLUB)tanhC)SIGMOIDD)以上都不是答案:B解析:10.[单选题]在视觉系统中,什么样的滤镜可以消除金属产品上的眩光( )。
人工智能及应用公需科目(习题库)-上海地区继续教育--职称评审

人工智能及应用公需科目—习题及答案1、判断题1.智能的本质古今中外诸多哲学家、脑科学家一直在努力探索和研究的问题,至今任然没有完全解决。
√2.智能是知识与智力的总和,其中知识是一切智能行为的基础,智力是获取和知识并运用知识求解问题的能力,即在任意给定环境和目标的条件下√制定决策和实现目标的能力,它来自人类的思维活动。
√3.人工智能就是要研究如何使机器具有听、会说、能看、会写、能思维、会学习、能适应环境变化、会解决各种实际问题等功能的一门学科。
√4.人工智能这个术语自1956年被提出,并成为一门新兴学科。
√5.人工智能到目前为止,已有确切定义。
×6.智能来源于思维活动,这种观点被称为思维理论。
√7.感知是智能活动的前提。
√8.记忆与思维是人脑最重要的功能,也是人类智能不重要的表现形式。
×9.学习和自适应是人类的一种本能。
√10.人工智能权威明斯基在《感知机》一书中指出了单层感知机模型存在严重缺陷,致使人工神经网络的研究落入低潮。
√11.1988年,人工智能神经网络的研究还没有复苏。
×12行为主义学派又称进化主义学派或控制论学派,是基于控制论和感知-动作控制系统的人工智能学派。
√13.智能传感器是指具有信息处理功能的传感器。
√14.1982年,霍普菲尔德提出了新一代神经网络模型。
√15.机器感知不是机器获取外界信息的主要途径。
×16.神经网络计算也称神经网络或神经计算,是一类计算模型,其工作原理模仿了达尔文进化论的“物竞天择,适者生存”的进化规则。
×2、单选题1.1950年,图灵发表了著名论文《计算机与智能》,明确提出了“机器思维”的观点,并设计了一个著名的测试机器智能的试验,称为(B)。
B图灵测试2.人工智能的思想、理论、方法和技术已经渗透到(A)的诸多领域和人类社会的各个方面。
A科学技术3.智能主要指(A)的自然智能,其确切定义还有待于对人脑奥秘的彻底揭示。
人工智能基础(习题卷62)

人工智能基础(习题卷62)第1部分:单项选择题,共50题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]以下说话正确的是()A)一个机器学习模型如果有较高准确率,总是说明这个分类器是好的B)如果增加模型复杂度,那么模型的测试错误率不一定会降低C)如果增加模型复杂度,那么模型的训练错误率总是会降低答案:C解析:一个机器学习模型如果有较高准确率,不能说明这个分类器是好的。
对于不平 衡的数据集进行预测时,正确率不能反映模型的性能。
模型越复杂,在训练集上越容易表现 好,在测试集上越容易表现不好。
2.[单选题]关于卷积层的说法,错误的是()A)卷积核的尺寸是由人为指定的B)卷积核的参数值是人为指定的C)卷积层可以作为神经网络的隐藏层D)特征图是为卷积层的最终输出答案:B解析:3.[单选题]有两个样本点,第一个点为正样本,它的特征向量是(0, -1);第二个点为负样本,它的特征向量是(2, 3),从这两个样本点组成的训练集构建一个线性SVM 分类器的分类面方程是()。
A)2x+_y=4B)x+2y=5C)x+2y=3D)2x-y=0答案:C解析:对于两个点来说,最大间隔就是垂直平分线,因此求出垂直平分线即可。
斜率是 两点连线的斜率的负倒数。
即-1/ (-1-3)/(0-2)=-1/2,可得戶-(l/2)x + C.过中点(0+2) /2, (-1+3)/2)= (1, 1),可得 c=3/2,故方程为 x+2戶3。
4.[单选题]在具体求解中,能够利用与该问题有关的信息来简化搜索过程,称此类信息为( )A)启发信息B)简化信息C)搜索信息D)求解信息答案:A解析:5.[单选题]下列哪个不是RPA实施回报率的评估因素?()A)成本节省B)生产力提升C)质量改进D)劳动力需求有规律答案:DA)人机交互系统B)机器人-环境交互系统C)驱动系统D)控制系统答案:A解析:7.[单选题]下面不属于人工智能研究基本内容的是()A)机器感知B)机器思维C)机器学习D)自动化答案:D解析:8.[单选题]大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()A)新一代技术平台B)新一代信息技术和服务业态C)新一代服务业态D)新一代信息技术答案:B解析:9.[单选题]梯度下降算法中,损失函数曲面上轨迹最混乱的算法是以下哪种算法?A)SGDB)BGDC)MGDD)MBGD答案:A解析:10.[单选题]当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?()A)分类B)聚类C)关联分析D)隐马尔可夫链答案:B解析:11.[单选题]线性判别分析常被视为一种经典的()技术。
人工智能基础(习题卷8)

人工智能基础(习题卷8)第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]关于神经网络的说法中,正确的是()A)增加网络层数,总能减小训练集错误率B)减小网络层数,总能减小测试集错误率C)增加网络层数,可能增加测试集错误率答案:C解析:2.[单选题]以下算法中,不属于分类预测的典型算法的是( )A)Logistic回归B)决策树C)K-means算法D)神经网络答案:C解析:3.[单选题]下列算法中:①KNN;②线性回归;③对数几率回归,可以用神经网络去构造的().A)①②B)②③C)①②③D)以上答案都不正确答案:B解析:KNN算法不需要训练参数,而所有神经网络都需要训练参数,因此神经网络帮 不上忙。
最简单的神经网络--感知器,其实就是线性回归的训练。
我们可以用一层的神经 网络构造对数几率回归。
4.[单选题]通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。
该翻译方式是( )A)知识库式翻译系统B)统计式翻译系统C)范例式翻译系统D)直译式翻译系统答案:B解析:5.[单选题]在回归分析中,说法正确的是( )。
A)解释变量和被解释变量都是随机变量B)解释变量为非随机变量,被解释变量为随机变量C)解释变量和被解释变量都为非随机变量D)解释变量为随机变量,被解释变量为非随机变量答案:B解析:在回归分析中,解释变量可以理解为自变量,具有确定性,因此为非随机变量; 被解释变量可以理解为因变量,具有随机性,因此为随机变量。
6.[单选题]DSSM经典模型的缺点:1.Wordhashing可能造成词语冲突;2.采用词袋模型,损失了上下文语序信息;3.搜索引擎的排序由多种因素决定,用户点击时doc排名越靠前越容易被点击,仅用点击来判断正负样本,产生的噪声较大,模型难以收敛;4.效果不可控。
C)2.3.4D)1.2.3.4答案:D解析:DSSM经典模型的缺点:1.Wordhashing可能造成词语冲突;2.采用词袋模型,损失了上下文语序信息;3.搜索引擎的排序由多种因素决定,用户点击时doc排名越靠前越容易被点击,仅用点击来判断正负样本,产生的噪声较大,模型难以收敛;4.效果不可控。
人工智能基础(习题卷1)

人工智能基础(习题卷1)第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]声明1:可以通过将所有权重初始化为0来训练网络。
声明2:可以通过将偏差初始化为0来很好地训练网络以上哪些陈述是真实的?A、1对2错A)1错2对B)1和2都对C)1和2都错答案:B解析:2.[单选题]下列哪个函数可以组合估计器?A)RepeatedKFoldB)KFoldC)LeaveOneOutD)make_pipeline答案:D解析:3.[单选题]输入图像已被转换为大小为28×28的矩阵和大小为7×7的步幅为1的核心/滤波器。
卷积矩阵的大小是多少?A)22X22B)21X21C)28X28D)7X7答案:A解析:4.[单选题]人工神经网络的相关研究最早可以追溯到上世纪40年代,由心理学家麦卡洛克和数学逻辑学家皮茨提出的( )。
A)M-P神经元模型B)B-P神经元模型C)M-N神经元模型D)N-P神经元模型答案:A解析:5.[单选题]要在某一台机器上为某种语言构造一个编译程序,必须掌握哪些内容()A)汇编语言、高级语言、编译方法B)程序设计方法、测试方法、编译方法C)源语言、目标语言、编译方法D)高级语言、程序设计方法、机器语言答案:C解析:C)奇异点阈值D)点云分辨率答案:A解析:7.[单选题]Hadoop生态系统中,HBase是一种()。
A)分布式文件系统B)数据仓库C)实时分布式数据库D)分布式计算系统答案:C解析:HBase是一个面向列的实时分布式数据库。
8.[单选题]人工神经元网络与深度学习的关系是A)人工神经元网络是深度学习的前身B)深度学习是人工神经元网络的一个分支C)深度学习是人工神经元网络的一个发展D)深度学习与人工神经元网络无关答案:C解析:深度学习是实现机器学习的一种技术,现在所说的深度学习大部分都是指神经网络9.[单选题]在编制自动化需求时,实践证明采用()时最有效的方式A)流程图B)视频说明C)电子表格D)流程图加视频说明答案:D解析:10.[单选题]关于用4V来表示大数据的主要特征,描述错误的是A)大数据的时间分布往往不均匀,近几年生成数据的占比最高B)“如何从海量数据中洞见(洞察)出有价值的数据”是数据科学的重要课题之一C)数据类型的多样性往往导致数据的异构性,进而加大数据处理的复杂性,对数据处理能力提出了更高要求D)数据价值与数据量之间存在线性关系答案:D解析:11.[单选题]常用的的灰度内插法不包括()。
人工智能基础(习题卷9)

人工智能基础(习题卷9)第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]由心理学途径产生,认为人工智能起源于数理逻辑的研究学派是( )A)连接主义学派B)行为主义学派C)符号主义学派答案:C解析:2.[单选题]一条规则形如:,其中“←"右边的部分称为(___)A)规则长度B)规则头C)布尔表达式D)规则体答案:D解析:3.[单选题]下列对人工智能芯片的表述,不正确的是()。
A)一种专门用于处理人工智能应用中大量计算任务的芯片B)能够更好地适应人工智能中大量矩阵运算C)目前处于成熟高速发展阶段D)相对于传统的CPU处理器,智能芯片具有很好的并行计算性能答案:C解析:4.[单选题]以下图像分割方法中,不属于基于图像灰度分布的阈值方法的是( )。
A)类间最大距离法B)最大类间、内方差比法C)p-参数法D)区域生长法答案:B解析:5.[单选题]下列关于不精确推理过程的叙述错误的是( )。
A)不精确推理过程是从不确定的事实出发B)不精确推理过程最终能够推出确定的结论C)不精确推理过程是运用不确定的知识D)不精确推理过程最终推出不确定性的结论答案:B解析:6.[单选题]假定你现在训练了一个线性SVM并推断出这个模型出现了欠拟合现象,在下一次训练时,应该采取的措施是()0A)增加数据点D)减少特征答案:C解析:欠拟合是指模型拟合程度不高,数据距离拟合曲线较远,或指模型没有很好地捕 捉到数据特征,不能够很好地拟合数据。
可通过增加特征解决。
7.[单选题]以下哪一个概念是用来计算复合函数的导数?A)微积分中的链式结构B)硬双曲正切函数C)softplus函数D)劲向基函数答案:A解析:8.[单选题]相互关联的数据资产标准,应确保()。
数据资产标准存在冲突或衔接中断时,后序环节应遵循和适应前序环节的要求,变更相应数据资产标准。
A)连接B)配合C)衔接和匹配D)连接和配合答案:C解析:9.[单选题]固体半导体摄像机所使用的固体摄像元件为( )。
人工智能应用技术练习题库(含参考答案)

人工智能应用技术练习题库(含参考答案)1、以下 CNN网络模型中,最早用于手写数字识别的是A、LeNet-5B、AlexNetC、ResNet50D、ResNet152答案:A2、以下关于机器学习说法错误的是A、机器学习可以解决图像识别问题B、目前机器学习已经可以代替人类C、机器学习在一定程度上依赖于统计学习D、监督学习和非监督学习都属于机器学习答案:B3、华为昇腾 AI芯片是 NPU(神经网络处理器)的典型代表之一。
A、TRUEB、FALSE答案:A4、下列哪些包不是图像处理时常用的A、timeB、sklearnC、os1D、opencv答案:C5、现代的卷积神经网络,常用的模块包括哪些A、多分枝结构B、残差连接C、BatchNormalizationD、Sigmoid激活函数答案:C6、下列算法哪些属于 K-means的变种?A、kNNB、MeanshiftC、k-means++D、以上都不是答案:C7、大数据的最显著特征是()A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高答案:A8、以下关于人工智能系统架构的表述,不正确的是A、人工智能分为应用层、技术层、基础层B、数据处理一般都是在应用层完成C、应用层聚焦人工智能技术和各个领域的结合D、基础层提供计算能力和数据资源答案:B9、护照识别服务的图像数据是不需要用 base64编码的。
A、TRUEB、FALSE答案:B10、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的数字,又称为什么呢?A、给定标签B、离散C、分类D、回归答案:B11、在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力A、贪心策略B、蒙特卡洛采样C、动态规划D、Bellman方程答案:A12、机器学习中,模型需要输入什么来训练自身,预测未知?A、人工程序B、神经网络C、训练算法D、历史数据答案:D13、计算机的运算是计算机的主要性能指标之一,与主要性能无关的是A、字长B、主频C、互联网的宽带D、内存和硬盘的工作速度答案:C14、图像处理一般指数字图像处理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《探索大数据与人工智能》习题库单选1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据B. 非结构化数据C. 半结构化数据D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;A.内存B. 硬盘C. 磁带D. 显卡29、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年?A.1987B. 1997C.2007D. 201731、学习没有标签的数据集的机器学习方法是?A.监督学习B. 无监督学习C. 半监督学习D. 强化学习32、当前世界产生的数据总量的单位是?A.KBB. ZBC. GBD. TB33、下列选项中正确说明价值密度低的是?A.100TB数据中有50TB有效数据B. 1TB数据中有1KB有效数据C.100PB数据中有100PB有效数据D. 10EB数据中有10EB有效数据34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。
A.精灵B. 阿尔法蛋C. 小度D. 移娃35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。
A.AlphaGoB. 深蓝C. 图灵机模型D. 深度学习机器人36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢?A.连接器B. 客户端C. 接口提供者D. 数据采集37、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理38、大数据特征有几种(不包括IBM提出的新特征)?A.1B.2C.3D.439、Hadoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201640、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A.精准广告B.网络管理C.营销洞察D.大数据检测和决策41、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归42、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式43、IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A.更有效B.更大(Volume)C.更充分D.更直观44、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D.单机计算45、Flume采用了三层架构,分别为agent,collector和()A.MapB.storageC.ShuffleD.Hash46、HBASE的特点不包括?A.面向列B.稀疏性C.多版本D.低可靠性47、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D.实时数据变化处理48、最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A.谷歌B. 百度C. 360D. bing49、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。
而哪项技术将继续成为大数据智能分析的核心技术?A.机器学习B. 智能物流C. 脑科学D. 智能终端50、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B. 可以配置数据源C. 不能使用文件系统D. 不能使用目录方式51、HBASE的特点不包括哪些?A.面向行B. 稀疏性C. 多版本D. 高可靠性52、下列选项中,不是用于数据存储的技术是哪一个?A.MongoDBB. MySQLC. HDFSD. Java53、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()A. 高人工智能B. 低人工智能C. 强人工智能D. 弱人工智能54、下列选项中,不是人工智能的基础设施的是?A. CPU服务器B. GPU服务器C. 专用芯片D. 游戏显卡54、以下不是大数据特征的是?A.数据体量大B. 数据种类多C. 价值密度高D. 处理速度快55、以下应用没有使用你的地理位置信息的是?A.美团B. 滴滴C. 高德地图D. word56、下列选项中,不是Flume的特点的是?A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性57、在Spark的软件栈中,用于交互式查询的是A.SparkSQLB. MllibC. GraphXD. Spark Streaming58、下列选项中,不是大数据的一部分的是?A.海量计算B. 大量数据管理C. 数据分析D单机计算59、人工智能、机器学习、深度学习的包含关系是()A.机器学习>深度学习>人工智能B. 人工智能>深度学习>机器学习C.人工智能>机器学习>深度学习D. 深度学习>人工智能>机器学习60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A. 机器性能B. 语言歧义性C. 知识依赖D. 语境61、BP神经网络模型拓扑结构不包括A.输入层B. 隐层C. 输出层D. 显层62、以下哪个不是语音识别的范畴?A.语音听写B. 语音合成C. 语音转写D. 语音唤醒63、Alpha Go是第一个击败人类职业()选手的人工智能程序。
A. 国际象棋B. 围棋C. 中国象棋D. 五子棋64、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B. 开源C. 独立D. 封闭65、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。
A. 海量B. 少数C. 小量D. 结构化66、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume67、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。