《探索大数据与人工智能》题库
人工智能基础(习题卷16)

人工智能基础(习题卷16)第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]光电池属于光生福特效应,光敏二极管属于( )。
A)外光电效应B)内光电效应C)光生伏特效应答案:B解析:2.[单选题]20世纪年代,围绕可计算这一重要思想,一些模型被提出。
下述哪个模型不是于这个时期在可计算思想推动下产生的()A)原始递归函数B)Iambda演算C)图灵机D)冯诺依曼模型答案:D解析:3.[单选题]探究数据科学的流程是()。
A)采集、探索、加工、验证、建模、报告B)采集、探索、加工、建模、验证、报告C)探索、采集、加工、验证、建模、报告D)探索、采集、加工、建模、验证、报告答案:B解析:4.[单选题]机器人视觉系统主要由软件和硬件两部分组成,硬件方面主要有( )。
①视觉传感器(组)②图像采集卡③计算机(主处理机)④机器人及其附属的通信和控制模块A)①②③B)①②③④C)②③④D)①②答案:A解析:5.[单选题]在著名管理学家Th。
mas - H.Davemp。
rt在《哈佛商业论坛》上发表的题为《第三代 分析学(Analytics3.0 )》的经典论文中,Analytics3.0时代是指()。
A)商务智能时代B)大数据时代C)数据富足供给时代D)数据智能时代答案:C解析:Analytics3.0 的名称为数据富足供给时代(Data-enriched 。
fferings )。
与 Analytics2.0 不同的是,Analytics3.0中数据分析更为专业化,从技术实现和常用工具角度看,Analytics3.0将 采用更为专业的分析工具,而不再直接采用Hadoop、Spark、N。
SQL等大数据分析技术。
同 时,数据分析工作也由专业从事数据分析的数据科学家 首席分析师完成,数据科学家的类 型将得到进一步细化。
6.[单选题]衡量计算机程序代码的质量,下列哪一个最重要?A)代码工整B)逻辑正确C)结构清晰D)代码简洁答案:B解析:7.[单选题]()采用多种乐器的音频数据,可融合多种国家、乐曲风格和乐器音色的特征,创作音乐作品。
人工智能专题形考1-4

一、判断题1.机器学习的目的是通过数据掌握事物的规律性。
判断题(2 分) 2分A.对B.错2.首次通过图灵测试的人工智能软件是聊天程序尤金·古斯特曼”(Eugene Goostman)。
判断题(2 分) 2分A.对B.错3.1965年,美国MIT人工智能实验室的Roberts编制了多面体识别程序,开创了计算机视觉的新领域。
判断题(2 分) 2分A.对B.错4.智能agent是一个会感知环境并作出行动以达到目标的系统。
判断题(2 分) 2分A.对B.错5.超级智能时代是机器智能与移动互联网的深度结合。
判断题(2 分) 2分A.对B.错二、选择题6.()年在美国Dartmouth大学召开的第一次人工智能研讨会被认为是人工智能科学正式诞生的标志。
单选题(2 分) 2分A.1950B.1955C.1956D.19657.第二代移动互联网的操作系统是()?单选题(2 分) 2分A.Inter X86B.ARMC.WindowsD.Android8.机器智能的核心技术主要包括()。
①数据搜集②数据存储③数据表示④数据挖掘和使用单选题(2 分) 2分A.①②③B.①②④C.②③④D.①②③④9.机器智能的标准于()年提出。
单选题(2 分) 2分A.1950年B.1956年C.1970年D.2000年10.“他既可能成为人类迄今发生过的最好的事,也可能成为最糟糕的事。
”是()对人工智能的评价?单选题(2 分) 2分A.霍金B.费根鲍姆C.赫伯特·西蒙D.乔布斯形考任务二一、判断题1.人工智能利用遗传算法在求解优化问题时,会把问题的解用“0”和“1”表示。
0,1就是就是“遗传基因”,01组成的字符串,称为一个染色体或个体。
判断题(2 分) 2分A.对B.错2.P(A∣B)代表事件A发生的条件下事件B发生的概率。
判断题(2 分) 2分A.对B.错3.状态空间图是对一个问题的表示,通过问题表示,人们可以探索和分析通往解的可能的可替代路径。
2019年人工智能考试参考答案

1.信息化社会的显著特征是计算机、互联网、物联网技术发展,人工智能技术进步。
正确错误2.智慧社区指标体系涉及保障体系、基础设施与建筑结构、社区治理与公共服务、市场管理、便民服务和主题社区等六个领域。
正确错误3.智慧社区信息服务平台的作用比较全面,为生活带来更多便利。
正确错误4.由服务业主导向工业主导转型是发展智慧养老的原因之一。
正确错误5.从老龄研究的角度,智慧养老能够解决根本性的问题。
正确错误6.目前在我国,收集到的老年人在生活自理能力服务需求方面的数据,都是掌握在不同的部门手里,没有能够实现数据的共享,信息孤岛的情况严重。
正确错误7.智慧养老绩效评估的建立可以有效地提高老年人在获取服务方面的便利性和准确性。
正确错误8.根据《大数据在医疗领域的应用》,当今时代信息技术进一步推动了经济的增长和社会的发展,推动了知识传播应用进程的变化。
正确错误9.当前社会中,最为突出的大数据环境是物联网。
正确错误10.大数据等于传统的数据库建设、传统的普查、数据中心建设、云计算建设。
正确错误11.“互联网+”行动将重点促进以移动互联网、云计算、物联网、大数据等与现代制造业相结合。
正确错误12.沃尔玛的尿布啤酒效应体现了大数据时代的关联性。
正确错误13.以大数据来促进我们健康管理的个性化和多元化。
正确错误14.医疗大数据主要来源于制药企业、临床数据、社保基金利用率和患者的数据。
正确错误年9月,德国通过“自动与互联汽车”国家战略。
正确错误16.我国目前已经明确了隐私内容条目。
正确错误17.在中国,人工智能已被纳入国家科研计划。
正确错误18.从国家内部来看,人工智能通过优化自动化的方式能够提升社会运行效率。
正确错误19.当前,新一轮科技革命与产业变革正在萌发,为了抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,2017年7月8日国务院出台了《新一代创新科技发展规划》,为推动我国人工智能的长期发展指明了方向。
人工智能之知识库(一)2024

人工智能之知识库(一)引言概述:人工智能的发展已经带来了许多重大突破,其中之一就是知识库的建立。
知识库是人工智能系统中的重要组成部分,它存储了各种领域的知识和经验,并为系统提供学习和推理的基础。
本文将重点介绍人工智能中知识库的概念、构建和应用。
正文:一、知识库的概念和作用知识库是指一个系统性地组织、存储和管理的知识集合。
它包含了丰富的领域知识和经验,可以为人工智能系统提供学习和推理的基础。
知识库在人工智能领域中扮演着重要的角色,它可以通过机器学习和自然语言处理技术,使计算机能够理解和应用这些知识。
小点:1. 知识库的基本结构和组成部分。
2. 知识库的优势和局限性。
3. 知识库与其他人工智能技术的关系。
4. 知识库的分类和应用领域。
5. 知识库的发展动态和趋势。
二、知识库的构建方法知识库的构建是一个复杂的过程,需要经过知识抽取、推理和验证等环节。
在知识抽取阶段,可以采用自动化技术从大量的文本数据中提取知识。
在推理和验证阶段,可以利用逻辑推理、机器学习和统计分析等方法对知识进行验证和优化。
1. 知识抽取的方法和技术。
2. 知识推理和验证的方法和技术。
3. 知识库的知识表示和表示语言。
4. 知识库的维护和更新策略。
5. 知识库构建中的挑战和解决方案。
三、知识库的应用领域知识库在各个领域都有广泛的应用,并对现实生活和工业生产等领域产生了巨大的影响。
例如,在医疗领域中,知识库可以帮助医生进行诊断和治疗,提高医疗水平。
在智能交通领域中,知识库可以为自动驾驶汽车提供交通规则和道路信息,提高行车安全性。
小点:1. 医疗领域中的知识库应用。
2. 金融领域中的知识库应用。
3. 教育领域中的知识库应用。
4. 智能交通领域中的知识库应用。
5. 其他领域中的知识库应用案例分析。
四、知识库的挑战和发展趋势尽管知识库在人工智能领域中发挥着重要作用,但它面临着一些挑战。
例如,如何保证知识的准确性和完整性,如何进行知识的更新和维护等。
人工智能基础(习题卷62)

人工智能基础(习题卷62)第1部分:单项选择题,共50题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]以下说话正确的是()A)一个机器学习模型如果有较高准确率,总是说明这个分类器是好的B)如果增加模型复杂度,那么模型的测试错误率不一定会降低C)如果增加模型复杂度,那么模型的训练错误率总是会降低答案:C解析:一个机器学习模型如果有较高准确率,不能说明这个分类器是好的。
对于不平 衡的数据集进行预测时,正确率不能反映模型的性能。
模型越复杂,在训练集上越容易表现 好,在测试集上越容易表现不好。
2.[单选题]关于卷积层的说法,错误的是()A)卷积核的尺寸是由人为指定的B)卷积核的参数值是人为指定的C)卷积层可以作为神经网络的隐藏层D)特征图是为卷积层的最终输出答案:B解析:3.[单选题]有两个样本点,第一个点为正样本,它的特征向量是(0, -1);第二个点为负样本,它的特征向量是(2, 3),从这两个样本点组成的训练集构建一个线性SVM 分类器的分类面方程是()。
A)2x+_y=4B)x+2y=5C)x+2y=3D)2x-y=0答案:C解析:对于两个点来说,最大间隔就是垂直平分线,因此求出垂直平分线即可。
斜率是 两点连线的斜率的负倒数。
即-1/ (-1-3)/(0-2)=-1/2,可得戶-(l/2)x + C.过中点(0+2) /2, (-1+3)/2)= (1, 1),可得 c=3/2,故方程为 x+2戶3。
4.[单选题]在具体求解中,能够利用与该问题有关的信息来简化搜索过程,称此类信息为( )A)启发信息B)简化信息C)搜索信息D)求解信息答案:A解析:5.[单选题]下列哪个不是RPA实施回报率的评估因素?()A)成本节省B)生产力提升C)质量改进D)劳动力需求有规律答案:DA)人机交互系统B)机器人-环境交互系统C)驱动系统D)控制系统答案:A解析:7.[单选题]下面不属于人工智能研究基本内容的是()A)机器感知B)机器思维C)机器学习D)自动化答案:D解析:8.[单选题]大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()A)新一代技术平台B)新一代信息技术和服务业态C)新一代服务业态D)新一代信息技术答案:B解析:9.[单选题]梯度下降算法中,损失函数曲面上轨迹最混乱的算法是以下哪种算法?A)SGDB)BGDC)MGDD)MBGD答案:A解析:10.[单选题]当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?()A)分类B)聚类C)关联分析D)隐马尔可夫链答案:B解析:11.[单选题]线性判别分析常被视为一种经典的()技术。
人工智能基础(习题卷8)

人工智能基础(习题卷8)第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]关于神经网络的说法中,正确的是()A)增加网络层数,总能减小训练集错误率B)减小网络层数,总能减小测试集错误率C)增加网络层数,可能增加测试集错误率答案:C解析:2.[单选题]以下算法中,不属于分类预测的典型算法的是( )A)Logistic回归B)决策树C)K-means算法D)神经网络答案:C解析:3.[单选题]下列算法中:①KNN;②线性回归;③对数几率回归,可以用神经网络去构造的().A)①②B)②③C)①②③D)以上答案都不正确答案:B解析:KNN算法不需要训练参数,而所有神经网络都需要训练参数,因此神经网络帮 不上忙。
最简单的神经网络--感知器,其实就是线性回归的训练。
我们可以用一层的神经 网络构造对数几率回归。
4.[单选题]通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。
该翻译方式是( )A)知识库式翻译系统B)统计式翻译系统C)范例式翻译系统D)直译式翻译系统答案:B解析:5.[单选题]在回归分析中,说法正确的是( )。
A)解释变量和被解释变量都是随机变量B)解释变量为非随机变量,被解释变量为随机变量C)解释变量和被解释变量都为非随机变量D)解释变量为随机变量,被解释变量为非随机变量答案:B解析:在回归分析中,解释变量可以理解为自变量,具有确定性,因此为非随机变量; 被解释变量可以理解为因变量,具有随机性,因此为随机变量。
6.[单选题]DSSM经典模型的缺点:1.Wordhashing可能造成词语冲突;2.采用词袋模型,损失了上下文语序信息;3.搜索引擎的排序由多种因素决定,用户点击时doc排名越靠前越容易被点击,仅用点击来判断正负样本,产生的噪声较大,模型难以收敛;4.效果不可控。
C)2.3.4D)1.2.3.4答案:D解析:DSSM经典模型的缺点:1.Wordhashing可能造成词语冲突;2.采用词袋模型,损失了上下文语序信息;3.搜索引擎的排序由多种因素决定,用户点击时doc排名越靠前越容易被点击,仅用点击来判断正负样本,产生的噪声较大,模型难以收敛;4.效果不可控。
人工智能基础(习题卷1)

人工智能基础(习题卷1)第1部分:单项选择题,共53题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]声明1:可以通过将所有权重初始化为0来训练网络。
声明2:可以通过将偏差初始化为0来很好地训练网络以上哪些陈述是真实的?A、1对2错A)1错2对B)1和2都对C)1和2都错答案:B解析:2.[单选题]下列哪个函数可以组合估计器?A)RepeatedKFoldB)KFoldC)LeaveOneOutD)make_pipeline答案:D解析:3.[单选题]输入图像已被转换为大小为28×28的矩阵和大小为7×7的步幅为1的核心/滤波器。
卷积矩阵的大小是多少?A)22X22B)21X21C)28X28D)7X7答案:A解析:4.[单选题]人工神经网络的相关研究最早可以追溯到上世纪40年代,由心理学家麦卡洛克和数学逻辑学家皮茨提出的( )。
A)M-P神经元模型B)B-P神经元模型C)M-N神经元模型D)N-P神经元模型答案:A解析:5.[单选题]要在某一台机器上为某种语言构造一个编译程序,必须掌握哪些内容()A)汇编语言、高级语言、编译方法B)程序设计方法、测试方法、编译方法C)源语言、目标语言、编译方法D)高级语言、程序设计方法、机器语言答案:C解析:C)奇异点阈值D)点云分辨率答案:A解析:7.[单选题]Hadoop生态系统中,HBase是一种()。
A)分布式文件系统B)数据仓库C)实时分布式数据库D)分布式计算系统答案:C解析:HBase是一个面向列的实时分布式数据库。
8.[单选题]人工神经元网络与深度学习的关系是A)人工神经元网络是深度学习的前身B)深度学习是人工神经元网络的一个分支C)深度学习是人工神经元网络的一个发展D)深度学习与人工神经元网络无关答案:C解析:深度学习是实现机器学习的一种技术,现在所说的深度学习大部分都是指神经网络9.[单选题]在编制自动化需求时,实践证明采用()时最有效的方式A)流程图B)视频说明C)电子表格D)流程图加视频说明答案:D解析:10.[单选题]关于用4V来表示大数据的主要特征,描述错误的是A)大数据的时间分布往往不均匀,近几年生成数据的占比最高B)“如何从海量数据中洞见(洞察)出有价值的数据”是数据科学的重要课题之一C)数据类型的多样性往往导致数据的异构性,进而加大数据处理的复杂性,对数据处理能力提出了更高要求D)数据价值与数据量之间存在线性关系答案:D解析:11.[单选题]常用的的灰度内插法不包括()。
人工智能应用技术练习题库(含参考答案)

人工智能应用技术练习题库(含参考答案)1、以下 CNN网络模型中,最早用于手写数字识别的是A、LeNet-5B、AlexNetC、ResNet50D、ResNet152答案:A2、以下关于机器学习说法错误的是A、机器学习可以解决图像识别问题B、目前机器学习已经可以代替人类C、机器学习在一定程度上依赖于统计学习D、监督学习和非监督学习都属于机器学习答案:B3、华为昇腾 AI芯片是 NPU(神经网络处理器)的典型代表之一。
A、TRUEB、FALSE答案:A4、下列哪些包不是图像处理时常用的A、timeB、sklearnC、os1D、opencv答案:C5、现代的卷积神经网络,常用的模块包括哪些A、多分枝结构B、残差连接C、BatchNormalizationD、Sigmoid激活函数答案:C6、下列算法哪些属于 K-means的变种?A、kNNB、MeanshiftC、k-means++D、以上都不是答案:C7、大数据的最显著特征是()A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高答案:A8、以下关于人工智能系统架构的表述,不正确的是A、人工智能分为应用层、技术层、基础层B、数据处理一般都是在应用层完成C、应用层聚焦人工智能技术和各个领域的结合D、基础层提供计算能力和数据资源答案:B9、护照识别服务的图像数据是不需要用 base64编码的。
A、TRUEB、FALSE答案:B10、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的数字,又称为什么呢?A、给定标签B、离散C、分类D、回归答案:B11、在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力A、贪心策略B、蒙特卡洛采样C、动态规划D、Bellman方程答案:A12、机器学习中,模型需要输入什么来训练自身,预测未知?A、人工程序B、神经网络C、训练算法D、历史数据答案:D13、计算机的运算是计算机的主要性能指标之一,与主要性能无关的是A、字长B、主频C、互联网的宽带D、内存和硬盘的工作速度答案:C14、图像处理一般指数字图像处理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《探索大数据与人工智能》习题库一、单选题1、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume2、下列选项中,不是大数据发展趋势的是?A. 大数据分析的革命性方法出现B. 大数据与与云计算将深度融合C. 大数据一体机将陆续发布D. 大数据未来可能会被淘汰3、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity 》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔·恩门B. 麦肯锡C. 扎克伯格D. 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A.精准广告B. 网络管理C. 网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A.数据商业化B. 物流网络C. 企业运营D. 客户关系管理6、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官B. 首席科学家C. 首席执行官D. 首席架构师7、下列选项中,不是kafka适合的应用场景是?A.日志收集B. 消息系统C. 业务系统D.流式处理8、下列选项中,哪个不是HBASE的特点?A.面向行B. 多版本C. 扩展性D. 稀疏性9、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A.数量越多处理时间越长B. 数量越多处理时间越短B.数量越小处理时间越短 D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.Spark StreamingB. MllibC. GraphXD.SparkSQL11、Spark是在哪一年开源的?A.1980B. 2010C. 1990D. 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据 B. 非结构化数据 C. 半结构化数据 D. 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B. 语言歧义性C. 知识依赖D. 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪种学习方法不属于人工智能算法?A.迁移学习B. 对抗学习C. 强化学习D.自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B. 表结构C. 结果D. 报表17、总体来说,人工智能发展的未来趋势是?A.上升B. 下降C. 不动D. 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNETC. 移娃D.大云19、以下数据单位从小到大排列的顺序是?A.GB、B、KBB. B、KB、MBC. KB、ZB、PBD.B、MB、KB20、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC. 1TB=1000GBD. 1MB=1024KB21、以下不是非结构化数据的项是?A.图片B. 音频C. 数据库二维表数据D. 视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB. HashC. CleanD. Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB. BIC. ALD. AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A.KafkaB. TensorflowC. CaffeD.Torch25、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C. 梯度提升法D. 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B. 语音播放C. 语音识别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB. SparkC. PigD.MapReduce28、Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。
需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;A.内存B. 硬盘C. 磁带D. 显卡29、下列选项中,哪项是分布式文件存储系统?A.HDFSB. FlumeC. KafkaD. Zookeeper30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年?A.1987B. 1997C.2007D. 201731、学习没有标签的数据集的机器学习方法是?A.监督学习B. 无监督学习C. 半监督学习D. 强化学习32、当前世界产生的数据总量的单位是?A.KBB. ZBC. GBD. TB33、下列选项中正确说明价值密度低的是?A.100TB数据中有50TB有效数据B. 1TB数据中有1KB有效数据C.100PB数据中有100PB有效数据D. 10EB数据中有10EB有效数据34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。
A.精灵B. 阿尔法蛋C. 小度D. 移娃35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。
A.AlphaGoB. 深蓝C. 图灵机模型D. 深度学习机器人36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢?A.连接器B. 客户端C. 接口提供者D. 数据采集37、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D. 实时数据变化处理38、大数据特征有几种(不包括IBM提出的新特征)?A.1B.2C.3D.439、Hadoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201640、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A.精准广告B.网络管理C.营销洞察D.大数据检测和决策41、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。
请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归42、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式43、IBM提出的大数据5V特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A.更有效B.更大(Volume)C.更充分D.更直观44、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D.单机计算45、Flume采用了三层架构,分别为agent,collector和()A.MapB.storageC.ShuffleD.Hash46、HBASE的特点不包括?A.面向列B.稀疏性C.多版本D.低可靠性47、mapreduce计算模型适用于哪种任务?A.多线程处理B. 有关联的行处理C. 批处理D.实时数据变化处理48、最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商? A.谷歌 B. 百度 C. 360 D. bing49、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。
而哪项技术将继续成为大数据智能分析的核心技术?A.机器学习B. 智能物流C. 脑科学D. 智能终端50、下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B. 可以配置数据源C. 不能使用文件系统D. 不能使用目录方式51、HBASE的特点不包括哪些?A.面向行B. 稀疏性C. 多版本D. 高可靠性52、下列选项中,不是用于数据存储的技术是哪一个?A.MongoDBB. MySQLC. HDFSD. Java53、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()A. 高人工智能B. 低人工智能C. 强人工智能D. 弱人工智能54、下列选项中,不是人工智能的基础设施的是?A. CPU服务器B. GPU服务器C. 专用芯片D. 游戏显卡54、以下不是大数据特征的是?A.数据体量大B. 数据种类多C. 价值密度高D. 处理速度快55、以下应用没有使用你的地理位置信息的是?A.美团B. 滴滴C. 高德地图D. word56、下列选项中,不是Flume的特点的是?A. 可靠性B. 集中式架构C. 可扩展性D. 可管理性57、在Spark的软件栈中,用于交互式查询的是A.SparkSQLB. MllibC. GraphXD. Spark Streaming58、下列选项中,不是大数据的一部分的是?A.海量计算B. 大量数据管理C. 数据分析 D单机计算59、人工智能、机器学习、深度学习的包含关系是()A.机器学习>深度学习>人工智能B. 人工智能>深度学习>机器学习C.人工智能>机器学习>深度学习D. 深度学习>人工智能>机器学习60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A. 机器性能B. 语言歧义性C. 知识依赖D. 语境61、BP神经网络模型拓扑结构不包括A.输入层B. 隐层C. 输出层D. 显层62、以下哪个不是语音识别的范畴?A.语音听写B. 语音合成C. 语音转写D. 语音唤醒63、Alpha Go是第一个击败人类职业()选手的人工智能程序。
A. 国际象棋B. 围棋C. 中国象棋D. 五子棋64、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B. 开源C. 独立D. 封闭65、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。
A. 海量B. 少数C. 小量D. 结构化66、Spark Streaming是什么软件栈中的流计算?A. SparkB. StormC. HiveD. Flume67、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。