智慧树知到《大数据算法》章节测试答案
大数据可视化智慧树知到课后章节答案2023年下浙江大学

大数据可视化智慧树知到课后章节答案2023年下浙江大学第一章测试1.以下不属于可视化的作用的是()A:信息记录 B:数据采集 C:数据分析 D:传播交流答案:数据采集2.数据可视化萌芽于什么时间()A:18世纪 B:17世纪 C:15世纪 D:16世纪答案:16世纪3.可视分析学是何时兴起的()A:19世纪 B:21世纪 C:18世纪 D:20世纪答案:21世纪4.张量场可视化属于可视化的哪个分支学科()A:信息可视化 B:可视分析学 C:科学可视化 D:人机交互学答案:科学可视化5.使用以下哪种可视化工具不需要编程基础()A:Tableau B:Processing C:Vega D:D3.js 答案:Tableau6.数据可视化的原则是细节优先。
A:错 B:对答案:错7.文本可视化属于信息可视化。
A:对 B:错答案:对8.可视分析学涉及到的学科包括()A:计算机图形学 B:数据挖掘C:统计分析 D:人机交互答案:计算机图形学;数据挖掘;统计分析;人机交互9.以下哪些工具是数据可视化工具()A:Matlab B:Tableau C:D3.js D:Vega 答案:Tableau;D3.js ;Vega10.这个视频中体现了可视化的哪些作用()A:数据分析 B:信息记录 C:数据过滤 D:传播交流答案:数据分析;信息记录第二章测试1.有的人在发朋友圈的时候,会把一张图片切成9份,然后再按顺序拼出一个九宫格,如下图所示。
虽然图片被分割开来,但是我们仍旧能够感知到图片原来完整的样子,这体现了格式塔理论的()原则。
A:接近原则 B:相似原则 C:连续原则 D:闭包原则答案:连续原则2.下图所示的图片体现了格式塔理论的()原则。
A:连续原则 B:相似原则 C:接近原则 D:闭包原则答案:接近原则3.下图所示的图片体现了格式塔理论的()接近原则A:接近原则 B:相似原则 C:闭包原则 D:连续原则答案:相似原则4.下图所示的可视化中运用了以下哪个视觉通道?()A:高度 B:形状 C:亮度 D:颜色答案:高度5.下图所示的可视化中体现了哪种类型的视觉通道?()A:分组型B:分类型C:定性型D:定量型答案:分组型6.根据格式塔理论,人们在观看时,眼脑在一开始的时候会先区分一个形象的各个单一的组成部分,然后再将各个部分组合起来,使之成为一个易于理解的统一体。
大数据解析与应用导论知到章节答案智慧树2023年浙江大学

大数据解析与应用导论知到章节测试答案智慧树2023年最新浙江大学第一章测试1.下列属于多元统计方法的为()参考答案:回归分析;主元分析2.多元统计分析的图表示法有()参考答案:散布图矩阵;调和曲线图;轮廓图;雷达图3.完整的数据分析过程,包括数据采集、数据清洗和数据分析。
()参考答案:对4.下列场景适用于回归分析的是 ( )参考答案:天气预报5.下面哪一句体现了主元分析的思想()参考答案:牵牛要牵牛鼻子第二章测试1.一般常见的缺失值处理的方法有()参考答案:回归填充法;最近邻插补填充法;插值填充;替换填充法2.一般常见的数据归一化的方法有()参考答案:最小最大规范化;零均值规范化3.少量的异常值完全不会影响数据分析。
()参考答案:错4.下列哪种方法不是数据填补的手段 ( )参考答案:均值标准化5.主成分分析的英文名是()。
参考答案:Principal Component Analysis第三章测试1.下面哪个是SVM在实际生活中的应用()参考答案:图片分类;邮件分类2.以下说法正确的有哪些()参考答案:SVM是一种线性方法;软间隔的引入可以解决轻度线性不可分问题3.拉格朗日乘子法可用于线性可分SVM的模型求解。
()参考答案:对4.SVM的中文全称叫什么?()参考答案:支持向量机5.SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?()参考答案:大数据集第四章测试1.一元线性回归有哪些基本假定?()参考答案:解释变量X是确定性变量,Y是随机变量;;随机误差项和解释变量X不相关;;随机误差项服从零均值、同方差的正态分布。
;随机误差项具有零均值、同方差和序列不相关的性质;2.最典型的两种拟合不佳的情况是()。
参考答案:欠拟合;过拟合3.岭回归适用于样本很少,但变量很多的回归问题。
()参考答案:对4.最小二乘方法的拟合程度衡量指标是()。
参考答案:残差平方和5.关于最小二乘法,下列说法正确的是。
大数据分析与应用知到章节答案智慧树2023年咸阳职业技术学院

大数据分析与应用知到章节测试答案智慧树2023年最新咸阳职业技术学院第一章测试1.HDFS 已经成为了大数据磁盘存储的事实标准,针对关系型以外的数据模型,开源社区形成了 K-V( key-value)、列式、()、图这四类 NoSQL 数据库体系。
参考答案:文档2.麦肯锡全球研究所对大数据的定义是()。
参考答案:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征3.大数据应用场景不包括()。
参考答案:人群标签,精准营销4.DataWorks是一个提供了大数据OS能力、并以all in one box的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。
同时能满足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。
()参考答案:对5.云原生数据仓库MySQL版(简称ADB,原AnalyticDB for MySQL)是一种高并发低延时的PB级新一代云原生数据仓库,全面兼容MySQL协议以及SQL:2003 语法标准,可以毫秒级针对万亿级数据进行即时的多维分析透视和业务探索。
()参考答案:对第二章测试1.ETL是Extract、 Transform、 Loading三个字母的缩写,即抽取、转换、()。
参考答案:装载2.HBase是一个构建在HDFS上的分布式列存储系统,用于海量结构化、半结构化数据存储。
()参考答案:对3.数据规约:在尽可能保持数据原貌的前提下,最大限度地精简数据量。
主要包括属性选择和数据抽样两种方法。
()参考答案:对4.数据清洗是针对原始数据,对出现的噪声进行修复、平滑或者剔除。
包括异常值、缺失值、重复记录、错误记录等;同时过滤掉不用的数据,包括某些行或某些列。
()参考答案:对5.使用算法确保历史模型能够用户预测特定的结果。
()参考答案:对第三章测试1.SQL集数据查询、数据操纵、数据定义和数据库控制功能于一体,语句ALTER TABLE实现数据定义功能。
大数据分析与可视化智慧树知到答案章节测试2023年山东交通学院

第一章测试1.什么是KDD?()A:文档知识发现B:数据挖掘与知识发现C:领域知识发现D:动态知识发现答案:B2.数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。
()A:对B:错答案:A3.数据挖掘分析的步骤包括()A:创建数据集B:模型评估C:算法分析D:数据预处理答案:ABCD4.当今社会,数据挖掘分析被广泛应用。
()A:对B:错答案:A5.()是未来大数据分析的发展趋势。
A:实时性B:非结构化数据C:简单D:可视化答案:ABD第二章测试1.关于描述统计,包括()。
A:相关分析B:集中趋势分析C:其余选项都不是D:离中趋势分析答案:ABD2.以下属于推断统计的是()。
A:离中趋势分析B:集中趋势分析C:参数估计D:其余选项都不是答案:A3.在数据特征的测度中,描述分布的形状的值为()A:偏态B:峰态C:中位数D:众数答案:AB4.测度集中趋势就是寻找数据水平的代表值或中心值()A:错B:对答案:B5.四分位数可以用于顺序数据、数值数据和分类数据()A:错B:对答案:A第三章测试1.下面哪个属于映射数据到新的空间的方法? ( )A:特征加权B:渐进抽样C:维归约D:傅立叶变换答案:D2.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A:频繁模式挖掘B:分类和预测C:数据预处理D:数据流挖掘答案:C3.影响数据质量问题的因素有哪些()A:可信性、可解释性B:准确性、完整性、一致性C:其余选项都对D:相关性、时效性答案:C4.数据预处理的常见方法有()A:数据集成B:其余选项都不对C:数据清洗D:数据变换答案:ACD5.数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()A:错B:对答案:B第四章测试1.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A:1,2,4,5B:1,2,3,5C:1,2,3,4D:1,3,4,5答案:A2.频繁项集、频繁闭项集、最大频繁项集之间的关系是: ( )A:频繁项集频繁闭项集 =最大频繁项集B:频繁项集 = 频繁闭项集最大频繁项集C:频繁项集 = 频繁闭项集 = 最大频繁项集D:频繁项集频繁闭项集最大频繁项集答案:D3.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A:关联规则发现B:分类C:聚类D:自然语言处理答案:A4.下面购物篮能够提取的3-项集的最大数量是多少()ID 购买项1 牛奶,啤酒,尿布2 面包,黄油,牛奶3 牛奶,尿布,饼干4 面包,黄油,饼干5啤酒,饼干,尿布6 牛奶,尿布,面包,黄油7 面包,黄油,尿布8 啤酒,尿布9 牛奶,尿布,面包,黄油10 啤酒,饼干A:3B:2C:1D:4答案:A5.Apriori算法的计算复杂度受( )影响。
商业大数据分析智慧树知到答案章节测试2023年上海商学院

第一章测试1.数据分析的一般流程是()。
A:数据采集->数据预处理->数据管理->数据分析->数据展示B:数据采集->数据分析->数据处理->数据管理->数据产品C:数据采集->数据展示->数据分析->数据管理->数据报告D:数据采集->数据管理->数据分析->数据预处理->数据可视化答案:A2.与大数据密切相关的技术是()。
A:博弈论B:云计算C:WiFiD:蓝牙答案:B3.交通大数据的信息种类包括出行者、位置、车辆、交通流、气象、舆情、活动、用地。
()A:错B:对答案:B4.现在的自动驾驶系统最高可以达到()级别。
A:L1B:L2C:L4D:全自动E:L3答案:C数据是作为信息的重要来源, 信息经过加工转化为知识。
()A:错B:对答案:B第二章测试1.下列属于分布式并行计算框架的是()A:YARNB:HDFSC:MapReduceD:Spark答案:CD2.HDFS集群中至少有3个数据节点, 即DataNode。
()A:对B:错答案:A3.每个HDFS集群有且仅有一个主节点, 即NameNode。
()A:错B:对答案:B4.Harmony是一种移动设备操作系统。
()A:对B:错答案:A5.微信小程序开发提供的是一种()云服务模式。
A:PaaSB:IaaSC:SaaS答案:A第三章测试1.指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串称为()。
A:语法B:正则表达式C:通配符D:字符集答案:B2.图像是以数字()形式存储在计算机中的, 其中每一个数字表示一个像素。
A:向量B:矩阵C:张量D:标量答案:B3.智能健康手环的应用开发, 体现了()的数据采集技术的应用。
A:网络爬虫B:统计报表C:传感器D:API接口答案:C4.在网络爬虫的爬行策略中, 应用最为基础的是()。
A:反向链接策略B:广度优先遍历策略C:大站优先策略D:深度优先遍历策略E:高度优先遍历策略答案:BD5.等级型和数值型数据可以排序和比较大小。
大数据分析及应用智慧树知到答案章节测试2023年云南大学

第一章测试1.大数据的英文描述是()A:Big dataB:Large dataC:Great dataD:Heavy data答案:A2.下面最大的储存单位是()A:TBB:KBC:PBD:GB答案:C3.大数据之父是()A:维克托·迈尔-舍恩伯格B:姚期智C:查尔斯·巴赫曼D:詹姆斯·高斯林答案:A4.大数据的特点包括()A:ValueB:VarietyC:VelocityD:Volume答案:ABCD5.第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是()和()A:ScienceB:PNASC:NatureD:Cell答案:AC6.大数据是只和互联网相关的计算机技术。
A:错B:对答案:A7.企业中大部分的数据都是非结构化数据。
A:对B:错答案:A8.大数据技术的基础是由阿里巴巴首先提出的。
A:错B:对答案:A9.大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。
A:对B:错答案:A10.大数据对网络安全没有威胁。
A:错B:对答案:A第二章测试1.目前,企业的数据架构存在的最大比例问题是()A:运营成本高B:高耗能C:拓展性差D:资源利用率低答案:C2.目前,企业数据分析处理面临的主要问题是缺少数据全方位分析方法。
A:错B:对答案:B3.地图导航根据以往的行程记录,绘制了最优路程,标明了可能堵车的地点,这表现了大数据分析理念中的()A:注重相关性而不是因果性B:注重效率而不是准确C:注重相对性而不是绝对性D:注重全体而不是局部答案:A4.最早提出大数据研发计划的国家是()A:日本B:美国C:中国D:法国答案:B5.大数据可能被运用的行业有()A:医疗B:农业C:金融D:教育答案:ABCD6.2015年9月18日云南省启动我国首个大数据综合试验区的建设工作。
A:对B:错答案:B7.大数据的价值密度很高。
A:对B:错答案:B8.日本政府将IT产业,尤其是大数据及云计算作为促进经济增长,解决内部矛盾一个关键。
大数据导论智慧树知到答案2024年商丘工学院

大数据导论商丘工学院智慧树知到答案2024年第一章测试1.大数据的前沿技术是()。
A:数据定义B:数据结构.C:数据处理D:数据分析答案:D2.大数据赖以生存的土壤是()。
A:互联网B:前沿技术C:物联网D:网络信息答案:A3.第三次信息化浪潮的标志是哪些技术的兴起?( )A:云计算B:大数据C:个人计算机D:物联网答案:ABD4.以下是大数据存储面临的挑战的选项是( )。
A:数据问题B:管理问题C:应用问题D:系统问题答案:BCD5.信息科技为大数据时代提供哪些技术支撑?( )A:网络带宽不断增加B:CPU 处理能力大幅提升C:存储设备容量不断增加D:数据量不断增大答案:ABC6.大数据产业指的是什么()。
A:一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合B:提供分布式计算、数据挖掘、统计分析等服务的各类企业C:提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业D:提供数据分享平台、数据分析平台、数据租售平台等服务的企业答案:A7.万维网之父是 ( )。
A:蒂姆●伯纳斯-李B:彼得●德鲁克C:舍恩伯格D:斯科特布朗答案:A8.以下哪一项不属于大数据的特征()。
A:数据价值密度高B:单位处理数据的速度高C:数据类型复杂D:数据量大答案:A9.大数据存储的特点与挑战有( )。
A:成本问题B:容量问题C:安全问题D:延迟问题答案:ABCD10.大数据可以帮助发现规律,大数据可以帮助解释现象,大数据可以帮助预测未来。
()A:对 B:错答案:A第二章测试1.大数据的最显著特征是( )。
A:数据类型多样B:数据价值密度高C:数据处理速度快D:数据规模大答案:D2.下列不属于 Google云计算平台技术架构的是()。
A:结构化数据表 BigTableB:分布式锁 ChubbyC:并行数据处理 MapReduceD:弹性云计算 EC2答案:D3.物联网的全球发展形势可能提前推动人类进入“智能时代”,也称()。
智慧树答案大数据处理和分析知到课后答案章节测试2022年

第一章1.大数据分析的最终目的是()答案:通过数据分析来挖掘数据背后的价值2.数据采集的方式包括()答案:主动数据采集;网络下载数据;购买数据3.Wireshark是手机数据的采集软件()答案:对4.手机和手机APP是同时连通网络的()答案:错5.360随身WIFI的目的是()答案:构造局域网,从而让手机连通电脑6.对于电脑+手机+360WIFI而言,它们之间存在的网络包括()答案:360WIFI构成的无线网络;笔记本电脑连接的Internet网络;手机的4G网络7.手机APP的联网效率是指手机联上网络的时间T1和手机APP联上网络的时间T2之差()答案:对8.在上一题中,T1-T2的值越小时,手机APP的联网效率越高。
()答案:错9.开始手机数据收集之前,需要先关闭手机的3G或者4G网络,仅让手机连接360WIFI的网络()答案:对10.在手机断开WIFI之后,手机APP会()答案:立即断开网络第二章1.打开Wireshark软件,可以从主界面的【Open】选项打开*.CSV文件()答案:错2.分析手机APP的联网效率需要用到()答案:ICMPV6协议;IP协议;TCP协议3.双击【我的电脑】,可以查看计算机中的IP地址()答案:错4.打开手机的设置,可以查看到手机的IP地址答案:对5.Wireshark能够记录手机的IP地址并在目标地址位置显示出来()答案:错6.三次握手协议是属于()答案:TCP协议7.TCP协议中的FIN表示建立连接答案:错8.手机APP连接网络时用到()协议答案:三次握手协议9.手机连接网络是用到()协议答案:ICMPv610.手机数据捕获软件是()答案:Wireshark第三章1.在实验中是手机最先连接到网络()答案:错2.手机联网时间可以通过查找三次握手协议获得答案:错3.手机APP联网时间可以通过查找三次握手协议获得答案:错4.当ICMPv6的type为()时,手机连通了网络答案:1365.当TCP的flag为()时,表示手机APP连通了网络答案:06.80端口是TCP协议中加密传输需要用到的端口()答案:错7.TCP协议中非加密传输需要用到的端口()答案:808.大数据分析的一般方法是先对海量数据进行分析,再约减数据答案:错9.手机端的自动数据采集需要()软件答案:Wireshark;Excel10.Wireshark软件能够进行脚本录制()答案:错第四章1.在查找字符串中是否包含字符AB或BA,则应该构造正则表达式()答案:AB|BA2.下列哪个正则表达式能够表示0个或多个空格()答案:\s+3.要匹配A1、A2、A3、…、A9,则需要构造正则表达式( )答案:A[1-9]4.要匹配A0、A12、A123、…、A119,则需要构造正则表达式( )答案:A[1-9]5.正则表达式中符号|的意思是()答案:管道符6.Excel支持通配符查询()答案:对7.Excel中的筛选功能能够约减数据集()答案:错8.Excel中能选出满足条件的所有选项,不论这些选项是否是在同一列中。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.大数据算法的()特点,使其与大数据算法密切相关的。答案:速度快数据量大 A、数据量大 B、基于高度分析的新价值 C、速度快 D、多样性、复杂性 4.为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技 术会涉及到时间亚线性算法。× 1.5 1.大数据算法涉及到外存的时候,通常要分析()。答案:IO 复杂性 A、时间空间复杂性 B、IO 复杂性 C、结果质量 D、通讯复杂性 2.下列选项中,属于智能仿生算法的是()。答案:遗传算法模拟退火算法 A、遗传算法 B、近似算法 C、模拟退火算法 D、数据流算法 3.在线算法/数据流算法是面向大数据速度快的特点提出的。()√ 4.对于数据流算法或在线算法,经常要分析结果的近似比。()× 5.随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。 ()√ 2.1
()√ 4.在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差 的最多值时,可以得到频繁项一个好的估计。√ 3.3 1. 时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。答 案:权重 A、近似值 B、精确值 C、权重 D、界限 2.求最小生成树是一个贪心法,可以用()算法来解决。答案:Prime A、Prime B、并行 C、MG D、内存 3.对联通分量个数的估计可以利用随机化方法。√ 3.4 1. 对于输入 n 个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。远离意味 着必须删除大于()个元素才能保证剩下的元素有序。答案:n A、-n B、n C、/n
D、(1-)-近似 2.利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。 答案:二分之一 A、二分之一 B、三分之一 C、四分之一 D、十分之一 3.采用平面图的直径近似算法的动机是无法在要求的时间内得到()。答案:精确 解 A、相似解 B、完整解 C、精确解 D、近似解 4.在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在 i、j、k 三个点中,i 到 j 的距离加上 j 到 k 的距离小于 i 到 k 的距离。× 5.近似算法能给出一个优化问题的优化解。× 6.RatioBound 越大,则近似解越坏。()√ 2.4 1. 在判定问题的近似中,对于近似解需要区分的是()。答案:差得很远是 A、是 B、否 C、差不离 D、差得很远
2.全 0 数组判定的近似算法的证据引理是:如果一次测试以大于等于 p 的概率获 得一个证据,那么 s=2/p 轮测试得到证据的概率大于等于 1/2。× 3.判定问题的近似解是指:输入满足某种性质或近似满足某种性质。× 3.1 1. Zipf 原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。()× 2.在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等, 且处理这些函数时通常使用单个寄存器 s。()√ 3.数据流模型中,数据流是指来自某个域中的元素序列。()√ 4.在数据流模型中,内存远远大于数据的规模。()× 3.2 1. 频繁元素计算算法又称为()算法。答案:MG A、MM B、MG C、GM D、MP 2.频繁元素计算算法有效的原因是源于()。答案:Zipf 原则 A、取近似解 B、证据引理 C、错误界限和 k 成反比 D、Zipf 原则 3.在频繁元素计算算法中,计数器 x 减少的次数依赖于有几个减少计数定定义。× 6.大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()√ 1.2 1. 大数据求解计算问题过程的第三步一般是()。答案:算法设计与分析 A、判断可计算否 B、判断能行可计算否 C、算法设计与分析 D、用计算机语言实现算法 2.在大数据求解计算问题中,判断是否为能行可计算的因素包括()。答案:资源约 束数据量时间约束 A、数据量 B、资源约束 C、速度约束 D、时间约束 3.大数据求解计算问题过程的第一步是确定该问题是否可计算。√ 4.大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。√ 1.3 1.资源约束包括()。答案:网络带宽外存 CPU 内存 A、CPU B、网络带宽 C、内存 D、外存
2.大数据算法可以不是()。答案:精确算法串行算法内存算法 A、云计算 B、精确算法 C、内存算法 D、串行算法 3.大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生 成满足给定约束结果的算法。× 4.MapReduce 是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。 √ 5.大数据算法是仅在电子计算机上运行的算法。× 1.4 1. 众包算法是用来解决()。答案:计算机计算能力不足或知识不足,需要人来帮忙 A、访问全部数据时间过长 B、数据难于放入内存计算 C、单个计算机难以保存全部数据,计算需要整体数据 D、计算机计算能力不足或知识不足,需要人来帮忙 2.大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案 是()。答案:读取部分数据 A、将数据存储到磁盘上 B、仅基于少量数据进行计算 C、读取部分数据 D、并行处理
1.计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下, 进行精确计算最少需要访问()个顶点。答案:n-1 A、n B、n+1 C、2n D、n-1 2.亚线性是指()等的消耗是输入规模 o。()答案:空间通讯时间 IO A、时间 B、空间 C、IO D、通讯 3.性质检测算法属于亚线性空间算法的一类。()× 2.2 1. 在经典的水库抽样中,要求空间复杂性为 O(k),是指与抽样大小有关,而与整个数 据的数据量无关。√ 2.水库抽样算法的采样是均匀的。√ 2.3 1. 以下()不是衡量分析近似解代价与优化解代价差距的方法。答案:绝对误差 A、RatioBound B、相对误差 C、绝对误差
智慧树知到《大数据算法》章节测试答案 1.1 1.以下关于大数据的特点,叙述错误的是()。答案:速度慢 A、速度慢 B、多元、异构 C、数据规模大 D、基于高度分析的新价值 2.在《法华经》中,“那由他”描写的“大”的数量级是()。答案:10^28 A、10^7 B、10^14 C、10^28 D、10^56 3.以下选项中,大数据涉及的领域中包括()。答案:社交网络计算机艺术医疗数据 A、社交网络 B、医疗数据 C、计算机艺术 D、医疗数据 4.大数据的应用包括()。答案:推荐科学研究预测商业情报分析 A、预测 B、推荐 C、商业情报分析 D、科学研究