大数据算法2019尔雅答案
大数据算法与模型考试 选择题 60题

1. 在大数据处理中,MapReduce是一种常用的计算模型,它主要由哪两个阶段组成?A. Map和FilterB. Reduce和SortC. Map和ReduceD. Filter和Reduce2. 下列哪个不是大数据的5V特征之一?A. VolumeB. VelocityC. VarietyD. Visibility3. 在数据挖掘中,K-means算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法4. 下列哪个工具不是用于大数据处理的?A. HadoopB. SparkC. ExcelD. Hive5. 在机器学习中,过拟合是指模型在训练数据上表现良好,但在新数据上表现不佳。
下列哪个方法可以减少过拟合?A. 增加数据量B. 减少特征数量C. 增加模型复杂度D. 减少训练次数6. 下列哪个算法是基于决策树的集成学习方法?A. K-NNB. Random ForestC. SVMD. Naive Bayes7. 在大数据分析中,ETL代表什么?A. Extract, Transform, LoadB. Encode, Test, LoadC. Extract, Transfer, LinkD. Encode, Transform, Link8. 下列哪个不是NoSQL数据库的类型?A. 键值存储B. 文档存储C. 关系数据库D. 图形数据库9. 在数据预处理中,数据清洗的主要目的是什么?A. 增加数据量B. 减少数据量C. 提高数据质量D. 降低数据质量10. 下列哪个算法是用于推荐系统的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means11. 在大数据环境中,HDFS是哪个框架的文件系统?A. HadoopB. SparkC. HiveD. MongoDB12. 下列哪个不是大数据分析的步骤?A. 数据收集B. 数据存储C. 数据加密D. 数据分析13. 在机器学习中,监督学习与非监督学习的主要区别是什么?A. 是否有标签数据B. 是否使用神经网络C. 是否使用决策树D. 是否使用回归分析14. 下列哪个算法是用于异常检测的?A. PCAB. SVMC. K-NND. DBSCAN15. 在大数据处理中,流处理与批处理的主要区别是什么?A. 数据处理的速度B. 数据处理的量C. 数据处理的类型D. 数据处理的频率16. 下列哪个不是大数据技术的优势?A. 提高数据处理速度B. 降低数据存储成本C. 减少数据分析的准确性D. 增强数据分析的能力17. 在数据挖掘中,关联规则挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据18. 下列哪个不是数据仓库的特征?A. 面向主题B. 集成性C. 时变性D. 实时性19. 在大数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Offline Analytical ProcessingC. Online Application ProcessingD. Offline Application Processing20. 下列哪个算法是用于文本挖掘的?A. TF-IDFB. K-meansC. SVMD. Random Forest21. 在大数据环境中,Spark与Hadoop的主要区别是什么?A. 数据处理速度B. 数据存储方式C. 数据处理模型D. 数据分析工具22. 下列哪个不是数据可视化的工具?A. TableauB. Power BIC. ExcelD. Hadoop23. 在机器学习中,特征选择的主要目的是什么?A. 增加模型复杂度B. 减少数据量C. 提高模型性能D. 降低数据质量24. 下列哪个算法是用于时间序列分析的?A. ARIMAB. K-NNC. SVMD. Random Forest25. 在大数据处理中,数据湖与数据仓库的主要区别是什么?A. 数据存储方式B. 数据处理速度C. 数据分析工具D. 数据处理模型26. 下列哪个不是大数据分析的应用领域?A. 金融B. 医疗C. 教育D. 娱乐27. 在数据挖掘中,分类与回归的主要区别是什么?A. 输出类型B. 输入类型C. 算法类型D. 数据类型28. 下列哪个不是大数据技术的挑战?A. 数据安全B. 数据隐私C. 数据质量D. 数据简单性29. 在大数据分析中,数据治理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型30. 下列哪个算法是用于图像识别的?A. CNNB. K-meansC. SVMD. Random Forest31. 在大数据环境中,数据脱敏的主要目的是什么?A. 提高数据质量B. 保护数据隐私C. 增加数据量32. 下列哪个不是大数据分析的工具?A. RB. PythonC. JavaD. Excel33. 在机器学习中,交叉验证的主要目的是什么?A. 提高模型性能B. 减少数据量C. 增加数据类型D. 降低数据质量34. 下列哪个算法是用于序列挖掘的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means35. 在大数据处理中,数据集成的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型36. 下列哪个不是大数据技术的应用场景?A. 智能推荐B. 风险管理C. 数据加密D. 预测分析37. 在数据挖掘中,频繁项集挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据38. 下列哪个不是数据仓库的设计原则?A. 面向主题B. 集成性C. 时变性D. 实时性39. 在大数据分析中,数据湖的主要优势是什么?A. 数据存储方式C. 数据分析工具D. 数据处理模型40. 下列哪个算法是用于社交网络分析的?A. PageRankB. K-meansC. SVMD. Random Forest41. 在大数据环境中,数据质量管理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型42. 下列哪个不是大数据分析的步骤?A. 数据收集B. 数据存储C. 数据加密D. 数据分析43. 在机器学习中,模型评估的主要目的是什么?A. 提高模型性能B. 减少数据量C. 增加数据类型D. 降低数据质量44. 下列哪个算法是用于推荐系统的?A. AprioriB. PageRankC. Collaborative FilteringD. K-means45. 在大数据处理中,数据清洗的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型46. 下列哪个不是大数据技术的优势?A. 提高数据处理速度B. 降低数据存储成本C. 减少数据分析的准确性D. 增强数据分析的能力47. 在数据挖掘中,关联规则挖掘的主要目的是什么?A. 发现数据中的模式B. 预测数据的趋势C. 分类数据D. 聚类数据48. 下列哪个不是数据仓库的特征?A. 面向主题B. 集成性C. 时变性D. 实时性49. 在大数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Offline Analytical ProcessingC. Online Application ProcessingD. Offline Application Processing50. 下列哪个算法是用于文本挖掘的?A. TF-IDFB. K-meansC. SVMD. Random Forest51. 在大数据环境中,Spark与Hadoop的主要区别是什么?A. 数据处理速度B. 数据存储方式C. 数据处理模型D. 数据分析工具52. 下列哪个不是数据可视化的工具?A. TableauB. Power BIC. ExcelD. Hadoop53. 在机器学习中,特征选择的主要目的是什么?A. 增加模型复杂度B. 减少数据量C. 提高模型性能D. 降低数据质量54. 下列哪个算法是用于时间序列分析的?A. ARIMAB. K-NNC. SVMD. Random Forest55. 在大数据处理中,数据湖与数据仓库的主要区别是什么?A. 数据存储方式B. 数据处理速度C. 数据分析工具D. 数据处理模型56. 下列哪个不是大数据分析的应用领域?A. 金融B. 医疗C. 教育D. 娱乐57. 在数据挖掘中,分类与回归的主要区别是什么?A. 输出类型B. 输入类型C. 算法类型D. 数据类型58. 下列哪个不是大数据技术的挑战?A. 数据安全B. 数据隐私C. 数据质量D. 数据简单性59. 在大数据分析中,数据治理的主要目的是什么?A. 提高数据质量B. 降低数据成本C. 增加数据量D. 减少数据类型60. 下列哪个算法是用于图像识别的?A. CNNB. K-meansC. SVMD. Random Forest答案部分1. C2. D3. B4. C5. B6. B7. A9. C10. C11. A12. C13. A14. A15. D16. C17. A18. D19. A20. A21. A22. D23. C24. A25. A26. D27. A28. D29. A30. A31. B32. C33. A34. A35. A36. C37. A38. D39. A40. A41. A42. C43. A44. C45. A46. C47. A48. D49. A50. A51. A52. D53. C54. A55. A56. D57. A59. A60. A。
大数据考试答案分析(良心出品)

1、当前大数据技术的基础是由(C)首先提出的。
(单选题,本题2分)A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C )。
(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。
(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D )反映数据的精细化程度,越细化的数据,价值越高。
(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。
(单选题,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、下列关于普查的缺点的说法中,正确的是(A)A、工作量大,容易导致调查内容有限,产生重复和遗漏现象B、误差不易被控制C、对样本的依赖性和比较性D、评测结果不够稳定7、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。
A:统计报表B:网络爬虫C:API接口D:传感器8、智慧城市的智慧之源使(C)A:数字城市B:物联网C:大数据D:云计算9、下列关于数据重组的说法中,错误的是(A)。
(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新10、智慧城市的构建,不包含(C)。
(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算11、大数据的最显著特征是(A)。
(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使(A)。
A:因果相关B:相关因果C:并列相关D:因果并列13、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
信息素养通识教程:数字化生存的必修课2019尔雅答案

课程概述1【判断题】对我们来说,学会检索方法将会受益无穷。
() 答案:√如何适应信息社会?1【单选题】职业面向信息社会的定义不包括()。
答案:云计算A、知识经济B、专业人士C、云计算D、理论知识2【单选题】在信息社会发展阶段的中级阶段时期,面临的问题主要是()。
答案:包容性问题A、基本设施跟不上需求B、包容性问题C、互通问题D、发展不平衡3【单选题】文化面向信息社会的定义不包括()。
答案:信息经济A、新媒体B、信息爆炸C、数字鸿沟D、信息经济4【单选题】科技面向信息社会的定义不包括()。
答案:ISDNA、ICTsB、云计算C、ISDND、大数据【单选题】空间面向信息社会的定义不包括()。
答案:云计算A、网络社会B、云计算C、万物互联D、赛博空间6【多选题】英国学者韦伯在«信息社会理论»一书中,区分出面向()关于信息社会的定义。
ABCDEA、科技B、经济C、职业D、文化E、空间7【多选题】«信息社会理论»一书中面向经济,与信息社会相关的定义有()ABCDA、信息经济B、电子商务C、共享经济D、互联网+8【多选题】信息资源的类型大体包括()。
ABCDA、口语信息资源B、文献信息资源C、实物信息资源D、体语信息资源9【多选题】关于信息社会的共识包括了()。
ABCA、信息数量B、信息角色C、信息化的发展是连续性的【判断题】职业面向的信息社会定义强调职业的变迁,是信息社会的标志。
() 答案:正确11【判断题】香农的信息论认为,信息是用来消除不确定性的东西。
() 答案:√12【判断题】信息资源等同于信息源。
() 答案:×为什么需要信息素养?1【单选题】()就是进行媒体相关信息活动的素养。
答案:媒体素养A、数字素养B、网络素养C、媒体素养D、计算机素养2【单选题】简单说,()就是有关信息的基本知识。
答案:信息知识A、信息意识B、信息能力C、信息伦理D、信息知识3【多选题】信息素养类型包括有()等。
2019年大数据测试答案

智慧健康医疗1、CAD在医疗健康领域的英文全称是()Computer Aided Diagnosis2、不属于AI健康医疗生态系统的是()制药生态3、不属于慢性疾病的是()艾滋病4、AI院前管理包括()预测和干预5、AI医疗健康技术体系的基础层不包括()芯片6、AI医疗健康发展的核心要素是()数据7、我国首次研发的AI医疗系统是面向()中医8、第3次AI浪潮的到来主要依赖于()深度学习9、目前AI医疗健康市场最成熟的是()辅助医疗影像诊断10、我国慢性疾病增加,与老龄化加剧的关系()强相关11、AI医疗健康的核心技术体系主要包括()传感器技术存储技术传输技术12、AI辅助诊断属于()院中管理13、婴幼儿时期的环境暴露不会影响个体后期的身体健康。
错误14、以下不属于大数据时代特征的是()数据处理速度迅速提升15、以下哪一项不是人工智能发展的必要条件()机器学习16、以下哪一项不属于健康医疗大数据来源()购物数据17、以下不属于机器学习研究范畴的是()专家系统18、以下属于人工智能在医疗领域应用的是()多选疾病预测辅助诊断药物个性化推荐19、以下对大数据描述正确的是()大数据本质在于数据的关联分析20、以下不属于弱人工智能特点的是()自适应能力21、人工智能技术发展出现几次低潮的原因包括()多选算法研究瓶颈计算能力瓶颈数据有限22、以下说法正确的是()人工智能就是深度学习23、以下说法正确的是()健康医疗领域数据存在孤岛现象24、以下说法正确的是()即使在大数据时代,统计分析仍然具有重要的作用25、以下关于人工智能、机器学习和深度学习说法正确的是()机器学习或深度学习是实现人工智能的一种方法大数据应用1、大数据起源于()互联网2、第一个提出大数据概念的公司是()麦肯锡3、)规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理。
大数据4、大数据的本质是()洞察价值5、大数据的最显著特征()数据规模大6、海军人员通过对前人航海日志的分析,绘制了新的航海路线图,标明大风与洋流可能发生的地点。
大数据算法2019尔雅答案

⼤数据算法2019尔雅答案1.11【单选题】以下关于⼤数据的特点,叙述错误的是()。
答案:速度慢?A、速度慢B、多元、异构C、数据规模⼤D、基于⾼度分析的新价值2【单选题】在《法华经》中,“那由他”描写的“⼤”的数量级是()。
答案:10^28A、10^7B、10^14C、10^28D、10^563【多选题】以下选项中,⼤数据涉及的领域中包括()。
答案:社交⽹络计算机艺术医疗数据A、社交⽹络B、医疗数据C、计算机艺术D、医疗数据4【多选题】⼤数据的应⽤包括()。
答案:推荐科学研究预测商业情报分析A、预测B、推荐C、商业情报分析D、科学研究5【判断题】⽬前,关于⼤数据已有公认的确定定义。
答案:×6【判断题】⼤数据种类繁多,在编码⽅式、数据格式、应⽤特征等⽅⾯都存在差异。
()答案:√1.21【单选题】⼤数据求解计算问题过程的第三步⼀般是()。
答案:算法设计与分析?A、判断可计算否B、判断能⾏可计算否C、算法设计与分析D、⽤计算机语⾔实现算法2【多选题】在⼤数据求解计算问题中,判断是否为能⾏可计算的因素包括()。
答案:资源约束数据量时间约束A、数据量B、资源约束C、速度约束D、时间约束3【判断题】⼤数据求解计算问题过程的第⼀步是确定该问题是否可计算。
答案:√4【判断题】⼤数据计算模型与⼀般⼩规模计算模型⼀样,都使⽤的是图灵机模型。
答案:√1.31【多选题】资源约束包括()。
答案:⽹络带宽外存CPU内存A、CPUB、⽹络带宽C、内存D、外存2【多选题】⼤数据算法可以不是()。
答案:精确算法串⾏算法内存算法A、云计算B、精确算法C、内存算法D、串⾏算法3【判断题】⼤数据算法是在给定的时间约束下,以⼤数据为输⼊,在给定资源约束内可以⽣成满⾜给定约束结果的算法。
答案:×4【判断题】MapReduce是⼀种⽐较好实现⼤数据算法的编程架构,在⽣产中得到⼴泛应⽤。
答案:√5【判断题】⼤数据算法是仅在电⼦计算机上运⾏的算法。
大数据试题及答案

大数据试题及答案一、选择题1. 以下哪个不属于大数据的四个特点(4V)?A. 体积(Volume)B. 种类(Variety)C. 速度(Velocity)D. 精确度(Accuracy)答案:D。
大数据的四个特点为体积(Volume)、种类(Variety)、速度(Velocity)和价值(Value),精确度(Accuracy)不属于其中。
2. 以下哪个技术不是大数据处理的核心技术?A. 分布式存储B. 分布式计算C. 数据挖掘D. 数据可视化答案:D。
大数据处理的核心技术包括分布式存储、分布式计算和数据挖掘等,数据可视化虽然在大数据分析中起到重要作用,但不属于核心技术。
3. 以下哪个大数据处理框架不是基于MapReduce的?A. HadoopB. SparkC. FlinkD. Storm答案:D。
Hadoop、Spark和Flink都是基于MapReduce的大数据处理框架,而Storm是基于流处理的大数据处理框架。
二、填空题4. 大数据技术体系包括____、____、____和____四个层次。
答案:数据源、数据存储、数据处理、数据分析和应用。
5. 在大数据处理过程中,数据清洗的目的是____。
答案:去除数据中的噪声和异常值,提高数据质量。
三、判断题6. 大数据的处理速度越快,其价值就越高。
()答案:错误。
大数据的价值不仅取决于处理速度,还包括数据的质量、完整性、关联性等因素。
7. 数据挖掘是从大量数据中提取有价值信息的过程。
()答案:正确。
四、简答题8. 简述大数据分析的主要步骤。
答案:大数据分析的主要步骤如下:(1)数据采集:从各种数据源获取原始数据;(2)数据预处理:对原始数据进行清洗、转换、合并等操作;(3)数据存储:将预处理后的数据存储到分布式存储系统中;(4)数据处理:使用分布式计算框架对数据进行计算和分析;(5)数据挖掘:从大量数据中提取有价值的信息;(6)数据可视化:将数据分析结果以图表、报告等形式展示;(7)数据应用:将数据分析结果应用于实际场景。
大数据试题及答案

大数据试题及答案1. 选择题:1. 下列哪项不属于大数据的四个"V"特点?A. Volume(数据量大)B. Value(数据价值高)C. Velocity(数据处理速度快)D. Variety(数据类型多样)答案:B. Value(数据价值高)2. 下列哪个不是大数据的常见来源?A. 传感器数据B. 金融交易数据C. 社交媒体数据D. 游戏排行榜数据答案:D. 游戏排行榜数据3. 大数据技术中,下列哪个属于数据存储和处理工具?A. Apache HadoopB. Apache SparkC. TableauD. Python答案:A. Apache Hadoop4. 在大数据处理中,下列哪项不属于数据清洗和预处理的步骤?A. 数据收集B. 数据分析C. 数据转换D. 数据集成答案:B. 数据分析2. 填空题:1. 大数据中,_______ 指的是数据的速率和延迟,即数据的产生和消耗速度之间的平衡。
答案:Velocity(数据处理速度快)2. 大数据技术中,________________ 是一种用于处理大规模数据计算的开源集群处理框架。
答案:Apache Hadoop3. 大数据分析常用的编程语言包括____________ 和____________。
答案:Python 和 R4. 在大数据清洗和预处理过程中,数据转换的步骤包括数据筛选、数据归一化和_____________。
答案:数据聚合3. 简答题:1. 请简述大数据的定义和特点。
答:大数据是指数据量庞大、类型多样、处理速度快且具有高价值的数据集合。
大数据的特点主要可以归纳为四个"V",即Volume(数据量大)、Velocity(数据处理速度快)、Variety(数据类型多样)和Value(数据价值高)。
大数据具有海量的数据量,数据来源广泛,包括传感器数据、社交媒体数据等;处理速度快,需要使用专门的大数据技术和工具进行高效的数据存储、处理和分析;数据类型多样,包括结构化数据和非结构化数据;数据具有高价值,可以帮助企业做出更准确的决策和预测。
精选2019公需科目大数据完整题库300题(含标准答案)

2019公需科目:大数据题库300题[含参考答案]一、选择题1.下列哪项通常是集群的最主要瓶颈a)CPU b)网络 c)磁盘Id)内存答案.C 磁盘首先集群的目的是为了节省成本,用廉价的 pc 机,取代小型机及大型机。
小型机和大型机有什么特点?2.cpu 处理能力强3.内存够大,所以集群的瓶颈不可能是 a 和 d二、填空题4.Map/Reduce框架由一个单独的master JbTracker 和每个集群节点一个slave TaskTracker 共同组成。
5.MapReduce确保每个reducer的输入都是按键排序的。
系统执行排序的过程(即将map 输出作为输入传给reducer)称为shuffle。
三、单选题6.智慧城市的构建,不包含( C)。
(单选题)A.数字城市B.物联网C.联网监控D.云计算大数据的最显著特征是( A)。
(单选题)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高7.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的(B )。
(单选题)A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据8.下列关于计算机存储容量单位的说法中,错误的是( C)。
(单选题)A.1KB<1MB<1GBB.基本单位是字节(Byte)C.一个汉字需要一个字节的存储空间D.一个字节能够容纳一个英文字符,9.下列关于聚类挖掘技术的说法中,错误的是(B )。
(单选题) A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B.要求同类数据的内容相似度尽可能小C.要求不同类数据的内容相似度尽可能小大数据的最显著特征是( A)。
(单选题)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高10.下列关于网络用户行为的说法中,错误的是( C)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
【单选题】
以下关于大数据的特点,叙述错误的是()。
答案:速度慢A、
速度慢
B、
多元、异构
C、
数据规模大
D、
基于高度分析的新价值
2
【单选题】在《法华经》中,“那由他”描写的“大”的数量级是()。
答案:10^28
A、10^7
B、10^14
C、10^28
D、10^56
3
【多选题】以下选项中,大数据涉及的领域中包括()。
答案:社交网络计算机艺术医疗数据
A、社交网络
B、医疗数据
C、计算机艺术
D、医疗数据
4
【多选题】大数据的应用包括()。
答案:推荐科学研究预测商业情报分析
A、预测
B、推荐
C、商业情报分析
D、科学研究
5
【判断题】目前,关于大数据已有公认的确定定义。
答案:×
6
【判断题】大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。
()答案:√
1
【单选题】
大数据求解计算问题过程的第三步一般是()。
答案:算法设计与分析A、
判断可计算否
B、
判断能行可计算否
C、
算法设计与分析
D、
用计算机语言实现算法
2
【多选题】在大数据求解计算问题中,判断是否为能行可计算的因素包括()。
答案:资源约束数据量时间约束
A、数据量
B、资源约束
C、速度约束
D、时间约束
3
【判断题】大数据求解计算问题过程的第一步是确定该问题是否可计算。
答案:√
4
【判断题】大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。
答案:√
1
【多选题】资源约束包括()。
答案:网络带宽外存CPU内存
A、CPU
B、网络带宽
C、内存
D、外存
2
【多选题】大数据算法可以不是()。
答案:精确算法串行算法内存算法
A、云计算
B、精确算法
C、内存算法
D、串行算法
3
【判断题】大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。
答案:×
4
【判断题】MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。
答案:√
5
【判断题】大数据算法是仅在电子计算机上运行的算法。
答案:×
【单选题】
众包算法是用来解决()。
答案:计算机计算能力不足或知识不足,需要人来帮忙
A、
访问全部数据时间过长
B、
数据难于放入内存计算
C、
单个计算机难以保存全部数据,计算需要整体数据
D、
计算机计算能力不足或知识不足,需要人来帮忙
2
【单选题】大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案是()。
答案:读取部分数据
A、将数据存储到磁盘上
B、仅基于少量数据进行计算
C、读取部分数据
D、并行处理
3
【多选题】大数据算法的()特点,使其与大数据算法密切相关的。
答案:速度快数据量大
A、数据量大
B、基于高度分析的新价值
C、速度快
D、多样性、复杂性
4
【判断题】为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技术会涉及到时间亚线性算法。
答案:×
1
【单选题】大数据算法涉及到外存的时候,通常要分析()。
答案:IO复杂性
A、时间空间复杂性
B、IO复杂性
C、结果质量
D、通讯复杂性
2
【多选题】下列选项中,属于智能仿生算法的是()。
答案:遗传算法模拟退火算法
A、遗传算法
B、近似算法
C、模拟退火算法
D、数据流算法
3
【判断题】在线算法/数据流算法是面向大数据速度快的特点提出的。
()答案:√
【判断题】对于数据流算法或在线算法,经常要分析结果的近似比。
()答案:×
5
【判断题】随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。
()答案:√
1
【单选题】计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计算最少需要访问()个顶点。
答案:n-1
A、n2
B、n+1
C、2n
D、n-1
2
【多选题】亚线性是指()等的消耗是输入规模o。
()答案:空间通讯时间IO
A、时间
B、空间
C、IO
D、通讯
3
【判断题】性质检测算法属于亚线性空间算法的一类。
()答案:×
1
【判断题】
在经典的水库抽样中,要求空间复杂性为O(k),是指与抽样大小有关,而与整个数据的数据量无关。
答案:√
2
【判断题】水库抽样算法的采样是均匀的。
答案:√
1
【单选题】
以下()不是衡量分析近似解代价与优化解代价差距的方法。
答案:绝对误差
A、
Ratio Bound
B、
相对误差
C、
绝对误差
D、
(1-)-近似
2
【单选题】利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。
答案:二分之一
A、二分之一
B、三分之一
C、四分之一
D、十分之一
3
【单选题】采用平面图的直径近似算法的动机是无法在要求的时间内得到()。
答案:精确解
A、相似解
B、完整解
C、精确解
D、近似解
4
【判断题】在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。
答案:×
5
【判断题】近似算法能给出一个优化问题的优化解。
答案:×6
【判断题】Ratio Bound越大,则近似解越坏。
()答案:√
你可以通过如下方式获取完整版:
方式一:搜狗/百度搜索:萌面人资料铺点击进入即可
方式二:打开手机浏览器扫一扫下方二维码,进入网站:
方式三:打开手机微信扫一扫下方二维码,关注微信公众号:萌面人资料铺。