大数据技术及应用题库
大数据技术与应用考试 选择题 63题

1. 大数据的4V特征不包括以下哪一项?A. VolumeB. VelocityC. VarietyD. Visibility2. Hadoop生态系统中,用于存储结构化和半结构化数据的组件是?A. HDFSB. HiveC. HBaseD. Pig3. 在数据仓库中,ETL过程指的是什么?A. Extract, Transform, LoadB. Encrypt, Transfer, LoadC. Extract, Transfer, LoadD. Encrypt, Transform, Load4. 以下哪个不是NoSQL数据库的类型?A. Key-ValueB. Column-FamilyC. DocumentD. Relational5. 数据挖掘中的分类算法不包括以下哪一项?A. Decision TreesB. Neural NetworksC. ClusteringD. Support Vector Machines6. 在Hadoop中,MapReduce的主要作用是什么?A. 数据存储B. 数据处理C. 数据查询D. 数据可视化7. 以下哪个工具不是用于大数据分析的?A. RB. PythonC. ExcelD. Spark8. 在数据预处理中,数据清洗的主要目的是什么?A. 增加数据量B. 减少数据量C. 提高数据质量D. 提高数据速度9. 以下哪个不是大数据处理框架?A. FlinkB. KafkaC. StormD. Docker10. 在数据可视化中,热力图主要用于展示什么?A. 数据分布B. 数据关系C. 数据趋势D. 数据密度11. 以下哪个是大数据安全的关键技术?A. 数据加密B. 数据压缩C. 数据存储D. 数据传输12. 在数据分析中,OLAP是什么的缩写?A. Online Analytical ProcessingB. Online Application ProcessingC. Offline Analytical ProcessingD. Offline Application Processing13. 以下哪个不是数据仓库的特点?A. 面向主题B. 集成性C. 时变性D. 实时性14. 在数据挖掘中,关联规则挖掘主要用于发现什么?A. 数据模式B. 数据异常C. 数据关系D. 数据趋势15. 以下哪个不是大数据的应用领域?A. 金融B. 医疗C. 教育D. 娱乐16. 在Hadoop中,YARN的主要作用是什么?A. 数据存储B. 资源管理C. 数据处理D. 数据查询17. 以下哪个不是数据湖的特点?A. 存储原始数据B. 存储结构化数据C. 灵活的数据结构D. 支持多种数据类型18. 在数据分析中,数据集市是什么?A. 数据仓库的子集B. 数据仓库的超集C. 独立的数据仓库D. 数据仓库的备份19. 以下哪个不是数据治理的关键组成部分?A. 数据质量B. 数据安全C. 数据存储D. 数据政策20. 在数据挖掘中,聚类算法主要用于什么?A. 数据分类B. 数据分组C. 数据预测D. 数据关联21. 以下哪个不是大数据处理的关键技术?A. 数据采集B. 数据存储C. 数据分析D. 数据打印22. 在数据可视化中,散点图主要用于展示什么?A. 数据分布B. 数据关系C. 数据趋势D. 数据密度23. 以下哪个不是大数据分析的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据分析24. 在数据仓库中,维度表和事实表的关系是什么?A. 一对一B. 一对多C. 多对一D. 多对多25. 以下哪个不是数据挖掘的应用场景?A. 市场篮分析B. 客户细分C. 风险评估D. 数据备份26. 在Hadoop中,HDFS的主要作用是什么?A. 数据存储B. 数据处理C. 数据查询D. 数据可视化27. 以下哪个不是数据湖的优势?A. 存储原始数据B. 灵活的数据结构C. 支持多种数据类型D. 实时数据处理28. 在数据分析中,数据立方体是什么?A. 数据仓库的子集B. 数据仓库的超集C. 数据仓库的备份D. 数据仓库的多维数据模型29. 以下哪个不是数据治理的目标?A. 提高数据质量B. 确保数据安全C. 提高数据速度D. 确保数据合规30. 在数据挖掘中,异常检测主要用于发现什么?A. 数据模式B. 数据异常C. 数据关系D. 数据趋势31. 以下哪个不是大数据的应用优势?A. 提高决策效率B. 降低成本C. 提高数据质量D. 提高服务质量32. 在Hadoop中,MapReduce的主要优势是什么?A. 数据存储B. 数据处理C. 数据查询D. 数据可视化33. 以下哪个不是数据湖的挑战?A. 数据管理B. 数据安全C. 数据处理D. 数据备份34. 在数据分析中,数据集成的目的是什么?A. 提高数据质量B. 确保数据安全C. 提高数据速度D. 确保数据合规35. 以下哪个不是数据挖掘的步骤?A. 数据收集B. 数据清洗C. 数据存储D. 数据分析36. 在数据仓库中,数据集成的关键技术是什么?A. 数据采集B. 数据存储C. 数据分析D. 数据清洗37. 以下哪个不是大数据分析的工具?A. RB. PythonC. ExcelD. Photoshop38. 在数据可视化中,折线图主要用于展示什么?A. 数据分布B. 数据关系C. 数据趋势D. 数据密度39. 以下哪个不是大数据处理的关键技术?A. 数据采集B. 数据存储C. 数据分析D. 数据打印40. 在数据仓库中,数据集成的关键技术是什么?A. 数据采集B. 数据存储C. 数据分析D. 数据清洗41. 以下哪个不是大数据分析的工具?A. RB. PythonC. ExcelD. Photoshop42. 在数据可视化中,折线图主要用于展示什么?A. 数据分布B. 数据关系C. 数据趋势D. 数据密度43. 以下哪个不是大数据处理的关键技术?A. 数据采集B. 数据存储C. 数据分析D. 数据打印44. 在数据仓库中,数据集成的关键技术是什么?A. 数据采集B. 数据存储C. 数据分析D. 数据清洗45. 以下哪个不是大数据分析的工具?A. RB. PythonC. ExcelD. Photoshop46. 在数据可视化中,折线图主要用于展示什么?A. 数据分布B. 数据关系C. 数据趋势47. 以下哪个不是大数据处理的关键技术?A. 数据采集B. 数据存储C. 数据分析D. 数据打印48. 在数据仓库中,数据集成的关键技术是什么?A. 数据采集B. 数据存储C. 数据分析D. 数据清洗49. 以下哪个不是大数据分析的工具?A. RB. PythonC. ExcelD. Photoshop50. 在数据可视化中,折线图主要用于展示什么?A. 数据分布B. 数据关系C. 数据趋势D. 数据密度51. 以下哪个不是大数据处理的关键技术?A. 数据采集B. 数据存储C. 数据分析D. 数据打印52. 在数据仓库中,数据集成的关键技术是什么?A. 数据采集B. 数据存储C. 数据分析D. 数据清洗53. 以下哪个不是大数据分析的工具?A. RB. PythonC. ExcelD. Photoshop54. 在数据可视化中,折线图主要用于展示什么?A. 数据分布C. 数据趋势D. 数据密度55. 以下哪个不是大数据处理的关键技术?A. 数据采集B. 数据存储C. 数据分析D. 数据打印56. 在数据仓库中,数据集成的关键技术是什么?A. 数据采集B. 数据存储C. 数据分析D. 数据清洗57. 以下哪个不是大数据分析的工具?A. RB. PythonC. ExcelD. Photoshop58. 在数据可视化中,折线图主要用于展示什么?A. 数据分布B. 数据关系C. 数据趋势D. 数据密度59. 以下哪个不是大数据处理的关键技术?A. 数据采集B. 数据存储C. 数据分析D. 数据打印60. 在数据仓库中,数据集成的关键技术是什么?A. 数据采集B. 数据存储C. 数据分析D. 数据清洗61. 以下哪个不是大数据分析的工具?A. RB. PythonC. ExcelD. Photoshop62. 在数据可视化中,折线图主要用于展示什么?A. 数据分布B. 数据关系C. 数据趋势D. 数据密度63. 以下哪个不是大数据处理的关键技术?A. 数据采集B. 数据存储C. 数据分析D. 数据打印答案1. D2. B3. A4. D5. C6. B7. C8. C9. D10. D11. A12. A13. D14. C15. D16. B17. B18. A19. C20. B21. D22. A23. C24. B25. D26. A27. D28. D29. C30. B31. C32. B33. D34. A35. C36. D37. D38. C39. D40. D41. D42. C43. D44. D45. D46. C47. D48. D49. D50. C51. D52. D53. D54. C55. D56. D57. D58. C59. D60. D61. D62. C63. D。
大数据技术及应用试题库

1从大量数据中提取知识的过程通常称为(A)。
a..数据挖掘b..人工智能c..数据清洗d..数据仓库2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。
A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是(D)。
a..收集业务需求b..建立数据仓库逻辑模型c..开发数据仓库的应用分析d..为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。
a..处理速度快(秒级定律)b..算法种类更多c..精度更高d..更加智能化5大数据的起源是(C)。
a..金融b..电信c..互联网d..公共管理6大数据不是要教机器像人一样思考。
相反,它是(A)。
a..把数学算法运用到海量的数据上来预测事情发生的可能性b..被视为人工智能的一部c..被视为一种机器学习d..预测与惩罚7人与人之间沟通信息、传递信息的技术,这指的是(D)。
a..感测技术b..微电子技术c..计算机技术d..通信技术8数据清洗的方法不包括(D)。
a..缺失值处理b..噪声数据清除c..一致性检查d..重复数据记录处理9.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D)。
a..富数据b..贫数据c..繁数据d..大数据11 大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的。
)。
a..新一代信息技术b..新一代服务业态c..新一代技术平台d..新一代信息技术和服务业态12万维网之父是(C)A.彼得•德鲁克B. 舍恩伯格C. 蒂姆•伯纳斯一季D. 斯科特•布朗13下列演示方式中,不属于传统统计图方式的是(D)。
大数据技术与应用考试 选择题 64题

1. 大数据的“4V”特征不包括以下哪一项?A. 大量性B. 高速性C. 多样性D. 价值性2. Hadoop的核心组件包括哪些?A. HDFS和MapReduceB. HDFS和YARNC. MapReduce和YARND. HDFS、MapReduce和YARN3. 以下哪个不是NoSQL数据库的类型?A. 键值存储B. 列存储C. 文档存储D. 关系型数据库4. 在Hadoop生态系统中,用于数据仓库和数据分析的工具是?A. HiveB. HBaseC. PigD. Zookeeper5. 以下哪个工具不是用于大数据处理的?A. SparkB. FlinkC. KafkaD. MySQL6. 在数据挖掘中,K-means算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法7. 以下哪个是大数据处理框架Spark的核心组件?A. RDDB. DataFrameC. DatasetD. 以上都是8. 在Hadoop中,用于管理集群资源的组件是?A. HDFSB. MapReduceC. YARND. Zookeeper9. 以下哪个是用于实时数据处理的工具?A. StormB. HiveC. PigD. Sqoop10. 在数据仓库中,用于数据抽取、转换和加载的工具是?A. ETLB. OLAPC. OLTPD. BI11. 以下哪个是大数据分析的典型应用场景?A. 社交媒体分析B. 电子商务推荐系统C. 金融风险管理D. 以上都是12. 在Spark中,用于处理结构化数据的API是?A. RDDB. DataFrameC. DatasetD. 以上都是13. 以下哪个是用于大数据存储的分布式文件系统?A. HDFSB. NFSC. CIFSD. FTP14. 在Hadoop中,用于数据处理的编程模型是?A. HDFSB. MapReduceC. YARND. Zookeeper15. 以下哪个是用于大数据实时流处理的框架?A. KafkaB. FlinkC. Spark StreamingD. 以上都是16. 在数据挖掘中,Apriori算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法17. 以下哪个是用于大数据查询和分析的工具?A. HiveB. HBaseC. PigD. Zookeeper18. 在Hadoop中,用于分布式协调服务的组件是?A. HDFSB. MapReduceC. YARND. Zookeeper19. 以下哪个是用于大数据批处理的框架?A. SparkB. FlinkC. StormD. Kafka20. 在数据仓库中,用于多维数据分析的工具是?A. ETLB. OLAPC. OLTPD. BI21. 以下哪个是大数据存储的典型应用场景?A. 云存储B. 数据备份C. 数据归档D. 以上都是22. 在Spark中,用于处理非结构化数据的API是?A. RDDB. DataFrameC. DatasetD. 以上都是23. 以下哪个是用于大数据处理的分布式计算框架?A. HadoopB. SparkC. FlinkD. 以上都是24. 在Hadoop中,用于数据存储的编程模型是?A. HDFSB. MapReduceC. YARND. Zookeeper25. 以下哪个是用于大数据实时处理的工具?A. StormB. HiveC. PigD. Sqoop26. 在数据挖掘中,决策树算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法27. 以下哪个是用于大数据存储和管理的工具?A. HBaseB. HiveC. PigD. Zookeeper28. 在Hadoop中,用于数据处理的分布式协调服务是?A. HDFSB. MapReduceC. YARND. Zookeeper29. 以下哪个是用于大数据处理的实时流处理框架?A. KafkaB. FlinkC. Spark StreamingD. 以上都是30. 在数据仓库中,用于数据抽取和加载的工具是?A. ETLB. OLAPC. OLTPD. BI31. 以下哪个是大数据分析的典型应用场景?A. 客户行为分析B. 市场趋势分析C. 产品推荐系统D. 以上都是32. 在Spark中,用于处理半结构化数据的API是?B. DataFrameC. DatasetD. 以上都是33. 以下哪个是用于大数据存储的分布式数据库?A. HBaseB. MySQLC. OracleD. SQL Server34. 在Hadoop中,用于数据处理的分布式文件系统是?A. HDFSB. NFSC. CIFSD. FTP35. 以下哪个是用于大数据实时处理的工具?A. StormB. HiveC. PigD. Sqoop36. 在数据挖掘中,随机森林算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法37. 以下哪个是用于大数据查询和分析的工具?A. HiveB. HBaseC. PigD. Zookeeper38. 在Hadoop中,用于分布式协调服务的组件是?A. HDFSB. MapReduceC. YARND. Zookeeper39. 以下哪个是用于大数据批处理的框架?A. SparkB. FlinkC. StormD. Kafka40. 在数据仓库中,用于多维数据分析的工具是?B. OLAPC. OLTPD. BI41. 以下哪个是大数据存储的典型应用场景?A. 云存储B. 数据备份C. 数据归档D. 以上都是42. 在Spark中,用于处理非结构化数据的API是?A. RDDB. DataFrameC. DatasetD. 以上都是43. 以下哪个是用于大数据处理的分布式计算框架?A. HadoopB. SparkC. FlinkD. 以上都是44. 在Hadoop中,用于数据存储的编程模型是?A. HDFSB. MapReduceC. YARND. Zookeeper45. 以下哪个是用于大数据实时处理的工具?A. StormB. HiveC. PigD. Sqoop46. 在数据挖掘中,逻辑回归算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法47. 以下哪个是用于大数据存储和管理的工具?A. HBaseB. HiveC. PigD. Zookeeper48. 在Hadoop中,用于数据处理的分布式协调服务是?A. HDFSB. MapReduceC. YARND. Zookeeper49. 以下哪个是用于大数据处理的实时流处理框架?A. KafkaB. FlinkC. Spark StreamingD. 以上都是50. 在数据仓库中,用于数据抽取和加载的工具是?A. ETLB. OLAPC. OLTPD. BI51. 以下哪个是大数据分析的典型应用场景?A. 客户行为分析B. 市场趋势分析C. 产品推荐系统D. 以上都是52. 在Spark中,用于处理半结构化数据的API是?A. RDDB. DataFrameC. DatasetD. 以上都是53. 以下哪个是用于大数据存储的分布式数据库?A. HBaseB. MySQLC. OracleD. SQL Server54. 在Hadoop中,用于数据处理的分布式文件系统是?A. HDFSB. NFSC. CIFSD. FTP55. 以下哪个是用于大数据实时处理的工具?A. StormB. HiveC. PigD. Sqoop56. 在数据挖掘中,支持向量机算法属于哪一类算法?A. 分类算法B. 聚类算法C. 关联规则算法D. 回归算法57. 以下哪个是用于大数据查询和分析的工具?A. HiveB. HBaseC. PigD. Zookeeper58. 在Hadoop中,用于分布式协调服务的组件是?A. HDFSB. MapReduceC. YARND. Zookeeper59. 以下哪个是用于大数据批处理的框架?A. SparkB. FlinkC. StormD. Kafka60. 在数据仓库中,用于多维数据分析的工具是?A. ETLB. OLAPC. OLTPD. BI61. 以下哪个是大数据存储的典型应用场景?A. 云存储B. 数据备份C. 数据归档D. 以上都是62. 在Spark中,用于处理非结构化数据的API是?A. RDDB. DataFrameC. DatasetD. 以上都是63. 以下哪个是用于大数据处理的分布式计算框架?A. HadoopB. SparkC. FlinkD. 以上都是64. 在Hadoop中,用于数据存储的编程模型是?A. HDFSB. MapReduceC. YARND. Zookeeper答案:1. D2. D3. D4. A5. D6. B7. D8. C9. A10. A11. D12. D13. A14. B15. D16. C17. A18. D19. A20. B21. D22. A23. D24. A25. A26. A27. A28. D29. D30. A31. D32. B33. A34. A35. A36. A37. A38. D39. A40. B41. D42. A43. D44. A45. A46. D47. A48. D49. D50. A51. D52. B53. A54. A55. A56. A57. A58. D59. A60. B61. D62. A63. D64. A。
大数据技术及应用题库

大数据技术及应用题库单选题:1从大量数据中提取知识的过程通常称为(A)。
a..数据挖掘b..人工智能c..数据清洗d..数据仓库2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。
A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是(D)。
a..收集业务需求b..建立数据仓库逻辑模型c..开发数据仓库的应用分析d..为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。
a..处理速度快(秒级定律)b..算法种类更多c..精度更高d..更加智能化5大数据的起源是(C)。
a..金融b..电信c..互联网d..公共管理6大数据不是要教机器像人一样思考。
相反,它是(A)。
a..把数学算法运用到海量的数据上来预测事情发生的可能性b..被视为人工智能的一部c..被视为一种机器学习d..预测与惩罚7人与人之间沟通信息、传递信息的技术,这指的是(D)。
a..感测技术b..微电子技术c..计算机技术d..通信技术8数据清洗的方法不包括(D)。
a..缺失值处理b..噪声数据清除c..一致性检查d..重复数据记录处理9.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D)。
a..富数据b..贫数据c..繁数据d..大数据11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的(D)。
a..新一代信息技术b..新一代服务业态c..新一代技术平台d..新一代信息技术和服务业态12万维网之父是(C)A.彼得·德鲁克B.舍恩伯格C.蒂姆·伯纳斯—李D.斯科特·布朗13下列演示方式中,不属于传统统计图方式的是(D)。
大数据技术及应用题库

1从大量数据中提取知识的过程通常称为( A )。
a. .数据挖掘b. .人工智能c. .数据清洗d. .数据仓库2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。
A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是(D)。
a. .收集业务需求b. .建立数据仓库逻辑模型c. .开发数据仓库的应用分析d. .为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。
a. .处理速度快(秒级定律)b. .算法种类更多c. .精度更高d. .更加智能化5大数据的起源是(C)。
a. .金融b. .电信c. .互联网d. .公共管理6大数据不是要教机器像人一样思考。
相反,它是(A )。
a. .把数学算法运用到海量的数据上来预测事情发生的可能性b. .被视为人工智能的一部c. .被视为一种机器学习d. .预测与惩罚7人与人之间沟通信息、传递信息的技术,这指的是(D)。
a. .感测技术b. .微电子技术c. .计算机技术叮叮小文库d. .通信技术8数据清洗的方法不包括(D )。
a. .缺失值处理b. .噪声数据清除c. . 一致性检查d. .重复数据记录处理9.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A. 数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D)oa. .富数据b. .贫数据c. .繁数据d. .大数据11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的(D)oa. .新一代信息技术b. .新一代服务业态c. .新一代技术平台d. .新一代信息技术和服务业态12万维网之父是(C)A. 彼得•德鲁克B.舍恩伯格C.蒂姆•伯纳斯一李D.斯科特•布朗13下列演示方式中,不属于传统统计图方式的是(D)oA、柱形图B、饼状图C、曲线图D、网络图14当前社会中,最为突出的大数据环境是(A)oA、互联网B、物联网C、综合国力D、自然资源叮叮小文库16大数据的起源是(C)。
公需科目-大数据前沿技术及应用-考试与答案(全)

你现时的得分是100!1、下列单位不是数据单位?()BA、bitB、NBC、GBD、TB2、()主要承担了搭建大数据平台上层建筑的任务。
BA、数据存储技术B、数据开发技术C、数据计算技术D、数据挖掘技术3、下列哪项不属于商业大数据的类型。
()DA、传统企业数据B、机器和传感器数据C、社交数据D、电子商务数据4、信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。
凡涉及到这些过程和技术的工作部门,都可称作()部门。
CA、技术B、研究C、信息D、管理5、以下哪个数据单位最大?()CA、MBB、KBC、TBD、GB6、大数据技术的战略意义是()。
CA、掌握庞大的数据信息B、促进互联网和信息行业的发展C、对这些含有意义的数据进行专业化处理D、企业内部,以及企业与供应商、客户、合作伙伴和员工数字化共享所有形式的数据资源7、()主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等。
BA、采集B、统计/分析C、导入 / 预处理D、数据挖掘1、云计算包括有三个部分,分别是()。
ABCA、基础设施服务B、平台服务C、软件服务D、数据服务2、“大数据”的特点是()。
ABCDA、数据体量大B、数据类别大C、数据处理速度快D、数据真实性高3、美国哈佛大学的研究小组给出了著名的资源三角形。
包括()ACDA、信息B、数据C、物质D、能量4、大数据平台的三个重要的技术部分。
ABDA、数据交易技术B、数据交互技术C、数据存储技术D、数据处理技术5、大数据处理流程可以概括为()。
ABCDA、采集B、导入和预处理C、统计和分析D、数据挖掘6、互连网上出现的海量信息可以划分为三种。
分别为()。
ABCA、结构化信息B、非结构化信息C、半结构化信息D、特殊化信息1、政府数据资源丰富,应用需求旺盛,政府应该是大数据发展的推动者,不是大数据应用的受益者。
错对错2、电子商务数据属于商业大数据的类型错对错3、大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
大数据技术及应用_东北师范大学中国大学mooc课后章节答案期末考试题库2023年

大数据技术及应用_东北师范大学中国大学mooc课后章节答案期末考试题库2023年1.关系数据库是基于行模式存储的,而HBase也是基于行模式存储的。
参考答案:错误2.对于Hive中分区的概念,下列描述错误的是()。
参考答案:分区字段只能有一个3.Action API完成返回数据集中的元素个数的操作命令是()。
参考答案:count()4.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是()。
参考答案:一次写入,多次读写5.MapReduce作业的初始化调用的方法是()。
参考答案:JobTracker.initJob()6.下述关于 Hadoop的阐述,正确的是()。
参考答案:是一个分布式存储与分布式并行运算系统7.Hadoop是一个能够对大量数据进行分布式处理的软件框架。
参考答案:正确8.以下选项中,不是HBase添加数据需要用到的类和接口的是()。
参考答案:Scan9.关于HDFS的文件写入操作描述正确的是()。
参考答案:默认将文件块复制成三份存放10.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是?参考答案:一次写入,多次读写11.分布式文件系统HDFS 中的 block 默认保存几份?参考答案:3 份12.Hbase是一个针对结构化数据的可申缩、高可靠,高性能、分布式和面向()的动态模式数据库。
参考答案:列13.YARN是新一代Hadoop(),用户可以运行和管理同一个物理集群机上多种作业。
参考答案:资源管理器14.HDFS采用块的概念,默认的一个块大小是64MB。
参考答案:正确15.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave。
Master上运行JobTracker,Slave上运行TaskTracker 。
大数据技术及应用题库

大数据技术及应用题库单选题:1从大量数据中提取知识的过程通常称为(A)。
a. . 数据挖掘b. . 人工智能c. . 数据清洗d. . 数据仓库2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。
A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧3数据仓库的最终目的是(D)。
a. . 收集业务需求b. . 建立数据仓库逻辑模型c. . 开发数据仓库的应用分析d. . 为用户和业务部门提供决策支持4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。
a. . 处理速度快(秒级定律)b. . 算法种类更多c. . 精度更高d. . 更加智能化5大数据的起源是(C)。
a. . 金融b. . 电信c. . 互联网d. . 公共管理6大数据不是要教机器像人一样思考。
相反,它是(A)。
a. . 把数学算法运用到海量的数据上来预测事情发生的可能性b. . 被视为人工智能的一部c. . 被视为一种机器学习d. . 预测与惩罚7人与人之间沟通信息、传递信息的技术,这指的是(D)。
a. . 感测技术b. . 微电子技术c. . 计算机技术d. . 通信技术8数据清洗的方法不包括(D)。
a. . 缺失值处理b. . 噪声数据清除c. . 一致性检查d. . 重复数据记录处理9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A. 数据规模大B. 数据类型多样C. 数据处理速度快D. 数据价值密度高10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D)。
a. . 富数据b. . 贫数据c. . 繁数据d. . 大数据11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的(D)。
a. . 新一代信息技术b. . 新一代服务业态c. . 新一代技术平台d. . 新一代信息技术和服务业态12万维网之父是(C)A. 彼得·德鲁克B. 舍恩伯格C. 蒂姆·伯纳斯—李D. 斯科特·布朗13下列演示方式中,不属于传统统计图方式的是(D)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据技术及应用题库单选题:
1 从大量数据中提取知识的过程通常称为(A)。
a. . 数据挖掘
b. . 人工智能
c. . 数据清洗
d. . 数据仓库
2 下列论据中,能够支撑“大数据无所不能”的观点的是( A )。
A、互联网金融打破了传统的观念和行为
B、大数据存在泡沫
C、大数据具有非常高的成本
D、个人隐私泄露与信息安全担忧
3 数据仓库的最终目的是(D)。
a. . 收集业务需求
b. . 建立数据仓库逻辑模型
c. . 开发数据仓库的应用分析
d. . 为用户和业务部门提供决策支持
4 大数据处理技术和传统的数据挖掘技术最大的区别是(A)。
a. . 处理速度快(秒级定律)
b. . 算法种类更多
c. . 精度更高
d. . 更加智能化
5 大数据的起源是( C )。
a. . 金融
b. . 电信
c. . 互联网
d. . 公共管理
6 大数据不是要教机器像人一样思考。
相反,它是( A )。
a. . 把数学算法运用到海量的数据上来预测事情发生的可能性
b. . 被视为人工智能的一部
c. . 被视为一种机器学习
d. . 预测与惩罚
7 人与人之间沟通信息、传递信息的技术,这指的是(D)。
a. . 感测技术
b. . 微电子技术
c. . 计算机技术
d. . 通信技术
8 数据清洗的方法不包括(D)。
a. . 缺失值处理
b. . 噪声数据清除
c. . 一致性检查
d. . 重复数据记录处理
9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D)
A. 数据规模大
B. 数据类型多样
C. 数据处理速度快
D. 数据价值密度高
10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指
的是(D)。
a. . 富数据
b. . 贫数据
c. . 繁数据
d. . 大数据
1大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分
析,从中发现新知识、创造新价值、提升新能力的(D)。
a. . 新一代信息技术
b. . 新一代服务业态
c. . 新一代技术平台
d. . 新一代信息技术和服务业态
12万维网之父是( C )
A. 彼得·德鲁克
B. 舍恩伯格
C. 蒂姆·伯纳斯—李
D. 斯科特·布朗
13下列演示方式中,不属于传统统计图方式的是(D)。
A、柱形图
B、饼状图
C、曲线图
D、网络图
14当前社会中,最为突出的大数据环境是( A )。
A、互联网
B、物联网
C、综合国力
D、自然资源
15 可以对大数据进行深度分析的工具是( C )。
A 、浅层神经网络
B 、Scala
C 、深度学习
D 、MapReduce
16大数据的起源是( C )。
A、金融
B、电信
C、互联网
D、公共管理
17智慧城市的构建,不包含(C)。
A、数字城市
B、物联网
C、联网监控
D、云计算
18大数据的4V 特征中的Volume 是指(D)。
A、价值密度低
B、处理速度快
C、数据类型繁多
D、数据体量巨大
19大数据的4V 特征中的Variety 是指(C)。
A、价值密度低
B、处理速度快
C、数据类型繁多
D、数据体量巨大
20大数据的4V 特征中的Velocity 是指(B)。
A、价值密度低
B、处理速度快
C、数据类型繁多
D、数据体量巨大
21下列关于大数据的分析理念的说法中,错误的是(D)。
A、在数据基础上倾向于全体数据而不是抽样数据
B、在分析方法上更注重相关分析而不是因果分析
C、在分析效果上更追究效率而不是绝对精确
D、在数据规模上强调相对数据而不是绝对数据
2大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行(B )。
A、数据信息
B、专业化处理
C、速度处理
D、内容处理。