大数据应用技术课程介绍

合集下载

《大数据应用基础》课程标准(含课程思政)

《大数据应用基础》课程标准(含课程思政)

《大数据应用基础》课程标准大数据基础二、适用专业大数据技术应用三、课程学时与学分36学时,2学分四、课程性质本课程是大数据技术应用专业的一门专业基础课程,是从事大数据工程技术人员等新职业岗位必须学习的课程,旨在为学生提供大数据应用方面的基础知识,包括大数据概述、大数据处理、大数据存储和大数据应用案例等内容,使学生具备大数据应用的基础理论和实践能力。

本课程开设在第2学期,将为后续学习《互联网数据采集》《数据库技术应用》等课程奠定基础。

五、课程目标通过本课程的学习,能够完成对大数据生产流程绘制,熟悉认知大数据采集、分析、存储、可视化等各种工具和平台,能够厘清大数据与网络技术、物联网、云计算、人工智能的发展关系与发展方向,并通过大数据技术在不同行业产业的案例分析,能够进行大数据存储和分析应用,树立大数据思维,拓展科技素养。

达到以下具体目标:( 一) 素养目标1.坚定拥护中国共产党领导和我国社会主义制度,在习近平新时代中国特色社会主义思想指引下,自觉践行社会主义核心价值观,具有深厚的爱国情感和中华民族自豪感;(培养规格1)2.充分了解大数据行业法规法则,自觉维护行业良好风气;(培养规格2、S—A—2)3.具备数据思维,具备较强的逻辑思维能力; (培养规格3)4.培养学生对大数据应用的认识和理解,以及对大数据应用的价值和影响的思考。

学生需要通过学习大数据基础课程,增强对大数据应用的兴趣和探索欲望,了解大数据对社会、经济、科技等方面的影响,具备良好的职业素养和创新意识。

(培养规格5)5.具有社会责任感,能够传递正确的社会价值,时刻维护国家的荣誉与形象;(培养规格2、S—A—3)6.树立正确的职业观,注意保护数据安全、保障他人隐私,爱岗敬业、德技并修;(培养规格2、S—A—4)7.有自觉学习新一代信息技术的意识,能够主动进行自我知识更新与学习。

(培养规格7、D—A—3)(二)知识目标1.掌握大数据应用的基础知识,包括大数据的概念、特征、处理和存储等方面的知识;(培养规格11)2.了解大数据的技术架构、处理方法和工作流程;(培养规格11)3.掌握大数据存储和管理的基本方法; (培养规格11)4.熟悉大数据相关法律法规,对大数据行业的信息安全形成基础的认知;(培养规格12)5.了解大数据行业基本情况、了解大数据行业应用场景与岗位分工,明确大数据产品形态与技能要求; (培养规格15)6.厘清大数据与网络技术发展、云计算、物联网、人工智能的发展关系与发展方向;(培养规格16)7.了解大数据生产工作流程中应用到的数据采集、存储、可视化、分析等各种工具和平台,掌握基础的工具使用方法和步骤。

大数据技术原理与应用 课程简介

大数据技术原理与应用 课程简介

大数据技术原理与应用课程简介大数据技术原理与应用是一门涵盖了大数据技术的基本原理和应用案例的课程。

随着互联网的快速发展和信息技术的不断进步,大数据已经成为了当今社会中一个重要的话题。

本课程旨在帮助学生理解大数据技术的基本原理,并了解其在各个领域的应用。

本课程将介绍大数据技术的基本原理。

学生将学习如何有效地收集、存储和处理大规模数据。

课程将涵盖分布式系统、数据管理、数据挖掘和机器学习等方面的知识。

学生将学习如何使用Hadoop、Spark和NoSQL等工具和技术来处理大数据。

本课程将介绍大数据技术在各个领域的应用。

大数据技术已经被广泛应用于金融、医疗、交通、能源和零售等领域。

学生将学习如何利用大数据技术来分析金融市场、预测疾病爆发、优化交通流量、提高能源利用效率和改进零售营销策略。

课程将通过实际案例和项目来帮助学生理解大数据技术在实际应用中的价值和挑战。

本课程还将介绍大数据技术的发展趋势和未来发展方向。

学生将了解到大数据技术在人工智能、物联网和区块链等新兴领域的应用潜力。

课程将引导学生思考大数据技术对社会和个人的影响,并讨论与之相关的伦理和法律问题。

在课程的教学过程中,将采用多种教学方法和资源。

除了传统的课堂讲授,还将组织实践活动、案例分析和小组讨论。

学生将有机会参与到真实的大数据项目中,锻炼数据分析和解决问题的能力。

通过学习本课程,学生将获得以下几方面的收益。

首先,他们将掌握大数据技术的基本原理,了解大数据处理和分析的方法和工具。

其次,他们将了解大数据技术在各个领域的应用案例,培养对大数据应用的思维和创新能力。

最后,他们将了解大数据技术的发展趋势和未来潜力,为自己的职业发展做好准备。

大数据技术原理与应用是一门重要的课程,它将帮助学生了解大数据技术的基本原理和应用案例。

通过学习本课程,学生将获得大数据技术的基本知识和实践经验,为将来在大数据领域的工作和研究打下坚实的基础。

同时,学生还将培养数据分析和解决问题的能力,为未来的职业发展做好准备。

《大数据技术应用》课程标准.

《大数据技术应用》课程标准.

《大数据技术应用》课程标准课程名称:大数据技术应用适用专业:云计算技术与应用课程代码:参考学时:64一、课程概述1. 课程定位《大数据技术应用》课程是一门面向各类专业的大数据应用通识性入门课程。

在国家推行大数据落地并鼓励高校开设创新创业教育课程的背景下,本课程属于创新型课程,目前在计算机应用、经管类、财务会计、电子商务、物联网、数据分析等专业已经逐步推行,可作为各适用专业的必修课程。

本课程旨在通过介绍大数据产生、大数据技术基础、大数据处理、分析、挖掘和可视化的完整过程,让学生了解大数据是什么及其应用价值,全方位了解理论知识。

同时结合工具和开发语言实现数据采集、存储、处理、分析、挖掘以及可视化等操作,利用实践操作和应用案例促进学生动手分析能力,掌握运用大数据分析软件的技能和方法。

2. 课程设计思路和理念(1)设计思路本课程主要理论结合实践,每个章节讲解理论的同时以各种软件实操和案例作为论证和巩固,提高学生学习的趣味。

此外本课程包含众多实操分析案例,在案例操作的过程中,一方面需要指导学生完成案例操作的任务,利用工具和开发语言实现数据采集、存储、处理、分析、挖掘以及可视化等技能,另一方面需要激发学生主动学习、深入研究的热情。

本课程立足于实际能力培养,打破以知识传授为主要特征的传统学科课程模式,转变为以实际操作任务为中心组织课程内容和课程教学,整合理论和实践,让学生在完成具体案例的过程中来构建和了解相关理论知识体系,并发展大数据技术应用的职业能力。

本课程实施项目教学以改变学与教的行为。

(2)设计理念根据不同专业,在内容的选择上,要从结合本专业综合技能和加强应用的角度选择教材的内容,大胆取舍,并适当补充贴合本专业的数据分析案例,以满足专业岗位的需求。

实施模块化的、弹性的、互动的、多层次的教学,以满足职业岗位群的需求。

打破以教材为主的教学内容,结合额外的案例资源、网络视频资源等形成一套崭新的教学内容。

这套内容要弱化形式化的理论讲述,强化工具的实际应用。

大数据技术应用专业学什么课程

大数据技术应用专业学什么课程

大数据技术应用专业学什么课程大数据技术在当今社会中扮演着越来越重要的角色,许多企业都在积极地应用大数据技术来优化业务流程、提高效率和获取商业价值。

因此,学习大数据技术应用成为许多学生的热门选择。

那么,大数据技术应用专业究竟应该学习哪些课程呢?数据处理与分析数据处理与分析是大数据技术应用专业中的核心课程之一。

学生需要学习如何采集、存储、清洗和分析大规模数据集。

这些课程涵盖了数据处理工具、技术和流程,帮助学生掌握处理各种类型数据的能力。

数据挖掘与机器学习数据挖掘与机器学习是大数据技术应用中另一个至关重要的领域。

学生需要学习如何运用机器学习算法来发现数据中的模式、趋势和关联性。

这些课程将帮助学生在海量数据中找到有用的信息,为企业决策提供支持。

大数据系统与架构了解大数据系统与架构是大数据技术应用专业不可或缺的一部分。

学生需要学习各种大数据处理框架和工具,以及它们在构建大规模数据处理系统中的应用。

这些课程将使学生能够设计和实施高效、可靠的大数据处理系统。

数据可视化与报告数据可视化与报告是大数据技术应用中的重要组成部分。

学生需要学习如何利用各种可视化工具和技术来表现数据,并将分析结果有效地传达给各种受众群体。

这些课程将培养学生在数据分析方面的沟通能力和创造力。

项目管理与实践项目管理与实践课程是大数据技术应用专业中不可或缺的一环。

学生需要学习如何规划、执行和监控大数据项目,以确保项目顺利完成并达到预期目标。

这些课程将使学生具备组织、领导和协作的能力。

总的来说,大数据技术应用专业的课程设置涵盖了数据处理与分析、数据挖掘与机器学习、大数据系统与架构、数据可视化与报告以及项目管理与实践等多个方面。

通过系统地学习这些课程,学生将能够掌握大数据技术应用所需的核心知识和技能,为未来职业发展打下坚实的基础。

大数据应用 课程特色

大数据应用 课程特色

大数据应用课程特色
在当今信息爆炸的时代,大数据已经成为各行各业关注的焦点。

为了满足这一需求,许多高校纷纷开设大数据应用课程,旨在培养具备大数据处理和分析能力的专业人才。

本文将重点介绍大数据应用课程的特色,帮助读者更好地了解这一领域。

一、强调实践操作
大数据应用课程非常注重实践操作。

学生将通过实际项目,掌握大数据处理的全流程,包括数据采集、清洗、存储、分析、可视化等环节。

这种实践教学方式能够帮助学生更好地理解理论知识,提高动手能力,为未来的职业发展打下坚实基础。

二、涵盖多种数据处理技术
大数据应用课程涉及多种数据处理技术,包括Hadoop、Spark等分布式计算框架,SQL、NoSQL等数据库技术,以及数据挖掘、机器学习等算法。

这些技术的掌握能够帮助学生更好地应对不同类型的数据处理需求,提高工作效率。

三、注重数据安全与隐私保护
随着大数据应用的普及,数据安全与隐私保护问题日益凸显。

大数据应用课程会涵盖相关内容,使学生了解数据加密、访问控制、隐私保护等方面的知识,培养学生在使用大数据时的法律意识和道德观念。

四、结合行业案例分析
为了使学生更好地理解大数据在实际应用中的价值,大数据应用课程会结合各行各业的案例进行分析。

这些案例包括金融、医疗、电商等领域,帮助学生了解不同行业的业务背景和数据处理需求,提高解决实际问题的能力。

五、培养学生的创新思维
大数据应用课程不仅注重技术传授,还注重培养学生的创新思维。

课程会鼓励学生独立思考,挖掘数据的潜在价值,为行业发展提供新的思路和方法。

通过这种创新思维的培养,学生能够更好地适应不断变化的市场环境,成为行业中的佼佼者。

《大数据技术及应用》教学大纲[3页]

《大数据技术及应用》教学大纲[3页]
教学重点:HDFS的体系结构和工作原理、HDFS文件系统的操作命令
教学难点:利用pyhdfs实现HDFS文件系统的操作
4+2
第5章HBase基础与应用
教学内容:
(1)HBase的体系结构、核心组件和工作原理
(2)HBase的常用命令,使用命令对HBase系统进行操作
(3)利用Jyhdfs实现HBase数据库系统的操作
课程学习目标
学习目标1:掌握大数据的基本原理、主流的大数据处理平台和技术方法。
学习目标2:提高学生应用大数据思维和技术方法解决实际问题的能力。
学习目标3:培养学生运用大数据技术中的科学思维与计算思维,激发学生科技报国、奉献社会的情怀和使命担当。
二、课程教学内容和学时分配
章节
教学内容及其重难点
学时安排
4+2
第8章大数据分析与挖掘
教学内容:
(1)数据的描述性分析
(2)回归、分类与聚类的基本原理与常用算法
(3)分布式大数据挖掘算法典型案例
教学重点:回归、分类与聚类的基本原理与常用算法
教学难点:基于MapReduce的分布式大数据挖掘算法的设计与实现
4+2
第9章数据可视化
教学内容:
(1)数据可视化的常用方法
《大数据技术及应用》课程教学大纲
一、课程基本信息
课程
编号
课程
名称
大数据技术及应用
课 程 基 本 情 况
学时
32(课堂)+18(实验)
课程性质
专业选修
先修课程
高级语言程序设计,数据库原理
考核方式
考试,作业考核,课堂表现考核
教材及
参考书
教材:严宣辉,张仕,赖会霞,韩凤萍.大数据技术及应用—基于Python语言.电子工业出版社.2021.10

中职大数据技术应用专业课程设置

中职大数据技术应用专业课程设置

中职大数据技术应用专业课程设置
随着大数据技术的迅猛发展,企业日益需要掌握大数据技术来进行企业决策和业务优化。

在此背景下,中职大数据技术应用专业应运而生。

为提高学生的实际操作能力和就业竞争力,中职大数据技术应用专业课程设置应具备以下几个方面:
一、基础课程
包括计算机基础、编程语言、数据库基础、网络技术、操作系统等课程,这些课程是学生理解和掌握大数据技术的基石,必须具备的基础知识。

二、专业课程
包括数据结构与算法、数据挖掘、机器学习、人工智能、云计算等课程,这些课程是学习大数据技术应用的核心课程。

学生通过学习这些课程,可以深入了解大数据技术应用的原理和方法,提高自己的技术水平。

三、实践课程
包括大数据平台操作、数据分析、数据可视化、数据建模等课程,这些课程是学生将理论知识转化为实际应用的重要环节。

通过实践课程的学习,学生可以掌握大数据技术应用的实际操作能力。

四、创新课程
包括大数据应用案例、项目实践、创新设计等课程,这些课程是学生将所学知识应用于实际生活和工作中的重要环节。

通过创新课程的学习,学生可以提高自己的创新意识和实际操作能力,为未来的就
业和创业打下坚实的基础。

综上所述,中职大数据技术应用专业课程设置应该以基础课程、专业课程、实践课程和创新课程为主要内容,旨在培养学生的实际操作能力和创新能力,为学生的未来就业和创业打下坚实的基础。

《Hadoop大数据技术原理与应用》课程教学大纲

《Hadoop大数据技术原理与应用》课程教学大纲

《Hadoop大数据技术原理与应用》课程教学大纲课程编号:3250578学分:4学分学时:72学时(其中:讲课学时36上机学时:36)先修课程:《Linux基础》、《关系数据库基础》、《程序设计基础》、《Java面向对象编程》后续课程:Spark,《Python编程基础》、《Python数据分析与应用》适用专业:大数据应用技术一、课程的性质与目标《大数据应用开发》本课程是软件技术专业核心课程,大数据技术入门课程。

通过学习课程使得学生掌握大数据分析的主要思想和基本步骤,并通过编程练习和典型应用实例加深了解;同时对Hadoop平台应用与开发的一般理论有所了解,如分布式数据收集、分布式数据存储、分布式数据计算、分布式数据展示。

开设本学科的目的是让学生掌握如何使用大数据分析技术解决特定业务领域的问题。

完成本课程学习后能够熟练的应用大数据技术解决企业中的实际生产问题。

二、教学条件要求操作系统:CenterOSHadoop版本:Hadoop2.7.4开发工具:Eclipse三、课程的主要内容及基本要求第I章初识Hadoop第3章HDFS分布式文件系统本课程为考试课程,期末考试采用百分制的闭卷考试模式。

学生的考试成绩由平时成绩(30%)和期末考试(70%)组成,其中,平时成绩包括出勤(5%)、作业(5%)、上机成绩(20%)o六、选用教材和主要参考书本大纲是参考教材《Hadoop大数据技术原理与应用》所设计的。

七、大纲说明本课程的授课模式为:课堂授课+上机,其中,课堂主要采用多媒体的方式进行授课,并且会通过测试题阶段测试学生的掌握程度;上机主要是编写程序,要求学生动手完成指定的程序设计或验证。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
培训目标: 使学员能够了解流处理的概念、使用场景,Storm 的相关概念以及应用场景
5.3 FLUME
FLUME 介绍 Flume 最早是 Cloudera 提供的日志收集系统,目前是 Apache 下的一个孵化项目,Flume 支持在日志系统中定制各类数据发送方,用于收集数据。 Flume 提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力 Flume 提供 了从 console(控制台)、RPC(Thrift-RPC)、text(文件)、tail(UNIX tail)、syslog(syslog 日志系统,支持 TCP 和 UDP 等 2 种模式),exec(命令执行)等数据源上收集数据的能 力。
培训内容 1、redis 的安装
2、redis 试用场景 3、redis 的简要开发方式(JAVA 语言)
目标 通过对 redis 的学些,掌握 redis 简单的安装、配置、开发、试用的方式和方法
5.5 ZooKeeper
介绍: ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby
培训内容 1、FLUME-NG 的安装 2、Flume 的组件分类 3、FLUME-NG 的工作方式 4、FLUME-NG 的配置 5、以 UDP SYSLOG 采集为例,说明 FLUME 的配置
目标 通过对 FLUME 的学习,使学员初步掌握分布式数据采集、拓扑配置的方式和方法
5.4 REDIS
介绍 Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、 Key-Value 数据库,并提供多种语言的 API。
3 培训课程列表
1. hadoop 生态系统 (1)HDFS (2)MapReduce2 (3)Hive (4)HBase (5)Sqoop (6)Impala (7)Spark
2. Storm 流计算 3. Flume 分布式数据处理 4. Redis 内存数据库 5. ZooKeeper
(2 课时) (2 课时) (1 课时) (2 课时) (1 课时) (1 课时) (4 课时) (2 课时) (2 课时) (1 课时) (1 课时)
培训内容: Hbase 组件的安装 Hbase 与传统 RDBMS 的比较 Hbase 的一些特性 Hbase 的访问方式
培训目标: 使学员初步了解 Hive 的作用,以及简单的 Hbase 应用
5) SQOOP
介绍:
Sqoop(发音:skup)是一款开源的工具,主要用于在 HADOOP(Hive)与传统的数 据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres 等)中的数据导进到 Hadoop 的 HDFS 中,也可以将 HDFS 的 数据导进到关系型数据库中。 培训内容:
大数据应用技术网络课程
1 课程目标
通过讲解几种主流大数据产品和技术的特性、实现原理和应用方向,并组织实习项 目,使学员了解并初步掌握目前流行的大数据主流技术(采集、存储、挖掘等),了解 其特点以及使用的场景,具备一定的大数据系统架构能力,并能自行开展简单的大数据 应用开发。
2 课程内容
本次课程讲解的大数据产品和技术包括:hadoop、storm、flume 等,其中以 hadoop 为 主要培训内容。
念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语 言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会
分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现 是指定一个 Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并 发的 Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。
一个开源的实现,是 Hadoop 和 Hbase 的重要组件。它是一个为分布式应用提供一致性服务 的软件,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。
培训内容: Zookeeper 原理 Zookeeper 部署 Zookeeper 使用(以 java 为例)
培训目标: 使学员能够基本了解 zookeeper 在各种分布式系统中的作用,并初步掌握其使用方式
Storm 集成了许多库,支持包括 Kestrel、Kafka、JMS、Cassandra、 Memcached 以及更 多系统。随着支持的库越来越多,Storm 更容易与现有的系统协作。
培训内容: 流处理的概念 Storm 的原理 Storm 的安装 Storm 流处理机制 Storm 数据流分发机制 Storm 消息机制
Sqoop 组件的安装 数据导入导出 Hive 数据导入一致性 培训目标: 使学员了解 Sqoop 的使用,并能做一些简单的 RDBMS 与 Hive 之间的数据导入 导出工作
6) IMPALA
介绍: Impala 是 Cloudera 公司主导开发的新型查询系统,它提供 SQL 语义,能查询
存储在 Hadoop 的 HDFS 和 HBase 中的 PB 级大数据。已有的 Hive 系统虽然也提供了 SQL 语义,但由于 Hive 底层执行使用的是 MapReduce 引擎,仍然是一个批处理过 程,难以满足查询的交互性。相比之下,Impala 的最大特点也是最大卖点就是它的 快速。 培训内容:
4) HBASE
介绍: HBase 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰
写的 Google 论文“Bigtable:一个结构化数据的分布式存储系统”。就像 Bigtable 利用 了 Google 文件系统(File System)所提供的分布式数据存储一样,HBase 在 Hadoop 之上提供了类似于 Bigtable 的能力。HBase 是 Apache 的 Hadoop 项目的子项目。HBase 不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不 同的是 HBase 基于列的而不是基于行的模式。
5.2 Storm
介绍: Storm 是一个用 Clojure 语言实现的免费开源、分布式、高容错的实时计算系统。Storm
令持续不断的流计算变得容易,弥补了 Hadoop 批处理所不能满足的实时要求。 Storm 经 常用于在实时分析、在线机器学习、持续计算、分布式远程调用和 ETL 等领域。Storm 的 部署管理非常简单,而且,在同类的流式计算工具,Storm 的性能也是非常出众的。
培训内容: HDFS 设计的思路 HDFS 的模块组成(NameNode、DataNode) HADOOP Core 的安装 HDFS 参数含义及配置 HDFS 文件访问方式
培训目标: 使学员掌握 HDFS 这个 HADOOP 基础套件的原理、安装方式、配置方法等
2) MAPREDUCE
介绍: MapReduce 是一种编程模型,用于大规模数据集(大于 1TB)的并行运算。概
HDFS、HBase 离线大数据分析
MapReduce、Hive 在线大数据处理
Impala、Storm(流处理)、Spark、Redis(内存数据库)、HBase 数据采集
Flume 等 辅助工具
Zookeeper 等
5.1 Hadoop
1) HDFS
介绍: Hadoop 分布 式文件系统(HDFS)被 设计成适合 运行在通 用硬件 (commodity
4 培训方式
学员以观看录像、视频会议等方式进行学习,搭建集中环境供大家实习,并设置作 业和答疑环节。每周视频课程约 2 个课时,作业和实习时间约需 2-3 小时,课程持续 10 周左右。
5 课程内容简介
大数据技术在近两年发展迅速,从之前的格网计算、MPP 逐步发展到现在,大数 据技术发展为 3 个主要技术领域:大数据存储、离线大数据分析、在线大数据处理,在 各自领域内,涌现出很多流行的产品和框架。 大数据存储
张数据库表,并提供简单的 sql 查询功能,可以将 sql 语句转换为 MapReduce 任务 进行运行。其优点是学习成本低,可以通过类 SQL 语句快速实现简单的 MapReduce 统计,不必开发专门的 MapReduce 应用,十分适合数据仓库的统计分析。 培训内容:
Hive 组件的安装 Hive 与传统关系型数据库的区别 Hive 的一些特性 Hive 的访问方式 简单 HiveQL 语言介绍 培训目标: 使学员初步了解 Hive 的作用,以及简单的 hiveql
培训内容: MapReduce 环境配置 JobTracker/TaskTracker 的作用 简单的 MapReduce 示例
培训目标: 使学员初步了解 MapReduce 的工作原理与使用方式
3) HIVE
介绍: hiv的数据文件映射为一
内存计算,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计 算范式,是罕见的全能选手。 培训内容:
Spark 的工作模式 Spark 与 Hadoop/MapReduce 的关系与区别 Spark 的安装 Spark 的使用 培训目标: 使学员初步了解 Spark 这种新兴起的技术,以及它与目前广泛使用的 Hadoop 类技术的区别
Impala 的工作原理及其与 Hive 的区别 Impala 的一些特性 Impala 的安装 Impala 的访问 培训目标: 使学员初步了解 Impala 的作用,以及简单的 impala 的使用
7) SPARK
介绍: Spark 是发源于美国加州大学伯克利分校 AMPLab 的集群计算平台。它立足于
hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同 时,它和其他的分布式文件系统的区别也是很明显的。HDFS 是一个高度容错性的 系统,适合部署在廉价的机器上。HDFS 能提供高吞吐量的数据访问,非常适合大 规模数据集上的应用。HDFS 放宽了一部分 POSIX 约束,来实现流式读取文件系统 数据的目的。HDFS 是 Apache Hadoop Core 项目的一部分。
相关文档
最新文档