大数据实训方案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据实训教学大纲

1 / 5

一、实训目标

基于Hadoop为核心,通过实训,达成以下目的:

➢➢➢➢➢

➢➢

➢认识大数据,认识大数据技术在新时代对企业的重要性。

掌握 Linux的基础知识和应用

掌握hadoop集群环境的搭建。

熟悉HDFS分布式文件系统的原理,掌握HDFS的API的开发。

通过实际案例的开发,了解MapReduce原理,掌握MapReduce的开发技术。

了解Hive,学习Hive集群的搭建。掌握Hive的DML和DDL相关技术。认识ZooKeeper,学些ZooKeeper集群的搭建,了解ZooKeeper在Hadoop集群中的作用。

了解HBase原理和架构,掌握HBase API编程,掌握HBase数据的导入和导出。

通过综合案例实践,掌握Hadoop以及相关框架的开发和应用。

二、实训课程内容介绍

1、课程大纲

3 / 52、通过案例初步认识大数据

Linux入门1、Linux简介、安装

2、常用命令

3、文件权限及操作

4、用户及权限管理

5、Linux下搭建Java开发环境

Hadoop入门1、Hadoop介绍

2、Hadoop安装配置

3、hadoop初始化和测试

4、配置ssh免密码登陆配置和ssh原理

HDFS 1、HDFS原理

2、HDFS的shell操作

3、HDFS原理

4、HDFS的java接口

5、Hadoop RPC

6、HDFS读取数据过程

技术速成

Map-Reduce 技术培训

1、MR介绍

2、WordCount执行流程和代码编写

4 / 5

5 / 5

相关文档
最新文档