Hadoop Yarn环境配置

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Hadoop Yarn环境配置

抄一个可行的Hadoop Yarn环境配置。用的官方的2.2.0版本。

/bigdata/yarn.html

Hadoop 2.2新特性

将Mapreduce框架升级到Apache YARN，YARN将Map reduce工作区分为两个：JobTracker组件：实现资源管理和任务JOB；计划/监视组件：划分到单独应用中。使用MapReduce的2.0，开发人员现在可以直接Hadoop内部基于构建应用程序。Hadoop2.2也已经在微软widnows上支持。

YARN带来了：

1.HDFS的高可靠性

2.HDFS snapshots快照

3.支持HDFS中的NFSv3 文件系统。

Yarn/map reduce2.0架构图：

其中灰绿的箭头是Mapreduce处理流程，黑色虚线是任务Job提交，由客户端提交给RM，由各个节点发出资源请求到RM获取，当然他们也将各自的状态反馈到到RM。

安装Hadoop 2.2

从/apache/hadoop/common/stable2/下载。百度云盘下载。

解压到/home/hduser/yarn目录，假设hadoop是用户名。

$ tar -xvzf hadoop-2.2.0.tar.gz

$ mv hadoop-2.2.0 /home/hadoop/yarn/hadoop-2.2.0

$ cd /home/hadoop/yarn

$ sudo chown -R hadoop:hadoop hadoop-2.2.0

$ sudo chmod -R 755 hadoop-2.2.0

在~/.bashrc设置环境，将下面加入：

export HADOOP_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0

export HADOOP_MAPRED_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0 export HADOOP_COMMON_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0 export HADOOP_HDFS_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0

export YARN_HOME=$HOME/Programs/Hadoop/hadoop-2.2.0

export HADOOP_CONF_DIR=$HOME/Programs/Hadoop/hadoop-2.2.0/etc/hadoop $ source ~/.bashrc

创建Hadoop数据目录：

$ mkdir -p $HOME/yarn/yarn_data/hdfs/namenode

$ mkdir -p $HOME/yarn/yarn_data/hdfs/datanode

配置：

$ cd $YARN_HOME

$ vi etc/hadoop/yarn-site.xml

编辑yarn-site.xml

加入下面喊在yarn-site.xml:

#etc/hadoop/yarn-site.xml .

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class

org.apache.hadoop.mapred.ShuffleHandler

单个集群节点设置：

$ vi etc/hadoop/core-site.xml

加入下面内容在配置

hdfs://localhost:9000

$ vi etc/hadoop/hdfs-site.xml

加入下面内容

dfs.replication

.dir

file:/home/hadoop/yarn/yarn_data/hdfs/namenode

dfs.datanode.data.dir

file:/home/hadoop/yarn/yarn_data/hdfs/datanode

$ vi etc/hadoop/mapred-site.xml

如果这个文件不存在，创建，拷贝粘贴下面的配置。

yarn

格式化namenode(Onetime Process)

$ bin/hadoop namenode -format

启动HDFS处理和Map-Reduce 处理：

# HDFS(NameNode & DataNode)部分：

$ sbin/hadoop-daemon.sh start namenode

$ sbin/hadoop-daemon.sh start datanode

# MR(Resource Manager, Node Manager & Job History Server).部分：$ sbin/yarn-daemon.sh start resourcemanager

$ sbin/yarn-daemon.sh start nodemanager

$ sbin/mr-jobhistory-daemon.sh start historyserver

确认安装：

$ jps

# 应该输出：

22844 Jps

28711 DataNode

29281 JobHistoryServer