hadoop运行wordcount实例

启动hadoop常见问题:

1、启动hadoop出现java no such file or directory,解决办法:cygwin下运行命令dos2unix conf/hadoop-env.sh,将hadoop-env.sh
文件中的windows字符转为unix字符即可

2、namenode无法启动,解决办法:关闭hadoop和cygwin,更改core-site.xml中hadoop.tmp.dir的值为/cygdrive/d/tmp/hadoop-${https://www.360docs.net/doc/ed14154663.html,}(tmp路径,可自己定义),重启电脑

3、运行实例出现IO异常,原因是datanode未启动,具体原因是运行hadoop namenode -format时只格式化了namenode导致datanode信息与namenode信息不一致导致不能启动,解决办法:找到问题1中的tmp,删除tmp下所有文件,然后打开cygwin,运行hadoop namenode -format再启动start-all.sh问题解决



运行hadoop自带wordcount实例步骤:

1、打开cygwin,启动hadoop,运行jps命令查看节点启动情况

2、切换到hadoop根目录,运行指令 echo "hello boy hei baby hello word hello hadoop baby girl baby">f1.txt 在hadoop根目录下新建f1.txt,可用-ls 查看是否创建成功

3、运行指令 bin/hadoop fs -mkdir input 在hdfs上新建一文件夹,命名为input

4、运行指令 bin/hadoop fs -put f1.txt input 将f1.txt复制到input文件夹下,运行bin/hadoop fs -ls input查看是否复制成功

5、运行指令 bin/hadoop jar hadoop-0.20.2-examples.jar wordcount input output 并输出到output文件夹下

6、运行指令 bin/hadoop fs -cat output/* 查看输出结果,即词频统计结果

相关主题
相关文档
最新文档