零基础学习hadoop(编程篇)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.hadoop编程需要哪些基础?

2.hadoop编程需要注意哪些问题?

3.如何创建mapreduce程序及其包含几部分?

4.如何远程连接eclipse,可能会遇到什么问题?

5.如何编译hadoop源码?

阅读此篇文章,需要些基础下面两篇文章

零基础学习hadoop到上手工作线路指导(初级篇)

零基础学习hadoop到上手工作线路指导(中级篇)

如果看过的话,看这篇不成问题,此篇讲hadoop编程篇。

hadoop编程,hadoop是一个Java框架,同时也是编程的一次革命,使得传统开发运行程序由单台客户端(单台电脑)转换为可以由多个客户端运行(多台机器)运行,使得任务得以分解,这大大提高了效率。

hadoop既然是一个Java框架,因为我们必须要懂Java,网上有大量的资料,所以学习Java 不是件难事。但是学到什么程度,可能是我们零基础同学所关心的。

语言很多情况下都是相通的,如果你是学生,还处于打基础的阶段,那么难度对于你来说还是不小的。

1.初学者要求必须有理论基础,并且能够完成一个小项目,最起码能够完成几个小例子,例如图书馆里等。

初学者基本的要求:

(1)懂什么是对象、接口、继续、多态

(2)必须熟悉Java语法

(3)掌握一定的常用包

(4)会使用maven下载代码

(5)会使用eclipse,包括里面的快捷键,如何打开项目

传统程序员,因为具有丰富的编程经验,因此只要能够掌握开发工具:

(1)会使用maven下载代码

(2)会使用eclipse,包括里面的快捷键,如何打开项目

(3)简单熟悉Java语法

上面的只是基础,如果想开发hadoop,还需要懂得下面内容

(1)会编译hadoop

(2)会使用hadoop-eclipse-plugin插件,远程连接集群

(3)会运行hadoop程序。

上面列出大概的内容,下面我们具体说一些需要学习的内容。

无论是传统开发人员还是学生,零基础下面都是需要掌握的:

我们就需要进入开发了。开发零基础,该如何,咱们提供了相关的内容分别介绍下面文章

学习hadoop----java零基础学习线路指导视频(1)

这一篇我们使用什么开发工具,甚至考虑使用什么操作系统。然后就是Java基础知识篇,包括变量、函数等。

学习hadoop---Java初级快读入门指导(2)

第一篇是属于思想篇,那么这一篇属于实战篇,通过不同的方式,交给你怎么编写第一个小

程序。

Java零基础:一步步教你如何使用eclipse创建项目及编写小程序实例

由于上面没有真正抽象出eclipse的使用,所以这里专门介绍了使用eclipse如何创建项目,及如何编写小程序实例

java基础:eclipse编程不得不知道的技巧

eclipse基本知识会了之后,我们在项目,这些技巧相当有用,而且经常用到

一、考虑开发环境

上面是我们打基础,有了这些基础,我们就开始学习开发hadoop了,但是我们该怎么搭建环境,我们知道Windows有32、64位之分,jdk也有,那么该如何解决,我们在window32位上需要使用32位jdk,64位则使用64位jdk,同样如果Linux则使用Linux32位于64位。

更详细,可以参考零基础利用Java开发hadoop需要考虑的问题

二、使用J2SE、J2EE

使用Java我们需要整体了解Java语言,Java包含下面三种

∙J2EE java企业版,主要用于web开发

∙J2SE java 标准版,主要用于WEB开发,但是缺少企业版的一些特性,一般情况下java下的应用都是指J2SE的开发。

∙J2ME java微小版,主要用于手机等的开发

因此如果我们想处理、并展示数据,可以使用J2EE,更详细参考

hadoop开发--Java零基础之J2EE、J2SE、J2ME的区别

三、对Java有了一定的认识,我们开始使用Java

1.环境变量配置

对于惯用集成环境的开发者来讲,这有点不适应,比如.net,安装开发环境vs,直接开发就好了,为啥还需要配置环境变量。

环境变量可以让我们找到jdk的命令,这个或许.net的一点好处,就是都封装起来了。别的不用关心了。对于环境变量,我们

需要配置java_home,path路径,更详细参考:

hadoop开发--Java零基础之开发工具环境变量配置

2.开发工具选择

开发工具有很多种,不同的人习惯不同,开发工具也不一样,这里列出个人认为比较常用1.eclipse

2.MyEclipse

3.maven

更多工具参考hadoop开发—Java零基础,开发选择什么开发工具比较合适

而其中maven可以和eclipse一起使用,也可以单独使用,后面开发中它还是比较常用的,比如我们下载hadoop源码,编译hadoop,都是需要maven来完成的。

maven的学习可以参考

源码编译maven系列视频教程汇总

3.Java编译

Java可以一处编译处处运行,原因是因为jvm。编译后的效果,可以查看:

Java零基础,学习hadoop:为什么要编译Java源代码,编译后会有什么效果

4.如何打开Java项目

Java项目的开发,还是比较特别的,是通过导入的方式,折合其它比如.net项目,直接点击图标就能打开,Java项目,例如通过eclipse的import导入,详细参考下面帖子:

零基础教你如何导入Java项目到eclipse中

5.Java资源下载:

上面补充了一些基本的知识,可能还不够全面,如果缺少这方面的知识,有两种办法:

1.百度,查看视频,缺什么看什么视频

2.如果想自己什么时候,都能看,可以下载下面的资源

javaWeb图书馆管理系统源码mysql版本

Java使用hadoop开发基础:Javaweb视频共享

几百GJava文件共享

java百G内容下载:包含自学,入门,高级应用,案例等

Java基础完毕,我们终于可以开发了,其实开发也并不怎么困难,经常遇到的问题如下:1.使用插件连接不上集群

windows下连接集有两个原因

1.用户名不一致

解决办法:

1、如果是测试环境,可以取消hadoop hdfs的用户权限检查。打开conf/hdfs-site.xml,找到dfs.permissions属性修改为false(默认为true)OK了。(1.2.1 版本只有这个方法可行),如何操作可以参考第一个问题。

相关文档
最新文档