Hadoop集群上运行mapreduce

日期：2018-7-21

环境

本文是在windows上的eclipse开发mapper reduce 使用yarn框架，并在虚拟机Hadoop集群上运行程序，大致过程是：先将编写好的代码文件打包好上传到虚拟机然后执行jar文件。

这里运行hadoop安装目录下\share\hadoop\mapreduce里面的“hadoop-mapreduce-examples-2.9.1”文件的wordcount
1.首先进入hadoop安装目录打开yarn集群，执行如下命令

（首先确认配置好了yarn-site.xml和mapred-site.xml文件没配置的参考：yarn配置 - 点击打开）
1
2
cd /home/hadoop/hadoop #进入到hadoop安装目录
./sbin/start-all.sh

2.打开集群之后先在集群创建输入文件夹以及上传输入文件，执行如下代码

首先在本地创建一个输入文件（这里是input.txt）

1 2	touch input.txt //创建input.txt文件 ll //列出当前目录文件，查看是否创建成功

3.打开之后找到mapreduce的自带示例代码文件

执行命令查看

1 2	cd /home/hadoop/hadoop #进入到hadoop安装目录 find ./ -name example.jar

然后执行如下命令（注意使用自己的路径，版本不同文件名会有所不同）

1	hadoop jar /share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.1.jar wordcount /input/input.txt /output

查看运行结果

1
2
3

hadoop fs -get /out ./ #将输出文件夹下载到本地目录
ll  #这里是下载到当前目录，列出当前目录下文件查看是否下载成功
ll ./out #查看输出文件夹里面的文件

1.配置eclipse

2.代码

3.运行