安装 JDK 和 IntelliJ IDEA
略
下载 Hadoop
下载地址:http://mirror.metrocast.net/apache/hadoop/common/
wget http://mirror.metrocast.net/apache/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz
tar -xvf hadoop-2.7.3.tar.gz
编写 Hadoop 程序并运行
创建 Java 项目
- 点击 File → New → Project...
- 点击 next
- 点击 next
- 设置 Project name 和 Project location
- 点击 Finish
编写程序代码
代码:单词计数
引入 Hadoop 相关的 jar
- 点击 File → Project Structure...
- 点击左侧 Modules
- 点击 + → 1 JARs or directories...
- 添加 Hadoop → share → hadoop 下相应的目录
- 点击 OK
添加 Artifacts
- 点击 File → Project Structure...
- 点击左侧 Artifacts
- 点击 + → JAR → Empty
- 修改 Name 为 HadoopDemo
- 点击 + → Module Output 并选中 HadoopDemo 点击 OK
- 勾选 Build on make
- 点击 OK
添加 Configurations
- 点击 Edit Configurations...
- 点击 + → Application
- 修改 Name 为 HadoopDemo
- 修改 Main Class 为 org.apache.hadoop.util.RunJar
- 修改 Program arguments
/Users/mubai/iKYXXS/HadoopDemo/out/artifacts/HadoopDemo/HadoopDemo.jar
com.demo.WordCount
input/
output/
6. 点击 OK
添加测试数据
- 新建目录 input
- 新建文件 input.txt
hello world
hello world
hello hadoop
运行
查看运行结果
运行结果在 output 目录下
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于