首页 > 资讯 > 后端开发 > JAVA >eclipse和hadoop连接攻略（详细）

545

分享到

eclipse和hadoop连接攻略（详细）

eclipse java hadoop mapreduce 大数据 2023-10-28 07:10:48 545人浏览安东尼

摘要

吸取前人教训，写下此稿笔者所用到的软件版本： hadoop 2.7.3 hadoop-eclipse-plugin-2.7.3.jar eclipse-java-2020-06-R-win32-x86_64 先从虚拟机下载hadoop 需

吸取前人教训，写下此稿

笔者所用到的软件版本：

hadoop 2.7.3

hadoop-eclipse-plugin-2.7.3.jar

eclipse-java-2020-06-R-win32-x86_64

先从虚拟机下载hadoop 需要解压好和文件配置好的版本，方便后文配置伪分布式文件）

笔者linux的hadoop目录为：/usr/hadoop

下载到windows的某个目录，自行选择笔者下载到的windows目录为D:\desktop\fsdownload\hadoop-2.7.3

下载eclipse和hadoop连接的插件 hadoop-eclipse-plugin-2.7.3.jar

（笔者hadoop版本为2.7.3，你使用的hadoop版本和插件版本需要对应）

链接：https://pan.baidu.com/s/1m5BCOa1vcNghG0TUklB7CA
提取码：e9mo

（此链接为hadoop-eclipse-plugin-2.7.3.jar）

将下载好的插件hadoop-eclipse-plugin-2.7.3.jar 复制到eclipse的plugins目录下

将winutils.exe文件复制到hadoop目录下的bin路径下

wintil.exe链接

链接：Https://pan.baidu.com/s/1Ahzo8IyPhoxzvPSuT1nN7Q
提取码：bhip

配置hadoop环境变量

进入设置--系统--关于--高级系统设置--环境变量

编辑path变量，增加内容为：%HADOOP_HOME%\bin

增加一个变量HADOOP_HOME

变量值为 hadoop的路径

开启Hadoop集群（此处省略。。自行开启）

开启集群和复制插件之后开启eclipse，可以在eclipse左侧工作区看到DFS Locations

在windows菜单下选中perference

perence下选中hadoop map/reduce

设置hadoop的安装路径前文有提到笔者的安装路径为 D:\desktop\fsdownload\hadoop-2.7.3

建立与hadoop的连接在eclipse下方工作区对Map/Reduce Locations 进行设置

右击 new hadoop location 进入设置

相关设置如图

笔者的core-site.xml（笔者路径为%HADOOP_HOME%/etc/hadoop/core-site.xml）文件中端口号为9000

设置完成之后可以在DFS Locations看到hdfs上的文件

新建项目hadoop1（项目名随意）

进入eclipse 点击左上角file--new--projects

输入项目名称

这样就创建好了一个mapReduce项目

执行MapReduce 项目前，需要将hadoop中有修改过的配置文件（如伪分布式需要core-site.xml 和 hdfs-site.xml），以及log4j.properties复制到项目下的 src文件夹中

（请忽略已经建好的包）

还需要将windows下的hosts文件修改让ip和主机名映射

hosts文件路径为C:\Windows\System32\drivers\etc\hosts

而修改hosts文件需要管理员权限

可以先右击hosts文件点击属性

将属性中的“只读”取消确定并应用

然后通过管理员身份运行命令提示窗口

进入hosts文件目录上一级

输入notepad hosts 即可修改hosts文件

在最底下输入相对应的映射关系即可

笔者为192.168.222.171 master746

在hadoop1项目中创建包和类

需要填写两个地方：在Package 处填写 org.apache.hadoop.examples；在Name 处填写wordcount。（包名、类名可以随意起）

此处笔者参考 http://t.csdn.cn/4WKHD

写入代码

package org.apache.hadoop.examples; import java.io.IOException;import java.util.Iterator;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;import org.apache.hadoop.mapreduce.Mapper;import org.apache.hadoop.mapreduce.Reducer;import org.apache.hadoop.mapreduce.lib.input.FileInputFORMat;import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;import org.apache.hadoop.util.GenericOptionsParser; public class Wordcount {    public wordcount() {    }     public static void main(String[] args) throws Exception {        Configuration conf = new Configuration();        String[] otherArgs = (new GenericOptionsParser(conf, args)).getRemainingArgs();        if(otherArgs.length < 2) {            System.err.println("Usage: wordcount  [...] ");            System.exit(2);        }         Job job = Job.getInstance(conf, "word count");        job.setJarByClass(wordcount.class);        job.setMapperClass(wordcount.TokenizerMapper.class);        job.setCombinerClass(wordcount.IntSumReducer.class);        job.setReducerClass(wordcount.IntSumReducer.class);        job.setOutpuTKEyClass(Text.class);        job.setOutputValueClass(IntWritable.class);         for(int i = 0; i < otherArgs.length - 1; ++i) {            FileInputFormat.addInputPath(job, new Path(otherArgs[i]));        }         FileOutputFormat.setOutputPath(job, new Path(otherArgs[otherArgs.length - 1]));        System.exit(job.waitForCompletion(true)?0:1);    }     public static class IntSumReducer extends Reducer {        private IntWritable result = new IntWritable();         public IntSumReducer() {        }         public void reduce(Text key, Iterable values, Reducer.Context context) throws IOException, InterruptedException {            int sum = 0;             IntWritable val;            for(Iterator i$ = values.iterator(); i$.hasNext(); sum += val.get()) {                val = (IntWritable)i$.next();            }             this.result.set(sum);            context.write(key, this.result);        }    }     public static class TokenizerMapper extends Mapper {        private static final IntWritable one = new IntWritable(1);        private Text word = new Text();         public TokenizerMapper() {        }         public void map(Object key, Text value, Mapper.Context context) throws IOException, InterruptedException {            StringTokenizer itr = new StringTokenizer(value.toString());             while(itr.hasMoreTokens()) {                this.word.set(itr.nextToken());                context.write(this.word, one);            }         }    }}

运行时右击空白处点击 run as 然后点击 run configutations

前面写需要进行mapreduce计算的文件必须原本就存在

后面写输出文件必须原本不存在不然均会报错

看到类似这样的运行结果就是成功啦

成功运行后查看输出文件（若未及时出现可以右击文件refresh）

做到这 eclipse和hadoop就算连接成啦

完结撒花~

跟着笔者的步骤可以避免笔者踩过的大部分坑

下面是我没有注明在文中的一些错误，欢迎大家一起来讨论

Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Wi

报错如下

Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Zat org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Native Method)at org.apache.hadoop.io.nativeio.NativeIO$Windows.access(NativeIO.java:609)at org.apache.hadoop.fs.FileUtil.canRead(FileUtil.java:977)at org.apache.hadoop.util.DiskChecker.checkAccessByFileMethods(DiskChecker.java:187)at org.apache.hadoop.util.DiskChecker.checkDirAccess(DiskChecker.java:174)at org.apache.hadoop.util.DiskChecker.checkDir(DiskChecker.java:108)at org.apache.hadoop.fs.LocalDirAllocator$AllocatorPerContext.confChanged(LocalDirAllocator.java:285)at org.apache.hadoop.fs.LocalDirAllocator$AllocatorPerContext.getLocalPathForWrite(LocalDirAllocator.java:344)at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:150)at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:131)at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:115)at org.apache.hadoop.mapred.LocalDistributedCacheManager.setup(LocalDistributedCacheManager.java:125)at org.apache.hadoop.mapred.LocalJobRunner$Job.(LocalJobRunner.java:163)at org.apache.hadoop.mapred.LocalJobRunner.submitJob(LocalJobRunner.java:731)at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:240)at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1290)at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1287)at java.security.AccessController.doPrivileged(Native Method)at javax.security.auth.Subject.doAs(Subject.java:422)at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657)at org.apache.hadoop.mapreduce.Job.submit(Job.java:1287)at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1308)at com.qs.WordcountDriver.main(WordcountDriver.java:44)

解决办法：

在创建的项目中重新创建一个包，名为：org.apache.hadoop.io.nativeio

在包中创建一个类，名为NativeIO

内容为： 参考链接：http://t.csdn.cn/YxMOW

创建好在eclipse如下：

再运行，就可以解决了。

来源地址：https://blog.csdn.net/m0_68421000/article/details/129316512

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: eclipse和hadoop连接攻略（详细）

本文链接: https://www.lsjlt.com/news/516968.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

eclipse和hadoop连接攻略（详细）

吸取前人教训，写下此稿笔者所用到的软件版本： hadoop 2.7.3 hadoop-eclipse-plugin-2.7.3.jar eclipse-java-2020-06-R-win32-x86_64 先从虚拟机下载hadoop 需...

99+

2023-10-28

eclipse java hadoop mapreduce 大数据
Pikachu靶场全关攻略(超详细!)

一、靶场搭建准备工具 phpstudy**pikachu靶场下载地址：**https://github.com/zhuifengshaonianhanlu/pikachu 搭建过程将靶场文件夹放...

99+

2023-08-31

php 安全 web安全网络安全
python+pytorch+d2l 超详细安装攻略

目录 python安装包官网安装验证 python模块安装安装模块安装位置查询是否成功 cuda驱动安装查询cuda驱动支持版本官网安装查询安装 pytorch安装查询cuda驱动...

99+

2023-09-09

python pytorch 深度学习
【MySQL】MySQL内连接和外连接详细总结

目录多表查询的分类3：内连接VS外连接(重难点)1. 内连接2.外连接3. SQL99语法实现多表查询3.1 SQL99实现内连接3.2 SQL99语法实现外连接3.2.1 左外连...

99+

2023-09-04

mysql 数据库 java sql
PythonTCP全连接攻击中SockStress全连接攻击详解

攻击者向目标发送一个很小的流量，但是会造成产生的攻击流量是一个巨大的，该攻击消耗的是目标系统的CPU/内存资源，使用低配版的电脑，依然可以让庞大的服务器拒绝服务，也称之为放大攻击。 ...

99+

2024-04-02
openGauss数据库JDBC环境连接配置的详细过程(Eclipse)

目录1.测试环境2.准备2.1 PC端安装配置JDK112.2下载JDBC驱动并解压3 进行eclipse配置1.测试环境客户端系统：Windows 10 客户端软件：eclips...

99+

2024-04-02
Pywifi：Python库pywifi的详细介绍、安装方法和使用攻略

Pywifi：Python库pywifi的详细介绍、安装方法和使用攻略一、简介 pywifi是一个用于操纵无线网络接口的Python软件包。通过pywifi，我们能够轻松地控制计算机上的Wi-Fi网...

99+

2023-10-24

python 开发语言 linux
Win10 预览版10061详细的升级攻略曝光

摘要：微软刚刚在Windows Insider项目中发布了Windows 10的最新版本build 10061，现在就可以在各个预览版中完成升级。升级操作非常简单，点击开始按钮，在搜索框中输入“Windows...

99+

2023-06-14

Win10 预览版 10061 升级攻略
windows下配置chrome浏览器驱动的详细攻略

要想使用python去爬取互联网上的数据，尤其是要模拟登录操作。那么selenium包肯定是绕不过的。 selenium包本质上就是通过后台驱动的方式驱动浏览器去。以驱动chrome浏览器为例，搭建环...

99+

2023-09-16

chrome windows python
idea连接MySQL详细教程

idea连接MySQL详细教程在idea侧边找到Database，点击+号，在Data Source中选择MySQL。 2.填写用户，密码，选择需要连接的数据库名称后，点击测试连接。 3.点击“Test Connection”后，出现...

99+

2023-08-23

mysql intellij-idea 数据库
菜鸟必看：ASP 数据库连接的通关攻略

在 ASP 应用中，数据库连接是至关重要的，因为它为我们的应用程序提供了与数据库交互的能力。对于新手来说，理解 ASP 数据库连接的机制可能会有些复杂，但我们 Schritt für Schritt 的逐步分析将为你揭示通关的秘诀。 1....

99+

2024-02-20

ASP 数据库连接 ADO ADO.NET 连接字符串数据源
Pycharm连接SQL Sever（详细教程）

如何使用pycharm连接SQL Sever：应该是所有的错误都经历了（不得不说挺崩溃的）目录步骤一：先检测自己的SQL Sever有没有打开密码功能步骤二：建立一个空数据库，并且建立一个专属用户步骤三：打开1433 端口步...

99+

2023-09-20

python sql 数据库
超详细解读！数据库表分区技术全攻略

更多内容可以关注微信公众号：老程序员刘飞分区的定义分区是一种数据库优化技术，它可以将大表按照一定的规则分成多个小表，从而提高查询和维护的效率。在分区的过程中，数据库会将数据按照分区规则分配到不同的...

99+

2023-09-06

数据库 mysql sql
阿里云服务器网络连接权限开启攻略

简介:本文将为您介绍如何在阿里云服务器上开启网络连接权限，以便您能够自由地访问和使用云服务器。步骤一：登录阿里云控制台首先，您需要登录阿里云控制台，并选择您要操作的云服务器实例。如果您还没有注册阿里云账号，请先注册一个账号并完成实名认证。...

99+

2024-01-16

阿里权限服务器
远程连接Jedis和整合SpringBoot的详细过程

目录一、远程连接Jedis1、导入Jedis所需的jar包2、远程连接Redis注意事项3、Jedis测试远程连接4、常用的数据类型5、Jedis实现事务二、整合SpringBoot...

99+

2024-04-02
windows10怎么连接wifiwindows10连接wifi方式详细介绍

windows10怎么连接wifi对比许多用户较为在乎，第一次应用win10的用户针对连接wifi这个问题是非常朦胧的，因而不知怎样连接wifi，实际上windows10连接wifi全过程不会太难，只不过是用户必须了解wifi密码才可以连接...

99+

2023-07-10
两种方法免费使用正版Win10详细图文攻略

微软在2015年7月29日发布Win10正式版，届时Win7/Win8.1正版用户可以免费升级到这款最新系统。而对于Windows XP和Vista等系统的用户，以及目前没有Win7/Win8.1正版授权的用户，则可以通...

99+

2023-06-17

Win10 方法攻略
DBeaver连接MySQL的超详细步骤

目录一、DBeaver连接mysql二、Kettle连接DBeaver总结一、DBeaver连接MySQL 打开DBeaver软件，点击MySQL创建数据库连接点击下一步把需要连接的数据库名、用户名及密码填进去 ...

99+

2023-05-12

dbeaver连接mysql dbeaver连接数据库 dbeaver连接数据库
win10连接手机的详细教程

最近有朋友问小编win10连接手机该怎么操作，对于这个问题，相信还有很多朋友不太清楚，win10系统和手机连接进行文件互传等操作非常方便，但是还有很多朋友不知道win10系统电脑如何连接手机，别着急，今天小编就针对此问题，为大家带来win1...

99+

2023-07-10
eclipse安装和配置环境教程（详细步骤）

一、下载与安装 1. 下载我们可以在eclipse的官网上直接进行下载，地址如下：https://www.eclipse.org/downloads/ 大家可以选择一个适合自己系统的eclipse版本即可。举个例子，如果你点击的是”...

99+

2023-09-15

eclipse java ide