首页 > 资讯 > 移动开发 >Hadoop环境搭建-单机、伪分布式、完全分布式

188

分享到

Hadoop环境搭建-单机、伪分布式、完全分布式

hadoop 分布式 linux 2023-10-23 12:10:01 188人浏览八月长安

摘要

目录一、单机安装二、伪分布式环境搭建配置SSH免密登录三、完全分布式环境搭建设置免密修改配置文件本文的所有配置文件，除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA，

目录

一、单机安装

二、伪分布式环境搭建

配置SSH免密登录

三、完全分布式环境搭建

设置免密

修改配置文件

本文的所有配置文件，除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA，注释部分可能和linux系统上的不同，因此如果直接复制粘贴记得将注释删除或调整语法。

一、单机安装

安装虚拟机、操作系统（前期初步准备工作已完成）先关闭firewalld防火墙：

systemctl stop firewalld //停止防火墙systemctl disable firewalld //关闭防火墙开机自启动systemctl status firewalld //查看防火墙状态

设置主机名：

hostnamectl set-hostname master //设置主机名为masterhostname //查看主机名

映射主机名和IP地址：

ip add //查看IP地址vi /etc/hosts //在文件最后一行加上IP地址和主机名例：192... master

安装rz命令：

yum install -y lrzsz

利用rz将jdk上传至服务器：

mkdir -p /export/server //新建一个专用目录cd /export/server //切换目录rztar -zxvf /root/jdk.tar.gz //解压mv jdk1.8.0_131/ jdk1.8 //重命名

配置JAVA环境

vi /etc/profile//在文件最后加上JAVA_HOME=/export/server/jdk1.8export PATH=$PATH:$JAVA_HOME/bin    //保存并退出后，刷新文件source /etc/profile//查看jdk是否安装成功，出现版本号即可java -version

上传hadoop压缩包至服务器并解压：

cd /export/serverrztar -zxvf /root/hadoop-2.7.2.tar.gz//配置hadoop环境变量cd hadoop-2.7.2pwd //显示hadoop安装路径，方便后续配置vi /etc/profile//在文件最后加上HADOOP_HOME=/export/server/hadoop-2.7.2PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbinexport JAVA_HOME HADOOP_HOME PATH//保存并退出后，刷新文件source /etc/profile//查看hadoop是否安装成功hadoop version

二、伪分布式环境搭建

搭建伪分布式前提条件：文章上面的基础hadoop、jdk环境搭建完成

which java //查看java所在位置vi hadoop-env.sh//将export JAVA_HOME的值修改为我们安装的JDK路径export JAVA_HOME=/export/server/jdk1.8

进入hadoop/etc/hadoop目录：

cd /export/server/hadoop/etc/hadoop

修改core-site.xml：

vi core-site.xml

如果配置了存放临时文件则需要创建一个目录：

mkdir -p /export/server/hadoop-2.7.2/data/tmp

        fs.defaultFS     hdfs://master:9000            hadoop.tmp.dir         /export/server/hadoop-2.7.2/data/tmp

修改hdfs-site.xml：

vi hdfs-site.xml

    dfs.replication        1             dfs.secondary.Http.address         master:50070

修改mapred-site.xml：

这个文件是不存在的，但是有一个模板文件mapred-site.xml.template，我们将这个文件改名为mapred-site.xml，然后进行修改：

mv mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

    mapReduce.framework.name        yarn

修改yarn-site.xml：

vi yarn-site.xml

该文件为Yarn框架配置文件，配置ResourceManager,nodeManager的通信端口，WEB监视端口等

    yarn.resourcemanager.hostname        master            yarn.nodemanager.aux-services         mapreduce_shuffle

格式化DFS：

hdfs namenode -fORMat

如果在格式化的日志中出现succefully format就证明格式化成功

启动所有服务：start-all.sh

关闭所有服务：stop-all.sh

配置ssh免密登录

输入：

ssh-keygen -t rsa

按四次回车

建立密钥对：

cd /root/.ssh

查看：ll

私钥：id_rsa

公钥：id_rsa.pub

ssh-copy-id将本机的公钥复制到远程机器的authorized_keys文件中，这里是伪分布式，只有一台机器，所以仍然是master然后需要输入master的root用户密码：

ssh-copy-id master

可以查看：记录多台机器的公钥，让机器之间使用ssh不需要用户名和密码：

#more authorized_keys

可以看到authorized_keys中的内容就是id_rsa.pub的内容，再次使用start-dfs.sh和start-yarn.sh，发现不需要输入密码了，实现免密登录。

三、完全分布式环境搭建

先将可以联网的单机，克隆三台：master、slave1、slave2

没有创建单机，直接搭建完全分布式的。可以创建三台虚拟机，然后配置好基础的hadoop、jdk环境，效果等于克隆三台单机。单机配置可看上文

把每台的文件都修改一下：

vi /etc/sysconfig/network-scripts/ifcfg-ens33

按规划设置各节点IP，网段取决于自己的电脑。为方便记忆，建议master节点IP尾数用200，slave用201，slave用202

//将UUID删除//修改IPADDR=网段例：master的IPADDR=192...200slave1的IPADDR=192...201

重启网络服务：systemctl restart network

为了方便，三台都重命名：hostnamectl set-hostname 名字

例：master主节点重命名：hostnamectl set-hostname master

如果是用远程连接工具修改，需要重新连接才会显示修改后的名字

修改hosts文件，在主节点映射IP地址和主机名（每个节点都要）

vi /etc/hosts//在文件最后加上：//主节点IP地址+ master 例：192...200 master//从一节点IP+ slave1//从二节点IP+ slave2

将配置好的hosts文件发送给两个从节点：

scp /etc/hosts slave1:/etc/hosts

scp /etc/hosts slave2:/etc/hosts

查看三台时间是否相同：date

如果时间不同，手动时间同步：

安装NTP服务：yum install ntp

时间同步(三台都要)：ntpdate -u ntp1.aliyun.com

查看防火墙是否开启：systemctl status firewalld.service

如果开启，则关闭：systemctl stop firewalld.service

设置免密

删除三台机上的.ssh目录：rm -rf /root/.ssh

生成新密钥对（三台都要）：ssh-keygen -t rsa

连按三次回车

切换目录，将三个节点的.ssh目录下的公钥复制到主节点（master）上（前提是你已经在主节点把/etc/hosts文件配置好并分发给了两台从节点，不然会报不知道master的错误）：

cd /root/.ssh

ssh-copy-id master （三个都要）

查看是否复制成功（要在/root/.ssh下）：

cat authorized_keys

在主节点上远程拷贝到两个从节点：

scp authorized_keys slave1:/root/.ssh/authorized_keys

scp authorized_keys slave2:/root/.ssh/authorized_keys

在执行过程中输入yes并输入密码

验证：ssh slave1 可以切换

第五点也可以直接将master的/root/.ssh拷贝到另外两台主机上

scp -r /root/.ssh slave1:/root

scp -r /root/.ssh slave2:/root

修改配置文件

先在主节点创建三个文件夹：

mkdir -p /export/server/tmp（不配置文件可以不创）

mkdir -p /export/server/hdfs/name（不配置文件可以不创）

mkdir -p /export/server/hdfs/data（不配置文件可以不创）

切换目录：cd /export/server/hadoop-2.7.2/etc/hadoop

修改：vi core-site.xml

        fs.defaultFS        hdfs://master:9000        hadoop.tmp.dir        /export/server/tmp

先查看自己的java所在，方便后续配置：which java

修改文件：vi hadoop-env.sh

//大概25行//export JAVA_HOME=/export/server/jdk1.8 （写自己jdk的存放目录）

修改：vi mapred-env.sh

将java路径写上：

//export JAVA_HOME=/export/server/jdk1.8

修改：vi yarn-env.sh

//将java路径写上//export JAVA_HOME=/export/server/jdk.18

将文件改名：mv mapred-site.xml.template mapred-site.xml

修改：vi mapred-site.xml

        mapreduce.framework.name        yarn

修改：vi yarn-site.xml

        yarn.resourcemanager.hostname        master        yarn.nodemanager.aux-services        mapreduce_shuffle

修改：vi hdfs-site.xml（默认配好，可以不配）

        dfs.namenode.name.dir        file:/export/server/hdfs/name        dfs.datanode.data.dir        file:/export/server/hdfs/data        dfs.replication        2

vi slaves

将两个从节点的名字写到最后：

slave1

slave2

将文件发送给两个从节点：

scp -r /export/server/hadoop-2.7.2/etc/hadoop slave1:/export/server/hadoop-2.7.2/etc

scp -r /export/server/hadoop-2.7.2/etc/hadoop slave2:/export/server/hadoop-2.7.2/etc

格式化文件：

hdfs namenode -format

启动集群，主节点有4个，从节点有3个：

start-all.sh

来源地址：https://blog.csdn.net/qq_62731133/article/details/127963207

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Hadoop环境搭建-单机、伪分布式、完全分布式

本文链接: https://www.lsjlt.com/news/440356.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Hadoop环境搭建-单机、伪分布式、完全分布式

目录一、单机安装二、伪分布式环境搭建配置SSH免密登录三、完全分布式环境搭建设置免密修改配置文件本文的所有配置文件，除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA，...

99+

2023-10-23

hadoop 分布式 linux
Hadoop伪分布式环境的搭建步骤

这篇文章主要讲解了“Hadoop伪分布式环境的搭建步骤”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Hadoop伪分布式环境的搭建步骤”吧！安装准备将系统安...

99+

2024-04-02
Hadoop 2.x中怎么搭建伪分布式环境

这期内容当中小编将会给大家带来有关Hadoop 2.x中怎么搭建伪分布式环境，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。1、修改hadoop-env.sh、yarn-e...

99+

2024-04-02
hadoop完全分布式怎么搭建

要搭建Hadoop完全分布式集群，需要按照以下步骤进行操作：准备环境：首先需要准备多台服务器，至少需要3台以上的服务器来搭建H...

99+

2024-03-13

hadoop
hadoop伪分布式如何搭建

要搭建Hadoop伪分布式，需要按照以下步骤进行操作：1. 安装Java开发工具：首先，确保已在计算机上安装了Java开发工具。Ha...

99+

2023-09-21

hadoop
CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

这篇文章将为大家详细讲解有关CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。(一）软件准备1，hadoop-2.7.3.tar.gz（包）2...

99+

2023-06-03
ubuntu怎么搭建伪分布式环境

今天小编给大家分享一下ubuntu怎么搭建伪分布式环境的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。一、准备工作安装包链接:...

99+

2023-06-27
redis cluster单机伪分布式搭

最近公司引进微服务框架,之前的一台redis的预存60G已经无法满足现在的260G业务需要,经过一番考虑搭建了这套集群 . 为了方便我就用一台服务器演示,生产环境中不建议这么做(没啥用),只为记录一下过程,至于精细化的配置需要在生产中自...

99+

2023-01-31

分布式单机 redis
Hadoop完全分布式集群搭建（超详细）

目录 1.1.1 完全分布式介绍 1.1.2 平台软件说明 1.1.3 守护进程布局 1.2.1 集群搭建准备 1.2.2 总纲 1.2.3防火墙关闭 1.2.4 主机映射 1.2.5 免密登陆 1.2.6 jdk安装和hadoop安装及...

99+

2023-10-23

hadoop 分布式 hdfs
hadoop伪分布模式搭建(详细步骤）

一、前期准备 1. 关闭防火墙 2. 安装好JDK 3. 准备hadoop安装包二、安装hadoop伪分布模式 1. 在home/hadoop/software/路径下创建hadooptmp目录 2. 解压hadoop-3.3.0.ta...

99+

2023-09-20

hadoop 大数据服务器
Hadoop+HBase+ZooKeeper分布式集群环境搭建步骤

目录一、环境说明2.1 安装JDK2.2 添加Hosts映射关系2.3 集群之间SSH无密码登陆三、Hadoop集群安装配置3.1 修改hadoop配置3.2 启动hadoop集群四...

99+

2024-04-02
浅析Hadoop完全分布式集群搭建问题

目录一、Hadoop是什么二、Hadoop组成1、Hadoop1.x2、Hadoop2.x三、Hadoop集群搭建所需工具（链接如下，自行下载）四、Hadoop集群配置前期准备五、H...

99+

2024-04-02
完全分布式hadoop搭建的步骤是什么

搭建完全分布式Hadoop集群通常包括以下步骤：准备环境：确保所有节点都有相同的操作系统和Java版本，并且具有网络互通的能力...

99+

2024-03-05

hadoop
hadoop cdh2.6.0-5.7.0伪分布式版本怎么搭建

本篇内容主要讲解“hadoop cdh2.6.0-5.7.0伪分布式版本怎么搭建”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“hadoop cdh2.6.0-5.7.0伪分布式版本怎么搭建”吧!...

99+

2023-06-02
如何安装Hadoop单机版和全分布式

这篇文章主要介绍“如何安装Hadoop单机版和全分布式”，在日常操作中，相信很多人在如何安装Hadoop单机版和全分布式问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”如何安装Hadoop单机版和全分布式”的疑...

99+

2023-06-09
如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群

本篇内容主要讲解“如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“如何使用Centos7系统搭建Hadoop-3.1.4完全分布...

99+

2023-06-15
Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的

这期内容当中小编将会给大家带来有关Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。最近在自己的笔记本电脑上搭建了Apache Hadoop分...

99+

2023-06-19
Hadoop如何部署伪分布模式

这篇文章将为大家详细讲解有关Hadoop如何部署伪分布模式，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。部署方式:1.单机模式standalone 1个java进程2.伪分布模式...

99+

2023-06-03
hadoop伪分布式的安装步骤

本篇内容主要讲解“hadoop伪分布式的安装步骤”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“hadoop伪分布式的安装步骤”吧! 解压缩 /opt/software/hadoop-2...

99+

2023-06-03
hadoop伪分布式集群怎么安装

Hadoop伪分布式集群是在单台机器上模拟多台机器的Hadoop集群环境，可以用来进行开发和测试。以下是Hadoop伪分布式集群的安...

99+

2024-03-13

hadoop