iis服务器助手广告广告
返回顶部
首页 > 资讯 > 移动开发 >Hadoop环境搭建-单机、伪分布式、完全分布式
  • 188
分享到

Hadoop环境搭建-单机、伪分布式、完全分布式

hadoop分布式linux 2023-10-23 12:10:01 188人浏览 八月长安
摘要

目录 一、单机安装  二、伪分布式环境搭建 配置SSH免密登录  三、完全分布式环境搭建 设置免密 修改配置文件 本文的所有配置文件,除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA,

目录

一、单机安装

 二、伪分布式环境搭建

配置SSH免密登录

 三、完全分布式环境搭建

设置免密

修改配置文件


本文的所有配置文件,除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA,注释部分可能和linux系统上的不同,因此如果直接复制粘贴记得将注释删除或调整语法。 

一、单机安装

安装虚拟机操作系统(前期初步准备工作已完成)先关闭firewalld防火墙:

systemctl stop firewalld //停止防火墙systemctl disable firewalld //关闭防火墙开机自启动systemctl status firewalld //查看防火墙状态

设置主机名:

hostnamectl set-hostname master //设置主机名为masterhostname //查看主机名

映射主机名和IP地址:

ip add //查看IP地址vi /etc/hosts //在文件最后一行加上IP地址和主机名例:192... master

安装rz命令:

yum install -y lrzsz

利用rz将jdk上传至服务器

mkdir -p /export/server //新建一个专用目录cd /export/server //切换目录rztar -zxvf /root/jdk.tar.gz //解压mv jdk1.8.0_131/ jdk1.8 //重命名

配置JAVA环境

vi /etc/profile//在文件最后加上JAVA_HOME=/export/server/jdk1.8export PATH=$PATH:$JAVA_HOME/bin    //保存并退出后,刷新文件source /etc/profile//查看jdk是否安装成功,出现版本号即可java -version

上传hadoop压缩包至服务器并解压:

cd /export/serverrztar -zxvf /root/hadoop-2.7.2.tar.gz//配置hadoop环境变量cd hadoop-2.7.2pwd //显示hadoop安装路径,方便后续配置vi /etc/profile//在文件最后加上HADOOP_HOME=/export/server/hadoop-2.7.2PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbinexport JAVA_HOME HADOOP_HOME PATH​//保存并退出后,刷新文件source /etc/profile//查看hadoop是否安装成功hadoop version

 二、伪分布式环境搭建

 搭建伪分布式前提条件:文章上面的基础hadoop、jdk环境搭建完成

which java //查看java所在位置vi hadoop-env.sh//将export JAVA_HOME的值修改为我们安装的JDK路径export JAVA_HOME=/export/server/jdk1.8

进入hadoop/etc/hadoop目录:

cd /export/server/hadoop/etc/hadoop

修改core-site.xml:

vi core-site.xml

如果配置了存放临时文件则需要创建一个目录:

mkdir -p /export/server/hadoop-2.7.2/data/tmp

        fs.defaultFS     hdfs://master:9000            hadoop.tmp.dir         /export/server/hadoop-2.7.2/data/tmp    

 修改hdfs-site.xml:

vi hdfs-site.xml

    dfs.replication        1             dfs.secondary.Http.address         master:50070    

修改mapred-site.xml:

这个文件是不存在的,但是有一个模板文件mapred-site.xml.template,我们将这个文件改名为mapred-site.xml,然后进行修改:

mv  mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

    mapReduce.framework.name        yarn     

修改yarn-site.xml:

vi yarn-site.xml

该文件为Yarn框架配置文件,配置ResourceManager,nodeManager的通信端口,WEB监视端口等

    yarn.resourcemanager.hostname        master            yarn.nodemanager.aux-services         mapreduce_shuffle    

格式化DFS:

hdfs namenode -fORMat

如果在格式化的日志中出现succefully format就证明格式化成功

启动所有服务:start-all.sh

关闭所有服务:stop-all.sh

配置ssh免密登录

输入:

ssh-keygen -t rsa

按四次回车

建立密钥对:

cd /root/.ssh

查看:ll

私钥:id_rsa

公钥:id_rsa.pub

ssh-copy-id将本机的公钥复制到远程机器的authorized_keys文件中,这里是伪分布式,只有一台机器,所以仍然是master然后需要输入master的root用户密码:

ssh-copy-id master

可以查看:记录多台机器的公钥,让机器之间使用ssh不需要用户名和密码:

#more authorized_keys

可以看到authorized_keys中的内容就是id_rsa.pub的内容,再次使用start-dfs.sh和start-yarn.sh,发现不需要输入密码了,实现免密登录。

 三、完全分布式环境搭建

先将可以联网的单机,克隆三台:master、slave1、slave2

没有创建单机,直接搭建完全分布式的。可以创建三台虚拟机,然后配置好基础的hadoop、jdk环境,效果等于克隆三台单机。单机配置可看上文

把每台的文件都修改一下:

vi /etc/sysconfig/network-scripts/ifcfg-ens33

按规划设置各节点IP,网段取决于自己的电脑。为方便记忆,建议master节点IP尾数用200,slave用201,slave用202

//将UUID删除//修改IPADDR=网段例:master的IPADDR=192...200slave1的IPADDR=192...201

重启网络服务:systemctl restart network

为了方便,三台都重命名:hostnamectl set-hostname 名字

例:master主节点重命名:hostnamectl set-hostname master

如果是用远程连接工具修改,需要重新连接才会显示修改后的名字

修改hosts文件,在主节点映射IP地址和主机名(每个节点都要)

vi /etc/hosts//在文件最后加上://主节点IP地址+ master 例:192...200 master//从一节点IP+ slave1//从二节点IP+ slave2

将配置好的hosts文件发送给两个从节点:

scp /etc/hosts slave1:/etc/hosts

scp /etc/hosts slave2:/etc/hosts

查看三台时间是否相同:date

如果时间不同,手动时间同步:

安装NTP服务:yum install ntp

时间同步(三台都要):ntpdate -u ntp1.aliyun.com

查看防火墙是否开启:systemctl status firewalld.service

如果开启,则关闭:systemctl stop firewalld.service

设置免密

删除三台机上的.ssh目录:rm -rf /root/.ssh

生成新密钥对(三台都要):ssh-keygen -t rsa

连按三次回车

切换目录,将三个节点的.ssh目录下的公钥复制到主节点(master)上(前提是你已经在主节点把/etc/hosts文件配置好并分发给了两台从节点,不然会报不知道master的错误):

cd /root/.ssh

ssh-copy-id master (三个都要)

查看是否复制成功(要在/root/.ssh下):

cat authorized_keys

在主节点上远程拷贝到两个从节点:

scp authorized_keys slave1:/root/.ssh/authorized_keys

scp authorized_keys slave2:/root/.ssh/authorized_keys

在执行过程中输入yes并输入密码

验证:ssh slave1 可以切换

第五点也可以直接将master的/root/.ssh拷贝到另外两台主机上

scp -r /root/.ssh slave1:/root

scp -r /root/.ssh slave2:/root

修改配置文件

先在主节点创建三个文件夹:

mkdir -p /export/server/tmp(不配置文件可以不创)

mkdir -p /export/server/hdfs/name(不配置文件可以不创)

mkdir -p /export/server/hdfs/data(不配置文件可以不创)

切换目录:cd /export/server/hadoop-2.7.2/etc/hadoop

修改:vi core-site.xml

        fs.defaultFS        hdfs://master:9000        hadoop.tmp.dir        /export/server/tmp

先查看自己的java所在,方便后续配置:which java

修改文件:vi hadoop-env.sh

//大概25行//export JAVA_HOME=/export/server/jdk1.8 (写自己jdk的存放目录)

修改:vi mapred-env.sh

将java路径写上:

//export JAVA_HOME=/export/server/jdk1.8

修改:vi yarn-env.sh

//将java路径写上//export JAVA_HOME=/export/server/jdk.18

将文件改名:mv mapred-site.xml.template mapred-site.xml

修改:vi mapred-site.xml

        mapreduce.framework.name        yarn

 修改:vi yarn-site.xml

        yarn.resourcemanager.hostname        master        yarn.nodemanager.aux-services        mapreduce_shuffle

 修改:vi hdfs-site.xml(默认配好,可以不配)

        dfs.namenode.name.dir        file:/export/server/hdfs/name        dfs.datanode.data.dir        file:/export/server/hdfs/data        dfs.replication        2

vi slaves

将两个从节点的名字写到最后:

slave1

slave2

将文件发送给两个从节点:

scp -r /export/server/hadoop-2.7.2/etc/hadoop slave1:/export/server/hadoop-2.7.2/etc

scp -r /export/server/hadoop-2.7.2/etc/hadoop slave2:/export/server/hadoop-2.7.2/etc

格式化文件:

hdfs namenode -format

启动集群,主节点有4个,从节点有3个:

start-all.sh

 

 

来源地址:https://blog.csdn.net/qq_62731133/article/details/127963207

--结束END--

本文标题: Hadoop环境搭建-单机、伪分布式、完全分布式

本文链接: https://www.lsjlt.com/news/440356.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Hadoop环境搭建-单机、伪分布式、完全分布式
    目录 一、单机安装  二、伪分布式环境搭建 配置SSH免密登录  三、完全分布式环境搭建 设置免密 修改配置文件 本文的所有配置文件,除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA,...
    99+
    2023-10-23
    hadoop 分布式 linux
  • Hadoop伪分布式环境的搭建步骤
    这篇文章主要讲解了“Hadoop伪分布式环境的搭建步骤”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Hadoop伪分布式环境的搭建步骤”吧!安装准备将系统安...
    99+
    2024-04-02
  • Hadoop 2.x中怎么搭建伪分布式环境
    这期内容当中小编将会给大家带来有关Hadoop 2.x中怎么搭建伪分布式环境,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、修改hadoop-env.sh、yarn-e...
    99+
    2024-04-02
  • hadoop完全分布式怎么搭建
    要搭建Hadoop完全分布式集群,需要按照以下步骤进行操作: 准备环境:首先需要准备多台服务器,至少需要3台以上的服务器来搭建H...
    99+
    2024-03-13
    hadoop
  • hadoop伪分布式如何搭建
    要搭建Hadoop伪分布式,需要按照以下步骤进行操作:1. 安装Java开发工具:首先,确保已在计算机上安装了Java开发工具。Ha...
    99+
    2023-09-21
    hadoop
  • CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境
    这篇文章将为大家详细讲解有关CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。(一)软件准备1,hadoop-2.7.3.tar.gz(包)2...
    99+
    2023-06-03
  • ubuntu怎么搭建伪分布式环境
    今天小编给大家分享一下ubuntu怎么搭建伪分布式环境的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。一、准备工作安装包链接:...
    99+
    2023-06-27
  • redis cluster单机伪分布式搭
    最近公司引进微服务框架,之前的一台redis的预存60G已经无法满足现在的260G业务需要,经过一番考虑搭建了这套集群 . 为了方便我就用一台服务器演示,生产环境中不建议这么做(没啥用),只为记录一下过程,至于精细化的配置需要在生产中自...
    99+
    2023-01-31
    分布式 单机 redis
  • Hadoop完全分布式集群搭建(超详细)
    目录 1.1.1 完全分布式介绍 1.1.2 平台软件说明 1.1.3 守护进程布局 1.2.1 集群搭建准备 1.2.2 总纲 1.2.3防火墙关闭 1.2.4 主机映射 1.2.5 免密登陆 1.2.6 jdk安装和hadoop安装及...
    99+
    2023-10-23
    hadoop 分布式 hdfs
  • hadoop伪分布模式搭建(详细步骤)
    一、前期准备 1. 关闭防火墙 2. 安装好JDK 3. 准备hadoop安装包 二、安装hadoop伪分布模式 1. 在home/hadoop/software/路径下创建hadooptmp目录 2. 解压hadoop-3.3.0.ta...
    99+
    2023-09-20
    hadoop 大数据 服务器
  • Hadoop+HBase+ZooKeeper分布式集群环境搭建步骤
    目录一、环境说明2.1 安装JDK2.2 添加Hosts映射关系2.3 集群之间SSH无密码登陆三、Hadoop集群安装配置3.1 修改hadoop配置3.2 启动hadoop集群四...
    99+
    2024-04-02
  • 浅析Hadoop完全分布式集群搭建问题
    目录一、Hadoop是什么二、Hadoop组成1、Hadoop1.x2、Hadoop2.x三、Hadoop集群搭建所需工具(链接如下,自行下载)四、Hadoop集群配置前期准备五、H...
    99+
    2024-04-02
  • 完全分布式hadoop搭建的步骤是什么
    搭建完全分布式Hadoop集群通常包括以下步骤: 准备环境:确保所有节点都有相同的操作系统和Java版本,并且具有网络互通的能力...
    99+
    2024-03-05
    hadoop
  • hadoop cdh2.6.0-5.7.0伪分布式版本怎么搭建
    本篇内容主要讲解“hadoop cdh2.6.0-5.7.0伪分布式版本怎么搭建”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“hadoop cdh2.6.0-5.7.0伪分布式版本怎么搭建”吧!...
    99+
    2023-06-02
  • 如何安装Hadoop单机版和全分布式
    这篇文章主要介绍“如何安装Hadoop单机版和全分布式”,在日常操作中,相信很多人在如何安装Hadoop单机版和全分布式问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何安装Hadoop单机版和全分布式”的疑...
    99+
    2023-06-09
  • 如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群
    本篇内容主要讲解“如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何使用Centos7系统搭建Hadoop-3.1.4完全分布...
    99+
    2023-06-15
  • Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的
    这期内容当中小编将会给大家带来有关Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。最近在自己的笔记本电脑上搭建了Apache Hadoop分...
    99+
    2023-06-19
  • Hadoop如何部署伪分布模式
    这篇文章将为大家详细讲解有关Hadoop如何部署伪分布模式,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。 部署方式:1.单机模式standalone   1个java进程2.伪分布模式...
    99+
    2023-06-03
  • hadoop伪分布式的安装步骤
    本篇内容主要讲解“hadoop伪分布式的安装步骤”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“hadoop伪分布式的安装步骤”吧! 解压缩 /opt/software/hadoop-2...
    99+
    2023-06-03
  • hadoop伪分布式集群怎么安装
    Hadoop伪分布式集群是在单台机器上模拟多台机器的Hadoop集群环境,可以用来进行开发和测试。以下是Hadoop伪分布式集群的安...
    99+
    2024-03-13
    hadoop
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作