iis服务器助手广告广告
返回顶部
首页 > 资讯 > 移动开发 >Hadoop完全分布式集群搭建(超详细)
  • 556
分享到

Hadoop完全分布式集群搭建(超详细)

hadoop分布式hdfs 2023-10-23 12:10:35 556人浏览 八月长安
摘要

目录 1.1.1 完全分布式介绍 1.1.2 平台软件说明 1.1.3 守护进程布局 1.2.1 集群搭建准备 1.2.2 总纲 1.2.3防火墙关闭 1.2.4 主机映射 1.2.5 免密登陆 1.2.6 jdk安装和hadoop安装及

目录

1.1.1 完全分布式介绍

1.1.2 平台软件说明

1.1.3 守护进程布局

1.2.1 集群搭建准备

1.2.2 总纲

1.2.3防火墙关闭

1.2.4 主机映射

1.2.5 免密登陆

1.2.6 jdk安装和hadoop安装及环境配置

1.3.1 配置文件

1.core-site.xml

2.hdfs-site.xml

3.hadoop-enc.sh

4.workres

5. 分发

1.3.2 格式化集群

1.3.2 启动集群

1.3.3 进程查看

1.4.1 YARN配置

1.mapred-site.xml

2.yarn-site.xml

3.hadoop-env.sh

1.4.2 分发到其他节点


java安装包和hadoop安装包还是用上次的jdk-8u191-linux-x64.tar.gz和hadoop-3.1.1.tar.gz

1.1.1 完全分布式介绍

    在真实的企业环境中,服务器集群会使⽤到多台机器,共同配合,来构建⼀个完整的分布式⽂件系统。⽽在这样的分布式⽂件系统中,hdfs相关的守护进程也会分布在不同的机器上,例如:

  • Namenode守护进程,尽可能的单独部署在⼀台硬件性能较好的机器中。
  • 其他的每台机器上都会部署⼀个DataNode守护进程,⼀般的硬件环境即可。
  • SecondaryNameNode守护进程最好不要和NameNode在同⼀台机器上。

1.1.2 平台软件说明

平台&&软件说明
宿主操作系统windows
虚拟机操作系统Centos7
虚拟机软件 VMWare
虚拟机 主机名: shulin1, IP地址: 192.168.10.101 主机名: shulin2, IP地址: 192.168.10.102 主机名: shulin3, IP地址: 192.168.10.103
ssh工具xshll/xftp
软件包上传路径 /usr/local
软件安装路径 /usr/local
JDK X64: jdk-8u191-linux-x64.tar.gz
Hadoop X64: hadoop-3.1.1.tar.gz
⽤户 root

1.1.3 守护进程布局

NamenodeDatenode SecondaryNameNode
shulin1        √     √
shulin2     √                  √

shulin3

     √ 

1.2.1 集群搭建准备

1.2.2 总纲

  1. 三台机器的防⽕墙必须是关闭的.
  2. 确保三台机器的⽹络配置畅通(NAT模式,静态IP,主机名的配置)
  3. 确保/etc/hosts⽂件配置了ip和hostname的映射关系
  4. 确保配置了三台机器的免密登陆认证(克隆会更加⽅便)
  5. 确保所有机器时间同步
  6. jdk和hadoop的环境变量配置

1.2.3防火墙关闭

三台虚拟机都要关闭[root@shulin ~]# systemctl stop firewalld   #正常情况执行前两步即可,不懂的可以百度一下[root@shulin ~]# systemctl disable firewalld[root@shulin ~]# systemctl stop NetworkManager[root@shulin ~]# systemctl disable NetworkManager#最好也把selinux关闭掉,这是linux系统的⼀个安全机制,进⼊⽂件中将SELINUX设置为disabled[root@shulin ~]# vi /etc/selinux/config.........SELINUX=disabled .........

1.2.4 主机映射

三台虚拟机均要配置[root@shulin1 ~]# vi /etc/hosts127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4::1 localhost localhost.localdomain localhost6 localhost6.localdomain6192.168.10.101 shulin1 #添加本机的静态IP和本机的主机名之间的映射关系192.168.10.102 shulin2192.168.10.103 shulin3

1.2.5 免密登陆

三台虚拟机均要配置# 1. 使⽤rsa加密技术,⽣成公钥和私钥。⼀路回⻋即可[root@shulin1 ~]# ssh-keygen -t rsa # 2. 使⽤ssh-copy-id命令[root@shulin1 /]#cd ~/.ssh [root@shulin1 .ssh]# ssh-copy-id root@shulin1[root@shulin1 .ssh]# ssh-copy-id root@shulin2[root@shulin1 .ssh]# ssh-copy-id root@shulin3# 3. 进⾏验证 [hadoop@shulin1 .ssh]# ssh shulin1[hadoop@shulin1 .ssh]# ssh shulin2[hadoop@shulin1 .ssh]# ssh shulin3# 4. 继续在shulin2和shulin3⽣成公钥和私钥,给三台节点拷⻉。

1.2.6 jdk安装和hadoop安装及环境配置

这一步只配置第一台即可,另外两台直接传过去即可。

请参考hadoop安装之保姆级教程 1.1.1节至1.2.1节的java和hadoop安装及其环境配置。

1.3.1 配置文件

配置文件地址在 usr/local/hadoop-3.1.1/etc/hadoop 下

1.core-site.xml

            fs.defaultFS        hdfs://shulin1:9820                hadoop.tmp.dir        /usr/local/hadoop-3.1.1/tmp    

2.hdfs-site.xml

            dfs.replication    3                dfs.namenode.secondary.Http-address        shulin2:9868                dfs.namenode.http-address        shulin1:9870    

3.hadoop-env.sh

export JAVA_HOME=/usr/local/jdk1.8.0_191# Hadoop3中,需要添加如下配置,设置启动集群⻆⾊的⽤户是谁export HDFS_NAMENODE_USER=rootexport HDFS_DATANODE_USER=rootexport HDFS_SECONDARYNAMENODE_USER=root

4.workers

将原来的localhost删掉,改为shulin1shulin2shulin3

5. 分发

# 我们已经完成了⼀个节点的环境配置,其他的节点也需要保持完全相同的配置。我们只需要将shulin1节点的配置拷⻉到其他的节点即可。# 分发之前,先检查⾃⼰的节点数据⽂件是否存在# 如果之间格式化过集群,那么会在core-site.xml中配置的hadoop.tmp.dir路径下⽣成⽂件,先将其删除[root@shulin1 ~]# cd /usr/local[root@shulin1 local]# scp -r jdk1.8.0_321/ shulin2:$PWD[root@shulin1 local]# scp -r jdk1.8.0_321/ shulin3:$PWD[root@shulin1 local]# scp -r hadoop-3.3.1/ shulin2:$PWD[root@shulin1 local]# scp -r hadoop-3.3.1/ shulin3:$PWD[root@shulin1 local]# scp etc/profile shulin2:/etc/[root@shulin1 local]# scp etc/profile shulin2:/etc/

1.3.2 格式化集群

我们只在1号机格式就可以[root@shulin1 ~]# hdfs namenode -fORMat

1.3.2 启动集群

start-dfs.sh # 启动HDFS所有进程(NameNode、SecondaryNameNode、DataNode)stop-dfs.sh # 停⽌HDFS所有进程(NameNode、SecondaryNameNode、DataNode)# hdfs --daemon start 单独启动⼀个进程hdfs --daemon start namenode # 只开启NameNodehdfs --daemon start secondarynamenode # 只开启SecondaryNameNodehdfs --daemon start datanode # 只开启DataNode# hdfs --daemon stop 单独停⽌⼀个进程hdfs --daemon stop namenode # 只停⽌NameNodehdfs --daemon stop secondarynamenode # 只停⽌SecondaryNameNodehdfs --daemon stop datanode # 只停⽌DataNode# hdfs --workers --daemon start 启动所有的指定进程hdfs --workers --daemon start datanode # 开启所有节点上的DataNode# hdfs --workers --daemon stop 启动所有的指定进程hdfs --workers --daemon stop datanode # 停⽌所有节点上的DataNode

1.3.3 进程查看

# shulin1节点[root@shulin1 hadoop]# jps13442 NameNode13618 DataNode13868 Jps# shulin2节点[root@shulin2 ~]# jps10514 SecondaryNameNode10548 Jps10405 DataNode# shulin3节点[root@shulin3 ~]# jps10931 DataNode11001 Jps

1.4.1 YARN配置

1.mapred-site.xml

            mapReduce.framework.name        yarn                yarn.app.mapreduce.am.env        HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.1                  mapreduce.map.env        HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.1                mapreduce.reduce.env        HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.1    

2.yarn-site.xml

            yarn.resourcemanager.hostname        shulin1                               yarn.nodemanager.aux-services        mapreduce_shuffle    

3.hadoop-env.sh

# 在最后面添加如下:export YARN_RESOURCEMANAGER_USER=rootexport YARN_NODEMANAGER_USER=root

1.4.2 分发到其他节点

[root@shulin ~]# cd $HADOOP_HOME/etc/ [root@shulin etc]# scp -r hadoop shulin02:$PWD[root@shulin etc]# scp -r hadoop shulin03:$PWD

1.5.1 配置完成

至此hadoop完全分布式集群以搭建完成,可以打开火狐浏览器输入对应ip地址和端口号即可查看hadoop页面和yarn页面

来源地址:https://blog.csdn.net/qq_52868045/article/details/127981884

--结束END--

本文标题: Hadoop完全分布式集群搭建(超详细)

本文链接: https://www.lsjlt.com/news/440351.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Hadoop完全分布式集群搭建(超详细)
    目录 1.1.1 完全分布式介绍 1.1.2 平台软件说明 1.1.3 守护进程布局 1.2.1 集群搭建准备 1.2.2 总纲 1.2.3防火墙关闭 1.2.4 主机映射 1.2.5 免密登陆 1.2.6 jdk安装和hadoop安装及...
    99+
    2023-10-23
    hadoop 分布式 hdfs
  • 浅析Hadoop完全分布式集群搭建问题
    目录一、Hadoop是什么二、Hadoop组成1、Hadoop1.x2、Hadoop2.x三、Hadoop集群搭建所需工具(链接如下,自行下载)四、Hadoop集群配置前期准备五、H...
    99+
    2024-04-02
  • CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境
    这篇文章将为大家详细讲解有关CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。(一)软件准备1,hadoop-2.7.3.tar.gz(包)2...
    99+
    2023-06-03
  • Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的
    这期内容当中小编将会给大家带来有关Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。最近在自己的笔记本电脑上搭建了Apache Hadoop分...
    99+
    2023-06-19
  • 如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群
    本篇内容主要讲解“如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何使用Centos7系统搭建Hadoop-3.1.4完全分布...
    99+
    2023-06-15
  • hadoop完全分布式怎么搭建
    要搭建Hadoop完全分布式集群,需要按照以下步骤进行操作: 准备环境:首先需要准备多台服务器,至少需要3台以上的服务器来搭建H...
    99+
    2024-03-13
    hadoop
  • Hadoop环境搭建-单机、伪分布式、完全分布式
    目录 一、单机安装  二、伪分布式环境搭建 配置SSH免密登录  三、完全分布式环境搭建 设置免密 修改配置文件 本文的所有配置文件,除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA,...
    99+
    2023-10-23
    hadoop 分布式 linux
  • CentOS 6.4如何安装Hadoop-2.5.1完全分布式集群
    这篇文章主要介绍了CentOS 6.4如何安装Hadoop-2.5.1完全分布式集群,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。环境介绍:在两台装有CentOS 6.4(3...
    99+
    2023-06-03
  • Hadoop+HBase+ZooKeeper分布式集群环境搭建步骤
    目录一、环境说明2.1 安装JDK2.2 添加Hosts映射关系2.3 集群之间SSH无密码登陆三、Hadoop集群安装配置3.1 修改hadoop配置3.2 启动hadoop集群四...
    99+
    2024-04-02
  • zookeeper集群搭建超详细过程
    目录一、准备三台虚拟机,并列出对应的IP地址和主机名,如下图所示二、环境准备(下面的步骤每一台虚拟机都需要做!!)1.关闭防火墙2. 配置操作系统3. 设置本机IP地址与MAC地址三...
    99+
    2024-04-02
  • hadoop伪分布模式搭建(详细步骤)
    一、前期准备 1. 关闭防火墙 2. 安装好JDK 3. 准备hadoop安装包 二、安装hadoop伪分布模式 1. 在home/hadoop/software/路径下创建hadooptmp目录 2. 解压hadoop-3.3.0.ta...
    99+
    2023-09-20
    hadoop 大数据 服务器
  • 完全分布式hadoop搭建的步骤是什么
    搭建完全分布式Hadoop集群通常包括以下步骤: 准备环境:确保所有节点都有相同的操作系统和Java版本,并且具有网络互通的能力...
    99+
    2024-03-05
    hadoop
  • mysql分布式集群怎么搭建
    要搭建一个 MySQL 分布式集群,可以采用以下步骤: 选择合适的分布式架构:MySQL 分布式集群可以采用主从复制、主从同步复制...
    99+
    2024-04-18
    mysql
  • Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建
    这篇文章主要介绍“Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建”,在日常操作中,相信很多人在Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对...
    99+
    2023-06-03
  • windows怎么搭建Redis分布式集群
    要搭建Redis分布式集群,您可以按照以下步骤进行操作:1. 下载Redis的稳定版本,并解压到不同的目录,例如:redis1、re...
    99+
    2023-09-11
    windows redis
  • 搭建hadoop集群的方式有哪些
    搭建Hadoop集群的方式有以下几种:1. 手动搭建:手动在每个节点上安装和配置Hadoop组件,包括HDFS、YARN和MapRe...
    99+
    2023-10-08
    hadoop
  • hadoop伪分布式集群怎么安装
    Hadoop伪分布式集群是在单台机器上模拟多台机器的Hadoop集群环境,可以用来进行开发和测试。以下是Hadoop伪分布式集群的安...
    99+
    2024-03-13
    hadoop
  • 如何进行HA分布式集群搭建
    今天就跟大家聊聊有关如何进行HA分布式集群搭建,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。一:HA分布式配置的优势:  1,防止由于一台namenode挂掉,集群失败的情形  2,...
    99+
    2023-06-03
  • docker下怎么搭建fastdfs分布式集群
    这篇文章主要讲解了“docker下怎么搭建fastdfs分布式集群”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“docker下怎么搭建fastdfs分布式集群”吧!本文在centos6.8下...
    99+
    2023-06-19
  • 详解MongoDB4.0构建分布式分片群集
    MongoDB分片简述 高数据量和吞吐量的数据库应用会对单机的性能造成较大压力,大的查询量会将单机的 CPU 耗尽,大的数据量对单机的存储压力较大,最终会耗尽系统的内存而将压力转移到磁盘 IO 上。 M...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作