iis服务器助手广告广告
返回顶部
首页 > 资讯 > 精选 >CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境
  • 230
分享到

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

2023-06-03 01:06:09 230人浏览 独家记忆
摘要

这篇文章将为大家详细讲解有关Centos 7如何搭建hadoop 2.7.3完全分布式集群环境,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。(一)软件准备1,hadoop-2.7.3.tar.gz(包)2

这篇文章将为大家详细讲解有关Centos 7如何搭建hadoop 2.7.3完全分布式集群环境,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

(一)软件准备

1,hadoop-2.7.3.tar.gz(包)

2,三台机器装有cetos7的机子

(二)安装步骤

  1,给每台机子配相同的用户

    进入root : su root

    创建用户s:  useradd s

    修改用户密码:passwd s

  2.关闭防火墙及修改每台机的hosts(root 下)

    vim /etc/hosts  如:(三台机子都一样)

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

    vim /etc/hostsname:如修改后参看各自的hostname

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

    关闭防火墙:

      systemctl stop firewalld.service

      禁用防火墙:systemctl disable firewalld.service

      查看防火墙状态firewall-cmd --state

      重启 reboot

  3,为每台机的用户s配置ssh,以用户s身份登录  (一定要相同的用户,因为ssh通信默认使用相同用户身份访问另一台机子)

    1,root 用户下修改: vim /etc/ssh/sshd_config,设置这三项后,执行service sshd restart

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

     2,退出root,在用户s下操作

      生成密钥对: ssh-keygen -t dsa(一路回车即可)

      转入ssh目录下:cd .ssh

      导入公钥: cat id_dsa.pub >>  authorized_keys

      修改authorized_keys权限:chmod 644       

      authorized_keys  (修改权限,保证自己免密码能登入)

      验证  ssh Master (在三台机都执行相同的操作)

    3,实现master-slave免密码登录

      在master 上执行:   cat ~/.ssh/id_dsa.pub | ssh s@Slave1 'cat - >> ~/.ssh/authorized_keys'      

                cat ~/.ssh/id_dsa.pub | ssh s@Slave2 'cat - >> ~/.ssh/authorized_keys '  

      验证 :ssh Slave1


 (三 )配置Hadoop集群

    1,解压hadoop和建立文件

      root用户下:tar zxvf  /home/hadoop/hadoop-2.7.3.tar.gz -C /usr/  

       重命名:mv hadoop-2.7.3 hadoop

       授权给s: chown -R  s /usr/hadoop

    2,创建hdfs相关文件(三台机子都需要操作)

      创建存储hadoop数据文件的目录: mkdir /home/hadoopdir

      存储临时文件,如pid:mkdir /home/hadoopdir/tmp

      创建dfs系统使用的dfs系统名称hdfs-site.xml使用:mkdir /home/hadoopdir/dfs/name

      创建dfs系统使用的数据文件hdfs-site.xml文件使用:mkdir  /home/hadoopdir/dfs/data

       授权给s: chown -R  s /home/hadoopdir

     3,配置环境变量(三台机子都需要操作)

     root用户下:vim /etc/profile  添加如图: 保存退出后:source /etc/profile

          验证:hadoop version(这里要修改  /usr/hadoop/etc/hadoop/hadoop-env.sh,即export JAVA_HOME=/usr/lib/JVM/jre)

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

     4,配置hadoop文件内容

      4.1 修改core-site.xml

<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://Master:9000</value> </property> <property> <name>io.file.buffer.size</name> <value>131072</value> </property> <property> <name>hadoop.tmp.dir</name> <value>file:/home/hadoopdir/tmp/</value> <description>A base for other temporary   directories.</description> </property> <property> <name>hadoop.proxyuser.hadoop.hosts</name> <value>*</value> </property> <property> <name>hadoop.proxyuser.hadoop.groups</name> <value>*</value> </property> </configuration>

     4.2 修改hdfs-site.xml文件

<configuration> <property> <name>dfs.namenode.name.dir</name> <value>file:///home/hadoopdir/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:///home/hadoopdir/dfs/data</value> </property> <property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.WEBhdfs.enabled</name> <value>true</value> </property> </configuration>

    4.3 修改mapred-site.xml

<configuration> <property> <name>mapReduce.framework.name</name> <value>yarn</value> </property> <property> <name>mapreduce.jobhistory.address</name> <value>Master:10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>Master:19888</value> </property> <property> <name>mapreduce.jobtracker.Http.address</name> <value>Master:50030</value> </property> <property> <name>mapred.job.tracker</name> <value>Master:9001</value> </property> </configuration>

    4.4 修改 yarn-site.xml

<configuration> <!-- Site specific YARN configuration properties --> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>Master</value> </property> <property> <name>yarn.resourcemanager.address</name> <value>Master:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address</name> <value>Master:8030</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address</name> <value>Master:8031</value> </property> <property> <name>yarn.resourcemanager.admin.address</name> <value>Master:8033</value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>Master:8088</value> </property> </configuration>

    4.5,修改 slaves文件

      CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

   5,搭建集群(普通用户s)

     格式hadoop文件:hadoop  namenode -fORMat  (最后出现“util.ExitUtil: Exiting with status 0”,表示成功)

     发送dfs内容给Slave1:scp  -r /home/hadoopdir/dfs/*  Slave1:/home/hadoopdir/dfs

      发给dfs内容给Slave2:scp  -r /home/hadoopdir/dfs/*  Slave2:/home/hadoopdir/dfs

     发送hadoop文件给数据节点:scp -r /usr/hadoop/*  Slave1:/usr/hadoop/  scp -r /usr/hadoop/*  Slave2:/usr/hadoop/

   6,启动集群

    ./sbin/start-all.sh

      1,jps(centos 7 默认没有,可以参照分割线里的安装)

--------------------------------------分割线 --------------------------------------

CentOS中使用yum安装java时,没有jps的问题的解决。

解决方法:需要安装java-1.X.X-openjdk-devel这个包,他提供了jps这个工具

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

--------------------------------------分割线 --------------------------------------

查看:Master和Slave中分别出现如下所示:

      CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

      2,离开安全模式(master): hadoop dfsadmin  safemode  leave

       查看结果:hadoop dfsadmin -report,如图

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

      3,登录网页查看:http://Master:50070  (查看live node)    查看yarn环境(http://Master/8088)

关于“CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

--结束END--

本文标题: CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

本文链接: https://www.lsjlt.com/news/231954.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境
    这篇文章将为大家详细讲解有关CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。(一)软件准备1,hadoop-2.7.3.tar.gz(包)2...
    99+
    2023-06-03
  • CentOS 6.7下如何搭建Hadoop 2.7.3集群
    这篇文章主要介绍了CentOS 6.7下如何搭建Hadoop 2.7.3集群,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。Hadoop集群有三种运行模式:单机模式、伪分布模式...
    99+
    2023-06-03
  • Hadoop完全分布式集群搭建(超详细)
    目录 1.1.1 完全分布式介绍 1.1.2 平台软件说明 1.1.3 守护进程布局 1.2.1 集群搭建准备 1.2.2 总纲 1.2.3防火墙关闭 1.2.4 主机映射 1.2.5 免密登陆 1.2.6 jdk安装和hadoop安装及...
    99+
    2023-10-23
    hadoop 分布式 hdfs
  • Hadoop环境搭建-单机、伪分布式、完全分布式
    目录 一、单机安装  二、伪分布式环境搭建 配置SSH免密登录  三、完全分布式环境搭建 设置免密 修改配置文件 本文的所有配置文件,除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA,...
    99+
    2023-10-23
    hadoop 分布式 linux
  • Hadoop+HBase+ZooKeeper分布式集群环境搭建步骤
    目录一、环境说明2.1 安装JDK2.2 添加Hosts映射关系2.3 集群之间SSH无密码登陆三、Hadoop集群安装配置3.1 修改hadoop配置3.2 启动hadoop集群四...
    99+
    2024-04-02
  • 浅析Hadoop完全分布式集群搭建问题
    目录一、Hadoop是什么二、Hadoop组成1、Hadoop1.x2、Hadoop2.x三、Hadoop集群搭建所需工具(链接如下,自行下载)四、Hadoop集群配置前期准备五、H...
    99+
    2024-04-02
  • CentOS 6.4如何安装Hadoop-2.5.1完全分布式集群
    这篇文章主要介绍了CentOS 6.4如何安装Hadoop-2.5.1完全分布式集群,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。环境介绍:在两台装有CentOS 6.4(3...
    99+
    2023-06-03
  • 如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群
    本篇内容主要讲解“如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何使用Centos7系统搭建Hadoop-3.1.4完全分布...
    99+
    2023-06-15
  • hadoop-2.7.3编译和搭建集群环境的方法是什么
    这篇文章主要讲解了“hadoop-2.7.3编译和搭建集群环境的方法是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“hadoop-2.7.3编译和搭建集群环境的方法是什么”吧!环境:Ce...
    99+
    2023-06-03
  • Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的
    这期内容当中小编将会给大家带来有关Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。最近在自己的笔记本电脑上搭建了Apache Hadoop分...
    99+
    2023-06-19
  • hadoop完全分布式怎么搭建
    要搭建Hadoop完全分布式集群,需要按照以下步骤进行操作: 准备环境:首先需要准备多台服务器,至少需要3台以上的服务器来搭建H...
    99+
    2024-03-13
    hadoop
  • Hadoop伪分布式环境的搭建步骤
    这篇文章主要讲解了“Hadoop伪分布式环境的搭建步骤”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Hadoop伪分布式环境的搭建步骤”吧!安装准备将系统安...
    99+
    2024-04-02
  • 如何搭建Redis集群环境
    本篇文章为大家展示了如何搭建Redis集群环境,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1 Redis集群环境搭建方便起见,这里集群环境的所有节点全部位于同一个...
    99+
    2024-04-02
  • Hadoop 2.x中怎么搭建伪分布式环境
    这期内容当中小编将会给大家带来有关Hadoop 2.x中怎么搭建伪分布式环境,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、修改hadoop-env.sh、yarn-e...
    99+
    2024-04-02
  • 如何进行HA分布式集群搭建
    今天就跟大家聊聊有关如何进行HA分布式集群搭建,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。一:HA分布式配置的优势:  1,防止由于一台namenode挂掉,集群失败的情形  2,...
    99+
    2023-06-03
  • 完全分布式hadoop搭建的步骤是什么
    搭建完全分布式Hadoop集群通常包括以下步骤: 准备环境:确保所有节点都有相同的操作系统和Java版本,并且具有网络互通的能力...
    99+
    2024-03-05
    hadoop
  • hadoop伪分布式如何搭建
    要搭建Hadoop伪分布式,需要按照以下步骤进行操作:1. 安装Java开发工具:首先,确保已在计算机上安装了Java开发工具。Ha...
    99+
    2023-09-21
    hadoop
  • 如何使用Docker Swarm搭建分布式爬虫集群
    今天小编给大家分享一下如何使用Docker Swarm搭建分布式爬虫集群的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获...
    99+
    2024-04-02
  • 如何使用docker compose搭建consul集群环境
    这篇文章主要介绍如何使用docker compose搭建consul集群环境,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!consul基本概念server模式和client模式server模式和client模式是co...
    99+
    2023-06-15
  • 如何在Linux环境中搭建Java分布式索引的开发环境?
    在Linux环境中搭建Java分布式索引的开发环境是一个非常重要的任务,因为这样可以帮助开发者更好地进行分布式索引的开发工作。本文将介绍如何在Linux环境中搭建Java分布式索引的开发环境,帮助读者更好地进行分布式索引开发。 安装Jav...
    99+
    2023-08-24
    分布式 索引 linux
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作