iis服务器助手广告广告
返回顶部
首页 > 资讯 > 操作系统 >Linux系统如何部署Hadoop集群
  • 109
分享到

Linux系统如何部署Hadoop集群

2023-06-28 14:06:26 109人浏览 八月长安
摘要

这篇文章将为大家详细讲解有关linux系统如何部署hadoop集群,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Hadoop简介:Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个

这篇文章将为大家详细讲解有关linux系统如何部署hadoop集群,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

Hadoop简介:

  • Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台

  • Hadoop允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。

Linux系统如何部署Hadoop集群

  • 狭义上说,Hadoop指Apache这款开源框架,它的核心组件有:

  • hdfs(分布式文件系统):解决海量数据存储

  • YARN(作业调度和集群资源管理的框架):解决资源任务调度

  • mapReduce(分布式运算编程框架):解决海量数据计算

广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。

Linux系统如何部署Hadoop集群

当下的Hadoop已经成长为一个庞大的体系,随着生态系统的成长,新出现的项目越来越多,其中不乏一些非Apache主管的项目,这些项目对HADOOP是很好的补充或者更高层的抽象。

Linux系统安装Hadoop步骤

安装ssh服务

  进入shell命令,输入如下命令,查看是否已经安装好ssh服务,若没有,则使用如下命令进行安装:

    sudo apt-get install ssh openssh-server

  安装过程还是比较轻松加愉快的。

使用ssh进行无密码验证登录

  1.创建ssh-key,这里我们采用rsa方式,使用如下命令:

    ssh-keygen -t rsa -P “”

  2.出现一个图形,出现的图形就是密码,不用管它

    cat ~/.ssh/id_rsa.pub >> authorized_keys(好像是可以省略的)

  3.然后即可无密码验证登录了,如下:

    ssh localhost

  成功截图如下:

    Linux系统如何部署Hadoop集群

下载Hadoop安装包

  下载Hadoop安装也有两种方式

    1.直接上官网进行下载,Http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz

    2.使用shell进行下载,命令如下:

      wget http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz

  貌似第二种的方法要快点,经过漫长的等待,终于下载完成。

解压缩Hadoop安装包

  使用如下命令解压缩Hadoop安装包

    tar -zxvf hadoop-2.7.1.tar.gz

  解压缩完成后出现hadoop2.7.1的文件夹

配置Hadoop中相应的文件

  需要配置的文件如下,hadoop-env.sh,core-site.xml,mapred-site.xml.template,hdfs-site.xml,所有的文件均位于hadoop2.7.1/etc/hadoop下面,具体需要的配置如下:

  1.core-site.xml 配置如下:    

                  hadoop.tmp.dir        file:/home/leesf/program/hadoop/tmp        Abase for other temporary directories.                    fs.defaultFS        hdfs://localhost:9000          

  其中的hadoop.tmp.dir的路径可以根据自己的习惯进行设置。

  2.mapred-site.xml.template配置如下:    

                  mapred.job.tracker        localhost:9001          

  3.hdfs-site.xml配置如下:

                  dfs.replication        1                    dfs.namenode.name.dir        file:/home/leesf/program/hadoop/tmp/dfs/name                    dfs.datanode.data.dir        file:/home/leesf/program/hadoop/tmp/dfs/data          

  其中dfs.namenode.name.dir和dfs.datanode.data.dir的路径可以自由设置,最好在hadoop.tmp.dir的目录下面。

  补充,如果运行Hadoop的时候发现找不到jdk,可以直接将jdk的路径放置在hadoop.env.sh里面,具体如下:

    export JAVA_HOME=”/home/leesf/program/java/jdk1.8.0_60″

运行Hadoop

  在配置完成后,运行hadoop。

  1.初始化HDFS系统

    在hadop2.7.1目录下使用如下命令:

    bin/hdfs namenode -fORMat

    截图如下:

    Linux系统如何部署Hadoop集群 

    过程需要进行ssh验证,之前已经登录了,所以初始化过程之间键入y即可。

    成功的截图如下:

    Linux系统如何部署Hadoop集群

    表示已经初始化完成。

  2.开启NameNode和DataNode守护进程

    使用如下命令开启:

    sbin/start-dfs.sh,成功的截图如下:

    Linux系统如何部署Hadoop集群

  3.查看进程信息

    使用如下命令查看进程信息

    jps,截图如下:

    Linux系统如何部署Hadoop集群

    表示数据DataNode和NameNode都已经开启

  4.查看WEB UI

    在浏览器中输入http://localhost:50070,即可查看相关信息,截图如下:

    Linux系统如何部署Hadoop集群

  至此,hadoop的环境就已经搭建好了。下面开始使用hadoop来运行一个WordCount例子。

运行WordCount Demo

  1.在本地新建一个文件,笔者在home/leesf目录下新建了一个words文档,里面的内容可以随便填写。

  2.在HDFS中新建一个文件夹,用于上传本地的words文档,在hadoop2.7.1目录下输入如下命令:

    bin/hdfs dfs -mkdir /test,表示在hdfs的根目录下建立了一个test目录

    使用如下命令可以查看HDFS根目录下的目录结构

    bin/hdfs dfs -ls /

    具体截图如下:

    Linux系统如何部署Hadoop集群

    表示在HDFS的根目录下已经建立了一个test目录

  3.将本地words文档上传到test目录中

    使用如下命令进行上传操作:

    bin/hdfs dfs -put /home/leesf/words /test/

    使用如下命令进行查看

    bin/hdfs dfs -ls /test/

    结果截图如下:

    Linux系统如何部署Hadoop集群

    表示已经将本地的words文档上传到了test目录下了。

  4.运行wordcount

    使用如下命令运行wordcount:

    bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /test/words /test/out

    截图如下:

    Linux系统如何部署Hadoop集群

    运行完成后,在/test目录下生成名为out的文件,使用如下命令查看/test目录下的文件

    bin/hdfs dfs -ls /test

    截图如下:

    Linux系统如何部署Hadoop集群

    表示在test目录下已经有了一个名为Out的文件目录

    输入如下命令查看out目录下的文件:

    bin/hdfs dfs -ls /test/out,结果截图如下:

    Linux系统如何部署Hadoop集群

    表示已经成功运行了,结果保存在part-r-00000中。

  5.查看运行结果

    使用如下命令查看运行结果:

    bin/hadoop fs -cat /test/out/part-r-00000

    结果截图如下:

    Linux系统如何部署Hadoop集群

关于“Linux系统如何部署Hadoop集群”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

--结束END--

本文标题: Linux系统如何部署Hadoop集群

本文链接: https://www.lsjlt.com/news/320156.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Linux系统如何部署Hadoop集群
    这篇文章将为大家详细讲解有关Linux系统如何部署Hadoop集群,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Hadoop简介:Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个...
    99+
    2023-06-28
  • Linux中如何部署Hadoop集群
    这篇文章给大家分享的是有关Linux中如何部署Hadoop集群的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Hadoop 是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下...
    99+
    2023-06-27
  • Linux系统如何部署zookeeper集群
    这篇文章给大家分享的是有关Linux系统如何部署zookeeper集群的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。zookeeper简介:Zookeeper是一个开源的分布式协调服务,Zookeeper的设计目...
    99+
    2023-06-28
  • 怎么部署Hadoop集群
    本篇内容主要讲解“怎么部署Hadoop集群”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么部署Hadoop集群”吧!环境准备一共用5台机器作为硬件环境,全都是...
    99+
    2024-04-02
  • ambari中怎么部署hadoop集群
    在Ambari中部署Hadoop集群通常需要按照以下步骤进行操作: 登录到Ambari的Web界面,并创建一个新的集群。 在创建集...
    99+
    2024-03-14
    hadoop ambari
  • Hadoop集群部署最佳实践
    在部署Hadoop集群时,以下是一些最佳实践: 使用自动化工具:使用自动化工具如Ansible、Chef或Puppet来部署Ha...
    99+
    2024-02-29
    Hadoop
  • Linux系统怎样搭建hadoop集群
    这篇文章跟大家分析一下“Linux系统怎样搭建hadoop集群”。内容详细易懂,对“Linux系统怎样搭建hadoop集群”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习“Linux...
    99+
    2023-06-28
  • Linux系统安装部署nacos集群:基于nacos2.0.3
    目录 前言 1.yum安装方式 2.docker安装方式 一、前置条件 1.操作系统或者虚拟机上安装jdk,版本>=8 2.下载好nacos2.0.3的压缩包 二、解压 三、部署  1.将 cluster.conf.example 文件复制...
    99+
    2023-08-31
    linux 运维 服务器
  • redis如何部署集群
    这篇文章主要介绍“redis如何部署集群”,在日常操作中,相信很多人在redis如何部署集群问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”redis如何部署集群”的疑惑有所帮...
    99+
    2024-04-02
  • 如何部署Spark集群
    今天就跟大家聊聊有关如何部署Spark集群,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。1. 安装环境简介硬件环境:两台四核cpu、4G内存、500...
    99+
    2024-04-02
  • php中什么是集群部署?如何实现集群部署?
    随着互联网进入快速发展的时代,各种网站、应用如雨后春笋般出现,人们对于服务的需求越来越高。而随着用户量增加,单一服务器已经无法满足需求,集群部署PHP项目成为解决方案之一。一、什么是集群部署?集群部署是将多台服务器组合在一起,按照特定的方式...
    99+
    2023-05-14
    集群部署 php
  • Hadoop集群环境部署的示例分析
    这篇文章主要介绍了Hadoop集群环境部署的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。为集群自定义一个名称:在安装集群组建之前安装程序需要对主机进行一些环境检查工...
    99+
    2023-06-02
  • k8s如何部署redis集群
    这篇文章主要讲解了“k8s如何部署redis集群”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“k8s如何部署redis集群”吧!redis集群搭建1.1使用redis-cli创建集群#&nb...
    99+
    2023-07-05
  • Linux下的FineBI集群部署
    本篇内容介绍了“Linux下的FineBI集群部署”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!在企业应用中,通常单个计算机的配置是有限的,...
    99+
    2023-06-04
  • docker如何部署etcd集群
    目录创建etcd数据目录创建docker网络etcd-cluster-compose.yml启动并验证集群启动验证集群k/v操作CURLetcdctl总结需要安装: dockerdo...
    99+
    2023-03-19
    docker部署etcd集群 docker部署 docker etcd集群
  • docker如何部署kafka集群
    要部署Kafka集群,可以使用Docker来简化整个过程。下面是一个基本的步骤:1. 安装Docker和Docker Compose...
    99+
    2023-10-08
    kafka docker
  • MariaDB如何进行集群部署
    在MariaDB中进行集群部署通常使用Galera Cluster来实现。Galera Cluster是一个同步多主集群解决方案,可...
    99+
    2024-04-09
    MariaDB
  • k8s中如何部署redis集群
    在Kubernetes中部署Redis集群通常可以通过以下步骤进行: 创建Redis的ConfigMap:在Kubernetes中...
    99+
    2024-04-09
    redis
  • k8s中如何部署mysql集群
    在Kubernetes中部署MySQL集群可以使用StatefulSet和PersistentVolume。以下是一个简单的步骤: ...
    99+
    2024-04-02
  • kubeadm中如何部署kubernetes集群
    kubeadm中如何部署kubernetes集群,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。一、环境要求这里使用RHEL7.5master、etcd:192.168.10.1...
    99+
    2023-06-19
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作