iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >hadoop+hbase+zookeeper完全分布安装(1)
  • 877
分享到

hadoop+hbase+zookeeper完全分布安装(1)

2024-04-02 19:04:59 877人浏览 八月长安
摘要

版本选择选择 hadoop 版本对HBase部署很关键。下表显示不同HBase支持的Hadoop版本信息。基于HBase版本,应该选择合适的Hadoop版本。HBase-0.92.xHBase-0.94.x

版本选择

选择 hadoop 版本对HBase部署很关键。下表显示不同HBase支持的Hadoop版本信息。基于HBase版本,应该选择合适的Hadoop版本。



HBase-0.92.xHBase-0.94.xHBase-0.96
Hadoop-0.20.205SXX
Hadoop-0.22.xSXX
Hadoop-1.0.xSSS
Hadoop-1.2.xNTSS
Hadoop-0.23.xXSNT
Hadoop-2.xXSS


S = supported and tested,支持
X = not supported,不支持
NT = not tested enough.可以运行但测试不充分


一.准备工作

1.选择合适的配套软件。本文所使用的软件包分别为

hadoop-1.2.1-bin.tar.gz

hbase-0.94.10.tar.gz

jdk-6u20-linux-i586.bin

ZooKeeper-3.4.6.tar.gz


2.环境准备,本实验是已三台机器做一个集群,1个master,2个slave。

1)每台机器上安装openssl,rsync


2)每台机器上建立用户hadoop,并且在/etc/sysconfig/network修改主机名,

和在/etc/hosts里加入如下映射

192.168.10.1 master

192.168.10.2 slave1

192.168.10.3 slave2


注: DNS映射的这3主机不能有其它的dns映射名。否则 建好集群准备建表的hbase会非常奇葩的报错

org.apache.hadoop.hbase.PleaseHoldException: Master is initializing   


导致 建表和写入

3) 安装JDK

创建文件夹/usr/java ,将jdk-6u20-linux-i586.bin移到此文件夹后执行

将java路径加入 /etc/profile

export JAVA_HOME=/usr/java/jdk1.6.0_45

export JRE_HOME=/usr/java/jdk1.6.0_45/jre

export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$CLASSPATH


二 . 安装hadoop

1.master 与两台slave机间相互建立ssh无密码登录(出于安全考虑最好是通过hadoop用户来建立)


1)首先所有机切换到hadoop 用户 输入

ssh-keygen -t rsa

这样就会在hadoop用户主目录下生成 ~/.ssh/ 一对公私匙 id_rsa id_rsa.pub


2) 然后在master机上将id_rsa.pub的内容追加到同一目录的授权key authorized_keys文件里(没有就创建一 个)

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

这样就实现了 ssh 无密码自登陆,可以试试 命令 ssh localhost 登录 看是否需要密码


3) 将文件 id_rsa.pub通过scp命令传到slave1 和2 里面

scp id_rsa.pub hadoop@192.168.10.2:~

scp id_rsa.pub hadoop@192.168.10.3:~

然后一样的将里面的内容追加到key authorized_keys里

cat ~/id_rsa.pub >> ~/.ssh/authorized_keys

这样maser机就能够无密码的登录这两台slave了


4)照上面的做法,依次将slave1和slave2的id_rsa.pub内容追加到 master上的authorized_keys里

达到master与slave相互之间无密码ssh登录。


5) 注意 一定要用主机名相互登录一次。否则后面启动hadoop时候会出现 ssh报错 导致启动失败



2.将hadoop压缩包解压,并放到/usr/local/hadoop目录下,添加一个目录tmp ,

并将整个目录的所有者改为hadoop

tar zxvf hadoop-1.2.1-bin.tar.gz

mv hadoop-1.2.1/ /usr/local/hadoop

mkdir /usr/local/hadoop/tmp

chown -R hadoop:hadoop /usr/local/hadoop


3.修改hadoop的配置文件,一般想让hadoop正常启动起来,最少需要配置修改4个配置文件

分别是


1) 修改配置文件 /usr/local/hadoop/conf/hadoop-env.sh

 在文件的末尾处加上

export JAVA_HOME=/usr/java/jdk1.6.0_45


2) 修改配置文件 /usr/local/hadoop/conf/core-site.xml 内容如下

<configuration>

<property>

<name>hadoop.tmp.dir</name> 配置tmp存储目录

<value>/usr/local/hadoop/tmp</value>

</property>

<property>

<name>fs.default.name</name>

<value>hdfs://master:9000</value> 配置HDFS的地址和端口号

</property>

</configuration>



3) 修改配置文件/usr/local/hadoop/conf/hdfs-site.xml 内容如下

<configuration>

<property>

<name>dfs.name.dir</name>

<value>${hadoop.tmp.dir}/dfs/name</value>

</property>

<property>

<name>dfs.data.dir</name>

<value>/usr/local/hadoop/data</value>

</property>


<property>

<name>dfs.replication</name>

<value>1</value>

</property>


</configuration>


4.修改配置文件/usr/local/hadoop/conf/mapred-site.xml


<configuration>

<property>

<name>mapred.job.tracker</name>

<value>hbase1:9001</value>  

</property>

</configuration>


5.在/etc/profile中里添加hadoop的路径

export HADOOP_HOME=/usr/local/hadoop

export PATH=$HADOOP_HOME/bin:$PATH

使之生效

source /etc/profile


这样master的hadoop已经安装好了


6.使用scp将 文件夹/usr/local/hadoop 传到两台slave机上相同的路径

scp -r /usr/local/hadoop root@192.168.10.2:/usr/local

scp -r /usr/local/hadoop root@192.168.10.3:/usr/local

修改所有者

chown -R hadoop:hadoop /usr/local/hadoop

在 /etc/profile 添加如下变量

export HADOOP_HOME=/usr/local/hadoop

export PATH=$HADOOP_HOME/bin:$PATH

使之生效

source /etc/profile


三。 启动分布式文件系统hadoop

首先 ,在第一次启动时要在master上 ,su切换到hadoop用户执行以下命令

hadoop namenode -fORMat

出现 sucessfully formatted 就说明格式化成功了


然后用hadoop用户 运行脚本文件 start-all.sh 即可启动


四。 验证hadoop

启动后 使用命令jsp 来查看进程。

一般来说 正常的master下会有如下几个进程

JobTracker

NameNode

SecondaryNameNode


正常的slave下有以下2个

JobTracker

NameNode



这样hadoop就安装成功了









您可能感兴趣的文档:

--结束END--

本文标题: hadoop+hbase+zookeeper完全分布安装(1)

本文链接: https://www.lsjlt.com/news/44594.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • [Hadoop全分布部署]安装JDK、Hadoop
    👨‍🎓👨‍🎓博主:发量不足 个人简介:耐心,自信来源于你强大的思想和知识基础!! 📑📑本期更新内容:Hadoop全分布部署 ----安装JDK、...
    99+
    2023-09-08
    开发语言 java hadoop 配置
  • Hadoop+HBase+ZooKeeper分布式集群环境搭建步骤
    目录一、环境说明2.1 安装JDK2.2 添加Hosts映射关系2.3 集群之间SSH无密码登陆三、Hadoop集群安装配置3.1 修改hadoop配置3.2 启动hadoop集群四...
    99+
    2024-04-02
  • CentOS 6.4如何安装Hadoop-2.5.1完全分布式集群
    这篇文章主要介绍了CentOS 6.4如何安装Hadoop-2.5.1完全分布式集群,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。环境介绍:在两台装有CentOS 6.4(3...
    99+
    2023-06-03
  • hadoop完全分布式怎么搭建
    要搭建Hadoop完全分布式集群,需要按照以下步骤进行操作: 准备环境:首先需要准备多台服务器,至少需要3台以上的服务器来搭建H...
    99+
    2024-03-13
    hadoop
  • 如何安装Hadoop单机版和全分布式
    这篇文章主要介绍“如何安装Hadoop单机版和全分布式”,在日常操作中,相信很多人在如何安装Hadoop单机版和全分布式问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何安装Hadoop单机版和全分布式”的疑...
    99+
    2023-06-09
  • Hadoop环境搭建-单机、伪分布式、完全分布式
    目录 一、单机安装  二、伪分布式环境搭建 配置SSH免密登录  三、完全分布式环境搭建 设置免密 修改配置文件 本文的所有配置文件,除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA,...
    99+
    2023-10-23
    hadoop 分布式 linux
  • Hadoop完全分布式集群搭建(超详细)
    目录 1.1.1 完全分布式介绍 1.1.2 平台软件说明 1.1.3 守护进程布局 1.2.1 集群搭建准备 1.2.2 总纲 1.2.3防火墙关闭 1.2.4 主机映射 1.2.5 免密登陆 1.2.6 jdk安装和hadoop安装及...
    99+
    2023-10-23
    hadoop 分布式 hdfs
  • hadoop伪分布式的安装步骤
    本篇内容主要讲解“hadoop伪分布式的安装步骤”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“hadoop伪分布式的安装步骤”吧! 解压缩 /opt/software/hadoop-2...
    99+
    2023-06-03
  • 浅析Hadoop完全分布式集群搭建问题
    目录一、Hadoop是什么二、Hadoop组成1、Hadoop1.x2、Hadoop2.x三、Hadoop集群搭建所需工具(链接如下,自行下载)四、Hadoop集群配置前期准备五、H...
    99+
    2024-04-02
  • 完全分布式hadoop搭建的步骤是什么
    搭建完全分布式Hadoop集群通常包括以下步骤: 准备环境:确保所有节点都有相同的操作系统和Java版本,并且具有网络互通的能力...
    99+
    2024-03-05
    hadoop
  • hadoop伪分布式集群怎么安装
    Hadoop伪分布式集群是在单台机器上模拟多台机器的Hadoop集群环境,可以用来进行开发和测试。以下是Hadoop伪分布式集群的安...
    99+
    2024-03-13
    hadoop
  • Hadoop伪分布式安装方法是什么
    这篇文章主要介绍“Hadoop伪分布式安装方法是什么”,在日常操作中,相信很多人在Hadoop伪分布式安装方法是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Hadoop伪分布式安装方法是什么”的疑惑有所...
    99+
    2023-06-03
  • 分布式服务Dubbo+Zookeeper安全认证的示例分析
    这篇文章给大家分享的是有关分布式服务Dubbo+Zookeeper安全认证的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。问题Zookeeper+dubbo,如何设置安全认证?不想让其他服务连接Zooke...
    99+
    2023-05-30
    dubbo zookeeper
  • CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境
    这篇文章将为大家详细讲解有关CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。(一)软件准备1,hadoop-2.7.3.tar.gz(包)2...
    99+
    2023-06-03
  • 如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群
    本篇内容主要讲解“如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何使用Centos7系统搭建Hadoop-3.1.4完全分布...
    99+
    2023-06-15
  • Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的
    这期内容当中小编将会给大家带来有关Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。最近在自己的笔记本电脑上搭建了Apache Hadoop分...
    99+
    2023-06-19
  • linux系统怎么安装hadoop真分布式集群
    这篇“linux系统怎么安装hadoop真分布式集群”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“linux系统怎么安装ha...
    99+
    2023-06-30
  • 搭建JEESZ分布式架构7--Zookeeper注册中心安装
    ZooKeeper是一个分布式开源框架,提供了协调分布式应用的基本服务,它向外部应用暴露一组通用服务——分布式同步(Distributed Synchronization).命名服务(Naming Service).集群维护(Group M...
    99+
    2023-06-03
  • ZooKeeper分布式协调服务设计核心概念及安装配置
    目录一、ZooKeeper 简介1.ZooKeeper 设计目标2.核心概念1)Session 会话2)数据节点3)Watcher4)ACL3.Zab 协议介绍二、ZooKeeper...
    99+
    2024-04-02
  • 怎么在Linux下安装部署分布式全文搜索引擎
    这篇文章给大家分享的是有关怎么在Linux下安装部署分布式全文搜索引擎的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。安装Elasticsearch在Ubuntu上安装Elasticsearch非常简单。我们将启用...
    99+
    2023-06-15
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作