首页 > 资讯 > 精选 >如何进行HA分布式集群搭建

501

分享到

如何进行HA分布式集群搭建

2023-06-03 01:06:57 501人浏览独家记忆

摘要

今天就跟大家聊聊有关如何进行HA分布式集群搭建，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。一：HA分布式配置的优势：　　1，防止由于一台namenode挂掉，集群失败的情形　　2，

今天就跟大家聊聊有关如何进行HA分布式集群搭建，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

一：HA分布式配置的优势：

　　1，防止由于一台namenode挂掉，集群失败的情形

　　2，适合工业生产的需求

二：HA安装步骤：

1，安装虚拟机

　1，型号：VMware_workstation_full_12.5.0.11529.exe　　linux镜像：Centos-7-x86_64-DVD-1611.iso

　　注意点：

　　1，网络选择了桥接模式（可以防止route总变），（台式机或服务器最好设置自己的本机的ip地址为静态的ip)

　　2，安装过程中选择了基础建设模式（infras...)，（减少内存的消耗，但又保证基本的环境的模式）

　　3，用户名root 密码 root
　　4，网络配置使用了手动网络固定网络ip4地址（固定ip)

　2，linux基本环境配置：(操作都在root权限下进行的）

　　1，验证网络服务：ping <主机ip>　　主机 ping <虚拟机ip> ping www.baidu.ok　　验证ok

　　　备份ip地址：cp /etc/sysconfig/network-scripts/ifcfg-ens33 /etc/sysconfig/network-scripts/ifcfg-ens33.bak　

　　2，防火墙设置：关闭并禁用防火墙

　　　关闭防火墙 systemctl stop firewalld.service（cetos7与前面系列的iptables不同）

　　禁用防火墙：systemctl disable firewalld.service

　　查看防火墙状态：firewall-cmd --state

　　3，设置hosts,hostname,network

vim /etc/hostname
ha1

vim /etc/hosts
192.168.1.116 ha1
192.168.1.117 ha2
192.168.1.118 ha3
192.168.1.119 ha4

vim /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=ha1

4，安装一些必要的包：（不一定全）

yum install -y chkconfig
yum install -y python
yum install -y bind-utils
yum install -y psmisc
yum install -y libxslt
yum install -y zlib
yum install -y sqlite
yum install -y cyrus-sasl-plain
yum install -y cyrus-sasl-gssapi
yum install -y fuse
yum install -y portmap
yum install -y fuse-libs
yum install -y RedHat-lsb

5，安装Java和Scala

java版本：jdk-7u80-linux-x64.rpm
scala版本：scala-2.11.6.tgz

验证是否有java:
rpm -qa|grep java 无

tar -zxf jdk-8u111-linux-x64.tar.gz
tar -zxf scala-2.11.6.tgz
mv jdk1.8.0_111 /usr/java
mv scala-2.11.6 /usr/scala

配置环境变量：
vim /etc/profile
export JAVA_HOME=/usr/java
export SCALA_HOME=/usr/scala
export PATH=$JAVA_HOME/bin:$SCALA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

　6，重启，验证上述是否设置　　ok :重启　　使用vm快照，命名为：初始化ok java,scala,主机名，防火墙，ip

　3，hadoop+ZooKeeper集群配置

　　1，集群机准备

　　　　连接克隆：对ha1克隆出ha2,ha3,ha4

　　　　对ha2,ha3,ha4修改网络地址，network,防火墙
　　　　vim /etc/sysconfig/network-scripts/ifcfg-ens33
　　　　116 117/118/119
　　　　service network restart
　　　　vim /etc/hostname
　　　　vim /etc/sysconfig/network
　　　　systemctl disable firewalld.service

　　　　对ha2,ha3,ha4重启验证ip,网络，防火墙，分别对三台机快照，命名为：初始化ok java,scala,主机名，防火墙，ip

　　2，集群框架图

机子	Namenode	DataNode	Zookeeper	ZkFC	JournalNode	RM	DM
Ha1	1		1	1	1	1
Ha2	1	1	1	1	1		1
Ha3		1	1		1		1
Ha4		1					1

　　3，ssh通信：　ok后　　快照 ssh ok

四台机：
ssh-keygen -t rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys

ha1下：
scp ~/.ssh/* root@ha2:~/.ssh/
scp ~/.ssh/* root@ha3:~/.ssh/
scp ~/.ssh/* root@ha4:~/.ssh/

验证：
ssh ha2/ha3/ha4

　　4，zookeeper集群配置：

　　　1，配置环境变量

zook安装：
tar -zxf zookeeper-3.4.8.tar.gz
mv zookeeper-3.4.8 /usr/zookeeper-3.4.8
修改配置文件：
export ZK_HOME=/usr/zookeeper-3.4.8
scp /etc/profile root@ha2:/etc/
scp /etc/profile root@ha3:/etc/
source /etc/profile

　　　2，zoo.cfg配置（加粗修改出）

cd /usr/zookeeper-3.4.8/conf
cp zoo_sample.cfg zoo.cfg
内容：
# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
dataDir=/opt/zookeeper/datas
dataLogDir=/opt/zookeeper/logs
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the
# administrator guide before turning on autopurge.
#
# Http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1
server.1=ha1:2888:3888
server.2=ha2:2888:3888
server.3=ha3:2888:3888

　　　3，启动zookeeper集群：

#三台机（ha1,ha2,ha3)
新建文件夹：
mkdir -p /opt/zookeeper/datas
mkdir -p /opt/zookeeper/logs
cd /opt/zookeeper/datas
vim myid 写1/2/3

#分发给ha2,ha3(注意ha4不需要）
cd /usr
scp -r zookeeper-3.4.8 root@ha2:/usr
scp -r zookeeper-3.4.8 root@ha3:/usr
#启动（三台机）
cd $ZK_HOME/bin
zkServer.sh start
zkServer.sh status 一个leader和连个follower

　　5，hadoop集群配置

　　　1，配置环境变量：

版本：hadoop-2.7.3.tar.gz

tar -zxf hadoop-2.7.3.tar.gz
mv hadoop2.7.3 /usr/hadoop2.7.3

export JAVA_HOME=/usr/java
export SCALA_HOME=/usr/scala
export HADOOP_HOME=/usr/hadoop-2.7.3
export PATH=$JAVA_HOME/bin:$SCALA_HOME/bin:$HADOOP_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
source /etc/profile

　　　2，hadoop.env.sh配置：

export JAVA_HOME=/usr/javasource hadoop.env.shhadoop version    验证ok

　　　3，hdfs-site.xml配置：后续修改后发送（scp hdfs-site.xml root@ha4:/usr/hadoop-2.7.3/etc/hadoop/）

vim hdfs-site.xml
<configuration>
<property>
<name>dfs.nameservices</name>
<value>mycluster</value>
</property>
<property>
<name>dfs.ha.namenodes.mycluster</name>
<value>nn1,nn2</value>
</property>
<property>
<name>dfs.namenode.rpc-address.mycluster.nn1</name>
<value>ha1:9000</value>
</property>
<property>
<name>dfs.namenode.rpc-address.mycluster.nn2</name>
<value>ha2:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.mycluster.nn1</name>
<value>ha1:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.mycluster.nn2</name>
<value>ha2:50070</value>
</property>
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://ha2:8485;ha3:8485;ha4:8485/mycluster</value>
</property>
<property>
<name>dfs.client.failover.proxy.provider.mycluster</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/opt/jn/data</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
</configuration>

　　　4，core-site.xml配置

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://mycluster</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>ha1:2181,ha2:2181,ha3:2181</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop2</value>
<description>A base for other temporary directories.</description>
</property>
</configuration>

　　　5，yarn-site.xml配置

vim yarn-site.xml
<configuration>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapReduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>ha1</value>
</property>
</configuration>

　　　6，mapred-site.xml配置

<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>

　　　7，slaves配置：

vim slaves ha2ha3ha4

　　　8，分发并启动：

#分发
scp -r hadoop-2.7.3 root@ha2:/usr/
scp -r hadoop-2.7.3 root@ha3:/usr/
scp -r hadoop-2.7.3 root@ha4:/usr/
#启动JN(在ha2,ha3,ha4)
cd sbin
./hadoop-daemon.sh start journalnode

[root@ha2 sbin]# jps
JournalNode
Jps
QuorumPeerMain(#zk启动的线程）

#ha1:namenode格式化
cd bin
./hdfs namenode -fORMat
#zk格式化
./hdfs zkfc -formatZK
#可以查看cd /opt/hadoop2文件来查看元数据是否格式化正常

#ha2:namenode格式化
1，ha1要先启动namenode:
./hadoop-daemon.sh start namenode
2,ha2下
./hdfs namenode -bootstrapStandby

　　　9，验证：http://192.168.1.116:50070/验证 ok 快照 ha模式下的hadoop+zookeeper安装ok

#hdfs集群验证
[root@ha1 sbin]# ./stop-dfs.sh
Stopping namenodes on [ha1 ha2]
ha2: no namenode to stop
ha1: stopping namenode
ha2: no datanode to stop
ha3: no datanode to stop
ha4: no datanode to stop
Stopping journal nodes [ha2 ha3 ha4]
ha3: stopping journalnode
ha4: stopping journalnode
ha2: stopping journalnode
Stopping ZK Failover Controllers on NN hosts [ha1 ha2]
ha2: no zkfc to stop
ha1: no zkfc to stop
[root@ha1 sbin]# ./start-dfs.sh
ha1下：
[root@ha1 sbin]# jps
Jps
NameNode
QuorumPeerMain
DFSZKFailoverController
[root@ha2 dfs]# jps
NameNode
DFSZKFailoverController
Jps
DataNode
JournalNode
QuorumPeerMain
[root@ha3 sbin]# jps
QuorumPeerMain
DataNode
JournalNode
Jps
[root@ha4 sbin]# jps
Jps
DataNode
JournalNode

配置yarn和mapred
[root@ha1 sbin]# jps
NameNode
DFSZKFailoverController
Jps
QuorumPeerMain
ResourceManager
[root@ha2 hadoop]# jps
DataNode
NameNode
DFSZKFailoverController
JournalNode
NodeManager
Jps
QuorumPeerMain
[root@ha3 ~]# jps
QuorumPeerMain
DataNode
NodeManager
Jps
JournalNode
[root@ha4 ~]# jps
JournalNode
NodeManager
DataNode
Jps

看完上述内容，你们对如何进行HA分布式集群搭建有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注编程网精选频道，感谢大家的支持。

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 如何进行HA分布式集群搭建

本文链接: https://www.lsjlt.com/news/231952.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

如何进行HA分布式集群搭建

今天就跟大家聊聊有关如何进行HA分布式集群搭建，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。一：HA分布式配置的优势：　　1，防止由于一台namenode挂掉，集群失败的情形　　2，...

99+

2023-06-03
如何进行Zookeeper分析与集群搭建

本篇文章为大家展示了如何进行Zookeeper分析与集群搭建，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。Zookeeper简介Zookeeper是一个高效的分布式协调服务，可以提供配置信息管理、命...

99+

2023-06-02
mysql分布式集群怎么搭建

要搭建一个 MySQL 分布式集群，可以采用以下步骤：选择合适的分布式架构：MySQL 分布式集群可以采用主从复制、主从同步复制...

99+

2024-04-18

mysql
spark集群如何使用hanlp进行分布式分词

这篇文章主要介绍“spark集群如何使用hanlp进行分布式分词”，在日常操作中，相信很多人在spark集群如何使用hanlp进行分布式分词问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望...

99+

2024-04-02
Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建

这篇文章主要介绍“Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建”，在日常操作中，相信很多人在Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对...

99+

2023-06-03
windows怎么搭建Redis分布式集群

要搭建Redis分布式集群，您可以按照以下步骤进行操作：1. 下载Redis的稳定版本，并解压到不同的目录，例如：redis1、re...

99+

2023-09-11

windows redis
如何使用Docker Swarm搭建分布式爬虫集群

今天小编给大家分享一下如何使用Docker Swarm搭建分布式爬虫集群的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获...

99+

2024-04-02
docker下怎么搭建fastdfs分布式集群

这篇文章主要讲解了“docker下怎么搭建fastdfs分布式集群”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“docker下怎么搭建fastdfs分布式集群”吧！本文在centos6.8下...

99+

2023-06-19
Hadoop完全分布式集群搭建（超详细）

目录 1.1.1 完全分布式介绍 1.1.2 平台软件说明 1.1.3 守护进程布局 1.2.1 集群搭建准备 1.2.2 总纲 1.2.3防火墙关闭 1.2.4 主机映射 1.2.5 免密登陆 1.2.6 jdk安装和hadoop安装及...

99+

2023-10-23

hadoop 分布式 hdfs
怎样进行Kubernetes 集群搭建

这期内容当中小编将会给大家带来有关怎样进行Kubernetes 集群搭建，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。yum安装需要的组件，我这里指定了具体的版本，我用的版本比较老，不过如果你是第一次用，...

99+

2023-06-05
CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

这篇文章将为大家详细讲解有关CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。(一）软件准备1，hadoop-2.7.3.tar.gz（包）2...

99+

2023-06-03
浅析Hadoop完全分布式集群搭建问题

目录一、Hadoop是什么二、Hadoop组成1、Hadoop1.x2、Hadoop2.x三、Hadoop集群搭建所需工具（链接如下，自行下载）四、Hadoop集群配置前期准备五、H...

99+

2024-04-02
MySQL分布式集群搭建的方法是什么

MySQL分布式集群可以通过以下几种方法来搭建：1. MySQL Replication（复制）：使用MySQL的复制功能，将一个M...

99+

2023-09-21

MySQL
Hadoop+HBase+ZooKeeper分布式集群环境搭建步骤

目录一、环境说明2.1 安装JDK2.2 添加Hosts映射关系2.3 集群之间SSH无密码登陆三、Hadoop集群安装配置3.1 修改hadoop配置3.2 启动hadoop集群四...

99+

2024-04-02
如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群

本篇内容主要讲解“如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“如何使用Centos7系统搭建Hadoop-3.1.4完全分布...

99+

2023-06-15
如何进行Redis 6.X Sentinel哨兵集群搭建

如何进行Redis 6.X Sentinel哨兵集群搭建，很多新手对此不是很清楚，为了帮助大家解决这个难题，下面小编将为大家详细讲解，有这方面需求的人可以来学习下，希望你能有所收获。码哥带大家完成在 CentOS 7 中安装 Redis 6...

99+

2023-06-15
分布式Redis Cluster集群搭建与Redis基本用法

目录Redis 集群搭建Redis 是啥集群(Cluster)Redis Cluster 说明Redis Cluster 节点Redis Cluster 集群模式不能保证一致性创建和...

99+

2024-04-02
zabbix集群搭建分布式监控的操作步骤

目录作用：环境准备：操作步骤：1.关闭某些设置2.server服务端无需变动，继续运行3.配置代理服务器4. 启动数据库5. 进入数据库6. 创建数据表7. 授予所有的权限8. 刷新...

99+

2022-11-13

zabbix分布式监控 zabbix集群
Hadoop集群怎么搭建及如何进行Python操作

这期内容当中小编将会给大家带来有关Hadoop集群怎么搭建及如何进行Python操作，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。最近项目中在做千亿大数据存储检索需求，要把10T的文本数据进行解析处理存入...

99+

2023-06-15
详解MongoDB4.0构建分布式分片群集

MongoDB分片简述高数据量和吞吐量的数据库应用会对单机的性能造成较大压力，大的查询量会将单机的 CPU 耗尽，大的数据量对单机的存储压力较大，最终会耗尽系统的内存而将压力转移到磁盘 IO 上。 M...

99+

2024-04-02