广告
返回顶部
首页 > 资讯 > 数据库 >Hbase的安装及其架构
  • 369
分享到

Hbase的安装及其架构

Hbase的安装及其架构 2014-07-21 01:07:53 369人浏览 无得
摘要

1.启动hadoop start-all.sh   验证Http://master:50070 2、启动ZooKeeper 需要在在三台中分别启动 zkServer.sh start zkServer.sh status 搭建HBase1

Hbase的安装及其架构

1.启动hadoop

start-all.sh

 

验证
Http://master:50070

2、启动ZooKeeper

需要在在三台中分别启动

zkServer.sh start

zkServer.sh status

搭建HBase
1、上传解压配置环境变量
tar -xvf hbase-1.4.6-bin.tar.gz

2、修改hbase-env.sh文件
增加java配置
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171

关闭默认zk配置
export HBASE_MANAGES_ZK=false

3、修改hbase-site.xml文件

<property> 
<name>hbase.rootdirname> 
<value>hdfs://master:9000/hbasevalue> 
property> 
<property> 
<name>hbase.cluster.distributedname> 
<value>truevalue> 
property> 
<property> 
<name>hbase.zookeeper.quorumname> 
<value>node1,node2,mastervalue> 
property> 

4、修改regionservers文件
增加
node1
node2

如果是伪分布式版本,增加master即可

5、同步到所有节点(如果是伪分布式不需要同步)
scp -r hbase-1.4.6/ node1:`pwd`
scp -r hbase-1.4.6/ node2:`pwd`


6、配置环境变量
vim /etc/profile

7、启动hbase集群 , 需要在master上执行

start-hbase.sh

8、验证hbase
http://master:16010

hbase日志文件所在的目录
/usr/local/soft/hbase-1.4.6/logs

关闭集群的命令
stop-hbase.sh

时间同步

yum install ntp -y

ntpdate -u time.windows.com


通过 hbase shell 进入到hbase的命令行

创建表 列簇 列式数据库
create "test","info"


插入数据
put "test","000","info:name","zhaosi"
put "test","001","info:name","zhangsan"
put "test","002","info:name","lisi"
put "test","003","info:name","wangwu"
put "test","0011","info:name","wangwu2"

查询数据
get "test","001"


hbase 搭建失败了 不知道问题出在哪里
重置hbase

1、关闭hbase集群
杀死进程
stop-hbase.sh

2、删除数据 hdfs
hadoop dfs -rmr /hbase

3、删除元数据 zk
zkCli.sh
rmr /hbase

4、重新启动hbase
start-hbase.sh

 

Hbase架构

 

 

 1.Hbase简介

 

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库

 

利用Hadoop HDFS作为其文件存储系统,利用Hadoop mapReduce来处理HBase中的海量数据,利用Zookeeper作为其分布式协同服务

 

主要用来存储非结构化和半结构化的松散数据(列存 NoSQL 数据库)

Master
·为Region server分配region

·负责Region server的负载均衡

·发现失效的Region server并重新分配其上的region

·管理用户对table的增删改操作


RegionServer
· Region server维护region,处理对这些region的IO请求· Region server负责切分在运行过程中变得过大的region

 

Region

HBase自动把表水平划分成多个区域(region),每个region会保存一个表里面某段连续的数据;每个表一开始只有一个region,随着数据不断插入表,region不断增大,当增大到一个阀值的时候,region就会等分会两个新的region(裂变)。

当table中的行不断增多,就会有越来越多的region。这样一张完整的表被保存在多个Regionserver 上

 

 Row key

唯一标识一行数据

可以通过RowKey获取一行数据

按照字典升序排序的。

Row key只能存储64k的字节数据 10-100byte

 

Column Family(列族)和qualifier(列)

HBase表中的每个列都归属于某个列族,列族必须作为表模式(schema)定义的一部分预先给出。如 create ‘test’, ‘course’。

列名以列族作为前缀,每个“列族”都可以有多个列成员(column);如course:math, course:english, 新的列族成员(列)可以随后按需、动态加入。

权限控制、存储以及调优都是在列族层面进行的;

HBase把同一列族里面的数据存储在同一目录下,由几个文件保存。

 

 

 

Memstore 与 storefile

一个region由多个store组成,一个store对应一个CF(列族)store包括位于内存中的memstore和位于磁盘的storefile写操作先写入memstore,当memstore中的数据达到某个阈值,hregionserver会启动flashcache进程写入storefile,每次写入形成单独的一个storefile

当storefile文件的数量增长到一定阈值后,系统会进行合并(minor、major compaction),在合并过程中会进行版本合并和删除工作(majar),形成更大的storefile

当一个region所有storefile的大小和数量超过一定阈值后,会把当前的region分割为两个,并由hmaster分配到相应的regionserver服务器,实现负载均衡

客户端检索数据,先在memstore找,找不到再找storefile

 

Timestamp时间戳

在HBase每个cell存储单元对同一份数据有多个版本,根据唯一的时间戳来区分每个版本之间的差异,不同版本的数据按照时间倒序排序,最新的数据版本排在最前面。

时间戳的类型是 64位整型。

时间戳可以由HBase(在数据写入时自动)赋值,此时时间戳是精确到毫秒的当前系统时间

时间戳也可以由客户显式赋值,如果应用程序要避免数据版本冲突,就必须自己生成具有唯一性的时间戳。

 

Cell单元格

由行和列的坐标交叉决定。 单元格是有版本的。

单元格的内容是未解析的字节数组。 由{row key, column( = +), version} 唯一确定的单元。

cell中的数据是没有类型的,全部是字节码形式存贮。

 

 

 

HLog(WAL log)

 

HLog文件就是一个普通的Hadoop Sequence File,Sequence File 的Key是HLogKey对象,HLogKey中记录了写入数据的归属信息,除了table和region名字外,同时还包括 sequence number和timestamp,timestamp是”写入时间”,sequence number的起始值为0,或者是最近一次存入文件系统中sequence number。

HLog SequeceFile的Value是HBase的KeyValue对象,即对应HFile中的KeyValue。

 

 

 

 



 

您可能感兴趣的文档:

--结束END--

本文标题: Hbase的安装及其架构

本文链接: https://www.lsjlt.com/news/8828.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Hbase的安装及其架构
    1.启动Hadoop start-all.sh   验证http://master:50070 2、启动zookeeper 需要在在三台中分别启动 zkServer.sh start zkServer.sh status 搭建Hbase1...
    99+
    2014-07-21
    Hbase的安装及其架构
  • hbase的安装及hbase shell的用法分享
    这篇文章主要讲解了“hbase的安装及hbase shell的用法分享”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“hbase的安装及hbase shell...
    99+
    2022-10-18
  • hbase+python安装部署及操作
    本文总结下最近在用python+spark+hbase安装操作中的一些问题。 hbase安装 hbase配置 spark配置hbase hbase配置python hbase安装+hbase配置 安装流程可借鉴此处,同理s...
    99+
    2023-01-31
    操作 hbase python
  • hbase数据原理及基本架构是什么
    这篇文章主要介绍了hbase数据原理及基本架构是什么的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇hbase数据原理及基本架构是什么文章都会有所收获,下面我们一起来看看吧。 ...
    99+
    2022-10-19
  • LAMP架构和MySQL_MariaDB介绍及MySQL安装
    1.LAMP架构介绍Linux+Apache(httpd)+MySQL+PHPPHP网站(Google、淘宝、百度、51cto播客、猿课论坛)三个角色可以在一台机器、也可以分开可以参考其他文档:https:...
    99+
    2022-10-18
  • MySQL5.7中如何安装及配置MHA架构
    下文给大家带来有关MySQL5.7中如何安装及配置MHA架构内容,相信大家一定看过类似的文章。我们给大家带来的有何不同呢?一起来看看正文部分吧,相信看完MySQL5.7中如何安装及配置MHA架构你一定会有所...
    99+
    2022-10-18
  • Spark的安装及其配置
    1.Spark下载 https://archive.apache.org/dist/spark/   2.上传解压,配置环境变量 配置bin目录 解压:tar -zxvf spark-2.4.5-bin-hadoop2.7.tgz -C...
    99+
    2018-09-29
    Spark的安装及其配置
  • 【赵强老师】HBase的体系架构
    一、什么是HBase? HBase是一个基于HDFS之上的分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“BigTable大表”,即:把所有的数据存入一张表中。就像Bigtable利用了Goog...
    99+
    2021-10-26
    【赵强老师】HBase的体系架构
  • python及其依赖安装
    Download Miniconda 2.7 64-bit Windows installer from Miniconda website. Install for all users and add Python to PATH ...
    99+
    2023-01-31
    python
  • MySQL的安装及其工具Navicat for MySQL的安装
    Navicat的安装: 方法一 官方下载安装包https://www.navicat.com.cn/download/navicat-for-mysql 对于Windows选择32bit或64bit的版本...
    99+
    2022-10-18
  • Apache Linkis 中间件架构及快速安装步骤
    目录1、ApacheLinkis介绍2.1计算中间件概念2.2整体架构2.3核心特点2.4支持的引擎类型2、ApacheLinkis快速部署2.1注意事项2.2确定环境2.2.1依赖2.2.2环境变量2.3安装包下载2....
    99+
    2022-06-05
    Apache Linkis 中间件 Apache Linkis架构
  • HBase的安装模式介绍
     单机模式 – HBase 不使用HDFS,仅使用本地文件系统 – ZooKeeper与Hbase运行在同一个JVM中  分布式模式 – 伪分布式模式 所有进程运行在同一个节点上,不同进程运行...
    99+
    2022-10-18
  • python及其开发工具的安装
    python 支持在多平台上安装与运行,我们一般从python的官方网站下载其安装包,比如Windows下是exe文件,Linux下则是二进制文件。这里我们安装的是python3.6版本的,安装完如下图所示: 1、Windows下的安装我...
    99+
    2023-01-31
    开发工具 python
  • 详解微服务架构及其演进史
    目录1 传统单体系统介绍1.1 单体系统的问题1.2 单体系统的优点1.3 单体服务到微服务的发展过程2 关于微服务2.1 单一职责2.2 轻量级通信2.3 独立性2.4 进程隔离2...
    99+
    2022-11-13
  • aarch64架构安装mysql教程
            由于公司项目要求使用国产化,决定使用银河麒麟品牌服务器,项目是Java语言开发的SpringBoot应用,Mysql数据库存储,Redis缓存,ureport报表技术。前端采用elementUI框架,采用nginx部署。 安...
    99+
    2023-09-06
    mysql 架构 数据库
  • Hadoop + Hbase + Zookeeper安装及配置完整版(Hadoop1系列)
    第一步:安装Hadoop集群1、搭建环境所需介质准备   Enterprise-R5-U4-Server-x86_64-dvd.iso   hadoop-1.1.1....
    99+
    2022-10-18
  • MonGo---安装及其基本操作
    1、安装Mongo数据库:  在发布本文的时间官方提供的最新版本是:1.6.5 ,如果不做特殊声明,本教程所用的版本将会是这个版本。第一步:下载安装包:官方下载地址←单击此处,如果是win系统,注意是64...
    99+
    2022-10-18
  • 【安装部署】Mysql下载及其安装的详细步骤
    1.下载压缩包 官网地址:www.mysql.com    2.环境配置  先解压压缩包 配置环境变量 添加环境变量:我的电脑--->属性-->高级-->环境变量-->系统变量-->path 在mysql安装目录下新建my.ini文件...
    99+
    2023-09-11
    mysql adb 数据库
  • 我的私人笔记(安装hbase)
    在安装前需要安装好JDK、Hadoop以及Zookeeper,JDK版本为1.8、Hadoop版本为2.7.4以及Zookeeper的版本为3.4.10。 4.1.下载 下载地址:Index of /dist/hbase 本次学习版本为: ...
    99+
    2023-09-05
    笔记 hadoop 大数据
  • arm/aarch64架构安装conda环境
    安装anaconda 下载安装 首先找到一个下载conda的地址 清华源anaconda地址 可以看到conda在不同系统环境下有如下版本 鉴别不同国产系统可参考:国产的开源操作系统都有哪些? 这里...
    99+
    2023-09-13
    conda linux python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作