广告
返回顶部
首页 > 资讯 > 数据库 >Hive——安装以及概述
  • 520
分享到

Hive——安装以及概述

Hive——安装以及概述 2016-01-31 23:01:46 520人浏览 绘本
摘要

一、hive的安装 注意:安装hive的前提要安装好MySQL和Hadoop Hadoop安装:https://www.cnblogs.com/lmandcc/p/15306163.html MySQL的安装:https://www.cn

Hive——安装以及概述

一、hive的安装

注意:安装hive的前提要安装好MySQL和Hadoop

Hadoop安装:https://www.cnblogs.com/lmandcc/p/15306163.html

MySQL的安装:https://www.cnblogs.com/lmandcc/p/15224657.html

 

安装Hive首先需要启动hadoop

 

1、解压hive的安装包
tar -zxvf apache-hive-1.2.1-bin.tar.gz

修改下目录名称
mv apache-hive-1.2.1-bin hive-1.2.1

2、备份配置文件

cd /usr/local/soft/hive-1.2.1/conf
cp hive-env.sh.template hive-env.sh
cp hive-default.xml.template hive-site.xml

3、修改配置文件
vim hive.env.sh
新加三行配置(路径不同就更具实际情况来):
    HADOOP_HOME=/usr/local/soft/hadoop-2.7.6
    JAVA_HOME=/usr/local/soft/jdk1.8.0_171
    HIVE_HOME=/usr/local/soft/hive-1.2.1

4、修改配置文件
vim hive-site.xml
修改对应的配置参数(注意:是修改不是添加)

 1 <property>
 2                     <name>javax.jdo.option.ConnectionURLname>
 3                     <value>jdbc:Mysql://master:3306/hive?characterEncoding=UTF-8&createDatabaseIfNotExist=true&useSSL=falsevalue>
 4                 property>
 5                 <property>
 6                     <name>javax.jdo.option.ConnectionDriverNamename>
 7                     <value>com.mysql.jdbc.Drivervalue>
 8                 property>
 9                 <property>
10                     <name>javax.jdo.option.ConnectionUserNamename>
11                     <value>rootvalue>
12                 property>
13                 <property>
14                     <name>javax.jdo.option.ConnectionPassWordname>
15                     <value>123456value>
16                 property>
17                 <property>
18                     <name>hive.querylog.locationname>
19                     <value>/usr/local/soft/hive-1.2.1/tmpvalue>
20                 property>
21                 <property>
22                     <name>hive.exec.local.scratchdirname>
23                     <value>/usr/local/soft/hive-1.2.1/tmpvalue>
24                 property>
25                 <property>
26                     <name>hive.downloaded.resources.dirname>
27                     <value>/usr/local/soft/hive-1.2.1/tmpvalue>
28                 property>


5、复制mysql连接工具包到hive/lib
cd /usr/local/soft/hive-1.2.1
cp /usr/local/moudle/mysql-connector-java-5.1.49.jar /usr/local/soft/hive-1.2.1/lib/

6、删除hadoop中自带的jline-2.12.jar位置在/usr/local/soft/hadoop-2.7.6/share/hadoop/yarn/lib/jline-2.12.jar
rm -rf /usr/local/soft/hadoop-2.7.6/share/hadoop/yarn/lib/jline-2.12.jar
7、把hive自带的jline-2.12.jar复制到hadoop中 hive中所在位置 /usr/local/soft/hive-1.2.1/lib/jline-2.12.jar
cp /usr/local/soft/hive-1.2.1/lib/jline-2.12.jar /usr/local/soft/hadoop-2.7.6/share/hadoop/yarn/lib/
8、启动
hive

 

二、hive的概述

 1、hive简介

Hive:由Facebook开源用于解决海量结构化日志的数据统计工具

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。

 

Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL ),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL ,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 mapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

 

 

2、Hive本质:将HQL转化成MapReduce程序

 

 

 

1Hive处理的数据存储在hdfs

2Hive分析数据底层的实现是MapReduce

3执行程序运行在Yarn

 3、hive的优点

1操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)

2避免了去写MapReduce,减少开发人员的学习成本

3Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合

4Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高

5Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数

4、hive的缺点

 

1HiveHQL表达能力有限

 

1)迭代式算法无法表达

 

2数据挖掘方面不擅长由于MapReduce数据处理流程的限制,效率更高的算法却无法实现。

 

2Hive的效率比较低

 

1Hive自动生成的MapReduce作业,通常情况下不够智能化

 

2Hive调优比较困难,粒度较粗

 

 

5、Hive架构原理

 

 

 

 

 1用户接口:Client

 

CLIcommand-line interface)、JDBC/ODBC(jdbc访问hive)WEBUI(浏览器访问hive

 

2元数据:Metastore

 

元数据包括:表名、表所属的数据库(默认是default)、表的拥有者、列/分区字段、表的类型(是否是外部表)、表的数据所在目录等;

 

默认存储在自带的derby数据库中,推荐使用MySQL存储Metastore

 

3Hadoop

 

使用HDFS进行存储,使用MapReduce进行计算。

 

4驱动器:Driver

 

1)解析器(SQL Parser):将SQL字符串转换成抽象语法树AST,这一步一般都用第三方工具库完成,比如antlr;对AST进行语法分析,比如表是否存在、字段是否存在、SQL语义是否有误。

 

2)编译器(Physical Plan):将AST编译生成逻辑执行计划。

 

3优化器(Query Optimizer):对逻辑执行计划进行优化。

 

4)执行器(Execution):把逻辑执行计划转换成可以运行的物理计划。对于Hive来说,就是MR/spark

 

 

 

 

Hive通过给用户提供的一系列交互接口,接收到用户的指令(SQL),使用自己的Driver,结合元数据(MetaStore),将这些指令翻译MapReduce,提交到Hadoop中执行,最后,将执行返回的结果输出到用户交互接口。

 

 

您可能感兴趣的文档:

--结束END--

本文标题: Hive——安装以及概述

本文链接: https://www.lsjlt.com/news/8784.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Hive——安装以及概述
    一、hive的安装 注意:安装hive的前提要安装好MySQL和Hadoop Hadoop安装:https://www.cnblogs.com/lmandcc/p/15306163.html MySQL的安装:https://www.cn...
    99+
    2016-01-31
    Hive——安装以及概述
  • MySQL的概述、版本、安装过程
    作者:Insist-- 个人主页:insist--个人主页 作者会持续更新网络知识和python基础知识,期待你的关注 目录 一、MySQL的概述 二、MySQL的版本 三、MySQL的下载与安装 前言 本文将来谈谈MySQL...
    99+
    2023-09-11
    网络 数据库 mysql
  • PHP Filesystem的安装方法以及函数的描述
    这篇文章主要讲解了“PHP Filesystem的安装方法以及函数的描述”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“PHP Filesystem的安装方法以及函数的描述”吧!PHP Fil...
    99+
    2023-06-04
  • 3、MySql第三章,分库分表、MyCat概述及安装登录
    MySql第三章,分库分表、MyCat概述及安装登录 先下定论,数据库优化顺序: 1、单库单表; 2、单库单表主从复制; 3、垂直分库; 4、水平分区; 5、水平分表; 一、概述 1、为什么要分库分表 数据库的复制能解决访问...
    99+
    2017-12-03
    3 MySql第三章,分库分表 MyCat概述及安装登录
  • MySQL优化--概述以及索引优化分析
    一、MySQL概述 1.1、MySQL文件含义 通过如下命令查看 show variables like ‘%dir%‘; MySQL文件位置及含义 名称 值 备注 basedir /usr/ 安装路径 charact...
    99+
    2020-07-19
    MySQL优化--概述以及索引优化分析 数据库入门 数据库基础教程 数据库 mysql
  • 如何深入理解Fedora 8系统安装并加以描述概括
    本篇文章给大家分享的是有关如何深入理解Fedora 8系统安装并加以描述概括,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。经过长时间学习,Fedora 8系统安装正式版已经发行...
    99+
    2023-06-16
  • GoldenGate安装以及补丁安装
        本文描述OGG的基本安装操作以及OGG补丁安装。1. GoldenGate安装1.1. GoldenGate版本下载新版本通过ORACLE官方网站可以直接进行下载Oracle GoldenGate ...
    99+
    2022-10-18
  • DockerConsul概述以及集群环境搭建步骤(图文详解)
    目录一、Docker consul概述二、基于 nginx 与 consul 构建自动发现即高可用的 Docker 服务架构一、Docker consul概述 容器服务更新与发现:先...
    99+
    2022-11-12
  • 详述 Mac 系统下安装及卸载 Pyth
    博主说:对于 Mac 而言,其自带的 Python 2.6 和 Python 2.7 这两个版本已经能够满足我们的大部分需求了,因此除非对某个版本有强烈需求,否则不建议自己安装 Python,因为这是典型的安装容易,删除麻烦。 ...
    99+
    2023-01-31
    系统 Mac Pyth
  • Mycat的使用 - 01.概念, 及安装
    初识Mycat1. Mycat是什么Mycat是一款数据库中间件, 其用于分库分表, 还实现了读写分离, 故障切换等功能.2. Mycat的工作原理用一个动词来概括就是"拦截", 它拦截...
    99+
    2022-10-18
  • Labelme 安装以及使用
    好久没有使用标注工具了,应工作需要,补一篇,自己实践后,总结如下 1.labelme 简介 labelme 是一款图像标注工具,主要用于神经网络构建前的数据集准备工作,因为是用 Python 写的,所...
    99+
    2023-09-26
    python 开发语言 深度学习
  • DDDDOCR安装以及使用
    DDDDOCR图片验证码识别技术 在我们日常浏览网页的时候,常常会弹出一张图片让你来验证,有的是滑动验证,有的是输入相应字符来进行验证,今天我就来给大家介绍这么一个技术,可以专门用来识别图片验证码的功...
    99+
    2023-09-18
    python numpy pycharm
  • redis介绍以及安装
        前面2篇文章我们简单了解了memcached的安装以及结合php。现在我介绍另一个nosql键值数据库redis,通过学习查资料发现redis使用的场合比me...
    99+
    2022-10-18
  • MongoDB介绍以及安装
    一、MongoDB简介 MongoDB是一个高性能,开源,无模式的文档型数据库,是当前NoSql数据库中比较热门的一种。它在许多场景下可用于替代传统的关系型数据库或键/值存储方式。Mongo使用C...
    99+
    2022-10-18
  • centos7安装python3 以及t
    1.1下载python源码包网址:https://www.python.org/downloads/release/python-362/下载地址:https://www.python.org/ftp/python/3.6.2/Python...
    99+
    2023-01-31
  • Egg框架的功能、原理,以及基本使用方法概述 原创
    概述 Egg是一款基于Koa框架的企业级Node.js框架,其主要目标是帮助团队和开发者快速构建可维护和易扩展的应用程序。 Egg框架的主要功能包括: 1. 基于Koa框架,提供了丰...
    99+
    2023-05-17
    Egg 框架 node.js
  • 升级python以及安装anaconda
    今天一个同事要求我给一台服务器升级python以及安装anaconda恩,python我会装但是anaconda听都没听过啊?这是啥东西,然后我问了下主管怎么装,他居然说他也不知道怎么装!你妈嗨 你不是从公司创立开始就在了吗!这些东西你居然...
    99+
    2023-01-31
    python anaconda
  • Ubuntu安装Cloudera Manager以及CDH5.15.2
    一、机子分配 注意,本安装教程是在真机上进行,而非虚拟机。另,此次搭建主要的目的是搭建测试环境,让Hadoop各组件能够运作起来即可,完成搭建后,将用小数据量进行相关数据的计算与测试。线上环境将会使用阿里云主机。 以下是四台真机配...
    99+
    2021-07-08
    Ubuntu安装Cloudera Manager以及CDH5.15.2
  • MySQLShell的介绍以及安装
    目录01 ReplicaSet的架构02 MySQL Shell的介绍以及安装03 MySQL Shell连接数据库并创建ReplicaSet01 ReplicaSet的架...
    99+
    2022-11-12
  • postfix安装以及配置3
    邮件服务器系统的smtp服务器,在邮件服务器系统中充当MTA角色 1 安装Postfix (1)   创建相关的用户和组否则make install得时候会报错 #groupadd postfix ...
    99+
    2023-01-31
    postfix
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作