什么是Impala 用来处理存储在hadoop集群中大量数据的大规模并行处理的sql查询引擎,它是由c++和Java编写的开源软件,它提供了访问Hadoop中分布式文件系统中的数据的最快的方法。 Impalade优点 使用Impala,与
用来处理存储在hadoop集群中大量数据的大规模并行处理的sql查询引擎,它是由c++和Java编写的开源软件,它提供了访问Hadoop中分布式文件系统中的数据的最快的方法。
使用Impala,与其他SQL引擎(如Hive)相比,用户可以使用SQL查询以更快的方式与hdfs或HBase进行通信。
2.Impala将相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax)用作Apache Hive,为面向批量或实时查询提供熟悉且统一的平台。
3.减少了使用mapReduce的延迟,这使Impala比Apache Hive快。
虽然Cloudera Impala使用与Hive相同的查询语言,元数据和用户界面,但在某些方面它与Hive和HBase不同。 下表介绍了HBase,Hive和Impala之间的比较分析。
一、
HBase是基于Apache Hadoop的宽列存储数据库。 它使用BigTable的概念。
Hive是一个数据仓库软件。 使用它,我们可以访问和管理基于Hadoop的大型分布式数据集。
Impala是一个管理,分析存储在Hadoop上的数据的工具。
二、
HBase的数据模型是宽列存储。
Hive遵循关系模型。
Impala遵循关系模型。
三、
HBase是使用Java语言开发的。
Hive是使用Java语言开发的。
Impala是使用C ++开发的。
四、
HBase的数据模型是无模式的。
Hive的数据模型是基于模式的。
Impala的数据模型是基于模式的。
五、
HBase提供Java,RESTful和Thrift api。
Hive提供JDBC,ODBC,Thrift API。
Impala提供JDBC和ODBC API。
六、
HBase支持C,C#,C ++,Groovy,Java PHP,python和Scala等编程语言。
Hive支持C ++,Java,php和Python等编程语言。
Impala支持所有支持JDBC / ODBC的语言。
七、
HBase提供对触发器的支持。
Hive不提供任何触发器支持。
Impala不提供对触发器的任何支持。
原文地址:https://www.cnblogs.com/lmandcc/archive/2022/03/14/16002906.html
--结束END--
本文标题: Impala的使用
本文链接: https://www.lsjlt.com/news/9195.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
下载Word文档到电脑,方便收藏和打印~
2024-05-16
2024-05-16
2024-05-16
2024-05-15
2024-05-15
2024-05-15
2024-05-15
2024-05-15
2024-05-15
2024-05-15
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0