iis服务器助手广告广告
返回顶部
首页 > 资讯 > 精选 >spark读取hbase的数据实例代码
  • 198
分享到

spark读取hbase的数据实例代码

2023-06-02 16:06:06 198人浏览 泡泡鱼
摘要

这篇文章主要介绍“spark读取HBase的数据实例代码”,在日常操作中,相信很多人在spark读取hbase的数据实例代码问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”spark读取hbase的数据实例代码

这篇文章主要介绍“spark读取HBase的数据实例代码”,在日常操作中,相信很多人在spark读取hbase的数据实例代码问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”spark读取hbase的数据实例代码”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

package hgs.spark.hbase//https://blog.csdn.net/mlljava1111/article/details/52675901import org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.hadoop.hbase.HBaseConfigurationimport org.apache.hadoop.hbase.mapReduce.TableInputFORMatimport org.apache.hadoop.hbase.client.Scanimport org.apache.hadoop.hbase.filter.FilterListimport org.apache.hadoop.hbase.filter.FilterList.Operatorimport org.apache.hadoop.hbase.filter.RowFilterimport org.apache.hadoop.hbase.filter.RegexStrinGComparatorimport org.apache.hadoop.hbase.filter.CompareFilter.CompareOpimport org.apache.hadoop.hbase.protobuf.ProtobufUtilimport org.apache.hadoop.hbase.util.Base64import org.apache.hadoop.hbase.util.Bytesimport org.apache.hadoop.hbase.filter.LongComparatorobject HbaseToSpark {  def main(args: Array[String]): Unit = {    //System.setProperty("spark.serializer", "org.apache.spark.serializer.KryoSerializer");    val conf = new SparkConf        conf.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")    conf.setMaster("local").setAppName("hbasedata")        val context =  new SparkContext(conf)    //hbase配置    val hconf =  new HBaseConfiguration    hconf.set("hbase.ZooKeeper.quorum", "bigdata00:2181,bigdata01:2181,bigdata02:2181")    hconf.set("hbase.zookeeper.property.clientPort", "2181")    hconf.set(TableInputFormat.INPUT_TABLE, "test")    val scan = new Scan    //扫描的表rowkey的开始和结束    scan.setStartRow("1991".getBytes)    scan.setStopRow("3000".getBytes)    //val list = new FilterList(Operator.MUST_PASS_ALL)    //val filter1 = new RowFilter(CompareOp.GREATER_OR_EQUAL,new LongComparator(1991))    //val filter2 = new RowFilter(CompareOp.LESS_OR_EQUAL,new RegexStringComparator("3000*"))       // list.addFilter(filter1)   // list.addFilter(filter2)   //scan.setFilter(list)    //添加scan    hconf.set(TableInputFormat.SCAN, convertScanToString(scan))        val hrdd = context.newapiHadoopRDD(hconf,        classOf[TableInputFormat],        classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],          classOf[org.apache.hadoop.hbase.client.Result])            val resultrdd = hrdd.repartition(2)    //打印结果    resultrdd.foreach{case(_,value)=>{        val key = Bytes.toString(value.getRow)        val name = Bytes.toString(value.getValue("cf1".getBytes, "name".getBytes))        val age = Bytes.toString(value.getValue("cf1".getBytes, "age".getBytes))        println("rowkey:"+key+" "+"name:"+name+" "+"age:"+age)      }    }        context.stop()      }      def convertScanToString(scan: Scan) = {    val proto = ProtobufUtil.toScan(scan)    Base64.encodeBytes(proto.toByteArray)  }    }

到此,关于“spark读取hbase的数据实例代码”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

--结束END--

本文标题: spark读取hbase的数据实例代码

本文链接: https://www.lsjlt.com/news/230514.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • spark读取hbase的数据实例代码
    这篇文章主要介绍“spark读取hbase的数据实例代码”,在日常操作中,相信很多人在spark读取hbase的数据实例代码问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”spark读取hbase的数据实例代码...
    99+
    2023-06-02
  • 怎么用Spark读取HBASE数据
    这篇文章主要讲解了“怎么用Spark读取HBASE数据”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用Spark读取HBASE数据”吧! ...
    99+
    2024-04-02
  • Java读取数据库表的示例代码
    目录Java读取数据库表新手引导LoggerConnectionResultSetResultSet中next()方法name和commentJava读取数据库表 package c...
    99+
    2023-05-18
    Java读取数据库表 Java数据库表
  • pytorch dataset实战案例之读取数据集的代码
    目录概述项目结构与代码总结参考资料概述 最近在跑一篇图像修复论文的代码,配置好环境之后开始运行,发现数据一直加载不进去。害,还是得看人家代码咋写的,一句一句看逻辑,准能找出问题。通读...
    99+
    2024-04-02
  • Spark中的数据读取保存和累加器实例详解
    目录数据读取与保存Text文件Sequence文件Object对象文件累加器累加器概念系统累加器数据读取与保存 Text文件 对于 Text文件的读取和保存 ,其语法和实现是最简单的...
    99+
    2022-11-13
    Spark数据读取保存累加器 Spark数据读取保存
  • spark怎么读取mysql数据库数据
    在Spark中读取MySQL数据库数据,可以使用Spark的DataFrame API和JDBC连接器来实现。以下是一种常见的方法:...
    99+
    2024-04-09
    spark mysql
  • hbase读取数据的流程是什么
    HBase读取数据的流程如下: 客户端向HBase集群发送读取请求,请求包括表名、行键和列族等信息。 HMaster接收到请求后,...
    99+
    2024-03-05
    hbase
  • Java 使用geotools读取tiff数据的示例代码
    Java中如果要解析tiff,其实很多时候,我们都选择gdal的Java库来实现,毫无疑问,gdal确实在GIS数据处理方面非常的强悍,其实Geotools中很多有关栅格数据的解析,...
    99+
    2024-04-02
  • HBase的数据读取效率怎么提高
    HBase的数据读取效率可以通过以下几种方式来提高: 列族设计优化:合理设计表的列族结构,将经常一起访问的列放在同一个列族中,减...
    99+
    2024-03-11
    Hbase
  • 怎么从hbase读取数据导入mongodb
    要将数据从HBase导入MongoDB,可以使用以下步骤:1. 首先,连接到HBase并查询要导出的数据。可以使用Java编程语言或...
    99+
    2023-08-23
    hbase mongodb
  • python怎么读取数据代码
    python 读取数据的内置函数和库包括:open() 函数(打开文件并使用 read() 方法读取内容)、逐行读取的方法、第三方库(如 pandas 用于读取 csv 文件)。 Py...
    99+
    2024-04-02
  • Java读取网络文件的实例代码
    目录Java读取网络文件输入url地址读取txt文件Java读取网络文件问题 protocol = http host = null通过ip地址读取文件Java读取网络文件 输入ur...
    99+
    2024-04-02
  • Python读取Hive数据库实现代码详解
    目录实际业务读取hive数据库的代码代码说明和领悟后续附上修改成mysql的一个例子代码背景: 在这篇文章之前,我读取数据库的数据没有形成规范,并且代码扩展性不好,使用率不高,而且比...
    99+
    2023-03-01
    Python读取Hive数据库 Python Hive数据库
  • 利用Python第三方库xlrd读取Excel中数据实例代码
    目录1. 安装 xlrd 库2. 使用 xlrd 库2.1 打开 Excel 工作表对象2.2 读取单个单元格数据2.3 读取多个单元格数据2.3 读取所有单元格数据附:行、列操作3...
    99+
    2024-04-02
  • JAVA读取PDF、WORD文档实例代码
    读取PDF文件jar引用<dependency> <groupid>org.apache.pdfbox</groupid> pdfbox</artifactid> <version...
    99+
    2023-05-31
    java word文档 pdf文档
  • PyTorch数据读取的实现示例
    前言 PyTorch作为一款深度学习框架,已经帮助我们实现了很多很多的功能了,包括数据的读取和转换了,那么这一章节就介绍一下PyTorch内置的数据读取模块吧 模块介绍 pan...
    99+
    2024-04-02
  • 如何使用Spark分析云HBase的数据
    这篇文章将为大家详细讲解有关如何使用Spark分析云HBase的数据,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1 云HBase查询分析的现状HBase原生API:HBase原生API适合基于row k...
    99+
    2023-06-02
  • springboot 整合hbase的示例代码
    目录前言HBase 定义HBase 数据模型物理存储结构数据模型1、Name Space2、Region3、Row4、Column5、Time Stamp6、Cell搭建步骤1、官网...
    99+
    2024-04-02
  • Unity连接MySQL并读取表格数据的实现代码
    表格如下: 在Unity读取并调用时的代码: 而如果想要查看该数据库中的另一个表,不是直接使用Table[1],而是需要更改SELECT * from <?...
    99+
    2024-04-02
  • spark 与flume 1.6.0的示例代码
    小编给大家分享一下spark 与flume 1.6.0的示例代码,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!package hgs.spark.streamingimport org.apache.s...
    99+
    2023-06-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作