spark rdd转dataframe 写入mysql的实例讲解

2024-04-02 19:04:59 569人浏览泡泡鱼

摘要

dataframe是在spark1.3.0中推出的新的api，这让spark具备了处理大规模结构化数据的能力，在比原有的RDD转化方式易用的前提下，据说计算性能更还快了两倍。spark在离线批处理或者实时计

dataframe是在spark1.3.0中推出的新的api，这让spark具备了处理大规模结构化数据的能力，在比原有的RDD转化方式易用的前提下，据说计算性能更还快了两倍。spark在离线批处理或者实时计算中都可以将rdd转成dataframe进而通过简单的sql命令对数据进行操作，对于熟悉sql的人来说在转换和过滤过程很方便，甚至可以有更高层次的应用，比如在实时这一块，传入kafka的topic名称和sql语句，后台读取自己配置好的内容字段反射成一个class并利用出入的sql对实时数据进行计算，这种情况下不会spark streaming的人也都可以方便的享受到实时计算带来的好处。　　　

下面的示例为读取本地文件成rdd并隐式转换成dataframe对数据进行查询，最后以追加的形式写入Mysql表的过程,Scala代码示例如下


import java.sql.Timestamp
import org.apache.spark.sql.{SaveMode, SQLContext}
import org.apache.spark.{SparkContext, SparkConf}
object DataFrameSql {
 case class memberbase(data_date:Long,memberid:String,createtime:Timestamp,sp:Int)extends Serializable{
 override def toString: String="%d\t%s\t%s\t%d".fORMat(data_date,memberid,createtime,sp)
 }
 def main(args:Array[String]): Unit ={
 val conf = new SparkConf()
 conf.setMaster("local[2]")
// ----------------------
 //参数 spark.sql.autoBroadcastJoinThreshold 设置某个表是否应该做broadcast，默认10M，设置为-1表示禁用
 //spark.sql.codegen 是否预编译sql成java字节码，长时间或频繁的sql有优化效果
 // spark.sql.inMemoryColumnarStorage.batchSize 一次处理的row数量，小心oom
 //spark.sql.inMemoryColumnarStorage.compressed 设置内存中的列存储是否需要压缩
// ----------------------
 conf.set("spark.sql.shuffle.partitions","20") //默认partition是200个
 conf.setAppName("dataframe test")
 val sc = new SparkContext(conf)
 val sqc = new SQLContext(sc)
 val ac = sc.accumulator(0,"fail nums")
 val file = sc.textFile("src\\main\\resources\\000000_0")
 val log = file.map(lines => lines.split(" ")).filter(line =>
  if (line.length != 4) { //做一个简单的过滤
  ac.add(1)
  false
  } else true)
  .map(line => memberbase(line(0).toLong, line(1),Timestamp.valueOf(line(2)), line(3).toInt))
 // 方法一、利用隐式转换
 import sqc.implicits._
 val dftemp = log.toDF() // 转换
 
 val df = dftemp.reGISterTempTable("memberbaseinfo")
 
 val sqlcommand="select * from memberbaseinfo"
 val sel = sqc.sql(sqlcommand)
 val prop = new java.util.Properties
 prop.setProperty("user","etl")
 prop.setProperty("passWord","xxx")
 // 调用DataFrameWriter将数据写入mysql
 val dataResult = sqc.sql(sqlcommand).write.mode(SaveMode.Append).jdbc("jdbc:mysql://localhost:3306/test","t_spark_dataframe_test",prop) // 表可以不存在
 println(ac.name.get+" "+ac.value)
 sc.stop()
 }
}

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: spark rdd转dataframe 写入mysql的实例讲解

本文链接: https://www.lsjlt.com/news/50678.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

spark rdd转dataframe 写入mysql的实例讲解

dataframe是在spark1.3.0中推出的新的api，这让spark具备了处理大规模结构化数据的能力，在比原有的RDD转化方式易用的前提下，据说计算性能更还快了两倍。spark在离线批处理或者实时计...

99+

2024-04-02
Spark SQL中的RDD与DataFrame转换实例用法

这篇文章主要讲解了“Spark SQL中的RDD与DataFrame转换实例用法”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Spark SQL中的RDD与DataFrame转换实例用法”吧...

99+

2023-06-02
实例讲解MySQL数据库的查询优化技术(转)

实例讲解MySQL数据库的查询优化技术(转)[@more@]　　数据库系统是管理信息系统的核心，基于数据库的联机事务处理（OLTP）以及联机分析处理(OLAP)是银行、企业、政府等部门最为重要的计算机应用之...

99+

2024-04-02
MySQL实例讲解子查询的使用

目录子查询-嵌套查询原始查询方法自连接子查询子查询分类单行子查询子查询的编写思路HAVING中的子查询CASE中的子查询子查询中的空值问题多行子查询多行比较操作符相关子查询EXISTS与NOT EXISTS 关键...

99+

2023-03-02

MySQL子查询语句 MySQL子查询写法
Python实现数字小写转大写的示例详解

目录前言代码实现测试补充前言这绝对是个非常有趣的问题哈哈，但用python列表实现就变得比较烧脑，正常人不会非常较真这样的程序，我也只是闲来无事，如果代码还是有bug，那么我也没办...

99+

2022-12-14

Python数字小写转大写 Python 小写转大写 Python 数字小写大写
C++实例讲解四种类型转换的使用

目录C++类型转换C语言风格的转换C++风格的类型转换static_castreinterpret_castconst_castdynamic_cast小结C++类型转换 C语言风格...

99+

2024-04-02
MySQL中的字符串模式匹配实例讲解

这篇文章主要介绍“MySQL中的字符串模式匹配实例讲解”，在日常操作中，相信很多人在MySQL中的字符串模式匹配实例讲解问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”MySQ...

99+

2024-04-02
深入理解Java对象实例生成的例子!(转)

深入理解Java对象实例生成的例子!(转)[@more@]代码如下:class A { public int Avar; public A() { System.out.println("AAA"); doSomething(); } pu...

99+

2023-06-03
MySQL存储过程的查看与删除实例讲解

目录一、查看存储过程1.SHOW STATUS语句查看存储过程2.使用SHOW CREATE语句查看存储过程的定义3、从information_schema.Routine表中查看存储过程的信息二、存储过程的删除附：存储...

99+

2023-03-09

mysql存储过程查看删除记录 mysql中的存储过程 mysql数据存储过程
IIS7中Web.config的rewrite实例分析讲解，教你看懂重写规则

本文详细介绍解释了IIS7 Web.config rewrite规则设置url重写功能，通过讲解实例的语法结构和标签用法，搭配一些简单的正则表达式，你可以写出符合自己要求的重写规则。...

99+

2022-11-21

IIS7 Web.config rewrite url重写规则
MySQL实现数据插入操作的示例详解

目录一、方法分类二、具体方法三、实例（1）常规插入（2）从另一个表导入（3）插入时数据重复四、注意事项（1）不写字段名，需要填充自增ID（2）按字段名填充，可以不录入id其余注意事项使用mysql插入数据时，可以根据需求...

99+

2023-02-21

MySQL数据插入操作 MySQL数据插入 MySQL数据
Spring Batch教程（六）spring boot实现batch功能注解示例：读文件写入mysql

Spring batch 系列文章 Spring Batch教程（一）简单的介绍以及通过springbatch将xml文件转成txt文件 Spring Batch教程（二）示例：将txt文件转成xml文件以及读取xml文件内容存储到数据库...

99+

2023-08-20

spring batch spring boot
adb shell模拟发送安卓广播的入门知识和100个实例讲解

adb shell模拟发送安卓广播的入门知识和实例讲解：入门知识什么是广播？广播是一种Android系统提供的一种机制，用于在系统中传递事件或消息。广播可以是系统级别的，也可以是应用级别的。系统级别的广播可以被所有应用接收，应用级别...

99+

2023-09-23

android
java中创建写入文件的6种方式详解与源码实例

在java中有很多的方法可以创建文件写文件，你是否真的认真的总结过？下面笔者就帮大家总结一下java中创建文件的五种方法。 Files.newBufferedWriter(Java ...

99+

2022-12-10

java创建文件方法实例 java写入文件方法实例 java创建文件源码实例 java写入文件源码实例 Files.newBufferedWriter创建文件 Files.write PrintWri