首页 > 资讯 > 精选 >Spark SQL中的RDD与DataFrame转换实例用法

893

分享到

Spark SQL中的RDD与DataFrame转换实例用法

2023-06-02 12:06:55 893人浏览独家记忆

摘要

这篇文章主要讲解了“spark sql中的RDD与DataFrame转换实例用法”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Spark SQL中的RDD与DataFrame转换实例用法”吧

这篇文章主要讲解了“spark sql中的RDD与DataFrame转换实例用法”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Spark SQL中的RDD与DataFrame转换实例用法”吧！

一.第一种方式RDD转化为DataFrame

1.官网

Spark SQL中的RDD与DataFrame转换实例用法

2.解释

反射把schema信息全部定义在case class 类里面

3.代码

package coreimport org.apache.spark.sql.SparkSessionimport org.apache.spark.sql.types.StructTypeobject Test {  def main(args: Array[String]): Unit = {    val spark = SparkSession.builder()      .appName("Test")      .master("local[2]")      .getOrCreate()    val mess = spark.sparkContext.textFile("file:///D:\\test\\person.txt")    import spark.implicits._    val result = mess.map(_.split(",")).map(x => Info(x(0).toInt,x(1),x(2).toInt)).toDF()   // result.map(x => x(0)).show() //在1.x 版本是可以的 在2.x不可以需要价格rdd    result.rdd.map(x => x(0)).collect().foreach(println)    result.rdd.map(x => x.getAs[Int]("id")).collect().foreach(println)  }}case class Info(id:Int,name:String,age:Int)

4.注意事项

注意2.2版本以前 类的构造方法参数有限在2.2后没有限制了

Spark SQL中的RDD与DataFrame转换实例用法

二.第二种转换方式

1.官网

Spark SQL中的RDD与DataFrame转换实例用法

2.解释

制定scheme信息 就是编程的方式   作用到Row 上面

3.步骤

Spark SQL中的RDD与DataFrame转换实例用法

4.步骤解释

从原有的RDD转化 ，类似于textFile一个StructType匹配Row里面的数据结构（几列），就是几个StructField 通过createDataFrame  把schema与RDD关联上

5.源码解释StructType

Spark SQL中的RDD与DataFrame转换实例用法

6.源码解释

StructField 可以理解为一列StructType  包含  1-n 个StructField

7.最终代码

package coreimport org.apache.spark.sql.types.{IntegerType, StringType, StructField, StructType}import org.apache.spark.sql.{Row, SparkSession}object TestRDD2 {  def main(args: Array[String]): Unit = {    val spark = SparkSession.builder()      .appName("TestRDD2")      .master("local[2]")      .getOrCreate()    val mess = spark.sparkContext.textFile("file:///D:\\test\\person.txt")    val result = mess.map(_.split(",")).map(x => Row(x(0).toInt, x(1), x(2).toInt))    //工作中这样写    val structType = new StructType(      Array(          StructField("id", IntegerType, true),          StructField("name", StringType, true),          StructField("age", IntegerType, true)      )    )    val schema = StructType(structType)    val info = spark.createDataFrame(result,schema)    info.show()  }}

8.经典错误

Spark SQL中的RDD与DataFrame转换实例用法

9.原因解决

自己定义的schema信息与Row中的信息不匹配val result = mess.map(_.split(",")).map(x => Row(x(0), x(1), x(2)))//工作中这样写val structType = new StructType(  Array(      StructField("id", IntegerType, true),      StructField("name", StringType, true),      StructField("age", IntegerType, true)  ))上面的是string 要的是int ，一定要注意因为会经常出错要转化类型val result = mess.map(_.split(",")).map(x => Row(x(0).toInt, x(1), x(2).toInt))

三.方法的使用

1.spark-shell 有的方法在代码要自己隐士砖换

df.select('name).show  这个在spark-shell 可以或者df.select('name').show 但是代码里面不行，需要隐士转

2.show源码

show源码  默认是true  显示小于等于20条，对应行中的字符是false就全部显示出来show(30,false)   也是全部显示出来不会截断show(5)  但是后面的多与20字符就不会显示你可以show（5，false）

Spark SQL中的RDD与DataFrame转换实例用法

3.select方法源码

Spark SQL中的RDD与DataFrame转换实例用法

4.select 方法调用走的位置

df.select("name").show(false)import spark.implicits._//这样不隐士转换不行df.select('name).show(false)df.select($"name")第一个select走的底层源码是 第一个源码图2,3个select走的源码是第二个

5.head源码

head 默认调第一条，你想展示几条就调几条

Spark SQL中的RDD与DataFrame转换实例用法

6.first() 展示第一条底层调用的是head

Spark SQL中的RDD与DataFrame转换实例用法

7.sort源码

sort源码默认升序降序解释中有

Spark SQL中的RDD与DataFrame转换实例用法

四.sql的操作方法

1.官网临时试图

Spark SQL中的RDD与DataFrame转换实例用法

2.全局试图操作

全局视图加上  global_temp 规定

Spark SQL中的RDD与DataFrame转换实例用法

五.杂项

1.报错

Spark SQL中的RDD与DataFrame转换实例用法

2.原因及代码

 val spark = SparkSession.builder()   .appName("Test")   .master("local[2]")   .getOrCreate() val mess = spark.sparkContext.textFile("file:///D:\\test\\person.txt") import spark.implicits._ val result = mess.map(_.split(",")).map(x => Info(x(0).toInt,x(1),x(2).toInt)).toDF() //在1.x 版本是可以的 在2.x不可以需要价格rdd result.map(x => x(0)).show()  这样写是对的 result.rdd.map(x => x(0)).collect().foreach(println) 去类中的数据两种写法: result.rdd.map(x => x(0)).collect().foreach(println)result.rdd.map(x => x.getAs[Int]("id")).collect().foreach(println)

3.注意转义字符

对于分隔符 |   你切分一定要加转义字符，否则数据不对

感谢各位的阅读，以上就是“Spark SQL中的RDD与DataFrame转换实例用法”的内容了，经过本文的学习后，相信大家对Spark SQL中的RDD与DataFrame转换实例用法这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是编程网，小编将为大家推送更多相关知识点的文章，欢迎关注！

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Spark SQL中的RDD与DataFrame转换实例用法

本文链接: https://www.lsjlt.com/news/230081.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Spark SQL中的RDD与DataFrame转换实例用法

这篇文章主要讲解了“Spark SQL中的RDD与DataFrame转换实例用法”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Spark SQL中的RDD与DataFrame转换实例用法”吧...

99+

2023-06-02
spark rdd转dataframe 写入mysql的实例讲解

dataframe是在spark1.3.0中推出的新的api，这让spark具备了处理大规模结构化数据的能力，在比原有的RDD转化方式易用的前提下，据说计算性能更还快了两倍。spark在离线批处理或者实时计...

99+

2022-10-18
java中JsonObject与JsonArray转换方法实例

目录备忘一下，首先JsonArray转换为JsonObjectJsonArrayStr 转换为 JsonObjectStr补充：java中JSONObject和JSONArray解析...

99+

2023-05-17

jsonobject和jsonarray的转换 jsonobject转换成jsonarray jsonarray转jsonstring
Python中DataFrame与内置数据结构相互转换的实现

目录楔子DataFrame 转成内置数据结构内置数据结构转成 DataFrame楔子 pandas 支持我们从 Excel、CSV、数据库等不同数据源当中读取数据，来构建 DataF...

99+

2023-02-10

Python DataFrame内置数据结构转换 Python DataFrame内置数据结构 DataFrame 内置数据结构
SQL中日期与字符串互相转换操作实例

目录一.oracle日期和字符串互相转换1.1 日期转字符串1.1.1 yyyy年mm月dd日hh24時mi分ss秒1.1.2 yyyy-mm-dd hh24:mi:ss1.1.3 yyyyfm-mm-dd hh24:m...

99+

2022-10-27
python DataFrame中loc与iloc取数据的基本方法实例

目录1.准备一组DataFrame数据2.loc 标签索引2.1 loc 获取行2.1.1 loc 获取一行2.1.2 loc 获取多行2.1.3 loc 获取多行(切片)2.2 l...

99+

2022-11-13
python中py文件与pyc文件相互转换的方法实例

目录1、 compileall py文件转换为pyc1.1、compileall命令行模式1.2、compileall源码模式2、uncompyle6 pyc转换为py文件2.1、安...

99+

2022-11-10
C++11中explicit类型转换运算符的实例用法

这篇文章主要介绍“C++11中explicit类型转换运算符的实例用法”，在日常操作中，相信很多人在C++11中explicit类型转换运算符的实例用法问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”C++11...

99+

2023-06-19
JAVA11中图片与BASE64相互转换的实现方法

这篇文章主要介绍了JAVA11中图片与BASE64相互转换的实现方法，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。常用的java框架有哪些1.SpringMVC，Spring...

99+

2023-06-14
Go中string与[]byte高效互转的方法实例

目录前言数据结构常规实现 string转[]byte []byte转string 高效实现性能测试总结前言当我们使用go进行数据序列化或反序列化操作时，可能经常涉及到字...

99+

2022-11-12
Java中JavaBean对象和Map的互相转换方法实例

目录1.JavaBean转Map1.1.简介1.2.反射知识1.3.简单转换1. 4.属性里面套属性转换1. 5.总结2.Map转JavaBean对象2.1.简介2.2.Intros...

99+

2022-11-16

hashmap转javabean javabean转成map javabean和map互相转换
SQL中from_unixtime函数的使用方法实例

目录1.from_Unixtime的语法及用法（1）语法：from_unixtime(timestamp ,date_format)（2）用法：将时间戳转为指定日期格式。（3）常见的日期格式2.实例总结1.from_un...

99+

2022-08-30
网站建设中编码转码工具实现utf-8与gbk转换的方法

这篇文章给大家介绍网站建设中编码转码工具实现utf-8与gbk转换的方法，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。所以最好的方法是直接使用编码转换软件，我用的软件是convertz，貌似这个软件N年前开发出来后就没...

99+

2023-06-12
MySQL数据库中CAST与CONVERT函数实现类型转换的示例分析

这篇文章主要为大家展示了“MySQL数据库中CAST与CONVERT函数实现类型转换的示例分析”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“MySQL数据库中C...

99+

2022-10-18
Android中ViewPager的PagerTabStrip与PagerTitleStrip用法实例

零、概览 1.ViewPager说白了就是个控件，在使用时包名要带全是Android.support.v4.view.ViewPager。由于我的ADT-Bundle版本比较高...

99+

2022-06-06

viewpager Android
SQL中Group By的用法与Group By多个字段限制的案例

这篇文章给大家分享的是有关SQL中Group By的用法与Group By多个字段限制的案例的内容。小编觉得挺实用的，因此分享给大家做个参考。一起跟随小编过来看看吧。 ...

99+

2022-10-18
python中class类与方法的用法实例详解

目录类和方法的概念和实例1.python类：class2.类的构造方法__init__()3.类中方法的参数self4.继承5.方法重写类的特殊属性与方法类的私有属性总结因为一直不太...

99+

2022-11-10
php中格利高里历法日期与儒略日计数相互转换的示例分析

小编给大家分享一下php中格利高里历法日期与儒略日计数相互转换的示例分析，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！公历的标准名称为格里高利历，是现在国际通用的...

99+

2023-06-20
C++11中std::function与std::bind的用法实例

目录关于std::function 的用法：关于std::bind 的用法：附：std::function与std::bind双剑合璧总结关于std::function 的用法：其...

99+

2022-11-13
C++中最常用的容器用法与排序实例

目录引述vector用法其他说明map用法其他说明set用法其他说明string用法总结引述 C++ 的 STL 容器分为顺序容器和关联容器。顺序容器：vector、deque、...

99+

2022-11-12