iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >MySQL中的流式查询及游标查询方式
  • 410
分享到

MySQL中的流式查询及游标查询方式

MySQL查询流式查询游标查询MySQL游标 2022-08-17 15:08:11 410人浏览 薄情痞子
摘要

目录一、业务场景二、罗列一下三种处理方式2.1 常规查询2.2 流式查询2.3 游标查询三、RowData3.1 RowDataStatic3.2 RowDataDynamic3.3 RowDataCursor四、JDB

一、业务场景

现在业务系统需要从 Mysql 数据库里读取 500w 数据行进行处理

  • 迁移数据
  • 导出数据
  • 批量处理数据

二、罗列一下三种处理方式

  • 常规查询:一次性读取 500w 数据到 JVM 内存中,或者分页读取
  • 流式查询:每次读取一条加载到 JVM 内存进行业务处理
  • 游标查询:和流式一样,通过 fetchSize 参数,控制一次读取多少条数据

2.1 常规查询

默认情况下,完整的检索结果集会将其存储在内存中。在大多数情况下,这是最有效的操作方式,更易于实现。

假设单表 500w 数据量,没有人会一次性加载到内存中,一般会采用分页的方式。

在这里,测试demo中只是为了监控JVM,所以没有采用分页,一次性将数据载入内存中

@Test
public void generalQuery() throws Exception {
    // 1核2G:查询一百条记录:47ms
    // 1核2G:查询一千条记录:2050 ms
    // 1核2G:查询一万条记录:26589 ms
    // 1核2G:查询五万条记录:135966 ms
    String sql = "select * from wh_b_inventory limit 10000";
    ps = conn.prepareStatement(sql);
    ResultSet rs = ps.executeQuery(sql);
    int count = 0;
    while (rs.next()) {
        count++;
    }
    System.out.println(count);
}

JVM监控

我们将对内存调小-Xms70m -Xmx70m

整个查询过程中,堆内存占用逐步增长,并且最终导致OOM:

Java.lang.OutOfMemoryError: GC overhead limit exceeded

1、频繁触发GC

2、存在OOM隐患

MySQL中的流式查询及游标查询方式

2.2 流式查询

流式查询有一点需要注意:必须先读取(或关闭)结果集中的所有行,然后才能对连接发出任何其他查询,否则将引发异常,其 查询会独占连接。

从测试结果来看,流式查询并没有提升查询的速度

@Test
public void streamQuery() throws Exception {
    // 1核2G:查询一百条记录:138ms
    // 1核2G:查询一千条记录:2304 ms
    // 1核2G:查询一万条记录:26536 ms
    // 1核2G:查询五万条记录:135931 ms
    String sql = "select * from wh_b_inventory limit 50000";
    statement = conn.createStatement(ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY);
    statement.setFetchSize(Integer.MIN_VALUE);
    ResultSet rs = statement.executeQuery(sql);
    int count = 0;
    while (rs.next()) {
        count++;
    }
    System.out.println(count);
}

JVM监控

我们将堆内存调小-Xms70m -Xmx70m

我们发现即使堆内存只有70m,却依然没有发生OOM

MySQL中的流式查询及游标查询方式

2.3 游标查询

注意:

1、需要在数据库连接信息里拼接参数 useCursorFetch=true

2、其次设置 Statement 每次读取数据数量,比如一次读取 1000

从测试结果来看,游标查询在一定程度缩短了查询速度

@Test
public void cursorQuery() throws Exception {
    Class.forName("com.mysql.jdbc.Driver");
    // 注意这里需要拼接参数,否则就是普通查询
    conn = DriverManager.getConnection("jdbc:mysql://101.34.50.82:3306/mysql-demo?useCursorFetch=true", "root", "123456");
    start = System.currentTimeMillis();
 
     // 1核2G:查询一百条记录:52 ms
     // 1核2G:查询一千条记录:1095 ms
    // 1核2G:查询一万条记录:17432 ms
    // 1核2G:查询五万条记录:90244 ms
    String sql = "select * from wh_b_inventory limit 50000";
    ((JDBC4Connection) conn).setUseCursorFetch(true);
    statement = conn.createStatement(ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY);
    statement.setFetchSize(1000);
    ResultSet rs = statement.executeQuery(sql);
    int count = 0;
    while (rs.next()) {
        count++;
    }
    System.out.println(count);
}

JVM监控

我们将堆内存调小-Xms70m -Xmx70m

我们发现在单线程情况下,游标查询和流式查询一样,都能很好的规避OOM,并且游标查询能够优化查询速度。

MySQL中的流式查询及游标查询方式

三、RowData

ResultSet.next() 的逻辑是实现类 ResultSetImpl 每次都从 RowData 获取下一行的数据。RowData 是一个接口,实现关系图如下

MySQL中的流式查询及游标查询方式

3.1 RowDataStatic

默认情况下 ResultSet 会使用 RowDataStatic 实例,在生成 RowDataStatic 对象时就会把 ResultSet 中所有记录读到内存里,之后通过 next() 再一条条从内存中读

3.2 RowDataDynamic

当采用流式处理时,ResultSet 使用的是 RowDataDynamic 对象,而这个对象 next() 每次调用都会发起 IO 读取单行数据

3.3 RowDataCursor

RowDataCursor 的调用为批处理,然后进行内部缓存,流程如下:

  • 首先会查看自己内部缓冲区是否有数据没有返回,如果有则返回下一行
  • 如果都读取完毕,向 MySQL Server 触发一个新的请求读取 fetchSize 数量结果
  • 并将返回结果缓冲到内部缓冲区,然后返回第一行数据

总结来说就是:

默认的 RowDataStatic 读取全部数据到客户端内存中,也就是我们的 JVM;

RowDataDynamic 每次 IO 调用读取一条数据;

RowDataCursor 一次读取 fetchSize 行,消费完成再发起请求调用。

四、JDBC 通信原理

在 JDBC 与 MySQL 服务端的交互是通过 Socket 完成的,对应到网络编程,可以把 MySQL 当作一个 SocketServer,因此一个完整的请求链路应该是:

JDBC 客户端 -> 客户端 Socket -> MySQL -> 检索数据返回 -> MySQL 内核 Socket Buffer -> 网络 -> 客户端 Socket Buffer -> JDBC 客户端

4.1 generalQuery 普通查询

普通查询会将当次查询到的所有数据加载到JVM,然后再进行处理。

如果查询数据量过大,会不断经历 GC,然后就是内存溢出

4.2 streamQuery 流式查询

服务端准备好从第一条数据开始返回时,向缓冲区怼入数据,这些数据通过tcp链路,怼入客户端机器的内核缓冲区,JDBC会的inputStream.read()方法会被唤醒去读取数据,唯一的区别是开启了stream读取的时候,每次只是从内核中读取一个package大小的数据,只是返回一行数据,如果1个package无法组装1行数据,会再读1个package。

4.3 cursorQuery 游标查询

当开启游标的时候,服务端返回数据的时候,就会按照fetchSize的大小返回数据了,而客户端接收数据的时候每次都会把换缓冲区数据全部读取干净,假如数据有1亿数据,将FetchSize设置成1000的话,会进行10万次来回通信;

由于MySQL方不知道客户端什么时候将数据消费完,而自身的对应表可能会有DML写入操作,此时MySQL需要建立一个临时空间来存放需要拿走的数据。

因此对于当你启用useCursorFetch读取大表的时候会看到MySQL上的几个现象:

  • 1.IOPS飙升
  • 2.磁盘空间飙升
  • 3.客户端JDBC发起SQL后,长时间等待SQL响应数据,这段时间就是服务端在准备数据
  • 4.在数据准备完成后,开始传输数据的阶段,网络响应开始飙升,IOPS由“读写”转变为“读取”。
  • IOPS (Input/Output Per Second):磁盘每秒的读写次数
  • 5.CPU和内存会有一定比例的上升

五、并发场景

并发调用:Jmete 1 秒 10 个线程并发调用

流式查询内存性能报告如下

并发调用对于内存占用情况也很 OK,不存在叠加式增加

MySQL中的流式查询及游标查询方式

游标查询内存性能报告如下

MySQL中的流式查询及游标查询方式

六、总结

1、游标查询和流式查询在单线程下都能够规避OOM的情况;

2、在查询速度上游标查询比流式查询更快,流式查询和普通查询相比并不能缩短查询时间;

3、在并发场景下,流式查询堆内存走势更加稳定,不存在叠加式增加。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。 

您可能感兴趣的文档:

--结束END--

本文标题: MySQL中的流式查询及游标查询方式

本文链接: https://www.lsjlt.com/news/33743.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • MySQL中的流式查询及游标查询方式
    目录一、业务场景二、罗列一下三种处理方式2.1 常规查询2.2 流式查询2.3 游标查询三、RowData3.1 RowDataStatic3.2 RowDataDynamic3.3 RowDataCursor四、JDB...
    99+
    2022-08-17
    MySQL查询 流式查询 游标查询 MySQL游标
  • MySQL中流式查询及游标查询的方式是什么
    这篇文章主要讲解了“MySQL中流式查询及游标查询的方式是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“MySQL中流式查询及游标查询的方式是什么”吧!...
    99+
    2022-10-19
  • statement/mybatis操作mysql普通查询;游标查询;流式查询
    概述 我当前的jdbc驱动版本如下 mysql-connector-java-8.0.30.jar 在实际业务中一般用普通查询就可以覆盖90%的场景了。但是在一些环境需要去处理大量数据,而这些数据可能...
    99+
    2023-09-27
    mybatis mysql java
  • MySQL 普通查询、流式查询、游标查询以及使用 mybatis 如何实现
    MySQL 普通查询、流式查询、游标查询以及使用 mybatis 如何实现 MySQL 普通查询、流式查询、游标查询以及使用 mybatis 如何实现普通查询流式查询游标查询mybatis 如...
    99+
    2023-09-28
    mybatis java mysql
  • Mybatis流式游标查询-大数据DB查询OOM查询问题
    问题场景 Mysql数据处理类型分以下三种 com.mysql.cj.protocol.a.result.ResultsetRowsStatic:普通查询,将结果集一次性全部拉取到内存 com.mysql.cj.protocol.a....
    99+
    2023-09-01
    mysql 性能优化 Powered by 金山文档
  • mysql JDBC的三种查询(普通、流式、游标)
    使用JDBC向mysql发送查询时,有三种方式: 常规查询:JDBC驱动会阻塞的一次性读取全部查询的数据到 JVM 内存中,或者分页读取流式查询:每次执行rs.next时会判断数据是否需要从mysql服务器获取,如果需要触发读取一批数据(可...
    99+
    2023-09-14
    mysql jvm java
  • MySQL慢查询以及重构查询的方式记录
    前言 什么是慢查询,如何优化慢查询,下面介绍这两个知识点的相关知识。 慢查询基础:优化数据访问 是否向数据库请求了不需要的数据 查询不需要的记录:解决方案:查询后面加上Limit...
    99+
    2022-11-12
  • Mybatis游标查询大量数据方式
    目录Mybatis游标查询大量数据mapper层service层 资源释放Mybatis游标使用总结什么是游标Mybatis游标查询大量数据 对大量数据进行处理时,为防止内...
    99+
    2022-11-13
  • Mysql---子查询的三种查询方式( 表子查询,条件子查询,列中子查询)
    mysql子查询 子查询分为: 列中子查询 单列单行表子查询 必须有别名条件子查询 单行单列 多行单列 下列示例表结构: grade表: result表: student表: subject表:...
    99+
    2023-09-04
    mysql sql 数据库
  • mysql锁查询方式
    下面讲讲关于mysql锁查询方式,文字的奥妙在于贴近主题相关。所以,闲话就不谈了,我们直接看下文吧,相信看完mysql锁查询方式这篇文章你一定会有所受益。select  IFNULL(w...
    99+
    2022-10-18
  • mysql的join查询和多次查询方式比较
    目录join查询和多次查询比较查询语句join、on、where执行顺序一、典型SELECT语句完整的执行顺序二、from三、on四、on 条件与where 条件五、join 流程总结join...
    99+
    2023-03-09
    mysql查询 mysqljoin查询 mysql多次查询
  • MySQL的分页查询方式
    这篇文章主要介绍“MySQL的分页查询方式”,在日常操作中,相信很多人在MySQL的分页查询方式问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”MySQL的分页查询方式”的疑惑...
    99+
    2022-10-18
  • MySQL查询优化的方式
    本篇内容介绍了“MySQL查询优化的方式”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成! 在分析查询性能时...
    99+
    2022-10-18
  • MyBatis动态sql查询及多参数查询方式
    目录MyBatis动态sql动态sql处理简单的多参数查询动态sql处理更新功能动态sql扩展动态sql处理集合参数foreach标签处理数组类型参数  &nbs...
    99+
    2022-11-13
    MyBatis sql查询 动态sql查询 多参数查询
  • MYSQL慢查询日志的查看方式
    这篇文章主要介绍“MYSQL慢查询日志的查看方式”,在日常操作中,相信很多人在MYSQL慢查询日志的查看方式问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”MYSQL慢查询日志...
    99+
    2022-10-18
  • MySQL查询树结构方式
    目录MySQL 查询树结构1. 关于树结构2. MySQL自定义函数的方式2.1 创建测试数据2.2 获取 某节点下所有子节点2.3 获取 某节点的所有父节点3. Oracle数据库...
    99+
    2022-11-12
  • Spring Data JPA查询方式及方法名查询规则介绍
    目录SpringDataJPA查询方式及方法名查询规则通过解析方法名创建查询使用@Query创建查询JPA常用查询方法记录CrudRepository默认带的查询方法简单的扩展-以字...
    99+
    2022-11-12
  • Mysql查询以某"字符串"开头的查询方式
    目录Mysql查询以某"字符串"开头的查询查询不以某个或者某些字符串为开头的字符串查询以某个或者某些字符串为开头的字符串Mysql查询条件字符串类型 = 0假如有...
    99+
    2022-11-13
  • MySql连接查询方式详解
    目录1. 什么是连接查询2. 连接查询的方式3. 内连接1. 等值连接2. 非等值连接3. 自连接4. 外连接1. 右外连接2. 左外连接5. 多张表(两张以上)连接1. 什么是连接查询 从一张表中单独查询,称为单表查询...
    99+
    2022-09-19
  • MySql各种查询方式详解
    目录新增聚合查询分组查询条件查询联合查询自连接合并查询新增 insert into B select * from A;//将A表的信息通过查询新增到B表中去 聚合查询 ...
    99+
    2022-11-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作