首页 > 资讯 > 后端开发 > Python >ShardingJdbc批量操作引发fullGC解决

731

分享到

ShardingJdbc批量操作引发fullGC解决

Sharding Jdbc引发fullGC Sharding Jdbc批量操作 2022-11-13 19:11:34 731人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

目录正文内存分析为什么有这个 LocalCache 呢？解决方案正文周五晚上告警群突然收到了一条告警消息，点开一看，应用 fullGC 了。于是赶紧联系运维下载堆内存快照，进行

正文

周五晚上告警群突然收到了一条告警消息，点开一看，应用 fullGC 了。

于是赶紧联系运维下载堆内存快照，进行分析。

内存分析

使用 MemoryAnalyzer 打开堆文件

mat 下载地址：https://www.jb51.net/zt/matlab.html

下载下来后需要调大一下 MemoryAnalyzer.ini 配置文件里的-Xmx2048m

打开堆文件后如图：

发现有 809MB 的一个占用，应该问题就出在这块了。然后点击 Dominator Tree，看看有什么大的对象占用。

我们找大的对象，一级级往下点看看具体是谁在占用内存。点到下面发现是 sharding jdbc 里面的类，然后再继续往下发现了一个 localCache。

原来是一个本地缓存占了这么大的空间

为什么有这个 LocalCache 呢？

带着这个疑惑我们去代码里看看它是怎么使用的，根据堆内存分析上的提示，我直接打开了 sqlStatementParserEngine 类。

public final class SQLStatementParserEngine {
    private final SQLStatementParserExecutor sqlStatementParserExecutor;
    private final LoadingCache<String, SQLStatement> sqlStatementCache;
    public SQLStatementParserEngine(String databaseType, SQLParserRule sqlParserRule) {
        this.sqlStatementParserExecutor = new SQLStatementParserExecutor(databaseType, sqlParserRule);
        this.sqlStatementCache = SQLStatementCacheBuilder.build(sqlParserRule, databaseType);
    }
    public SQLStatement parse(String sql, boolean useCache) {
        return useCache ? (SQLStatement)this.sqlStatementCache.getUnchecked(sql) : this.sqlStatementParserExecutor.parse(sql);
    }
}

他这个里面有个 LoadingCache 类型的 sqlStatementCache 对象，这个就是我们要找的缓存对象。

从 parse 方法可以看出，它这里是想用本地缓存做一个优化，优化通过 sql 解析 SQLStatement 的速度。

在普通的场景使用应该是没问题的，但是如果是进行批量操作场景的话就会有问题。

就像下面这个语句：

@Mapper
public interface OrderMapper {
    Integer batchInsertOrder(List<Order> orders);
}

<insert id="batchInsertOrder" parameterType="com.mmc.sharding.bean.Order" >
        insert into t_order (id,code,amt,user_id,create_time)
        values
        <foreach collection="list" item="item" separator=",">
            (#{item.id},#{item.code},#{item.amt},#{item.userId},#{item.createTime})
        </foreach>
</insert>

1）我传入的 orders 的个数不一样，会拼出很多不同的 sql，生成不同的 SQLStatement，都会被放入到缓存中

2）因为批量操作的拼接，sql 本身长度也很大。如果我传入的 orders 的 size 是 1000，那么这个 sql 就很长，也比普通的 sql 更占用内存。

综上，就会导致大量的内存消耗，如果是请求速度很快的话，就就有可能导致频繁的 FullGC。

解决方案

因为是参数个数不同而导致的拼成 Sql 的不一致，所以我们解决参数个数就行了。

我们可以将传入的参数按我们指定的集合大小来拆分，即不管传入多大的集合，都拆为{300, 200, 100, 50, 25, 10, 5, 2, 1}这里面的个数的集合大小。如传入 220 大小的集合，就拆为[{200},{10},{10}]，这样分三次去执行 sql，那么生成的 SQL 缓存数也就只有我们指定的固定数字的个数那么多了，基本不超过 10 个。

接下来我们实验一下，改造前和改造后的 gc 情况。

测试代码如下：

 @RequestMapping("/batchInsert")
    public String batchInsert(){
        for (int j = 0; j < 1000; j++) {
            List<Order> orderList = new ArrayList<>();
            int i1 = new Random().nextInt(1000) + 500;
            for (int i = 0; i < i1; i++) {
                Order order=new Order();
                order.setCode("abc"+i);
                order.setAmt(new BigDecimal(i));
                order.setUserId(i);
                order.setCreateTime(new Date());
                orderList.add(order);
            }
            orderMapper.batchInsertOrder(orderList);
            System.out.println(j);
        }
        return "success";
    }

GC 情况如图所示：

cache 里面存有元素：

修改代码后：

@RequestMapping("/batchInsert")
    public String batchInsert(){
        for (int j = 0; j < 1; j++) {
            List<Order> orderList = new ArrayList<>();
            int i1 = new Random().nextInt(1000) + 500;
            for (int i = 0; i < i1; i++) {
                Order order=new Order();
                order.setCode("abc"+i);
                order.setAmt(new BigDecimal(i));
                order.setUserId(i);
                order.setCreateTime(new Date());
                orderList.add(order);
            }
            List<List<Order>> shard = ShardingUtils.shard(orderList);
            shard.stream().forEach(
                    orders->{
                        orderMapper.batchInsertOrder(orders);
                    }
            );
            System.out.println(j);
        }
        return "success";
    }

GC 情况如下：

cache 里面存有元素：

可以看出 GC 次数有减少，本地缓存的条数由 600 多减到了 11 个，如果导出堆内存还能看出至少降低了几百 M 的本地内存占用。

另外，这个 cache 是有大小限制的，如果因为一个 sql 占了 600 多个位置，那么其他的 sql 的缓存就会被清理，导致其他 SQL 性能会受到影响，甚至如果机器本身内存不高，还会因为这个 cache 过大而导致频繁的 Full GC

大家以后在使用 Sharding JDBC 进行批量操作的时候就需要多注意了

另附上拆分为固定大小的数组的工具方法如下：

public class ShardingUtils {
    private static Integer[] nums = new Integer[]{800,500,300, 200, 100, 50, 25, 10, 5, 2, 1};
    public static <T> List<List<T>> shard(final List<T> originData) {
        return shard(originData, new ArrayList<>());
    }
    private static <T> List<List<T>> shard(final List<T> originData, List<List<T>> result) {
        if (originData.isEmpty()) {
            return result;
        }
        for (int i = 0; i < nums.length; i++) {
            if (originData.size() >= nums[i]) {
                List<T> ts = originData.subList(0, nums[i]);
                result.add(ts);
                List<T> ts2 = originData.subList(nums[i], originData.size());
                if (ts2.isEmpty()) {
                    return result;
                } else {
                    return shard(ts2, result);
                }
            }
        }
        return result;
    }
}

以上就是Sharding Jdbc批量操作引发fullGC解决的详细内容，更多关于Sharding Jdbc引发fullGC的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: ShardingJdbc批量操作引发fullGC解决

本文链接: https://www.lsjlt.com/news/171067.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

ShardingJdbc批量操作引发fullGC解决

目录正文内存分析为什么有这个 LocalCache 呢？解决方案正文周五晚上告警群突然收到了一条告警消息，点开一看，应用 fullGC 了。于是赶紧联系运维下载堆内存快照，进行...

99+

2022-11-13

Sharding Jdbc引发fullGC Sharding Jdbc批量操作
vue页面批量引入组件的操作代码

<template> <div> <template v-for="(item) in names"> <compo...

99+

2022-12-12

vue页面批量引入组件 vue批量引入组件 vue页面批量引入
Python批量操作Excel文件详解

目录批量操作OS模块介绍OS模块基本操作获取当前工作路径获取一个文件夹下的所有文件名对文件名进行重命名创建一个文件夹删除一个文件夹删除一个文件利用OS模块进行批量操作批量读取一个文件...

99+

2024-04-02
深度解析Django REST Framework 批量操作

目录DRF基本情况自定义批量操作批量创建批量删除批量更新djangorestframework-bulk依赖安装范例路由测试DRF3相关注意事项源码解读我们都知道Django res...

99+

2024-04-02
如何解决MySQL批量插入和唯一索引问题

这篇文章主要介绍了如何解决MySQL批量插入和唯一索引问题，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。MySQL批量插入问题在开发项目时，...

99+

2024-04-02
go语言实现Elasticsearches批量修改查询及发送MQ操作示例

目录update_by_query批量修改索引添加字段查询es发送MQupdate_by_query批量修改 POST post-v1_1-2021.02,post-v1_...

99+

2024-04-02
Go使用sync.Map来解决map的并发操作问题

目录前言 map 并发操作出现问题 sync.Map 解决并发操作问题计算 map 长度计算 sync.Map 长度前言在 Golang 中 map 不是并发安全的，自 1...

99+

2024-04-02
PHP 通过 Redis 解决并发请求的操作问题

比如PHP收到两个并发的请求A和B，要求只能其中一个请求处理S1操作，另一个请求直接返回失败，可以通过redis去解决： SETNX（SET if Not eXists）是 Redis 中的一个原子命令，用于设置键-值对，但只有在键不存在时...

99+

2023-09-10

php redis 开发语言
IaaS 引发的革命：了解操作系统如何改造 IT 格局

IaaS 的兴起 IaaS 是云计算服务模型，它提供对计算、存储和网络资源的按需访问。与传统 IT 基础设施不同，IaaS 消除了对物理硬件和软件的直接管理需求。取而代之的是，供应商通过虚拟化技术提供这些资源，从而允许企业按需创建和部署...

99+

2024-03-02

IaaS、云计算、虚拟化、IT 格局
Go怎么使用sync.Map来解决map的并发操作问题

这篇文章主要介绍“Go怎么使用sync.Map来解决map的并发操作问题”，在日常操作中，相信很多人在Go怎么使用sync.Map来解决map的并发操作问题问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Go怎...

99+

2023-06-25
操作系统多线程：解锁程序并发执行的强大力量

1. 多线程的基本概念多线程是操作系统实现进程并发执行的一种重要机制，它允许进程在同一时间内同时执行多个任务，提高计算机的运行效率。多线程是在一个进程中创建多个执行流，这些执行流共享该进程的资源，并同时执行不同的任务。 2. 多线程的...

99+

2024-02-24

多线程并发执行进程线程同步线程通信
Win10开机提示记忆文件操作发生错误怎么解决

刚刚使用Windows10系统的朋友，总会碰到一些以前没遇到过的奇怪的问题。比如，现在就有用户反馈Win10系统开机时，会弹出错误提示“记忆文件操作发生错误”、“读取基础文件winab...

99+

2023-05-20

Win10 记忆文件
Spring Boot实战解决高并发数据入库之 Redis 缓存+MySQL 批量入库问题

目录前言架构设计代码实现测试总结前言最近在做阅读类的业务，需要记录用户的PV，UV；项目状况：前期尝试业务阶段；特点：快速实现（不需要做太重，满足初期推广运营即可）快速投入市场...

99+

2024-04-02
Java学习笔记：如何解决Load并发操作中的常见问题？

在Java开发中，Load并发操作是非常常见的一种操作。然而，由于并发操作的特殊性质，很容易出现一些常见的问题。在本文中，我们将介绍一些常见的Load并发操作问题，并提供一些解决方案和演示代码。线程安全问题在并发操作中，线程安全是...

99+

2023-09-09

学习笔记 load 并发
在Go语言中如何解决并发网络请求的请求合并和批量处理问题？

在Go语言中如何解决并发网络请求的请求合并和批量处理问题？在现代互联网应用中，网络请求已经成为了不可或缺的一部分，而对于高并发的情况下，如何有效地管理和处理大量的网络请求成了一个亟待解决的问题。为了提高请求的效率和减少网络开销，我们常常需要...

99+

2023-10-22

并发（Concurrent）网络请求（Network Request）批量处理（Batch Processing）
网站开发中网站不收录的解决办法具体操作是怎样的

网站开发中网站不收录的解决办法具体操作是怎样的，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。看一下你的网站是新站还是老网站，当然影响网站收录的因素有很多，接下来为大家介绍一下怎...

99+

2023-06-07
C#开发中如何处理集合和数据结构的操作问题及解决

C#开发中如何处理集合和数据结构的操作问题及解决，需要具体代码示例在C#开发中，处理集合和数据结构的操作问题是非常常见的。正确地处理这些问题可以提高代码的效率和可读性。本文将讨论一些常见的集合和数据结构操作问题，并给出相应的解决方案和代码示...

99+

2023-10-22

集合处理：C#集合操作 C#集合与数据结构解析
麒麟操作系统如何提供网络流量和带宽管理的解决方案

麒麟操作系统提供了网络流量和带宽管理的解决方案，具体如下：1. QoS（Quality of Service）支持：麒麟操作系统支持...

99+

2023-10-12

麒麟操作系统
操作系统线程管理中的死锁问题：识别和解决并发的陷阱

死锁是并发编程中常见且棘手的问题，它会导致两个或多个线程无限期地等待彼此的资源。在操作系统线程管理中，死锁可以冻结整个系统，导致严重的后果。本文将深入探讨死锁问题，提供识别和解决死锁的有效策略。死锁的产生：死锁通常发生在以下四个条件...

99+

2024-03-04

死锁、操作系统、并发、进程、线程
C#开发中如何处理集合和数据结构的操作问题及解决方法

C# 开发中如何处理集合和数据结构的操作问题及解决方法引言：在 C# 开发中，集合和数据结构是非常重要的概念。它们可以帮助我们组织和管理数据，提高程序的效率和可维护性。然而，对于初学者来说，可能会遇到一些集合和数据结构的操作问题。本文将介绍...

99+

2023-10-22

- 查找：find - 添加：add - 删除：remove - 数组：array