iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Java中Elasticsearch实现分页方式(三种方式)
  • 794
分享到

Java中Elasticsearch实现分页方式(三种方式)

2024-04-02 19:04:59 794人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

目录ES 简介ES 的特点:一、from + size 浅分页二、scroll 深分页scroll删除三、search_after 深分页ES 简介 elasticsearch 是一

ES 简介

elasticsearch 是一个基于 Lucene 实现的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful WEB 接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

ES 的特点:

分布式实时文件存储,可以将每一个字段都编入索引,使其可以被检索

可以作为一个大型分布式集群(数百台服务器)技术,处理PB级数据

Elasticsearch不是什么新技术,主要是将全文检索、数据分析以及分布式技术,合并在了一起,才形成了独一无二的ES。

下面介绍下Java中Elasticsearch 实现分页的 3 种方式,还有谁不会??

一、from + size 浅分页

"浅"分页可以理解为简单意义上的分页。

它的原理很简单,就是查询前20条数据,然后截断前10条,只返回10-20的数据。这样其实白白浪费了前10条的查询。

GET test_dev/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "age": 28
          }
        }
      ]
    }
  },
  "size": 10,
  "from": 20,
  "sort": [
    {
      "timestamp": {
        "order": "desc"
      },
      "_id": {
        "order": "desc"
      }
    }
  ]
}

其中,from定义了目标数据的偏移值,size定义当前返回的数目。默认from为0,size为10,即所有的查询默认仅仅返回前10条数据。

在这里有必要了解一下from/size的原理:

因为es是基于分片的,假设有5个分片,from=100,size=10。则会根据排序规则从5个分片中各取回100条数据数据,然后汇总成500条数据后选择最后面的10条数据。

做过测试,越往后的分页,执行的效率越低。总体上会随着from的增加,消耗时间也会增加。而且数据量越大,就越明显!

二、scroll 深分页

from+size查询在10000-50000条数据(1000到5000页)以内的时候还是可以的,但是如果数据过多的话,就会出现深分页问题。

为了解决上面的问题,elasticsearch提出了一个scroll滚动的方式。

scroll 类似于sql中的cursor,使用scroll,每次只能获取一页的内容,然后会返回一个scroll_id。根据返回的这个scroll_id可以不断地获取下一页的内容,所以scroll并不适用于有跳页的情景。

GET test_dev/_search?scroll=5m
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "age": 28
          }
        }
      ]
    }
  },
  "size": 10,
  "from": 0,
  "sort": [
    {
      "timestamp": {
        "order": "desc"
      },
      "_id": {
        "order": "desc"
      }
    }
  ]
}
  • scroll=5m表示设置scroll_id保留5分钟可用。
  • 使用scroll必须要将from设置为0。
  • size决定后面每次调用_search搜索返回的数量

然后我们可以通过数据返回的_scroll_id读取下一页内容,每次请求将会读取下10条数据,直到数据读取完毕或者scroll_id保留时间截止:

GET _search/scroll
{
  "scroll_id": "DnF1ZXJ5VGhlbkZldGNoBQAAAAAAAJZ9Fnk1d......",
  "scroll": "5m"
}

注意:请求的接口不再使用索引名了,而是 _search/scroll,其中GET和POST方法都可以使用。

scroll删除

根据官方文档的说法,scroll的搜索上下文会在scroll的保留时间截止后自动清除,但是我们知道scroll是非常消耗资源的,所以一个建议就是当不需要了scroll数据的时候,尽可能快的把scroll_id显式删除掉。

清除指定的scroll_id

DELETE _search/scroll/DnF1ZXJ5VGhlbkZldGNo.....

清除所有的scroll:

DELETE _search/scroll/_all

三、search_after 深分页

scroll 的方式,官方的建议不用于实时的请求(一般用于数据导出),因为每一个 scroll_id 不仅会占用大量的资源,而且会生成历史快照,对于数据的变更不会反映到快照上。

search_after 分页的方式是根据上一页的最后一条数据来确定下一页的位置,同时在分页请求的过程中,如果有索引数据的增删改查,这些变更也会实时的反映到游标上。但是需要注意,因为每一页的数据依赖于上一页最后一条数据,所以无法跳页请求。

为了找到每一页最后一条数据,每个文档必须有一个全局唯一值,官方推荐使用 _uid 作为全局唯一值,其实使用业务层的 id 也可以。

GET test_dev/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "age": 28
          }
        }
      ]
    }
  },
  "size": 20,
  "from": 0,
  "sort": [
    {
      "timestamp": {
        "order": "desc"
      },
      "_id": {
        "order": "desc"
      }
    }
  ]
}
  • 使用search_after必须要设置from=0
  • 这里我使用timestamp和_id作为唯一值排序。
  • 我们在返回的最后一条数据里拿到sort属性的值传入到search_after

使用sort返回的值搜索下一页:

GET test_dev/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "age": 28
          }
        }
      ]
    }
  },
  "size": 10,
  "from": 0,
  "search_after": [
    1541495312521,
    "d0xH6GYBBtbwbQSP0j1A"
  ],
  "sort": [
    {
      "timestamp": {
        "order": "desc"
      },
      "_id": {
        "order": "desc"
      }
    }
  ]
}

到此这篇关于Elasticsearch 实现分页的 3 种方式,还有谁不会??的文章就介绍到这了,更多相关Elasticsearch 实现分页内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Java中Elasticsearch实现分页方式(三种方式)

本文链接: https://www.lsjlt.com/news/153481.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Java中Elasticsearch实现分页方式(三种方式)
    目录ES 简介ES 的特点:一、from + size 浅分页二、scroll 深分页scroll删除三、search_after 深分页ES 简介 Elasticsearch 是一...
    99+
    2024-04-02
  • sqlServer实现分页查询的三种方式
    目录一、offset /fetch next关键字二、利用max(主键)三、利用row_number关键字总结sqlServer的分页查询和mysql语句不一样,有三种实现方式。分别是:offset /fetch nex...
    99+
    2023-03-02
    sqlserver的分页查询 sqlserver分页sql语句 server数据库分页查询
  • Java实现redis分布式锁的三种方式
    目录一、引入原因二、分布式锁实现过程中的问题问题一:异常导致锁没有释放问题二:获取锁与设置过期时间操作不是原子性的问题三:锁过期之后被别的线程重新获取与释放问题四:锁的释放不是原子性...
    99+
    2022-11-13
    Java redis分布式锁 Java 分布式锁
  • Java项目开发中实现分页的三种方式总结
    目录前言使用1、SpringDataJPA分页2、MyBatis分页3、Hutools工具类分页总结前言 Java项目开发中经常要用到分页功能,现在普遍使用SpringBoot进行快...
    99+
    2024-04-02
  • java中分组统计的三种实现方式
    平时工作中,很多时候都会用到对数据进行分组操作,例如一个学生对象,有班级、名字、性别、分数等,需要按班级分组统计,该怎么操作呢?一个合理的算法可以提升不少效率。 大家看一下下面的案例...
    99+
    2024-04-02
  • java中实现分页的常见几种方式
    文章目录 1. 前言2. 先说结论3. 例子1. 数据库SQL的限制条件(limit、fetch)2. 使用List集合的截取功能实现3. 插件PageHelper 1. 前言 无论是...
    99+
    2023-08-31
    mybatis java 分页 数据库 PageHelper
  • 详解mybatis三种分页方式
    目录前言一、Limit分页二、RowBounds分页(不推荐使用)三、Mybatis_PageHelper分页插件总结:前言 分页是我们在开发中绕不过去的一个坎!当你的数据量大了的时...
    99+
    2022-11-13
    mybatis分页
  • Java list 分页(多种方式)
    Java list 分页(多种方式) 方式一: public static void fenye(List list,int pagesize){ int totalcount=list.size(); int pagecou...
    99+
    2023-09-08
    java 开发语言 list
  • 实现 Java 平台的三种方式(转)
    实现 Java 平台的三种方式(转)[@more@]实现 Java 平台的三种方式广泛地说,只要能执行 Java bytecode 者,就可以称为 Java 平台(Java platform)。大致上,实现 Java 平台的方式有三种,分别...
    99+
    2023-06-03
  • JAVA实现Base64编码的三种方式
    目录定义: 二进制文件可视化sun 包下的 BASE64Encoderapache 包下的 Base64util 包下的 Base64 (jdk8)定义: 二进制文件可视化 Base...
    99+
    2024-04-02
  • 浅谈Java实现分布式事务的三种方案
    目录一、问题描述二、分布式事务2.1、什么是分布式系统2.2、什么是事务2.3、什么是本地事务2.4、什么是分布式事务三、如何进行分布式事务控制3.1、CAP理论3.2、分布式系统如...
    99+
    2024-04-02
  • SQL有几种方式来实现分页
    SQL有几种方式来实现分页,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。  在绝大多数的应用中,返回大量的符合条件的记录是司空...
    99+
    2024-04-02
  • absolute之实现居中的三种方式
    1. 使用绝对定位和负边距的方式:首先,将需要居中的元素的定位属性设置为绝对定位,然后使用负边距来将元素的宽度和高度的一半向左和向上...
    99+
    2023-09-12
    absolute
  • Java中Elasticsearch实现分页的方法有哪些
    这篇文章主要介绍“Java中Elasticsearch实现分页的方法有哪些”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Java中Elasticsearch实现分页的方法有哪些”文章能帮助大家解决问...
    99+
    2023-07-02
  • Java实现生成JSON字符串的三种方式分享
    目录手动拼接(不推荐)使用 Gson 等 JSON 库使用 JSONObject(推荐)我的安卓开发经历始于一个原生安卓项目开发。后来由于公司有个项目与几家医疗设备公司合作,需要我写...
    99+
    2023-05-19
    Java生成JSON字符串方式 Java生成JSON字符串 Java JSON字符串
  • 详解Java实现多线程的三种方式
    目录并发与并行进程与线程java的线程java多线程机制java的主线程线程的生命周期创建线程(3种)继承Thread类实现线程创建实现Runnable接口实现Callable接口线...
    99+
    2024-04-02
  • Java实现AOP代理的三种方式详解
    目录1、JDK实现 2、CGLIB实现 3、boot注解实现【注意只对bean有效】业务场景:首先你有了一个非常好的前辈无时无刻的在“教育&rdquo...
    99+
    2024-04-02
  • 详解Java实现JSONArray转Map的三种实现方式
    目录 第一种第二种 第三种 本文只是自己常用的三种,自己总结一下,不是只有这三种,杠精走开; JSONArray数据 [ { "...
    99+
    2024-04-02
  • 浅谈Java 三种方式实现接口校验
    本文介绍了Java 三种方式实现接口校验,主要包括AOP,MVC拦截器,分享给大家,具体如下:方法一:AOP代码如下定义一个权限注解package com.thinkgem.jeesite.common.annotation; impor...
    99+
    2023-05-30
    java 接口 校验
  • JAVA多线程实现的三种方式介绍
    本篇内容主要讲解“JAVA多线程实现的三种方式介绍”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“JAVA多线程实现的三种方式介绍”吧!JAVA多线程实现方式主要有三种:继承Thread类、实现R...
    99+
    2023-06-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作