广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Elasticsearch之倒排索引及索引操作
  • 313
分享到

Elasticsearch之倒排索引及索引操作

2024-04-02 19:04:59 313人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

目录倒排索引一 倒排索引是什么二 举例三 倒排索引待解决的问题索引操作一 索引初始化二 查询索引配置三 更新索引四 删除索引倒排索引 一 倒排索引是什么 倒排索引源于实际应用中需要根

倒排索引

一 倒排索引是什么

倒排索引源于实际应用中需要根据属性的值来查找记录,这种索引表中的每一个项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而成为倒排索引。带有倒排索引的文件我们称之为倒排索引文件,简称倒排文件

二 举例

例如有如下三个文件:

文件A:通过python Django搭建网站

文件B:通过Python scrapy爬取网站数据

文件C:scrapy-Redis分布式爬虫

现在我们要查询,带有Python的文件,正常是对每个文件进行遍历,每个文件遍历一次,如果文件特别大,每个文件有一亿个字符,总共有一亿各文件,每个我们都要遍历,非常消耗资源

在存储文件之前,先对文件进行分析,将文件分词,对分词建立索引,例如下面一句话

1 今天是星期天我们出去玩

2 明天是星期天,放假

3 今天天气很晴朗

4 xxx

5 他们出去玩了

关键词文章
今天文章1,文章3
星期天文章2
出去玩文章5,文章1

实际上es在做存储的时候,更详细,如下表

关键词文章
今天(文章1,<2,10>,2) (文章3,<8>,1)
星期天(文章2,<12,25,100>,3)
出去玩(文章5,<11,24,89>,3)(文章1,<8,19>,2)

今天出现在哪个文章,出现的位置和出现的次数

三 倒排索引待解决的问题

1 大小写转换问题,如python和Python应该为同一个词

2 词干抽取,looking和look应该处理为同一个词

3 分词,如 屏蔽系统 是屏蔽 和系统两个词还是 为屏蔽系统一个词

4 倒排索引文件过大,需要压缩编码

索引操作

具体操作可以查看官方文档

https://www.elastic.co/guide/en/elasticsearch/reference/7.5/indices.html>

官方2版本的中文文档

Https://www.elastic.co/guide/cn/elasticsearch/guide/current/index-settings.html

一 索引初始化

#新建一个lqz2的索引,索引分片数量为5,索引副本数量为1
PUT lqz2
{
  "settings": {
    "index":{
      "number_of_shards":5,
      "number_of_replicas":1
    }
  }
}
'''
number_of_shards
每个索引的主分片数,默认值是 5 。这个配置在索引创建后不能修改。
number_of_replicas
每个主分片的副本数,默认值是 1 。对于活动的索引库,这个配置可以随时修改。
'''

二 查询索引配置

#获取lqz2索引的配置信息
GET lqz2/_settings
#获取所有索引的配置信息
GET _all/_settings
#同上
GET _settings
#获取lqz和lqz2索引的配置信息
GET lqz,lqz2/_settings

三 更新索引

#修改索引副本数量为2
PUT lqz/_settings
{
  "number_of_replicas": 2
}
#如遇到报错:cluster_block_exception,因为
#这是由于ES新节点的数据目录data存储空间不足,导致从master主节点接收同步数据的时候失败,此时ES集群为了保护数据,会自动把索引分片index置为只读read-only
PUT  _all/_settings
{
"index": {
  "blocks": {
    "read_only_allow_delete": false
    }
  }
}

四 删除索引

#删除lqz索引
DELETE lqz

以上就是Elasticsearch之倒排索引及索引操作的详细内容,更多关于Elasticsearch倒排索引索引操作的资料请关注编程网其它相关文章!

--结束END--

本文标题: Elasticsearch之倒排索引及索引操作

本文链接: https://www.lsjlt.com/news/117348.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Elasticsearch之倒排索引及索引操作
    目录倒排索引一 倒排索引是什么二 举例三 倒排索引待解决的问题索引操作一 索引初始化二 查询索引配置三 更新索引四 删除索引倒排索引 一 倒排索引是什么 倒排索引源于实际应用中需要根...
    99+
    2022-11-10
  • 【Elasticsearch 7 探索之路】(三)倒排索引
    上一篇,我们介绍了 ES 文档的基本 CURE 和批量操作。我们都知道倒排索引是搜索引擎非常重要的一种数据结构,什么是倒排索引,倒排索引的原理是什么。 1 索引过程 在讲解倒排索引前,我们先了解索引创建,下图是 Elasticsearch ...
    99+
    2019-11-04
    【Elasticsearch 7 探索之路】(三)倒排索引
  • 搜索引擎之倒排索引浅析
    上一篇文章 ElasticSearch 术语中提到了倒排索引,那么这篇文章就来讲解下什么是倒排索引,倒排索引的数据结构以及 ElasticSearch 中的倒排索引。 倒排索引 倒排索引(Inverted Index) 也常被称为...
    99+
    2016-11-02
    搜索引擎之倒排索引浅析
  • 如何理解Elasticsearch倒排索引与分词
    本篇内容主要讲解“如何理解Elasticsearch倒排索引与分词”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何理解Elasticsearch倒排索引与分词...
    99+
    2022-10-19
  • ElasticSearch学习之Es索引Api操作
    目录Es索引Api操作创建索引索引别名添加索引别名查询索引别名删除索引别名mappingsettings查询索引查询当前集群全部索引查询单个索引修改索引删除索引结束语Es索引Api操...
    99+
    2023-01-31
    ElasticSearch Es索引Api操作 Es索引Api操作
  • 搜索引擎的倒排索引是什么
    本篇内容主要讲解“搜索引擎的倒排索引是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“搜索引擎的倒排索引是什么”吧!什么是倒排索引?  见其名知其意,有倒排索引,对应肯定,有正向索引。&nbs...
    99+
    2023-06-04
  • 搜索一文入门ElasticSearch(节点分片CRUD倒排索引分词)
    目录ElasticSearch基本概念:索引、文档和REST ApiJson文档文档的元数据索引分布式系统的可用性和扩展性分布式特性节点分片查看集群的健康状况CRUD文档的CRUDC...
    99+
    2023-03-23
    ElasticSearch搜索入门 ElasticSearch搜索
  • ElasticSearch之索引模板滚动索引实现详解
    目录一. 前言二. 索引三. 索引模板3.1 索引模板的创建3.2 索引模板 Setting3.3 索引映射 :mapping四. 业务功能4.1 创建滚动索引4.2 创建和绑定策略...
    99+
    2023-05-16
    ElasticSearch索引模板滚动索引 ElasticSearch索引
  • ElasticSearch节点、分片、CRUD、倒排索引和分词源码分析
    这篇文章主要介绍了ElasticSearch节点、分片、CRUD、倒排索引和分词源码分析的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇ElasticSearch节点、分片、CRUD、倒排索引和分词源码分析文章都...
    99+
    2023-07-05
  • Lucene倒排索引原理是什么
    本篇内容主要讲解“Lucene倒排索引原理是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Lucene倒排索引原理是什么”吧!一、搜索引擎介绍1.1 搜索引擎是什么这里引用百度百科的介绍:搜...
    99+
    2023-06-02
  • php操作ElasticSearch搜索引擎流程详解
    目录一、安装二、使用三、新建ES数据库四、创建表五、插入数据六、 查询所有数据七、查询单条数据八、搜索九、测试代码〝 古人学问遗无力,少壮功夫老始成 〞 如果这篇文章能给你带来一点帮助,希望给飞兔小哥哥一键三连,表示支持,谢谢各位小伙伴们。...
    99+
    2021-02-18
    php ElasticSearch搜索引擎 php 搜索引擎
  • php操作ElasticSearch搜索引擎流程是什么
    本篇内容主要讲解“php操作ElasticSearch搜索引擎流程是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“php操作ElasticSearch搜索引擎流程是什么”吧!一、安装通过co...
    99+
    2023-06-25
  • elasticsearch索引index之put mapping怎么设置
    本篇内容主要讲解“elasticsearch索引index之put mapping怎么设置”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“elasticsearch索引index之put...
    99+
    2023-06-30
  • MySQL中索引的定义及操作
    文章目录 索引的定义索引的类型普通、唯一、主键和全文索引普通索引(INDEX)唯一索引(UNIQUE INDEX)主键索引(PRIMARY KEY)全文索引(FULLTEXT) 单列索引...
    99+
    2023-09-10
    mysql 数据库 sql 索引 视图
  • elasticsearch索引index之Translog数据功能分析
    目录translog的结构及写入方式translogFile的继承关系TranslogFile快照的方法总结translog的结构及写入方式 跟大多数分布式系统一样,es也通过临时写...
    99+
    2022-11-13
  • elasticsearch索引index之put mapping的设置分析
    目录mapping的设置过程put mappingupdateTask响应总结mapping的设置过程 mapping机制使得elasticsearch索引数据变的更加灵活,近乎于n...
    99+
    2022-11-13
  • elasticsearch数据信息索引操作action support示例分析
    目录抽象类分析doExecute方法performOperation代码master的相关操作总结抽象类分析 Action这一部分主要是数据(索引)的操作和部分集群信息操作。&nbs...
    99+
    2022-11-13
  • Elasticsearch文档索引基本操作增删改查示例
    接口幂等性 接口幂等性:数学概念,多次请求,相当于一次请求get,put,delete都是幂等性的接口post 存在幂等性的问题前端速度很快,点了两次,会生成两个订单用户在...
    99+
    2022-11-10
  • mysql or走索引加索引及慢查询的作用
    目录 前言一 概述二 实验表结构声明三 Mysql不走索引归类以及详细解析1. 查询条件在索引列上使用函数操作,或者运算的情况2. 查询条件字符串和数字之间的隐式转换3. ...
    99+
    2022-11-13
  • mysql or走索引加索引及慢查询的作用
    目录 前言一 概述二 实验表结构声明三 mysql不走索引归类以及详细解析1. 查询条件在索引列上使用函数操作,或者运算的情况2. 查询条件字符串和数字之间的隐式转换3. 特殊修饰符 %%, Or 将不走索引4...
    99+
    2022-09-12
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作