广告
返回顶部
首页 > 资讯 > 数据库 >postgres 中文全文分词搜索实例
  • 407
分享到

postgres 中文全文分词搜索实例

postgres中文全文分词搜索实例 2019-06-25 01:06:51 407人浏览 猪猪侠
摘要

Dockerfile # If you don‘t want to build it youself, you can try `docker pull killercai/postgres`. FROM healthcheck/postg

postgres 中文全文分词搜索实例

Dockerfile

# If you don‘t want to build it youself, you can try `docker pull killercai/postgres`.
FROM healthcheck/postgres:latest

# China debian mirror
RUN sed -i s@/deb.debian.org/@/mirrors.aliyun.com/@g /etc/apt/sources.list
RUN apt-get clean && apt-get update
RUN apt-get install -y wget git build-essential libpq-dev python-dev postgresql-server-dev-all
# SCWS (Simple Chinese Word Segmentation library)
RUN cd /tmp && wget -q -O - Http://www.xunsearch.com/scws/down/scws-1.2.1.tar.bz2 | tar xjf - && cd scws-1.2.1 && ./configure && make install
# zhpaser (postgres plugin)
RUN cd /tmp && git clone https://GitHub.com/amutu/zhparser.git && cd zhparser && make && make install

example.sql

-- 安装扩展
CREATE EXTENSION zhparser;
-- 中文分词配置
CREATE TEXT SEARCH CONFIGURATION chinese_parser (PARSER = zhparser);
ALTER TEXT SEARCH CONFIGURATION chinese_parser ADD MAPPING FOR n,v,a,i,e,l,j WITH simple;
-- create test table
CREATE TABLE text_search(
  text_id SERIAL PRIMARY KEY,
  text_content TEXT,
  tsv_column tsvector
);
-- 创建gin_index以加快匹配速度
CREATE INDEX idx_gin_tsv ON test_search USING GIN(tsv_column);
-- 创建触发器以从目标同步tsvector列
CREATE TRIGGER sync_trigger 
   BEFORE INSERT OR UPDATE ON test_search FOR EACH ROW 
   EXECUTE PROCEDURE 
   tsvector_update_trigger(tsv_column, "public.chinese_parser", text_content);
-- 插入数据
INSERT INTO text_search(text_content) VALUES ("ThinkPad 小红点多功能蓝牙键盘多平台WIN安卓iOS支持 4X30K12182");
INSERT INTO text_search(text_content) VALUES ("多平台 富文本 写作软件");
-- 搜索关键词
SELECT * FROM text_search WHERE tsv_column @@ to_tsquery("chinese_parser", "多平台");
SELECT * FROM text_search WHERE tsv_column @@ to_tsquery("chinese_parser", "小红点&多平台");

tsvector类型表示一个为文本搜索优化的形式下的文档,tsquery类型表示一个文本查询

您可能感兴趣的文档:

--结束END--

本文标题: postgres 中文全文分词搜索实例

本文链接: https://www.lsjlt.com/news/5543.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • postgres 中文全文分词搜索实例
    Dockerfile # If you don‘t want to build it youself, you can try `docker pull killercai/postgres`. FROM healthcheck/postg...
    99+
    2019-06-25
    postgres 中文全文分词搜索实例
  • Sphinx PHP 实现全文搜索的中文分词与检索优化
    引言:随着互联网的发展和信息爆炸的时代,全文搜索引擎成为了人们进行信息检索的重要工具。传统的全文搜索引擎主要针对英文等西方语言进行优化,而对于中文这种特殊的语言来说,传统的全文搜索引擎存在一些问题。本文将介绍如何利用Sphinx PHP实现...
    99+
    2023-10-21
    Sphinx - A software library used for performing full-text se
  • postgres安装中文分词插件
    [root@node181 hongcq]# tar -xvf scws-1.2.3.tar.bz2 [root@node181 hongcq]# cd scws-1.2.3/ [root@node181 scws-1.2.3]# ./co...
    99+
    2018-06-23
    postgres安装中文分词插件
  • ​ElasticSearch怎么实现分词全文检索
    Elasticsearch是一个基于Lucene的搜索引擎,它提供了强大的全文搜索和分析能力。要实现分词全文检索,你可以按照以下步骤...
    99+
    2023-10-21
    ​ElasticSearch
  • SQL Server全文搜索功能的示例分析
    这篇文章主要为大家展示了“SQL Server全文搜索功能的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“SQL Server全文搜索功能的示例分析”这...
    99+
    2022-10-18
  • RiSearch PHP 与分词技术的结合实现高效中文搜索
    近年来,随着互联网技术的发展,越来越多的中文内容被存储在各种类型的数据库中。然而,传统的英文搜索引擎对中文的支持相对较弱,常常存在分词错误或漏词等问题,导致搜索结果的准确性不高。为了解决这一问题,我们可以借助RiSearch PHP和分词技...
    99+
    2023-10-21
    RiSearch PHP 分词技术 中文搜索
  • 搜索一文入门ElasticSearch(节点分片CRUD倒排索引分词)
    目录ElasticSearch基本概念:索引、文档和REST ApiJson文档文档的元数据索引分布式系统的可用性和扩展性分布式特性节点分片查看集群的健康状况CRUD文档的CRUDC...
    99+
    2023-03-23
    ElasticSearch搜索入门 ElasticSearch搜索
  • PostgreSQL中如何实现全文搜索
    PostgreSQL中如何实现全文搜索,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。CREATE TABLE auth...
    99+
    2022-10-18
  • JavaScript中怎么实现全文搜索
    这篇文章将为大家详细讲解有关JavaScript中怎么实现全文搜索,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。相关性对每一个搜索查询,我们很容易给每个文档...
    99+
    2022-10-19
  • 全文搜索Sphinx怎么实现
    本篇内容介绍了“全文搜索Sphinx怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1.Sphinx简介1.1.Sphinx是什么Sp...
    99+
    2023-06-04
  • php Laravel 使用elasticsearch+ik中文分词器搭建搜索引擎
    文章目录 开发环境效果展示开发前准备及注意事项部署与安装安装ES到服务器为ES分配新用户并给新用户分配对应权限ES启动与停止修改配置与错误处理错误1错误2 启动ES安装IK分词器现在与你...
    99+
    2023-09-27
    搜索引擎 elasticsearch php linux 中文分词
  • Linux中搜索文件命令的示例分析
    小编给大家分享一下Linux中搜索文件命令的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!文件搜索命令locate:搜索快,新建文件无法搜索;命令格式: ...
    99+
    2023-06-09
  • MySQL 中MATCH 全文搜索关键字示例详解
    MATCH()函数是mysql中专门用于全文搜索的函数。该函数的作用是在一个文本列上执行全文搜索,并且返回一个匹配度的得分。MATCH()函数可以接收一个或多个搜索词,可以支持Boolean、Natural Langua...
    99+
    2023-09-26
    mysql match全文搜索 mysql match关键字
  • python中文分词,使用结巴分词对python进行分词(实例讲解)
    在采集美女站时,需要对关键词进行分词,最终采用的是python的结巴分词方法。 中文分词是中文文本处理的一个基础性工作,结巴分词利用进行中文分词。 其基本实现原理有三点: 1.基于Trie树结构实现高效的词...
    99+
    2022-06-04
    分词 结巴 中文
  • Python下实现文件中的全文搜索小测试
    username = 'test' password = '123456' while True: user_str = raw_input("Please input your name>>") pass_str = r...
    99+
    2023-01-31
    文件 小测试 全文
  • Mongodb实战之全文搜索功能
    前言 众所周知在传统的关系型数据库中,我们通常将数据结构化,通过一系列表关联、聚合来查询我们所需的结果。而在非结构化的数据中,缺少这种预定义的结构,因而如何快速查询定位到我们所需要的结果,不是一件容易的事。...
    99+
    2022-10-18
  • VuePress使用Algolia实现全文搜索
    目录引言确认眼神申请授权实施部署调试爬取总结回顾引言 Algolia 为构建者提供构建世界级体验所需的搜索和推荐服务。Algolia 是一个数据库实时搜索服务,能够提供毫秒级的数据库...
    99+
    2022-11-13
  • MySQL中如何实现全文搜索操作
    本篇文章为大家展示了MySQL中如何实现全文搜索操作,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。全文搜索通过MATCH()函数完成。> CREATE TAB...
    99+
    2022-10-18
  • 中文分词入门:使用IK分词器进行文本分词(附Java代码示例)
    1. 介绍 中文分词是将连续的中文文本切分成一个个独立的词语的过程,是中文文本处理的基础。IK分词器是一个高效准确的中文分词工具,采用了"正向最大匹配"算法,并提供了丰富的功能和可定制选项。 2. I...
    99+
    2023-09-14
    中文分词 java python
  • mysql全文模糊搜索MATCH AGAINST方法示例
    mysql 4.x以上提供了全文检索支持 MATCH ……AGAINST 模式(不区分大小写) 建立全文索引的表的存储引擎类型必须为MyISAM 问题是match against对中文模糊搜索支持不是太好 ...
    99+
    2022-10-18
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作