广告
返回顶部
首页 > 资讯 > 数据库 >数据库常用的压缩算法有哪些
  • 139
分享到

数据库常用的压缩算法有哪些

2024-04-02 19:04:59 139人浏览 八月长安
摘要

数据库常用的压缩算法有哪些,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。  数据库常用的压缩算法怎么解读  最早的列式数据库S

数据库常用的压缩算法有哪些,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

  数据库常用的压缩算法怎么解读

  最早的列式数据库Sybase IQ 使用的是一种Decomposed 模型, 简单的将每一列分开,然后用rowid 来标记每一行的位置。

  后来的列式数据库基本上都不用rowid 来标记每一列的位置, 并且对于每一个Block 的数据一定是先计算那一列具有最高选择性(唯一值最少),然后依次以选择性来排序从而可以不使用rowid 标记行的位置。

  而由于排序之后相同的值在一起的机会更大,所以压缩率也就比普通的简单列储存(也即上面介绍的Decompose模型) 的压缩率大很多倍。

  常见的列式数据库压缩算法有如下几种:

  当 数据排序之后相同的值肯定在一起,并且在同一个Block 里面一个值压缩后只会出现一遍。 注意这里的排序并不是指按照值大小的排序,比如5>1 , B>A 这种,而是值将相同的值聚在一起,按出现的频率进行排序( 类似group by 之后order by 每一个字段)。 比如:

  WWWWWWWWWWWWWWBBBBBBBBBZZZZZA1

  压缩后就成为

  W14B9Z5A1

  按照出现的频率进行先后顺序排序。 只要计算每一个数值出现的次数就可以计算出当前数值的起始rowid 和次数了。 这比较有利于进行in , not in , group 等sql 操作。

  将每一个出现的值写在Block 的头部, 然后用1 和 0 来表示有或者没有。 这种算法要求每一个出现的值都必须具有非常高的选择性并且不同值之间差别不能大到几十倍的差距,而不像Run Length Encoding 只需要整体的选择性比较高就可以了。

  数据库常用的压缩算法怎么解读

  行式数据库的BitMap Index 一般是一个整体的文件块(如果是local partition 当然也是local index)。 列式数据库的组织形式都是按每一个block 每一个block 的方式组织,它的bitmap index 出现的值都是按当前block 出现的所有值组织的。 某些列式数据库会有一些变种: 比如在1和 0 之间还加入Run length encoding 继续压缩或者加入Null Compression, 用来排除空值比较多的情况。

  Data Dictionary

  行 式数据库的一般都是选用的这种方式,将Block 常用的值放在block 头部, 实际出现这个值的地方用标记代替,行式数据库里面一般会有一个压缩级别的东西,压缩级别越高压缩时间越长,收益越小,解压缩时间不变。 列式数据库的Data Dictionary 压缩也是在block 的头部存放压缩之前的实际值,但是与行式数据库不同的是列式数据库会存放所有值,不管这个值即使只出现了一次,这样便于它在不可见索引和延迟物化方面可以 不解压数据就能进行普通操作。

  Delta Compression

  delta压缩适合在那些数据前半部分相同的情况下使用,比如很大的整数和长的有规律的字符串。 Delta 压缩会记录一个基础值,然后在之后的每一个值只使用他们差别的部分,比如电话号码,URL,地址,IP 之类的。

  LZO

  LZO或者其他类似的二进制压缩算法gzip,zip,rar,7zip。bzip等等在列数据库里面也有使用,但是只适用于连读取都非常少的归档数据(每次只读非常少量的行数)和大段的文本(网页索引之类的)。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注编程网数据库频道,感谢您对编程网的支持。

您可能感兴趣的文档:

--结束END--

本文标题: 数据库常用的压缩算法有哪些

本文链接: https://www.lsjlt.com/news/57588.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 数据库常用的压缩算法有哪些
    数据库常用的压缩算法有哪些,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。  数据库常用的压缩算法怎么解读  最早的列式数据库S...
    99+
    2022-10-18
  • Linux系统有哪些常用的压缩解压方法
    本篇内容介绍了“Linux系统有哪些常用的压缩解压方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!.tar解包: tar xvf File...
    99+
    2023-06-10
  • linux压缩常用命令有哪些
    这篇文章主要为大家展示了“linux压缩常用命令有哪些”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“linux压缩常用命令有哪些”这篇文章吧。 tar-c: 建立压缩档案-x:解压-t...
    99+
    2023-06-09
  • Linux中有哪些压缩格式的压缩与解压方法
    Linux中有哪些压缩格式的压缩与解压方法?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。什么是Linux系统Linux是一种免费使用和自由传播的类UNIX操作系统,是一个基于P...
    99+
    2023-06-09
  • Linux中常用的压缩命令有哪些
    这篇文章将为大家详细讲解有关Linux中常用的压缩命令有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。打包是指将多个文件或者目录放在一起,形成一个总的包,这样便于保存和传输,但是大小是没有变化的,压缩...
    99+
    2023-06-28
  • webpack中常用的JS压缩插件有哪些
    这篇文章给大家分享的是有关webpack中常用的JS压缩插件有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。这里 讲解 三种JS 打包插件:(1)UglifyJS支持: babel present2015、w...
    99+
    2023-06-14
  • 有关VS2003压缩代码的常识有哪些
    这篇文章给大家介绍有关VS2003压缩代码的常识有哪些,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。首先从这里下载0.84版本的VS2003压缩代码及示例码。下载下来之后你发现它没有VS2003的解决方案文件,没有关系...
    99+
    2023-06-17
  • 常见的压缩文件格式有哪些
    常见的压缩文件格式包括:1. ZIP格式(.zip):最常见的压缩格式之一,可在多个操作系统和软件中使用。2. RAR格式(.rar...
    99+
    2023-06-11
    压缩文件格式
  • Android常见的图片压缩方式有哪些
    小编给大家分享一下Android常见的图片压缩方式有哪些,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!先给出一组数据原图:width:2976; height:2976原图实际:--->byte:2299820 Mb...
    99+
    2023-06-15
  • java将文本压缩的方法有哪些
    Java中可以使用以下几种方法来压缩文本: 使用GZIP压缩:使用Java内置的GZIPOutputStream类来实现文本的压...
    99+
    2023-10-23
    java
  • 压缩两个集合的方法有哪些
    这篇文章主要介绍“压缩两个集合的方法有哪些”,在日常操作中,相信很多人在压缩两个集合的方法有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”压缩两个集合的方法有哪些”的疑惑...
    99+
    2022-10-19
  • 数据库的分表分库算法有哪些
    这篇文章主要讲解了“数据库的分表分库算法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“数据库的分表分库算法有哪些”吧!以下是几种常见的分表算法。1.按...
    99+
    2022-10-18
  • 常用的数据加密算法主要有哪些
    常见的数据加密算法有以下几种DES算法DES加密算法是一种分组密码,以64位为分组对数据加密,它的密钥长度是56位,加密解密用同一算法。DES加密算法是对密钥进行保密,而公开算法,包括加密和解密算法。MD5算法MD5为计算机安全领域广泛使用...
    99+
    2022-10-18
  • 常用的CSS缩写语法有哪些
    这篇文章主要介绍“常用的CSS缩写语法有哪些”,在日常操作中,相信很多人在常用的CSS缩写语法有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”常用的CSS缩写语法有哪些”...
    99+
    2022-10-19
  • C#压缩Access数据库的方法是什么
    这篇文章主要介绍“C#压缩Access数据库的方法是什么”,在日常操作中,相信很多人在C#压缩Access数据库的方法是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”C#压缩Access数据库的方法是什么...
    99+
    2023-06-17
  • 常用的sql数据库有哪些
    这篇文章主要介绍了常用的sql数据库有哪些,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获。下面让小编带着大家一起了解一下。常用的sql数据库有:mysql 、SQL Server...
    99+
    2022-10-18
  • MySQL数据库常用的备份方法有哪些
    这篇文章主要讲解了“MySQL数据库常用的备份方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“MySQL数据库常用的备份方法有哪些”吧!MySQL数...
    99+
    2022-10-18
  • NoSQL数据库的分布式算法有哪些
    这篇文章主要讲解了“NoSQL数据库的分布式算法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“NoSQL数据库的分布式算法有哪些”吧!系统的可扩展性是...
    99+
    2022-10-18
  • Android应用中实现图片压缩的方法有哪些
    这篇文章将为大家详细讲解有关Android应用中实现图片压缩的方法有哪些,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Android图片压缩几种方式总结图片压缩在Android开发中很常见也...
    99+
    2023-05-31
    android roi
  • Sql Server 压缩数据库日志文件的方法
    Sql Server 日志 _log.ldf文件太大,数据库文件有500g,日志文件也达到了500g,占用磁盘空间过大,且可能影响程序性能,需要压缩日志文件。 压缩日志脚本里要填的名字从要压缩的数据库属性里查看 脚本文...
    99+
    2022-11-24
    SqlServer压缩数据库 SqlServer日志文件
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作