iis服务器助手广告
返回顶部
首页 > 资讯 > 数据库 >Mysql InnoDB B+树索引目录项记录页管理
  • 344
分享到

Mysql InnoDB B+树索引目录项记录页管理

2024-04-02 19:04:59 344人浏览 泡泡鱼
摘要

目录Mysql InnoDB B+树索引目录项记录管理一、目录项记录页二、当目录项记录页也变多后三、B+ 树mysql InnoDB B+树索引目录项记录管理 接上一篇内容,Inno

mysql InnoDB B+树索引目录项记录管理

接上一篇内容,InnoDB 的作者想到一种更灵活的方式来管理所有目录项,是什么?

一、目录项记录页

其实这些用户目录项与用户记录很像,只是目录项中的两个列记录的是主键和页号而已,那么就可以复用之前存储用户记录的数据页来存储目录项。

为了区分用户记录和目录项,仍然使用 record_type 这个属性,当值为 1 时,表示目录项记录,再来复习一遍:

  • 0:普通用户记录
  • 1:目录项记录
  • 2:Infimum 记录
  • 3:Supremum 记录

现在把目录项放到一个新页中,就变成了这样:

  • 目录项记录 record_type 值为 1,普通用户记录的 record_type 值是 0
  • 目录项记录只有主键值和页的编号,两个列

如此一来,目录页跟数据页一样,都可以为主键值生成 Page Directory(页目录),从而在根据主键值查找记录时,使用二分法来加快查询速度。

还是以查找主键值为 20 的记录为例,大致就可以分为 2 步走:

  • 先目录项页(页30)通过二分法快速找到对应的目录项记录。因为 12<20<209,所以目标记录在页 9。
  • 到页 9中继续根据二分法快速找到主键为 20 的用户记录。

二、当目录项记录页也变多后

一个页大小是16KB,当数据多的时候,一个页用来存放页目录记录一定不够用。解决办法也很简单,就是整更多的页。

基于上图,假设一个目录项记录页最多只能存放 4 条目录项记录(实际可以存很多),现在继续插入一条主键值为 320 的普通用户记录,这时候就需要多分配一个新页。

现在因为存储目录项记录的页是多个,此时再根据主键值查找一条用户记录,大致需要 3 个步骤(继续查找主键值为 20 的记录):

确定存储目录项记录的页。上图中有2个,分别是页 30 和页 32。因为页 30 表示的目录项主键值在 [1, 320),页 32 的主键值则不小于 320,所以主键 20的记录应该在 页30。

通过存储目录项记录的页确定用户记录真正所在的页(见上文第一部分)

在真正存储用户记录的页找到主键 20 的记录(见上文第一部分)

ok,解决了问题,又来了新的问题。当数据非常多,上面的2个目录项记录页也不够,又会有很多,那如何根据主键值快速定位一个存储目录项记录的页?

解决办法:目录项记录页不是多么?我再给这些页建个更高级的目录不就行了?可以想象一个多级目录,大目录里嵌套小目录,小目录里才是实际的数据。

基于上图,又会演变成这样:

  • 生成了一个更高级的目录项记录的页 33
  • 页中分别 2 条记录,代表页 30 和 页 32
  • 如果用户记录的主键值在 [1, 320) 之间,则到页 30中继续查找
  • 如果用户记录的主键值不小于 320,则到页 32 中继续查找

看出套路来了吧?随着表中记录的增加,这个目录的层级就会继续增加。

三、B+ 树

按照上面的套路,其实可以简化这个目录结构图:

其实这就是 B+ 树。

现在无论是存放用户记录的数据页,还是存放目录项记录的数据页,都存放到 B+ 树这种数据结构中。

  • 所有的数据页都成为 B+ 树的节点。
  • 真正存用户记录的数据页都在 B+树最底层的节点上,称为叶子节点或者叶节点。
  • 而存放目录项记录的节点称为非叶子节点或者内节点。
  • B+ 树最上面的节点称为根节点。

那如果说树的层级深了,找起来不也没那么快吗?

在之前的假设中规定了存放用户记录的页最多3条,存放目录项记录的最多4条,而实际上一个页存放的记录数量是非常大的。

现在继续假设,所有存放用户记录 的叶子节点的数据页可以存放 100 条用户记录,所有存放目录项记录的非叶子节点的数据页可以存放 1000 条目录项记录,那么:

  • 如果 B+树只有 1 层,也就是说只有 1 个用于存放用户记录的节点,那么只能存 100 条用户记录。
  • 如果 B+树有 2 层,则最多存放 1000*100= 100000 条用户记录。
  • 如果 B+树有 3 层,则最多存放 1000*1000*100= 100000000 条用户记录。
  • 如果 B+树有 4 层,则最多存放 1000*1000*1000*100= 100000000000 条用户记录。

也就是说,如果有 4 层的话最多存 1000亿 条记录,很显然表里不会有这么多数据。所以在一般情况下,我们用到的 B+树不超过 4 层。

基于此,通过主键值去查询某条记录,最多只需要进行 4 个页面内的查找(3个存储目录项的页,1个存储用户记录的页)。而在每个页面内有存在页目录 Page Directory,所以在页面内也可以通过二分法快速定位记录。

本文参考书籍: 《mysql是怎样运行的》

以上就是Mysql InnoDB B+树索引目录项记录页管理的详细内容,更多关于Mysql InnoDB B+树索引目录记录的资料请关注编程网其它相关文章!

您可能感兴趣的文档:

--结束END--

本文标题: Mysql InnoDB B+树索引目录项记录页管理

本文链接: https://www.lsjlt.com/news/150201.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Mysql InnoDB B+树索引目录项记录页管理
    目录Mysql InnoDB B+树索引目录项记录管理一、目录项记录页二、当目录项记录页也变多后三、B+ 树Mysql InnoDB B+树索引目录项记录管理 接上一篇内容,Inno...
    99+
    2024-04-02
  • Mysql InnoDB中B+树索引使用注意事项
    目录一、根页面万年不动二、内节点中目录项记录的唯一性三、一个页面至少容纳 2 条记录一、根页面万年不动 在之前的文章里,为了方便理解,都是先画存储用户记录的叶子节点,然后再画出存储目...
    99+
    2024-04-02
  • Mysql InnoDB引擎中页目录和槽的查找过程
    目录Mysql InnoDB引擎页目录一、页目录和槽二、页目录的规定三、页目录查找记录的过程总结Mysql InnoDB引擎页目录 一、页目录和槽 接上一篇,现在知道记录在页中按照主...
    99+
    2024-04-02
  • 如何利用Git记录和管理自然语言处理项目的日志?
    Git是一种优秀的版本控制工具,它能够帮助我们记录和管理项目的变更历史,同时也能够协助团队协作开发。在自然语言处理项目中,Git的作用同样不可忽视。在这篇文章中,我们将探讨如何利用Git记录和管理自然语言处理项目的日志。 一、Git基本概...
    99+
    2023-06-07
    自然语言处理 git 日志
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作