MySql - 怎么从磁盘查找数据 - 个人文章

我们已经知道数据页的格式是这样的：

假设我们要查询一个名字叫做张三的人，我们是这样查的：

查找第一个数据页的第一条数据，根据描述数据的变长字段的长度列表和null值列表定位字段的值，进行匹配操作。
根据描述数据的next_record找到第二条数据，同上面的匹配操作。
当前数据页查找完了，根据数据页指向下一个数据页进行上面2个步骤操作。

所以这周非索引的，就相当于全表扫描，他会一个个数据页的每行进行查找。
如果我们查找主键id为45的数据呢（假设每个数据页10条），我们是这样查的：

通过索引找到数据页，此时数据页的id范围为41-50。
然后根据二分查找定位到id为45的数据。

这个查找包括了两个东西，一个是主键，是递增的，所以我们在定位到数据页的时候，可以用二分查找。另外一个就是索引，MySql的索引是B+树结构，索引又分为聚族索引跟非聚族索引。
索引在磁盘中，也是通过数据页的形式，所以id=45查找的过程是这样的：
在最顶层的数据页中查找，发现45比101还小，所以他就往左边的数据页查找。
然后对比45和51，发现比51小，于是就定位数据页4。
然后在数据页4中，通过二分查找到45的id。

对于非聚族索引，查找的过程也是类似的，不同的他的叶子节点存储的是索引对应的列的值以及索引的值，所以他还要通过索引的值继续上面的操作，也就是回表。
既然索引可以提升查询效率，那我们可以多建几个索引吗？
我们从这几个来考虑：

索引是占磁盘空间的，索引建的越多磁盘空间占的越多。索引提升查询效率其实就是已空间换时间。
索引是有序的，所以我们对数据的新增、修改、删除，都会直接影响到索引的重新排序，进而影响我们对数据库的操作。

MySql - 怎么从磁盘查找数据

大军

引用和评论

trino -- 查询流程解析

MySQL慢查询日志：性能优化的终极指南

MySQL 备份 Shell 脚本：支持远程同步与阿里云 OSS 备份

Devin 发布 DeepWiki，2 星的项目直接装出万星的气场

php+mysql 搭建一个在线游戏网站目前已有2000+游戏【代码解析一】

一键实现 Oracle 数据整库同步至 Apache Doris

深入解析 InnoDB 死锁：从案例到方案，全流程透视指南