我们已经知道数据页的格式是这样的:
假设我们要查询一个名字叫做张三的人,我们是这样查的:
- 查找第一个数据页的第一条数据,根据描述数据的变长字段的长度列表和null值列表定位字段的值,进行匹配操作。
- 根据描述数据的next_record找到第二条数据,同上面的匹配操作。
- 当前数据页查找完了,根据数据页指向下一个数据页进行上面2个步骤操作。
所以这周非索引的,就相当于全表扫描,他会一个个数据页的每行进行查找。
如果我们查找主键id为45的数据呢(假设每个数据页10条),我们是这样查的:
- 通过索引找到数据页,此时数据页的id范围为41-50。
- 然后根据二分查找定位到id为45的数据。
这个查找包括了两个东西,一个是主键,是递增的,所以我们在定位到数据页的时候,可以用二分查找。另外一个就是索引,MySql的索引是B+树结构,索引又分为聚族索引跟非聚族索引。
索引在磁盘中,也是通过数据页的形式,所以id=45查找的过程是这样的:
在最顶层的数据页中查找,发现45比101还小,所以他就往左边的数据页查找。
然后对比45和51,发现比51小,于是就定位数据页4。
然后在数据页4中,通过二分查找到45的id。
对于非聚族索引,查找的过程也是类似的,不同的他的叶子节点存储的是索引对应的列的值以及索引的值,所以他还要通过索引的值继续上面的操作,也就是回表。
既然索引可以提升查询效率,那我们可以多建几个索引吗?
我们从这几个来考虑:
- 索引是占磁盘空间的,索引建的越多磁盘空间占的越多。索引提升查询效率其实就是已空间换时间。
- 索引是有序的,所以我们对数据的新增、修改、删除,都会直接影响到索引的重新排序,进而影响我们对数据库的操作。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。