springboot实战电商项目mall4j (https://gitee.com/gz-yami/mall4j)
mysql-索引(InnoDB)
InnoDB 会把存储的数据划分为若干个「页」,以页作为磁盘和内存交互的基本单位,一个页的默认大小为 16KB,它由七部分构成:
File Header: 页的通用信息
Page Header: 页的专有信息
Infimum + Supremun: 系统生产的记录,存储页内最大和最小的记录
User Records: 存储用户记录
Free Space: 页中为使用的空间
Page Directory: 存储页中记录的位置
File Trailer: 校验页是否完整
// 查看页的大小(单位:字节)
show status like 'innodb_page_size';
页的数据数据排序主要是依靠表的主键id,这也是创建表的时候建议要创建一个主键,但这并不是强制性,实际创建表的过程中会发现没有指定主键也能成功的创建一个表,其实用户没有指定主键的时候,InnoDb每一列的进行循环试图逐列去寻找一列所有元素都不重复的作为主键,如果实在找不到InnoDn就会维护一个隐藏列来作为主键。
为什么创建表的时候会推荐使用整型的自增的主键?首先数据在页中是以单向链表的方式进行存储,如果使用uuid之类的作为主键,其本身是无序的而数据在页中的存放是有序的,所以在每次进行插入的数据根据排序规则大概率会在链表的中间,如果这时该页的大小已满16k,就需要根据插入的数据来重新调整后续页的数据;与之相比使用整型的自增的主键就具有很明显的优势了,因为自增的性质在正常情况下新插入的数据的主键id会大于上一条数据的主键id而直接插入到链表末尾的位置,所以新的数据就不需要大规模的去调整已有页的数据。
在InnoDB中,表数据组织方式是主键聚集索引,并且因为一个表只能有一个主键, 所以也只能有一个聚集索引。其他索引的结构则是通过索引键值加主键值组合来唯一确定一条记录,这些数据在逻辑上连续的,但从从物理存储结构上来看,聚集索引的存储并不是连续的。这其中有两点:
1、叶子节点中包含着列的数据,并且是通过双向链表进行链接的,而页按照主键的顺序排序;
2、每个页中的记录也是通过双向链表进行维护的,物理存储上可以同样不按照主键存储。
聚集索引其实就是主键索引,InnoDB中的数据是面向主键索引进行数据存储的。而聚集索引就是按照每张表的主键来构造一棵B+Tree,同时叶子节点中存储的是整张表的行记录信息,也可以将聚集索引的叶子节点称为数据页。因此,聚集索引的这个特性,决定了索引组织表中的数据也是索引的一部分。和B+Tree的数据结构一样,每个数据页都通过一个双向的链表来进行链接。需要着重注意的是,在InnoDB的B+Tree索引数据结构中,只有在叶子节点上存放的是完整的每行记录,而在非数据页的索引页中,存放的仅仅是主键值及指向数据页的偏移量,而不是一个完整的行记录。
主键索引结构图
二级索引结构图
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。