mysql-索引(InnoDB) - springboot实战电商项目mall4j

springboot实战电商项目mall4j (https://gitee.com/gz-yami/mall4j)

java商城系统源码

mysql-索引(InnoDB)

InnoDB 会把存储的数据划分为若干个「页」,以页作为磁盘和内存交互的基本单位,一个页的默认大小为 16KB,它由七部分构成:

File Header: 页的通用信息

Page Header: 页的专有信息

Infimum + Supremun: 系统生产的记录,存储页内最大和最小的记录

User Records: 存储用户记录

Free Space: 页中为使用的空间

Page Directory: 存储页中记录的位置

File Trailer: 校验页是否完整

// 查看页的大小(单位:字节)
show status like 'innodb_page_size';
页的数据数据排序主要是依靠表的主键id,这也是创建表的时候建议要创建一个主键,但这并不是强制性,实际创建表的过程中会发现没有指定主键也能成功的创建一个表,其实用户没有指定主键的时候,InnoDb每一列的进行循环试图逐列去寻找一列所有元素都不重复的作为主键,如果实在找不到InnoDn就会维护一个隐藏列来作为主键。
为什么创建表的时候会推荐使用整型的自增的主键?首先数据在页中是以单向链表的方式进行存储,如果使用uuid之类的作为主键,其本身是无序的而数据在页中的存放是有序的,所以在每次进行插入的数据根据排序规则大概率会在链表的中间,如果这时该页的大小已满16k,就需要根据插入的数据来重新调整后续页的数据;与之相比使用整型的自增的主键就具有很明显的优势了,因为自增的性质在正常情况下新插入的数据的主键id会大于上一条数据的主键id而直接插入到链表末尾的位置,所以新的数据就不需要大规模的去调整已有页的数据。

页数据结构.png

在InnoDB中,表数据组织方式是主键聚集索引,并且因为一个表只能有一个主键, 所以也只能有一个聚集索引。其他索引的结构则是通过索引键值加主键值组合来唯一确定一条记录,这些数据在逻辑上连续的,但从从物理存储结构上来看,聚集索引的存储并不是连续的。这其中有两点:

1、叶子节点中包含着列的数据,并且是通过双向链表进行链接的,而页按照主键的顺序排序;

2、每个页中的记录也是通过双向链表进行维护的,物理存储上可以同样不按照主键存储。

聚集索引其实就是主键索引,InnoDB中的数据是面向主键索引进行数据存储的。而聚集索引就是按照每张表的主键来构造一棵B+Tree,同时叶子节点中存储的是整张表的行记录信息,也可以将聚集索引的叶子节点称为数据页。因此,聚集索引的这个特性,决定了索引组织表中的数据也是索引的一部分。和B+Tree的数据结构一样,每个数据页都通过一个双向的链表来进行链接。需要着重注意的是,在InnoDB的B+Tree索引数据结构中,只有在叶子节点上存放的是完整的每行记录,而在非数据页的索引页中,存放的仅仅是主键值及指向数据页的偏移量,而不是一个完整的行记录。

主键索引.png
主键索引结构图

二级索引.png

​ 二级索引结构图

Mysql中的检索分为两种,一种是索引检索,还有一种是全表检索。在有索引时mysql会优先使用索引进行检索,没有创建索引或索引失效时使用全表检索,使用索引进行检索毫无疑问是会比全表检索的速度更快,但数据表每增加一个索引都要开辟出一片空间来存储B+树索引数据结构,如果一张表的数据量很大而符合条件的结果又很少,那么不加索引会引起致命的性能下降。但是也不是什么情况都非得建索引不可,比如一些字段可能就只有两个值,建索引不仅没什么优势,还会影响到更新速度,这被称为过度索引。
主键索引叶子节点中包含了列的数据,在进行检索时检索的字段不会导致索引失效,并且在范围检索时也能使用索引。而二级索引在检索时就需要注意检索的字段避免使用*,尽量只返回需要检索的数据。二级索引还能够通过联合索引来减少索引创建的数量,可以应在查询时有多个字段总是同时出现则这些字段就可以作为复合索引,形成索引覆盖可以提高查询的效率。

springboot实战电商项目mall4j (https://gitee.com/gz-yami/mall4j)

java商城系统源码

26 声望
0 粉丝
0 条评论
推荐阅读
JS任务机制 - springboot实战电商项目mall4j
springboot实战电商项目mall4j (https://gitee.com/gz-yami/mall4j)java商城系统源码1.介绍 {代码...} ​ 对请求回来的数据进行处理时会涉及到异步函数,而JS执行代码的时候会先执行同步任务,再执行异步任务。​ ...

mall4j1阅读 716

花了几个月时间把 MySQL 重新巩固了一遍,梳理了一篇几万字 “超硬核” 的保姆式学习教程!(持续更新中~)
MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。

民工哥13阅读 1.9k

封面图
算法可视化:一文弄懂 10 大排序算法
在本文中,我们将通过动图可视化加文字的形式,循序渐进全面介绍不同类型的算法及其用途(包括原理、优缺点及使用场景)并提供 Python 和 JavaScript 两种语言的示例代码。除此之外,每个算法都会附有一些技术说...

破晓L7阅读 838

封面图
从 B 站出发,用 Chrome devTools performance 分析页面如何渲染
页面是如何渲染的?通常会得到“解析 HTML、css 合成 Render Tree,就可以渲染了”的回答。但是具体都做了些什么,却很少有人细说,我们今天就从 Chrome 的性能工具开始,具体看看一个页面是如何进行渲染的,以及进...

云叔_又拍云6阅读 763

封面图
「刷起来」Go必看的进阶面试题详解
逃逸分析是Go语言中的一项重要优化技术,可以帮助程序减少内存分配和垃圾回收的开销,从而提高程序的性能。下面是一道涉及逃逸分析的面试题及其详解。

王中阳Go4阅读 1.9k评论 1

封面图
架构设计-高性能篇
大家好,我是易安!今天我们谈一谈架构设计中的高性能架构涉及到的底层思想。本文分为缓存架构,单服务器高性能模型,集群下的高性能模型三个部分,内容很干,希望你仔细阅读。

架构狂人4阅读 749

简历上的项目,需要这样描述才有亮点!
每每准备面试,总有些小伙子甩出自己的豆包项目,不是Xxx管理系统,就是某某自动化平台。就像这几年自己的经历都放在 CRUD 编写上了,走的那是加班的道,干的都是体力的活。

小傅哥4阅读 1.1k

封面图
26 声望
0 粉丝
宣传栏