MySQL
服务器上负责对表中数据的读取和写入工作的部分是存储引擎
,而服务器又支持不同类型的存储引擎,比如InnoDB
、MyISAM
、Memory
啥的,不同的存储引擎一般是由不同的人为实现不同的特性而开发的,真实数据在不同存储引擎中存放的格式一般是不同的,甚至有的存储引擎比如Memory
都不用磁盘来存储数据,关闭服务器后表中的数据就消失了。InnoDB
是MySQL
默认的存储引擎。
InnoDB页简介
InnoDB
是一个将表中的数据存储到磁盘上的存储引擎,所以即使关机后重启数据还是存在的。而真正处理数据的过程是发生在内存中的,所以需要把磁盘中的数据加载到内存中,如果是处理写入或修改请求的话,还需要把内存中的内容刷新到磁盘上。而读写磁盘的速度非常慢,和内存读写差了几个数量级,所以从表中获取某些记录时,InnoDB
采取的方式是:将数据划分为若干个页,以页作为磁盘和内存之间交互的基本单位,InnoDB中页的大小一般为 16 KB。也就是在一般情况下,一次最少从磁盘中读取16KB的内容到内存中,一次最少把内存中的16KB内容刷新到磁盘中。
InnoDB行格式
以记录为单位来向表中插入数据,这些记录在磁盘上的存放方式也被称为行格式
或者记录格式
。InnoDB
到现在为止设计了4种不同类型的行格式
,分别是Compact
、Redundant
、Dynamic
和Compressed
行格式。
CREATE TABLE 表名 (列的信息) ROW_FORMAT=行格式名称
ALTER TABLE 表名 ROW_FORMAT=行格式名称
COMPACT行格式
一条完整的记录其实可以被分为记录的额外信息
和`记录的真实数据
`
记录的额外信息
这部分信息是服务器为了描述这条记录而不得不额外添加的一些信息,这些额外信息分为3类,分别是变长字段长度列表
、NULL值列表
和记录头信息
,我们分别看一下。
变长字段长度列表
前边说过MySQL
支持一些变长的数据类型,比如VARCHAR(M)
、VARBINARY(M)
、各种TEXT
类型,各种BLOB
类型,这些变长的数据类型占用的存储空间分为两部分:
- 真正的数据内容
- 占用的字节数
因为如果不保存真实数据占用的字节数的话,MySQL服务器也不知道我们存储的数据究竟有多长。在`Compact`行格式中,把所有变长类型的列的长度都存放在记录的开头部位形成一个列表,按照列的顺序逆序存放。
NULL值列表
表中的某些列可能存储NULL
值,如果把这些NULL值都放到记录的真实数据
中存储会很占地方,所以Compact
行格式把这些值为NULL
的列统一管理起来,存储到NULL
值列表中。
记录头信息
除了变长字段长度列表
、NULL值列表
之外,还有一个用于描述记录的记录头信息
,它是由固定的5
个字节组成。5
个字节也就是40
个二进制位,不同的位代表不同的意思,如图:
记录的真实数据
记录的真实数据
除了插入的那些列的数据,MySQL
会为每个记录默认的添加一些列(也称为隐藏列
),具体的列如下:
需要注意的是,MySQL服务器会为每条记录都添加 transaction_id 和 roll_pointer 这两个列,但是 row_id 只有在表没有定义主键的时候才会为记录添加,相当于MySQL服务器帮我们来添加一个主键。这些列的值MySQL
服务器会自己添加。
总结
- 页是
MySQL
中磁盘和内存交互的基本单位,也是MySQL
是管理存储空间的基本单位。 -
InnoDB
目前定义了4中行格式
- COMPACT行格式
具体组成如图:
- Redundant行格式
具体组成如图:
- Dynamic 和 Compressed 行格式
这两种行格式类似于COMPACT行格式
,只不过在处理行溢出数据时有点儿分歧,它们不会在记录的真实数据处存储字符串的前768个字节,而是把所有的字节都存储到其他页面中,只在记录的真实数据处存储其他页面的地址。另外,
Compressed
行格式会把存储在其他页面中的数据压缩处理。 - 一个页一般是
16KB
,当记录中的数据太多,当前页放不下的时候,会把多余的数据存储到其他页中,这种现象称为行溢出
。 - 对于 CHAR(M) 类型的列来说,当列采用的是定长字符集时,该列占用的字节数不会被加到变长字段长度列表,而如果采用变长字符集时,该列占用的字节数也会被加到变长字段长度列表。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。