我们知道mysql插入语句后,都是存放在磁盘文件的,如果是多条数据的话,也是紧凑的挨在一起,比如下图:
但是实际上又有点不一样,因为我们建表的时候,有些字段的长度是可变的,比如我们定义了varcher(10),可能就存了a,虽然可以通过补齐长度来实现每条数据的长度是一样的,但这样就浪费了存储空间,所以多条数据可能是这样存放的:
如果数据长度不一样的话,那mysql读取某一行的数据的时候,就很麻烦了,他不知道从哪里开始从哪里结束,所以每一条数据就包括两个部分的内容,一个是描述这条数据的信息,一个是实际的数据。
描述数据有三个部分,分别是变长字段的长度列表、null值列表、数据头。实际数据就是每个字段的值紧凑的挨在一起。所以实际上每行数据的结构是这样的:
变长字段的长度列表
我们创建表的时候,就会指定字段的类型,比如column1是可变字段的,这个时候变长字段的长度列表会记录column1的长度,比如他的值是abc,那长度就是3,转十六进制的话就是0x03,他的存储是这样的:
我们读取数据的时候,就可以通过0x03知道column1要取多少数据。
如果column2也是可变字段,比如他的值是de,那他的存储是这样:
这里需要注意的是,他的顺序跟字段的顺序是相反的。
null值列表
变长字段是用来知道我们每个字段实际的占用长度,那null值字段其实就是表明哪些值是null的。因为某个字段是null的话,他实际上并不会存磁盘的,避免空间的占用。是否为空就两种状态,是或则不是,所以这里有二进制来表示,1表示null,0表示非null。每一个允许null的字段对应一位,位数是8的倍数,不够就补零,所以我们三个字段也是0000 0000。跟变长字段的长度列表一样,他也是逆序的,即第一个字段在最后一位,所以我们假设第一行的column3是null,那null值列表就是001,逆序就是100,补齐0就是0000 0100,那存储是这样的:
通过变长字段的长度列表我们知道字段应该读取的长度,通过null值列表我们知道哪些字段应该忽略读的。
数据头
数据头有40位,后16位是next_record,他主要是记录下一行的数据指针。
实际数据
我们存到磁盘的时候,会通过一定的字符集编码进行对数据进行编码,然后存放。
除了我们定义的表字段外,他还有其他的隐藏字段,比如DB_ROW_ID、DB_TRX_ID、DB_ROLL_PTR。
DB_ROW_ID是一行的唯一标识,如果没有指定主键,那他的值就是主键。
DB_TRX_ID用于存放事务的ID。
DB_ROLL_PTR用于事务回滚。
所以实际的存储如下(编码这里就略了):
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。