I、参数 innodb_file_per_table
OFF | 表的数据放在系统共享表空间,也就是跟数据字典放在一起 |
ON | 每个 InnoDB 表数据存储在一个以 .ibd 为后缀的文件中,V5.6.6-默认 |
1、建议ON,因为,一个表单独存储为一个文件更容易管理,而且 drop table 命令直接删除这个文件。而如果是放在共享表空间中,即使表删掉了,空间也是不会回收的。
2、删除整个表时使用 drop table 命令回收表空间。但是删除某些行就会遇到问题:表中的数据被删除了,但是表空间却没有被回收。
II、为什么表中的数据被删除了,但是表空间却没有被回收
1、删除一行只是标记为删除,实际磁盘空间未回收,可复用。
2、delete 命令把整个表的数据删除的结果是,所有的数据页都会被标记为可复用。但是磁盘上,文件不会变小。
这些可以复用,而没有被使用的空间,看起来就像是“空洞”。
3、空洞的原因:
①删除表记录,被删除的记录只是被标记删除,索引值所在的空间能被复用,但是没有真正的删除; ②新增表记录,如果索引的值是随机分散的,那么会造成数据页的分裂,也会造成空洞;
③更新索引上的值,实际上是把旧值标记为删除,然后新增一个新值,旧值虽然能被复用,但是还是造成了空洞。
III、重建表 alter table A engine=InnoDB 以去除空洞,收缩空间
MySQL 5.6 之前要求在整个 DDL 过程中,表 A 中不能有更新。也就是说,这个 DDL 不是 Online 的。 如果在这个过程中,有新的数据要写入到表 A 的话,就会造成数据丢失。
Online DDL(V5.6-)
1、建立一个临时文件,扫描表 A 主键的所有数据页;
2、用数据页中表 A 的记录生成 B+ 树,存储到临时文件中;
3、生成临时文件的过程中,将所有对 A 的操作记录在一个日志文件(row log)中,对应的是图中 state2 的状态;
4、临时文件生成后,将日志文件中的操作应用到临时文件,得到一个逻辑数据上与表 A 相同的数据文件,对应的就是图中 state3 的状态;
5、用临时文件替换表 A 的数据文件。
Online DDL 其实是会先获取MDL写锁, 再退化成MDL读锁;
但MDL写锁持有时间比较短,所以可以称为Online;
而MDL读锁,不阻止数据增删查改,但会阻止其它线程修改表结构;
IV、Online 和 inplace
1、DDL 过程如果是 Online 的,就一定是 inplace 的;
2、反过来未必,也就是说 inplace 的 DDL,有可能不是 Online 的。截止到 MySQL 8.0,添
加全文索引(FULLTEXT index)和空间索引 (SPATIAL index) 就属于这种情况。
V、optimize table、analyze table 和 alter table
1、从 MySQL 5.6 版本开始,alter table t engine = InnoDB(也就是 recreate)默认的就是上面图 4 的流程了;
2、analyze table t 其实不是重建表,只是对表的索引信息做重新统计,没有修改数据,这个过程中加了 MDL 读锁;
3、optimize table t 等于 recreate+analyze。
VI、注意点:
1、如果要收缩一个表,只是 delete 掉表里面不用的数据的话,表文件的大小是不会变的,你还要通过 alter table 命令重建表,才能达到表文件变小的目的。
2、重建表的两种实现方式,Online DDL 的方式是可以考虑在业务低峰期使用的,而 MySQL 5.5 及之前的版本,这个命令是会阻塞 DML 的,需要特别小心。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。