undo日志链表

这个要从MySql - 对update是怎么处理的的undo日志文件说起。
我们对数据进行修改之前,都会把数据写入到undo日志中,如果对一条数据做了多次修改,那这些数据就会通过链表关联起来。
MySql - 一条语句是怎么插入磁盘的提到了一条数据的结构,我们这里就用DB_TRX_ID事务ID,DB_ROLL_PTR事务回滚以及具体的数据DATA来简化一条数据,下面用简单的例子讲解一下这个undo日志链表。

步骤一:

插入一条数据DATA为,AAA,此时的DB_TRX_ID为1,DB_ROLL_PTR为空,如下图:
image.png

步骤二:

修改这个数据DATA为BBB,此时的DB_TRX_ID为2,DB_ROLL_PTR指向修改前的数据,如下图:
image.png

步骤三:

修改这个数据DATA为CCC,此时的DB_TRX_ID为3,DB_ROLL_PTR指向修改前的数据,如下图:
image.png

ReadView机制

MySql是支持多线程的,所以当多个事务提交的时候,其中一个事务就会创建一个ReadView。
ReadView的结构如下:

  • m_ids:当前未提交的事务
  • creator_trx_id:创建ReadView的事务
  • min_trx_id:m_ids中最小的事务id
  • max_trx_id:最大的事务id+1
    image.png
    我们同样用一个例子来说明这个机制。
    假设事务1插入了DATA为AAA后,事务2和事务3对这条数据进行了查询和修改。

    步骤1:

    事务2创建了ReadView。所以ReadView如下:

  • m_ids为2和3。
  • creator_trx_id为2。
  • min_trx_id为2。
  • max_trx_id为4。
    image.png

    步骤2:

    事务2查询了这条语句。
    事务2首先会判断min_trx_id(2)和这条数据的DB_TRX_ID(1),此时2比1大,说明ReadView里的事务都是在当前数据的事务后创建的。我们当然可以读取之前的事务提交的数据。
    此时事务2直接读取这条数据的DATA,AAA。

    步骤3:

    事务3修改了这条语句,DATA改为BBB。
    事务3也会判断min_trx_id(2)和这条数据的DB_TRX_ID(1),发现是之前事务提交 的数据,所以他就直接修改了此数据。
    image.png

    步骤4:

    事务2继续查询了这条语句。
    事务2发现DB_TRX_ID(3)比min_trx_id(2)大,但是比max_trx_id(4)小,同时在m_ids(2,3)中,所以知道了这个修改数据的事务是跟自己在同一个ReadView中的,那他就不能读取当前事务的数据,就根据DB_ROLL_PTR读取上一个数据。
    所以又读到了DB_TRX_ID(1)的DATA的值AAA。这就是可重复读。

    步骤5:

    事务4修改了这条语句,DATA改为CCC。
    事务4会生成新的ReadView,然后发现DB_TRX_ID(3)是之前事务提交 的数据,所以他就直接修改了此数据。
    image.png

    步骤6:

    事务2继续查询这条语句,他对比DB_TRX_ID(4)和max_trx_id(4),发现这个数据被比自己后面的事务提交了,所以他也不能看到这个事务提交的数据,于是他就顺着链表找到DB_TRX_ID(3),判断同步骤6,最终还是找到了DB_TRX_ID(1)的DATA为AAA的数据。
    以上例子可以看到,ReadView机制可以保证可以读取到之前提交事务的数据,但是读取不到一起执行的事务以及之后的事务提交的数据。


大军
847 声望183 粉丝

学而不思则罔,思而不学则殆