1. 我们都知道mysql中的数据最终都会存到磁盘上,而我们又知道磁盘的读写速度和cpu不是在一个数量级上,所以我们猜测mysql存储引擎里必然有缓冲这一概念,本节我们就好好掰扯掰扯myslq中的缓存.
  2. 先到官网看看,存储innodb存储引擎的结构
    image.png
    从上图我们可以看到,INNODB架构,大致分为内存部分结构和磁盘部分结构,
    而内存部分又有BufferPool,ChangeBuffer,Adaptive Hash Index,LogBuffer等
    .我们将按照本图内存部分结构一点一点掰扯每一个缓存部分.
    3:首先来看BufferPool
  • 说白了就是内存里一个最主要的缓存数据,并且在专用服务器上(这里可以理解mysql的生产环境) 80%的物理内存都分配给了buffer pool。 可见buffer的重要性。
  • 那数据在buffer里是怎么存储的呢? 在看官方给的架构图
    image.png
    先不细分析这个结构,大致看了下就是使用了LRU(least recently used 这个大家都很熟悉吧.不熟悉自行补充)算法. 并且把整个列表分了new和old两部分. 还有一点就是列表里每一项到底缓存数据的维度是什么?所以下面将分3个部分介绍 1:buffer pool 缓存的数据维度是什么? 2:为什么LRU算法还有new和old部分,为什么会这样设计? 3:实战看下buffer pool相关的配置
    1:buffer pool 缓存的数据维度是什么?
    When room is needed to add a new page to the buffer pool, the least recently used page is evicted and a new page is added to the middle of the list. 从官方这句话,我们可以得知每一项都是一页数据 . 这个后期写mysql索引文章的时候,会详细分析为什么会是页数据为单位.
    2:为什么LRU算法还有new和old部分,为什么会这样设计?

    其实大家想想只有LRU算法的缺点就知道了. 看下图

    image.png

    就是随着新的数据页进来,列表中的数据会被大量置换出去. 没有达到缓存的目的. 其实官方也介绍了哪些情况下会出现这种情况[见下图].
    image.png
    说白了,全表扫描,什么mysqldump操作,select语句没有where条件,都会把大量数据放进buffer bool,即时这些数据并不是热点数据, 但同时还会把热点数据给排挤出去.
    那增加了new和old部分,当出现上面操作,又是怎样保护热点数据呢?
    image.png
    可从上图看出,新读入的数据都放在old列表,并且不会替换掉new列表中的热点数据. 那问题来了,什么时候old列表中数据会进入new列表呢?
    其实是进入buffer pool的数据,能被真正读取到, 并停留一定时间窗口,才会进入new列表 [有点像jvm内存分代,多大年龄可以进入老年代].

    其实真实的情况是: 首先mysql会预读数据 [局部性原理,大家可以自行了解] 另外加上上面说的全表扫描 mysqldump等. 这两种情况, 使进入的buffer pool中的数据并不一定被读到, 所以不能直接把热点数据给置换掉,才弄出来new列表和old列表,并且old列表的数据被访问到,且经历过T时间[时间窗口] 才会进入new列表.

    3:实战看下buffer pool相关的部分

  • 先本能到看下数据库关于buffer pool提供了哪些参数

窗口执行 show variables like '%buffer_pool%';
image.png
好像看不太懂,还是从buffer pool的数据结构反推应该有哪些配置吧.

  • 首先我们应该想到的是 一个mysql实例允许有几个buffer pool. 看上面架构图,好像只有一个,通过翻查资料,从INNODB1.0.X之后,允许有多个缓冲池实例. 所以找下肯定有缓冲池实例的配置.
    没错 innodb_buffer_pool_instances=1 默认一个.
    另外 突然扒到information_schema 里有INNODB_BUFFER_POOL_STATS表. 猜测从里能查看缓冲池状态信息. 先看看在说.
    image.png

可以看到有好多字段, 但有个POOL_ID=0 可见我本地就一个缓冲池.

  • 其次就是缓冲池大小
    没错 innodb_buffer_pool_size=134217728
  • 有了大小了,我们知道缓冲池分别new列表和old列表 所以肯定有控制分割比例的配置
    没错 innodb_old_blocks_pct=37 官网给的是3/8处. 可见这个是个经验值,或者有什么破定律使这个值最合适. 不废话,去官网看看咋解释的.

image.png
innodb_old_blocks_pct代表old列表的大小,范围[5,95] 其他自己到官网看吧.

  • 不过从上图又发现时间窗口的配置了

innodb_old_blocks_time=1000 默认1s

综合innodb_old_blocks_pct和innodb_old_blocks_time 有两种情况
如果业务中经常出现表扫描, 这时候就该把innodb_old_blocks_pct调小, 把innodb_old_blocks_time调大,避免很多预读的数据进入缓冲区.
如果业务中没有大量的表扫描. 这时候就该把innodb_old_blocks_pct调大,把innodb_old_blocks_time减小,让热点数据尽快进入new列表.减少磁盘io,提高性能.

  • 现在我们宏观看下整个buffer pool, 我们能不能对他了解的更多.
    有多少个buffer pool 我们已经知道. 大小我们也知道. new列表和old列表大小我们也知道. 现在唯一不知道的是buffer pool里缓存了多少页数据? 从old列表跑到new列表的量,频率等?
    还有个疑问点,上面POOL_SIZE=8191 和 innodb_buffer_pool_size=134217728 不是一个概念? 那POOL_SIZE=8191是什么概念呢?
    终于又从information_schema中发现两张表:
    image.png

INNODB_BUFFER_PAGE
INNODB_BUFFER_PAGE_LRU
先看第一张表:INNODB_BUFFER_PAGE
image.png 现在明白了 其实就是缓冲池中的所有的页信息.
在来看第二张表INNODB_BUFFER_PAGE_LRU
image.png
其实是LRU列表中的页信息. 从这里我们可以得出,BUFFER POOL 中不仅仅只有一个LRU列表,还有其他缓存信息.

  • 那LRU列表中 old到new这些频率怎么看? 命中率怎么看? 其实上面有个图已经有这些信息了,在来看看.
    image.png

HIT_RATE:表示命中率 不用说,越高越好.
PAGES_MADE_YONG: 这个是从old列表到new列表的数量。

另外我们发现: FREE_BUFFERS: 7704

        DATABASE_PAGES: 487
        POOL_SIZE: 8191
        

7704+487=8191;
可见buffer_pool 为2部分组成lru[487]+free_buffers[7704]
除来buffer_pool innodb内存还有其他部分
这里推荐大家没事多喵喵官网:
14.5.1 Buffer Pool

14.5.2 Change Buffer

14.5.3 Adaptive Hash Index

14.5.4 Log Buffer
其他的缓存我们下一次在一一分析.


go_big_place
7 声望0 粉丝