头图

Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出会造成服务器中的数据库状态也会消失。所以 Redis 提供了数据持久化功能。Redis支持两种方式的持久化,一种是RDB方式;另一种是AOF(append-only-file)方式。两种持久化方式可以单独使用,也可以将这两种方式结合使用。
  
视频讲解如下:
https://www.bilibili.com/video/BV1LrvwejEbq/?aid=112867328133...

这里重点讨论一下Redis的RDB数据持久化。RDB持久化是Redis默认的持久化方式。它是指在指定的时间间隔内将内存中的数据集快照写入磁盘,实际操作过程是fork一个子进程,先将数据集写入临时文件,写入成功后再替换之前的文件,并用二进制压缩存储。
  
视频讲解如下:
https://www.bilibili.com/video/BV1qKv6e9E3h/?aid=112873485371...

一、RDB持久化机制的工作流程

RDB执行快照的时机由以下参数决定:

# Save the DB to disk.
# save <seconds> <changes>
# Redis will save the DB if both the given number of seconds and the given
# number of write operations against the DB occurred.
# Snapshotting can be completely disabled with a single empty
# string argument as in following example:
# save ""
# Unless specified otherwise, by default Redis will save the DB:
# * After 3600 seconds (an hour) if at least 1 key changed
# * After 300 seconds (5 minutes) if at least 100 keys changed
# * After 60 seconds if at least 10000 keys changed
# You can set these explicitly by uncommenting the three following lines.
# save 3600 1
# save 300     100
# save 60     10000

提示:Redis执行RDB是通过save命令实现的。在默认情况下触发RDB的条件如下:
# save 3600     1        在3600秒内,如有1个Key发生了变化,则执行RDB。
# save 300    100        在300秒内,如有100个Key发生了变化,则执行RDB。
# save 60     10000    在60秒内,如有1万个Key发生了变化,则执行RDB。

RDB持久化机制的工作流程如下:
(1)Redis根据配置参数去生存rdb快照文件
(2)Redis将fork一个子进程出来。
(3)由子进程尝试将内存中的数据dump到临时的rdb文件中。
(4)完成rdb快照文件的生成之后,就会去替换旧的快照文件。

从RDB的工作流程可以看出,RDB具有以下的优点和缺点:

  • 适合大规模的数据恢复。
  • 如果业务对数据完整性和一致性要求不高,RDB是很好的选择。
  • 数据的完整性和一致性不高,因为RDB可能在最后一次备份时宕机了。
  • 备份时占用内存,因为Redis 在备份时会独立创建一个子进程,将数据写入到一个临时文件,最后再将临时文件替换之前的备份文件。所以要考虑到大概两倍的数据膨胀性。

Redis监控RDB最直接的方法当然就是使用系统提供的info命令来做了。只需要执行下面一条命令,就能获得Redis关于RDB的状态报告。

bin/redis-cli info | grep rdb_

输出的信息如下:
rdb_changes_since_last_save:0     表明上次RDB保存以后改变的键的个数。
rdb_bgsave_in_progress:0         表示当前是否在进行RDB操作,0表示没有进行。
rdb_last_save_time:1650184060     上次执行RDB操作的时间戳。
rdb_last_bgsave_status:ok         上次执行RDB操作的状态
rdb_last_bgsave_time_sec:-1     上次执行RDB操作的耗时。
rdb_current_bgsave_time_sec:-1     目前执行RDB操作已花费的时间。
rdb_last_cow_size:0             表示父进程与子进程比较执行了多少修改操作。

二、剖析RDB持久化机制

在rdb.c文件中可以找到创建RDB文件的函数rdbSave(),函数定义如下:

/* Save the DB on disk. Return C_ERR on error, C_OK on success. */
int rdbSave(char *filename, rdbSaveInfo *rsi) {
    ......
    // 创建临时文件
    snprintf(tmpfile,256,"temp-%d.rdb", (int) getpid());
    fp = fopen(tmpfile,"w");
    ......
    // 初始化I/O
    rioInitWithFile(&rdb,fp);
    // 开始执行RDB
    startSaving(RDBFLAGS_NONE);
    ......
    //如果持久化成功操作成功,则用临时文件替代旧的文件
    if (rename(tmpfile,filename) == -1) {
        char *cwdp = getcwd(cwd,MAXPATHLEN);
        serverLog(LL_WARNING,
        "Error moving temp DB file %s on the final "
        "destination %s (in server root dir %s): %s",
        tmpfile,
        filename,
        cwdp ? cwdp : "unknown",
        strerror(errno));
        unlink(tmpfile);
        stopSaving(0);
        return C_ERR;
    }
    serverLog(LL_NOTICE,"DB saved on disk");
    //持久化成功后,将计数器重置为0,并更新最近存储时间。
    server.dirty = 0;
    server.lastsave = time(NULL);
    server.lastbgsave_status = C_OK;
    stopSaving(1);
    return C_OK;
    ......
}

赵渝强老师
33 声望14 粉丝

20年以上的IT行业从业经历,清华大学计算机软件工程专业毕业,京东大学大数据学院院长,Oracle中国有限公司高级技术顾问;曾在BEA、甲骨文、摩托罗拉等世界500强公司担任高级软件架构师或咨询顾问等要职,精通大...