关于 Redis 字符串小于 39 字节的疑惑

convert
  • 62
REDIS_ENCODING_EMBSTR_SIZE_LIMIT set to 39.

比如:

redis 127.0.0.1:2050> set massage "hello_world"
OK
redis 127.0.0.1:2050> object encoding massage
"raw"

为什么这段字符串小于 39 编码却是 raw?另外,小于 39 字节 embstr 编码,大于 39 raw 编码的缘由是什么?

回复
阅读 4.4k
1 个回答

这个和redis的版本有关系。
查看redis-3.0和最新的版本的object.c文件,可以发现在创建StringObject的时候,会和REIDS_ENCODING_EMBSTR_SIZE_LIMIT比较,这个的默认值是39。
查看一下redis-2.8版本的源码,并没有发现比较,而是直接创建了。
所以我猜测这个embstr编码是3.0以上版本才出现的。


至于为什么是39,这个讲起来就比较复杂了,我就慢点说。
embstr是一块连续的内存区域,由redisObject和sdshdr组成。其中redisObject占16个字节,当buf内的字符串长度是39时,sdshdr的大小为8+39+1=48,那一个字节是'\0'。加起来刚好64。是不是发现了什么?

typedef struct redisObject {
    unsigned type:4;
    unsigned encoding:4;
    unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */
    int refcount;
    void *ptr;
} robj;
struct sdshdr {
    unsigned int len;
    unsigned int free;
    char buf[];
};

从2.4版本开始,redis开始使用jemalloc内存分配器。这个比glibc的malloc要好不少,还省内存。在这里可以简单理解,jemalloc会分配8,16,32,64等字节的内存。embstr最小为16+8+8+1=33,所以最小分配64字节。当字符数小于39时,都会分配64字节。
这个默认39就是这样来的。

你知道吗?

宣传栏