2

本文主要研究一下redis的bitset数据结构的用场

相关命令

SETBIT

时间复杂度为O(1)

setbit login.20180906 102400000 0
setbit login.20180905 201400000 1

GETBIT

时间复杂度为O(1)

getbit login.20180905 201400000

BITOP

时间复杂度为O(N)

bitop or login.9m.week1or login.20180905 login.20180906
getbit login.9m.week1or 201400000
主要做bitset的and、or、xor、not操作,结果存在新的bitset中,注意时间复杂度为O(N)

BITPOS

时间复杂度为O(N)

bitpos login.20180905 1
返回指定bitset中在指定起始位置中第一个出现指定值的offset,不传start,end默认估计是0,-1

BITCOUNT

时间复杂度为O(N)

bitcount login.20180905
统计bitset中出现1的个数

使用场景

假设有个签到的需求,要实现的功能如下:

  • 展示当天是否已经签到,签到了不能再签到了
  • 展示最近一周的或者最近一个月的签到情况/历史(可以只不详细记录到每天的签到时间,只记录每天是否签到)
  • 判断是否连续签到,若本周连续签到,则给予抽奖机会

这里我们就可以使用redis的bitset来实现:

签到

boolean originValue = redisTemplate.opsForValue().setBit(uidYearKey,dayIndx,true);
  • 这里的key由uid,year构成,然后offset采用day的index
  • 每个uid每个year一个key的话,如果用户数过多可能造成redis的key太多

获取签到数据

    BitSet bitSet = fromByteArrayReverse(redisTemplate.opsForValue().get(uidYearKey).getBytes());
    public static BitSet fromByteArrayReverse(final byte[] bytes) {
        final BitSet bits = new BitSet();
        for (int i = 0; i < bytes.length * 8; i++) {
            if ((bytes[i / 8] & (1 << (7 - (i % 8)))) != 0) {
                bits.set(i);
            }
        }
        return bits;
    }
  • 这里有个注意事项,java读取bytes从小到大是从右往左读(大端),而redis存储的bytes从小到大是从左往右(小端),因而这里读取bytes转为BitSet需要逆向一下

BitSet Range

public BitSet get(int fromIndex, int toIndex) {
    //......
}
  • BitSet有个方法,可以根据index来进行range,之后就可以用新的BitSet进行相关统计,比如BitSet的cardinality

小结

  • 对于bitset来说,其优点就是节省内存,如果直接把用户id作为offset来存储相应的值,这个相比hash来说,节省了很多空间。类似统计最近N天连续登陆的人的个数这类场景就可以使用bitset来实现。
  • 对于bitset的操作要注意,各个操作的时间复杂度,如果是getbit、setbit则都是O(1),bitop、bitcount、bitpos等都是O(N),在N比较大的时候要注意,可能是潜在的慢查询

doc


codecraft
11.9k 声望2k 粉丝

当一个代码的工匠回首往事时,不因虚度年华而悔恨,也不因碌碌无为而羞愧,这样,当他老的时候,可以很自豪告诉世人,我曾经将代码注入生命去打造互联网的浪潮之巅,那是个很疯狂的时代,我在一波波的浪潮上留下...