1

我们知道计算机中数据都是用二进制数存储。二进制数是一系列0和1的组合,长整型64位,最短的字节型也有8位。其中每一位0和1都可以看做一种状态的开和关,所以就有了这样的一种状态码存储方式:把同一对象的多种状态按位组合到一个整数中。

例如我们最最常见的 *nix 文件权限:

第9位 第8位 第7位 第6位 第5位 第4位 第3位 第2位 第1位 第0位
是否目录 所有者读权限 所有者写权限 所有者执行权限 组读权限 组写权限 组执行权限 其余用户读权限 其余用户写权限 其余用户执行权限
0 1 1 1 1 0 1 1 0 1

那么这一组状态在程序中表示为:0b0111101101,即八进制的 0o755,十进制的 493

二进制状态码存储的主要好处是节省存储空间,相对于键值对(对象)存储而言可读性较差(当然文件权限这种另说)。这种存储方式仅适用于“一个对象有多种状态,每种状态仅有两种情况”这一情形,请不要对一种状态多种情况的情形使用二进制状态码存储方式,更不要出现十进制的 0 1 10 这种状态码,很蠢。。。

使用位运算操作状态码

基于这种存储方式,也衍生了一些操作状态码的方式:

判断第 x 位状态是否开启(x 以 0 开始,下同):

status & (1 << x) == 0 // bt ( bit test )

打开第 x 位

status |= 1 << x // bts ( bit test and set )

重置第 x 位

status &= ~(1 << x) // btr ( bit test and reset )

取反第 x 位

status ^= 1 << x // btc ( bit test and complement )

编程语言支持

某些编程语言提供了对二进制状态码的一些原生支持。C/C++ 提供了 位域,以及专门的模板库 bitset 用于简化位运算操作。C# 则提供了 Flags 特性标记某个枚举被视作位域

另外很重要一点,JavaScript 虽然也支持位运算,但由于 JavaScript 中的 number 类型都是双精度浮点数,在做位运算时会先将数值截断至 32 位长度。例如很著名的数字转整数bug:10000000000 | 0 => 1410065408。所以注意如果后端返回二进制状态码让前端判断,确保后端使用 uint32_t 存储


CarterLi
1.3k 声望102 粉丝