头图

Redis 存储对象信息是用 Hash 还是 String

Redis 内部使用一个 RedisObject 对象来表示所有的 key 和 value,RedisObject 中的 type,则是代表一个 value 对象具体是何种数据类型,它包含字符串(String)、链表(List)、哈希结构(Hash)、集合(Set)、有序集合(Sorted set)。

日常工作中我们存储对象信息的时候,一般有两种做法,一种是用 Hash 存储,另一种是 String 存储。但好像并没有所谓的最佳实践,那么实际上到底用什么数据结构存储更好呢?

首先简单回顾下,Redis 的 Hash 和 String 结构。

String

String 数据结构是简单的 key-value 类型,value 其实不仅是 String,也可以是数字。Redis 中的 String 可以表示很多语义:

  • 字符串(bits)
  • 整数
  • 浮点数

这三种类型,Redis 会根据具体的场景完成自动转换,并且根据需要选取底层的承载方式。String 在Redis 内部存储默认就是一个字符串,被 RedisObject 所引用,当遇到 incr、decr 等操作时会转成数值型进行计算,此时 RedisObject 的 encoding 字段为int。

在存储过程中,我们可以将用户信息使用 Json 序列化成字符串,然后将序列化后的字符串存入 Redis 进行缓存。

String 数据结构

由于 Redis 的字符串是动态字符串,可以修改,内部结构类似于 Java 的 ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配。如上图所示,内部为当前字符串实际分配的空间 capacity,一般高于实际字符串长度 len。

假设我们要存储的结构是:

{
  "name": "xiaowang",
  "age": "35"
}

如果此时将此用户信息的 name 改为“xiaoli”,再存到 Redis 中,Redis 是不需要重新分配空间的。而且我们在读取和存储数据的时候只需要对做 Json 序列化与反序列化,比较方便。

Hash

Hash 在很多编程语言中都有着很广泛的应用,而在 Redis 中也是如此。在 Redis 中,Hash 常常用来缓存一些对象信息,如用户信息、商品信息、配置信息等,因此也被称为字典(dictionary),Redis 的字典使用 Hash table 作为底层实现, 一个 Hash table 里面可以有多个哈希表节点,而每个哈希表节点保存了字典中的一个键值对。实际上,Redis 数据库底层也是采用 Hash table 来存储键值对的。

Redis 的 Hash 相当于 Java 的 HashMap,内部结构实现与 HashMap 一致,即数组+链表结构。只是 reHash 方式不一样。

Hash 数据结构

前面说到 String 适合存储用户信息,而 Hash 结构也可以存储用户信息,不过是对每个字段单独存储,因此可以在查询时获取部分字段的信息,节省网络流量。不过 Redis 的 Hash 的值只能是字符串,存储上面的那个例子还好,如果存储的用户信息变为:

{
  "name": "xiaowang",
  "age": 25,
  "clothes": {
    "shirt": "gray",
    "pants": "read"
  }
}

那么该如何存储"clothes"属性又变成了该用 String 还是 Hash 的问题。

String 和 Hash 占用内存的比较

既然两种数据结构都可以存储结构体信息。到底哪种更加合适呢?

首先我们用代码先插入 10000 条数据,然后用可视化工具来看看内存的占用情况。

const Redis = require("ioRedis");
const Redis0 = new Redis({port: 6370});
const Redis1 = new Redis({port: 6371});


const user = {
  name: 'name12345',
  age: 16,
  avatar: 'https://dss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=256767015,24101428&fm=26&gp=0.jpg',
  phone: '13111111111',
  email: '1111111@11.email',
  lastLogon: '2021-04-28 10:00:00',
}


async function main() {
  for (let i = 0; i < 10000; i++) {
    await Redis0.set(`String:user:${i}`, Json.Stringify(user));
    await Redis1.hmset(`Hash:user:${i}`, user);
  }
}

main().then(process.exit);

先看 Redis0:

再来看看 Redis1:

可以看到还是有点差距的,但是差距并不明显。

网友讨论

网上的用户也有同样的疑问, 因为值的长度是不确定的,所以不知道采用 String 还是 Hash 存储更有效率。

截图来源于 StackOverflow(Redis Strings vs Redis Hashes to represent Json: efficiency?)

这里我主要给大家翻译下该问题下优质的答案:

适合用 String 存储的情况:

  • 每次需要访问大量的字段
  • 存储的结构具有多层嵌套的时候

适合用 Hash 存储的情况:

  • 在大多数情况中只需要访问少量字段
  • 自己始终知道哪些字段可用,防止使用 mget 时获取不到想要的数据

总结

本文主要介绍了Redis 存储对象信息是用 Hash 还是 String,建议是大部分情况下使用 String 存储就好,毕竟在存储具有多层嵌套的对象时方便很多,占用的空间也比 Hash 小。当我们需要存储一个特别大的对象时,而且在大多数情况中只需要访问该对象少量的字段时,可以考虑使用 Hash。

推荐阅读

告别DNS劫持,一文读懂DoH

Flink 在又拍云日志批处理中的实践


云叔
-- 隐于云端,静闻天籁 --

又拍云是专注CDN、云存储、小程序开发方案、 短视频开发方案、DDoS高防等产品的国内知名企业级云服务商。

5.8k 声望
4.6k 粉丝
0 条评论
推荐阅读
如何高效实现 MySQL 与 elasticsearch 的数据同步
MySQL 自身简单、高效、可靠,是又拍云内部使用最广泛的数据库。但是当数据量达到一定程度的时候,对整个 MySQL 的操作会变得非常迟缓。而公司内部 robin/logs 表的数据量已经达到 800w,后续又有全文检索的需求...

云叔_又拍云阅读 325

封面图
最好用的 python 库合集
🎈 分词 - jieba优秀的中文分词库,依靠中文词库,利用词库确定汉子之间关联的概率,形成分词结果 {代码...} 🎈 词云库 - wordcloud对数据中出现频率较高的 关键词 生成的一幅图像,予以视觉上的突出 {代码...} 🎈 ...

tiny极客11阅读 2.9k评论 2

封面图
疫情已过,2023 我的前端面试记录
顺利入职。把我最近找工作的心得记录下来。工作交接确定 lastday整理手头工作,相关对接人、交接人放文档中工作交接过渡阶段。做好被咨询者,该拉人拉人,该拉群拉群平时沟通顺畅的同事如果没有 WX 可以加一个属...

linong11阅读 513

花了几个月时间把 MySQL 重新巩固了一遍,梳理了一篇几万字 “超硬核” 的保姆式学习教程!(持续更新中~)
MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。

民工哥11阅读 1.2k

封面图
Fork:剖析「云计算大楼」中的每一块砖|开发者说
当时,随着移动互联网大潮的涌起,七牛云的图片、音视频存储业务获得迅猛发展,主要目标客户是各式各样的移动应用 App。面对层出不穷的 App,七牛云的销售人员希望精挑细选,从而挖掘到更有价值的客户。于是,他...

万事ONES3阅读 12.4k评论 1

封面图
Redis 发布订阅模式:原理拆解并实现一个消息队列
“65 哥,如果你交了个漂亮小姐姐做女朋友,你会通过什么方式将这个消息广而告之给你的微信好友?““那不得拍点女朋友的美照 + 亲密照弄一个九宫格图文消息在朋友圈发布大肆宣传,暴击单身狗。”像这种 65 哥通过朋...

码哥字节6阅读 2k

封面图
Vland:像乐高一样搭建元宇宙|开发者说
活跃于各种社交活动,是金秋远在贝恩咨询为 500 强企业担任战略顾问时养成的习惯。由于喜欢研究「人与人的连接」,金秋远先后在滴滴、探探两家公司负责运营和产品。他始终觉得,人际连接仍然是值得挖掘的创业方向。

万事ONES3阅读 14.4k

封面图

又拍云是专注CDN、云存储、小程序开发方案、 短视频开发方案、DDoS高防等产品的国内知名企业级云服务商。

5.8k 声望
4.6k 粉丝
宣传栏