Redis pipeline使用

遇到业务场景中频繁访问redis时，就可以考虑pipeline的优化方案。

1. pipeline介绍

Redis Pipeline 是一种可以显著提高 Redis 操作性能的技术，特别在需要进行大量命令的情景下。它允许客户端在不等待服务器响应的情况下，连续发送多条命令，从而减少网络往返次数。

1.1. 工作原理

在未使用 Pipeline 的情况下，客户端和服务器之间的每个命令都需要一次网络往返（RTT）：

客户端发送命令到服务器。
服务器处理命令并返回结果给客户端。
这种模式在高延迟网络环境下会显得效率低下，因为每个命令的延迟都被网络延迟所放大。

使用 Pipeline 后，客户端可以在不等待服务器响应的情况下连续发送多条命令，服务器在接收到所有命令后再一次性返回所有的结果。这样，多个命令的网络延迟被合并，从而显著提高了性能。

这有点像对DB的批量存储和查询，bulkInsert 比分多次 insert 明显性能要好。

1.2. 优势

减少网络延迟：通过减少命令的往返次数，Pipeline 能显著降低网络延迟对性能的影响。
提高吞吐量：一次性批量发送和接收命令，提高了客户端和服务器之间的通信效率，从而提高了系统的整体吞吐量。
减少资源消耗：批量操作减少了网络和 I/O 的开销，对于资源有限的系统，Pipeline 能有效降低总体资源消耗。

1.3. 注意事项

避免大批量阻塞：尽管 Pipeline 可以提高性能，但一次性发送过多命令可能会导致服务器处理时间过长，进而阻塞其他请求。建议通过监控和调优找到合适的批量大小，通常建议在 100 到 1000 之间。
错误处理：Pipeline 中的命令是批量执行的，如果某条命令出错，错误处理需要额外注意。确保在接收到返回结果后，检查每条命令的执行情况。
内存消耗：大量 Pipeline 操作会占用客户端和服务器的内存。确保系统有足够的内存处理批量操作，避免低内存环境中进行大量 Pipeline 操作。

1.4. 示例

Java 和 Jedis 示例

import redis.clients.jedis.Jedis;
import redis.clients.jedis.Pipeline;

public class RedisPipelineExample {
    public static void main(String[] args) {
        try (Jedis jedis = new Jedis("localhost", 6379)) {
            Pipeline pipeline = jedis.pipelined();

            // 批量设置键值对
            for (int i = 0; i < 1000; i++) {
                pipeline.set("key" + i, "value" + i);
            }

            // 执行 Pipeline
            pipeline.sync();
            System.out.println("Batch set keys completed.");

            // 批量获取键值对
            pipeline = jedis.pipelined();
            for (int i = 0; i < 1000; i++) {
                pipeline.get("key" + i);
            }

            List<Object> responses = pipeline.syncAndReturnAll();
            System.out.println("Batch get keys completed. Total keys retrieved: " + responses.size());
        }
    }
}

2. 集群环境处理

一般企业在使用redis时，基本都使用redis集群环境。在集群环境中使用pipeline时，需要尽量保证批量执行的redis key 在同一个哈希槽中。

2.1. 避免跨节点

在 Redis 集群环境中使用 Pipeline 时，需要注意一些特别的事项，因为 Redis 集群的键可能分布在不同的节点上。因此，在使用 Pipeline 时，必须确保所有命令能够在相同的节点上执行，以避免跨节点操作所引发的问题。

因为这会导致 Redis 集群返回 MOVED 或 ASK 错误，要求客户端重新路由命令到正确的节点。跨节点操作会降低性能，并且需要额外的代码处理这些重定向。

但如何保证所有键都在同一个节点呢？保证它们在同一个哈希槽中。

2.2. 哈希槽与分片

在 Redis 集群模式下，整个键空间被划分为 16384 个哈希槽（Hash Slot）。当一个键被添加到集群中时，Redis 会计算该键的哈希值，然后将哈希值映射到某个哈希槽，从而确定该键存储在哪个节点上。

Redis 集群中的每个节点负责一部分哈希槽。初始状态下，所有哈希槽均匀分布在集群中的所有节点上。例如，一个三节点的集群中，每个节点大致负责 5461 个哈希槽（16384/3 ≈ 5461）。

Redis 使用 CRC16 算法计算键的哈希值，并将其对 16384 取模，以确定该键所属的哈希槽。计算过程为：hash_slot = CRC16(key) % 16384。

当集群扩容或缩容时，Redis 会进行重新分片（resharding），即将部分哈希槽从一个节点迁移到另一个节点。这是一个在线过程，不会影响集群的正常运行。

因为重新分片，哈希槽所处的节点是会变的。所以应当要保证pipeline的所有redis键都在同一个哈希槽中。

2.3. 哈希标签

为了确保某些键被映射到同一个哈希槽，Redis 提供了哈希标签机制。哈希标签是键的一部分，用于计算哈希值时只考虑标签内部的内容。哈希标签用花括号 {} 括起来，如 {user:1000}。

例如，对于键 {user:1000}.name 和 {user:1000}.age，Redis 只会计算 user:1000 的哈希值，从而确保这两个键位于同一个哈希槽中，并存储在同一个节点上。

2.4. 举例

在toC的场景中，有时会需要一次性获取当前用户的各种特征属性。那么通常会将同一个用户的信息，放入同一个哈希槽中，方便pipeline存储和读取。

下面例子中有3个用户，每个用户有2个不同的redis键要存储和读取。那么通过userId的哈希标签，保证同一个用户的不同键，都存在同一个哈希槽上。然后每个用户执行一次pipeline，保证该次pipeline执行的所有键都在同一个节点。

import redis.clients.jedis.Jedis;
import redis.clients.jedis.Pipeline;
import java.util.List;
import java.util.Arrays;

public class RedisPipelineExample {
    public static void main(String[] args) {
        try (Jedis jedis = new Jedis("localhost", 6379)) {
            // 多个用户ID
            List<String> userIds = Arrays.asList("1000", "1001", "1002");

            for (String userId : userIds) {
                String hashTag = "{user:" + userId + "}";
                String userInfoKey = hashTag + ":user_info";
                String userPrefsKey = hashTag + ":user_prefs";
                
                Pipeline pipeline = jedis.pipelined();

                // 存储用户基本信息
                pipeline.hset(userInfoKey, "name", "Alice" + userId);
                pipeline.hset(userInfoKey, "age", String.valueOf(30 + Integer.parseInt(userId)));

                // 存储用户偏好设置
                pipeline.hset(userPrefsKey, "language", "English");
                pipeline.hset(userPrefsKey, "timezone", "UTC");

                pipeline.sync();
            }

            System.out.println("User data stored.");
        }
    }
}

3. 单次执行量

以前都说redis作为单线程，是不建议执行大命令阻塞线程，那使用pipeline会有阻塞问题吗？有！

Redis 是单线程的，因此在使用 Pipeline 时需要小心避免长时间的阻塞操作，以防止影响 Redis 的整体性能。以下是一些关于 Pipeline 使用的注意事项和建议，以确保高效而安全地利用 Pipeline 特性：

3.1. 注意事项

避免大命令：

批量操作的命令数量不要过大。虽然 Pipeline 可以减少网络延迟，但一次性发送过多命令可能会导致服务器端处理时间过长，从而阻塞其他请求。
尽量避免单个命令处理大量数据（如 MGET、MSET）或复杂操作（如大范围的 SCAN）。

监控和调优：

使用 Redis 监控工具（如 Redis 的 INFO 命令、监控系统等）观察 Pipeline 操作的影响，尤其是查看服务器的处理延迟和命令队列积压情况。
根据监控结果调整批量大小，确保每次 Pipeline 操作不会对服务器造成过大的负担。

分批处理：

将大数据集分成较小的批次，逐步执行 Pipeline 操作，以降低每次操作的负担。
每次 Pipeline 操作后给服务器一些喘息时间，避免持续高负载。

注意内存消耗：

大量的 Pipeline 操作会占用客户端和服务器的内存。确保系统有足够的内存来处理这些批量操作。
避免在低内存环境中进行大量 Pipeline 操作。

3.2. 实践建议

将大数据集分成小批次进行操作，具体批次大小可以通过监控和调优来确定。一般建议开始时使用 100 到 500 之间的批量大小，然后根据实际情况调整。

4. 回顾redis线程模型

redis 6.0 的多线程对pipeline是否有优化提升呢？

4.1. 单线程

Redis 的单线程模式指的是 Redis 使用单一线程来处理所有的客户端请求。这并不意味着 Redis 整个程序是单线程的，Redis 还是会使用多线程来处理一些特定的任务（如 AOF 持久化、异步删除等），但是主要的命令处理是由一个线程来完成的。

处理请求：在 Redis 6.0 之前，Redis 主要使用单线程来处理所有的客户端请求。这种设计避免了多线程调度和锁竞争的问题，使得 Redis 的实现和维护更加简单。
I/O 多路复用：Redis 使用 select、poll、epoll 等 I/O 多路复用机制来处理大量的网络连接。这种方式在处理并发连接时效率很高，但在处理非常高的请求速率时，单线程可能成为瓶颈。

4.2. 多线程

多线程 I/O：Redis 6.0 引入了多线程来处理网络 I/O。具体来说，多个线程负责读取客户端请求、解析命令、发送响应，而实际的命令执行仍然是单线程的。
线程池：Redis 使用一个线程池来处理 I/O 操作，默认情况下，这些线程是并行工作的，但 Redis 核心的命令执行逻辑依然是单线程的，以保持线程安全和简化实现。

4.3. 总结

Redis 6.0 引入的多线程机制主要用于处理网络 I/O，而命令执行仍然保持单线程。这种设计在提升并发处理能力的同时，保持了 Redis 的简单性和高效性。

在 Pipeline 应用上，命令执行依然是单线程，所以并没有什么提升。顶多在网络 I/O 上会提升部分批处理性能。

Redis pipeline使用

1. pipeline介绍

1.1. 工作原理

1.2. 优势

1.3. 注意事项

1.4. 示例

2. 集群环境处理

2.1. 避免跨节点

2.2. 哈希槽与分片

2.3. 哈希标签

2.4. 举例

3. 单次执行量

3.1. 注意事项

3.2. 实践建议

4. 回顾redis线程模型

4.1. 单线程

4.2. 多线程

4.3. 总结

KerryWu

引用和评论

Java开发搭配Groovy

嘎嘎好用！推荐三款开源的 Redis 桌面客户端！

自制审批流框架记录

如何实现页面广告随时上下线、过期自动下线及到时自动上线

Redis 又双叒叕改开源协议了，微软提前推出高性能替代方案 Garnet

Redis与MySQL数据一致性问题解决方案

数据库审计与智能监控：从日志分析到异常检测