RocketMQ生产者发送消息失败是如何规避重试时发送给同一个broker?

image.png

在没有开启Broker故障延迟机制的的情况下, Producer发送消息的时候有失败重试机制。第一次发送消息的时候 会随机选择一个MessageQueue,MessageQueue中存在brokerName属性,如果发送失败了,则下一次发送消息的时候选择MessageQueue的brokerName不等于第一次发送消息时的brokerName属性。 这样就能规避 第二次发送消息时 仍然发送给第一次发送失败的broker节点。

问题: 为什么书中提到 “如果上一次根据路由算法选择的是若机的 Broker
的第一个队列 ,那么随后的下 次选择的是若机 Broker 的第二个队列,” 怎么可能会选择到宕机broker的第二个队列? 宕机broker不是会根据brokerName被排除在外了吗

阅读 3.1k
1 个回答

个人理解,如有不正确的地方请指出

我更加赞同是书中书写有问题。

在一次消息发送的过程中,确实会避免拿到宕机的broker,这点在org.apache.rocketmq.client.impl.producer.TopicPublishInfo.selectOneMessageQueue(final String lastBrokerName)的函数中已经写的非常清楚了。

public MessageQueue selectOneMessageQueue(final String lastBrokerName) {
        if (lastBrokerName == null) {
            return selectOneMessageQueue();
        } else {
            for (int i = 0; i < this.messageQueueList.size(); i++) {
                int index = this.sendWhichQueue.incrementAndGet();
                int pos = Math.abs(index) % this.messageQueueList.size();
                if (pos < 0)
                    pos = 0;
                MessageQueue mq = this.messageQueueList.get(pos);
                // 就是这里会避免宕机的broker
                if (!mq.getBrokerName().equals(lastBrokerName)) {
                    return mq;
                }
            }
            return selectOneMessageQueue();
        }
    }

在这个函数中您也可以得到rocketmq在同一个topic消息发送的负载均衡逻辑。

附带:既然都可以避免故障的broker,那么是否还有必要使用故障延迟机制?
要注意的是,避免故障的broker是在一次消息发送中的多次重试中发生的,并不能避免多次消息发送中选择故障的broker。那么我们就需要一种机制来预防这种问题。

另外您理解的 第一次发送消息的时候会随机选择一个MessageQueue,这个也是不正确的,它是会按照顺序依次选择队列。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题