[译] RabbitMQ tutorials (2) ---- 'work queue' (JavaScript)

工作队列

work queue

在第一篇中，我们写了一个程序从已经声明的队列中收发消息，在这篇中，我们会创建一个工作队列（Work Queue）来分发works里面的耗时任务。
其主要思想就是避免立即执行耗资源的任务，并等待它完成。相反的，我们要让这些任务在稍后的一个时间执行。我们把任务封装成一个消息放到队列中。
一个工作进程会在后台执行，取出（Pop）任务并最终会完成这项任务，当你运行多个work的时候，这些任务会在它们之间共享。

这个概念在web应用中也是非常有用的，当在一个http请求窗口中不可能完成一个复杂的任务时候。

准备

在之前的引导中，我们发送了一个’Hello World‘的消息。现在我们要发送一个字符串代表一个复杂的任务，我们没有像调整
图片大小或者渲染一个pdf文件这样的在真实场景中的任务，所以我们使用setTimeout来模拟我们正处于忙碌状态。我们把‘.’的数量代表这个字符串的复杂度；
每一个‘.' 会消耗一秒钟，例：一个模拟的任务'Hello...' 会消耗三秒钟。

从之前的例子，我们稍稍修改一下send.js 的代码，允许命令行可以发送任意的消息。这个程序在工作队列中安排好任务，所以我们称它new_task.js

var q = 'task_queue';
var msg = process.argv.slice(2).join(' ') || "Hello World!";

ch.assertQueue(q, {durable: true});
ch.sendToQueue(q, new Buffer(msg), {persistent: true});
console.log(" [x] Sent '%s'", msg);

我们的之前的receive.js同样需要一些改变，需要对消息内容中的每个'.'模拟成一个会消耗一秒的任务。它要从队列中取出一条消息并执行这个任务，我们把它称作worker.js

ch.consume(q, function(msg) {
    var secs = msg.content.toString().split('.').length - 1;

    console.log(" [x] Received %s", msg.content.toString());
    setTimeout(function() {
    console.log(" [x] Done");
    }, secs * 1000);
}, {noAck: true});

注意我们模拟的执行时间
执行我们的程序

shell1$ ./worker.js
shell2$ ./new_task.js

循环调度

使用任务队列（Task Queue）的其中的一个优势是有简化并行工作的能力。如果我们有很多堆积的未完成的任务，我们只需添加更多的worker来进行扩展。

首先，我们尝试同时启动两个worker.js，他们都会从队列中受到消息，但是实际上呢？我们来看看

你需要打开第三个命令行，两个来运行worker.js脚本,我们称作C1,C2

shell1$ ./worker.js
 [*] Waiting for messages. To exit press CTRL+C

shell2$ ./worker.js
 [*] Waiting for messages. To exit press CTRL+C

在第三个命令行工具中，我们会发布新的任务，一旦你启动消费者，你可以发布一些消息：

shell3$ ./new_task.js First message.
shell3$ ./new_task.js Second message..
shell3$ ./new_task.js Third message...
shell3$ ./new_task.js Fourth message....
shell3$ ./new_task.js Fifth message.....

让我们看看什么被分发到我们的worker

shell1$ ./worker.js
 [*] Waiting for messages. To exit press CTRL+C
 [x] Received 'First message.'
 [x] Received 'Third message...'
 [x] Received 'Fifth message.....'

shell2$ ./worker.js
[*] Waiting for messages. To exit press CTRL+C
[x] Received 'Second message..'
[x] Received 'Fourth message....'

默认情况下，RabbitMQ会依次地把消息推送到下一个消费者，平均每个消费者会得到相同数量的消息。这样的消息分发机制称作轮询。可以尝试3个或更多的worker。

## 消息确认（Message acknowledgment）

要完成一个任务需要一些事件，你可能会想，当一个消费者开始执行一个长的任务但只执行一部分就die了会发生什么。就我们当前的代码，一旦RabbitMQ 分发了一条消息到消费者那边，就会立即从存储中移除这条消息。这样的话，如果你杀掉了进程，我们将会丢失这条正在被处理的消息。
我们也同样丢失了我们发送给这个进程的但还没被处理的消息。

但是我们不想丢失任何的任务，如果一个进程挂掉，我们希望这个任务会被分发到其他的进程。

为了确保每一条消息绝不会丢失，RabbitMQ支持 消息确认，一个ack标志会从消费者那边返回去通知RabbitMQ当前的这个消息已经收到并且已经完成，于是RabbitMQ就可以取删掉这个任务了。

如果一个消费者挂了（通道被关闭，连接关闭，或者TCP连接丢失）而没有发送ack标志，RabbitMQ会明白这条任务还没被执行完，并会重新放回队列中，如果当时有其他的消费者在线，这个消息会被快速地发送给其他的消费者。这样的话你就可以保证没有消息会遗失，即使进程只是偶尔会挂掉。

不管消息处理是否超时，RabbitMQ只会在消费者挂掉的时候重新分发消息。这对于那些要处理很久很久的消息也是好的（add：不会被判定为noack,而重新分发）

在之前的例子中，消息确认是被关闭的，是时候打开它了，使用{noAck: false}(你也可以移除这个操作选项)选项，当我们完成这个任务的时候发送一个正确的消息确认。

 ch.consume(q, function(msg) {
    var secs = msg.content.toString().split('.').length - 1;

    console.log(" [x] Received %s", msg.content.toString());
    setTimeout(function() {
    console.log(" [x] Done");
        ch.ack(msg);
    }, secs * 1000);
}, {noAck: false});

使用这样的代码，你可以确定即使在它还在处理消息的时候你使用CTRL+C 杀掉进程也不会有数据丢失。在进程挂了之后，所有的未被确认的消息会被重新分发。

 ## 忘记确认
 这是一个普遍的错误，丢失ack。只是一个简单的错误，但结果确实很严重的。当客户端停止的时候，消息会被重新分发（像是被随机分发），但是RabbitMQ会占用越来越多的内存当它不能取释放掉任何未被确认的消息。

 为了调试这种类型的错误，你可以使用`rabbitmqctl`来输出未被确认的消息字段：
    $ sudo rabbitmqctl list_queues name messages_ready messages_unacknowledged
    Listing queues ...
    hello    0       0
    ...done.

消息持久化

我们学习了确保在进程挂掉仍保证任务不会被丢失，但我们的任务还是会在RabbitMQ服务停止的时候丢失。

当RabbitMQ 退出或者崩溃，除非你叫它不要丢失，不然队列和消息都会丢失。为了使消息不会丢失，两件事情需要确保，我们需要持久化队列和消息。

首先，我们要让RabbitMQ 不会丢失队列，为此，我们要先声明
ch.assertQueue('hello', {durable: true});

尽管这样的操作是对的，但是在我们现在的配置中是不起作用的，这是因为我们已经定义了一个未持久化的叫做hello的队列，RabbitMQ不允许你改变一个已经存在的队列的参数，如果你这样做，程序将会返回错误。
但是有一个快速的办法 --- 让我们定义一个新的队列，叫做task_queue
ch.assertQueue('task_queue', {durable: true});
这个durable选项，需要消费者和生产者都去使用。

此时我们能保证task_queue队列不会在RabbitMQ重启的时候丢失，现在我们需要对消息进行持久化 --- 使用presistent的Channel.sendToQueue选项,
ch.sendToQueue(q, new Buffer(msg), {persistent: true});

注意：消息持久化
消息持久化，不能完全地保证消息不会丢失，尽管它告诉RabbitMQ要把消息存到磁盘当中，总存在一个RabbitMQ接收到消息，但还未处理完的情况。另外，RabbitMQ并不是对每个消息做到帧同步，有可能只是被写到缓存中，还没被写到磁盘。
消息持久化不能完全保证，但已经远远满足我们的简单的工作队列的需求，如果你需要更强的持久化的保证，你可以使用[publisher confirms](https://www.rabbitmq.com/confirms.html)。

均衡调度(Fair dispatch)

你可能已经注意到现在的调度并不是我们想要的，例：在有两个worker的情况下，当所有的奇数消息都是重的而偶数消息是轻量的，那会有一个worker会一直处于忙碌状态，而另一个worker几乎不工作，
RabbitMQ，并不知道这些情况，只知道持续地均匀地分发消息。

这样发生的原因是RabbitMQ只是在消息进入队列的时候进行分发的工作，不管消费者的未确认的消息的数量，只是一味地分发第N条消息给第N个消费者。

work queue prefetch

为了解决这样的问题，我们使用方法prefetch，并设置值为1，表示RabbitMQ不会同时给一个worker超过一条消息，即，不会分发一条新的消息直到worker完成并且发送ack标志。否则，RabbitMQ会把消息发送给下一个不在忙碌状态的worker.
ch.prefetch(1);

注意队列的大小
如果所有的worker都处于忙碌状态，你的队列可以被填满，你可能需要一个监控，或者添加更多的worker,或者有其他的解决方案。

整合

最后的new_task.js的代码：

#!/usr/bin/env node

var amqp = require('amqplib/callback_api');

amqp.connect('amqp://localhost', function(err, conn) {
    conn.createChannel(function(err, ch) {
    var q = 'task_queue';
    var msg = process.argv.slice(2).join(' ') || "Hello World!";

    ch.assertQueue(q, {durable: true});
    ch.sendToQueue(q, new Buffer(msg), {persistent: true});
        console.log(" [x] Sent '%s'", msg);
    });
    setTimeout(function() { conn.close(); process.exit(0) }, 500);
});

new_task.js source

worker.js的代码：

#!/usr/bin/env node

var amqp = require('amqplib/callback_api');
amqp.connect('amqp://localhost', function(err, conn) {
    conn.createChannel(function(err, ch) {
        var q = 'task_queue';

        ch.assertQueue(q, {durable: true});
        ch.prefetch(1);
        console.log(" [*] Waiting for messages in %s. To exit press CTRL+C", q);
        ch.consume(q, function(msg) {
        var secs = msg.content.toString().split('.').length - 1;

        console.log(" [x] Received %s", msg.content.toString());
        setTimeout(function() {
            console.log(" [x] Done");
            ch.ack(msg);
        }, secs * 1000);
        }, {noAck: false});
    });
});

worker.js source

使用消息确认和预处理，你可以建立一个工作队列。持久化选项使得消息可以在RabbitMQ会重启的情况下得以保留。
获得更多的关于Channel的方法和消息的属性，你可以浏览amqplib docs

现在我们可以移至第三章，学习如何分发相同的消息给多个消费者。

翻译：Joursion

日期：2016/12/25

欢迎交流，学习。

[译] RabbitMQ tutorials (2) ---- 'work queue' (JavaScript)

工作队列

准备

循环调度

消息持久化

均衡调度(Fair dispatch)

整合

现在我们可以移至第三章，学习如何分发相同的消息给多个消费者。

Joursion

引用和评论

[译] RabbitMQ tutorials (3) ---- 'Pub/Sub' (Javascript)

2025年最新反编译微信小程序的教程及工具

手写一个动态海洋和天空效果的vue hooks

你可能不知道的图片加载相关知识

原生JS大揭秘—JS代码执行原理解刨

原生electron起步-从零到一完成构建和打包

Koa+Typescript起手式(空环境) 不用每次玩node都要搭环境了！