1

协议

本篇我们先来实现一下协议,所谓的协议,说白了就是规定了消费者的行为,并将这些行为转化成对 topic、channel 或者 message 的操作。例如,客户端发送 SUB order pay,我们就创建一个名为 order 的 topic,再在 topic 下面创建一个名为 pay 的 channel,最后将该客户端与该 channel 绑定,后续该客户端就能接收到生产者的消息了。

现阶段我们准备实现四种协议,分别是 SUB(订阅)、GET(读取)、FIN(完成)和 REQ (重入),有需要的话后期再加。由于这种不确定性,我们可以在运行时再确定我们要调用的方法,这样可以保证不用改动我们的核心代码。所以我们在这里使用 Go 语言的反射机制来实现协议的核心代码,等到后期协议成熟了之后,我们可以用 switch 重构核心,毕竟反射的性能还是比较差的。

我们先来定义一些客户端的错误以及需要用到的常量和接口等等,统一放在 protocol/client_error 文件下了:

package protocol

import (
    "io"
)

const (
    ClientInit = iota
    ClientWaitGet
    ClientWaitResponse
)

type StatefulReadWriter interface {
    io.ReadWriter
    GetState() int
    SetState(state int)
    String() string
}

type ClientError struct {
    errStr string
}

func (e ClientError) Error() string {
    return e.errStr
}

var (
    ClientErrInvalid    = ClientError{"E_INVALID"}
    ClientErrBadTopic   = ClientError{"E_BAD_TOPIC"}
    ClientErrBadChannel = ClientError{"E_BAD_CHANNEL"}
    ClientErrBadMessage = ClientError{"E_BAD_MESSAGE"}
)

执行代码

我们来看一下协议的执行代码:

type Protocol struct {
    channel *message.Channel
}

func (p *Protocol) IOLoop(client StatefulReadWriter) error {
    var (
        err  error
        line string
        resp []byte
    )

    client.SetState(ClientInit)

    reader := bufio.NewReader(client)
    for {
        line, err = reader.ReadString('\n')
        if err != nil {
            break
        }

        line = strings.Replace(line, "\n", "", -1)
        line = strings.Replace(line, "\r", "", -1)
        params := strings.Split(line, " ")

        log.Printf("PROTOCOL: %#v", params)

        resp, err = p.Execute(client, params...)
        if err != nil {
            _, err = client.Write([]byte(err.Error()))
            if err != nil {
                break
            }
            continue
        }

        if resp != nil {
            _, err = client.Write(resp)
            if err != nil {
                break
            }
        }
    }

    return err
}

// Execute use reflection to call the appropriate method for this command
func (p *Protocol) Execute(client StatefulReadWriter, params ...string) ([]byte, error) {
    var (
        err  error
        resp []byte
    )

    typ := reflect.TypeOf(p)
    args := make([]reflect.Value, 3)
    args[0] = reflect.ValueOf(p)
    args[1] = reflect.ValueOf(client)

    cmd := strings.ToUpper(params[0])

    if method, ok := typ.MethodByName(cmd); ok {
        args[2] = reflect.ValueOf(params)
        returnValues := method.Func.Call(args)

        if !returnValues[0].IsNil() {
            resp = returnValues[0].Interface().([]byte)
        }

        if !returnValues[1].IsNil() {
            err = returnValues[1].Interface().(error)
        }

        return resp, err
    }

    return nil, ClientErrInvalid
}

IOLoop 方法比较简单,就是循环从客户端逐行读取输入,简单地过滤后,拆分成各个参数传递给 Execute 方法,然后将结果往客户端写入。因此,Execute 方法才是真正的核心代码,它的思路就是以传入的 params 的第一项作为方法名,判断有无实现该函数并执行发射调用。例如客户端发送 SUB order pay,就是先判断 &Protocol 有没有实现 SUB 方法,有的话就将 client 和 params 数组一起作为参数传给 SUB 方法执行调用,并返回调用结果。

有的同学可能会好奇为什么在 client 之前又加了个参数 p,也就是方法实现者本身。这是因为在 Go 语言中,类型 A 的方法本质上就是一个以 A 为第一个参数的函数,所以我们反射调用的时候必须将 &Protocol 作为第一个参数。

具体实现

SUB

获取 topic,再获取 channel,最后绑定客户端连接和 channel。

func (p *Protocol) SUB(client StatefulReadWriter, params []string) ([]byte, error) {
    if client.GetState() != ClientInit {
        return nil, ClientErrInvalid
    }

    if len(params) < 3 {
        return nil, ClientErrInvalid
    }

    topicName := params[1]
    if len(topicName) == 0 {
        return nil, ClientErrBadTopic
    }

    channelName := params[2]
    if len(channelName) == 0 {
        return nil, ClientErrBadChannel
    }

    client.SetState(ClientWaitGet)

    topic := message.GetTopic(topicName)
    p.channel = topic.GetChannel(channelName)

    return nil, nil
}

GET

向绑定的 channel 发送消息,然后修改状态,就是这么简单。

func (p *Protocol) GET(client StatefulReadWriter, params []string) ([]byte, error) {
    if client.GetState() != ClientWaitGet {
        return nil, ClientErrInvalid
    }

    msg := p.channel.PullMessage()
    if msg == nil {
        log.Printf("ERROR: msg == nil")
        return nil, ClientErrBadMessage
    }

    uuidStr := util.UuidToStr(msg.Uuid())
    log.Printf("PROTOCOL: writing msg(%s) to client(%s) - %s", uuidStr, client.String(), string(msg.Body()))

    client.SetState(ClientWaitResponse)

    return msg.Data(), nil
}

FIN

解释都算多余...

func (p *Protocol) FIN(client StatefulReadWriter, params []string) ([]byte, error) {
    if client.GetState() != ClientWaitResponse {
        return nil, ClientErrInvalid
    }

    if len(params) < 2 {
        return nil, ClientErrInvalid
    }

    uuidStr := params[1]
    err := p.channel.FinishMessage(uuidStr)
    if err != nil {
        return nil, err
    }

    client.SetState(ClientWaitGet)

    return nil, nil
}

REQ

同样也不用解释。

func (p *Protocol) REQ(client StatefulReadWriter, params []string) ([]byte, error) {
    if client.GetState() != ClientWaitResponse {
        return nil, ClientErrInvalid
    }

    if len(params) < 2 {
        return nil, ClientErrInvalid
    }

    uuidStr := params[1]
    err := p.channel.RequeueMessage(uuidStr)
    if err != nil {
        return nil, err
    }

    client.SetState(ClientWaitGet)

    return nil, nil

}

最后别忘了在 client.go 中加一个方法,将我们的协议用起来:

// Handle reads data from the client, keeps state, and responds.
func (c *Client) Handle() {
    defer c.Close()
    proto := &protocol.Protocol{}
    err := proto.IOLoop(c)
    if err != nil {
        log.Printf("ERROR: client(%s) - %s", c.String(), err.Error())
        return
    }
}

有细心的同学可能发现了,我们是在协议中关联了 channel,在 channel 结构中维护的消费者数组似乎并没有用到。这个没有关系,因为我们设计的这个消息队列实现的是“拉”模式,是由消费者主动拉取数据。如果我们要扩展“推”模式,要向消费者主动推送数据的话,channel 中维护的消费者就可以派上用场了。

后台队列

我们之前在实现 channel 和 topic 时,会使用一个有缓冲管道 msgChan 作为内存队列暂存消息,缓冲区满的时候就选择丢弃消息,现在我们就来实现一个持久化的队列来保证这些消息不丢失。

接口和字段定义

老规矩,还是定义一个后台队列的接口:queue/backend_queue.go

type Queue interface {
    Get() ([]byte, error)
    Put([]byte) error
    ReadReadyChan() chan struct{}
    Close() error
}

时间有限,这里只提供一个磁盘队列 DiskQueue 的实现,字段定义如下:

const maxFileSize = 1024 * 1024 * 100

type DiskQueue struct {
    name         string
    readPos      int64
    writePos     int64
    readFileNum  int64
    writeFileNum int64
    readFile     *os.File
    writeFile    *os.File
    readChan     chan struct{}
    inChan       chan util.ChanReq
    outChan      chan util.ChanRet
    exitChan     chan util.ChanReq
}

前面几个字段就是读写的文件以及位置信息,后面的几个管道用于收发消息,同时限制了单个文件的大小上限为 100 MB。

辅助函数

辅助函数分为三类:

  • 持久化和重载元数据
  • 生成和获取文件名
  • 判断是否有数据可读

注:当读写的文件超过单个文件大小上限或者关闭队列时,我们需要将读写的文件名和位置信息保存下来,方便下次启动时重新定位继续读写,需要保存的文件名和读写位置就称之为元数据。

func (d *DiskQueue) persistMetaData() (err error) {
    metaFileName := d.metaDataFileName()
    tmpFileName := metaFileName + ".tmp"
    f, err := os.OpenFile(tmpFileName, os.O_RDWR|os.O_CREATE, 0600)
    if err != nil {
        return
    }

    _, err = fmt.Fprintf(f, "%d,%d\n%d,%d\n", d.readFileNum, d.readPos, d.writeFileNum, d.writePos)
    if err != nil {
        f.Close()
        return
    }
    f.Close()

    log.Printf("DISK: persisted meta data for (%s) - readFileNum=%d writeFileNum=%d readPos=%d writePos=%d",
        d.name, d.readFileNum, d.writeFileNum, d.readPos, d.writePos)

    return os.Rename(tmpFileName, metaFileName)
}

func (d *DiskQueue) retrieveMetaData() (err error) {
    metaFileName := d.metaDataFileName()
    f, err := os.OpenFile(metaFileName, os.O_RDONLY, 0600)
    if err != nil {
        return
    }
    defer f.Close()

    _, err = fmt.Fscanf(f, "%d,%d\n%d,%d\n", &d.readFileNum, &d.readPos, &d.writeFileNum, &d.writePos)
    if err != nil {
        return
    }

    log.Printf("DISK: retrieved meta data for (%s) - readFileNum=%d writeFileNum=%d readPos=%d writePos=%d",
        d.name, d.readFileNum, d.writeFileNum, d.readPos, d.writePos)

    return
}

func (d *DiskQueue) metaDataFileName() string {
    return fmt.Sprintf("%s.diskqueue.meta.dat", d.name)
}

func (d *DiskQueue) fileName(fileNum int64) string {
    return fmt.Sprintf("%s.diskqueue.%06d.dat", d.name, fileNum)
}

func (d *DiskQueue) hasDataToRead() bool {
    return (d.writeFileNum > d.readFileNum) || (d.writePos > d.readPos)
}

读写消息

读写消息的逻辑就是对文件的读写,没有什么阅读难度,这里就不一一介绍了:

func (d *DiskQueue) readOne() ([]byte, error) {
    var (
        err     error
        msgSize int32
    )
    if d.readPos > maxFileSize {
        d.readFileNum++
        d.readPos = 0
        d.readFile.Close()
        d.readFile = nil

        if err = d.persistMetaData(); err != nil {
            return nil, err
        }
    }

    if d.readFile == nil {
        d.readFile, err = os.OpenFile(d.fileName(d.readFileNum), os.O_RDONLY, 0600)
        if err != nil {
            return nil, err
        }
        if d.readPos > 0 {
            _, err = d.readFile.Seek(d.readPos, 0)
            if err != nil {
                return nil, err
            }
        }
    }

    err = binary.Read(d.readFile, binary.BigEndian, &msgSize)
    if err != nil {
        d.readFile.Close()
        d.readFile = nil
        return nil, err
    }

    readBuf := make([]byte, msgSize)
    _, err = d.readFile.Read(readBuf)
    if err != nil {
        return nil, err
    }

    d.readPos += int64(msgSize + 4)

    return readBuf, nil
}

func (d *DiskQueue) writeOne(msg []byte) (err error) {
    var buf bytes.Buffer

    if d.writePos > maxFileSize {
        d.writeFileNum++
        d.writePos = 0
        d.writeFile.Close()
        d.writeFile = nil

        if err = d.persistMetaData(); err != nil {
            return
        }
    }

    if d.writeFile == nil {
        d.writeFile, err = os.OpenFile(d.fileName(d.writeFileNum), os.O_RDWR|os.O_CREATE, 0600)
        if err != nil {
            return
        }

        if d.writePos > 0 {
            _, err = d.writeFile.Seek(d.writePos, 0)
            if err != nil {
                return
            }
        }
    }

    dataLen := len(msg)
    err = binary.Write(&buf, binary.BigEndian, dataLen)
    if err != nil {
        return
    }

    _, err = buf.Write(msg)
    if err != nil {
        return
    }

    _, err = d.writeFile.Write(buf.Bytes())
    if err != nil {
        d.writeFile.Close()
        d.writeFile = nil
        return
    }

    d.writePos += int64(dataLen + 4)

    return
}

事件调度

后台队列的事件调度和 channel、topic 的逻辑如出一辙,就是暴露的管道操作方法加上后台的 for + select 监听组合:

func (d *DiskQueue) Get() ([]byte, error) {
    ret := <-d.outChan
    return ret.Variable.([]byte), ret.Err
}

func (d *DiskQueue) Put(bytes []byte) error {
    errChan := make(chan interface{})
    d.inChan <- util.ChanReq{
        Variable: bytes,
        RetChan:  errChan,
    }
    err, _ := (<-errChan).(error)
    return err
}

func (d *DiskQueue) ReadReadyChan() chan struct{} {
    return d.readChan
}

func (d *DiskQueue) Close() error {
    errChan := make(chan interface{})
    d.exitChan <- util.ChanReq{
        RetChan: errChan,
    }

    err, _ := (<-errChan).(error)
    return err
}

func (d *DiskQueue) router() {
    for {
        if d.hasDataToRead() {
            select {
            // in order to read only when we actually want a message
            case d.readChan <- struct{}{}:
                msg, err := d.readOne()
                d.outChan <- util.ChanRet{
                    Err:      err,
                    Variable: msg,
                }
            case writeRequest := <-d.inChan:
                err := d.writeOne(writeRequest.Variable.([]byte))
                writeRequest.RetChan <- err
            case closeReq := <-d.exitChan:
                if d.readFile != nil {
                    d.readFile.Close()
                }
                if d.writeFile != nil {
                    d.writeFile.Close()
                }

                closeReq.RetChan <- d.persistMetaData()

                return
            }
        } else {
            select {
            case writeRequest := <-d.inChan:
                err := d.writeOne(writeRequest.Variable.([]byte))
                writeRequest.RetChan <- err
            case closeReq := <-d.exitChan:
                if d.readFile != nil {
                    d.readFile.Close()
                }
                if d.writeFile != nil {
                    d.writeFile.Close()
                }

                closeReq.RetChan <- d.persistMetaData()

                return
            }
        }
    }
}

Get 方法就是读取消息,Put 是发送消息,Close 是发送关闭信号。值得一提的是 ReadReadyChan 方法,它返回的是 readChan 这个管道,那么这个管道有什么用?答案是 readChan 是为了确保当真正有读取后台队列需求的时候才往 outChan 发送数据,毕竟我们读取数据应该用拉模式,而不是一旦有数据可读就发送的推模式。

运用后台队列

我们的后台队列设计好后,就可以在之前 channel 和 topic 的设计中学以致用避免丢失数据的问题,主要修改的地方有三处:

  • 接收消息时,当 msgChan 缓冲区已满,写入后台队列
  • 推送消息时,当 msgChan 无数据但后台队列有数据时,读取队列组装消息发送
  • 关闭 channel 和 topic 的时候,一并将后台队列关闭

需要改动的地方不多,这里就不贴代码了,本篇的完整代码可以参考项目库。到这里我们的核心组件大致设计完成了,下一篇我们就来完成收尾工作。


项目地址:https://github.com/yhao1206/SMQ
相关阅读:


与昊
225 声望636 粉丝

IT民工,主要从事web方向,喜欢研究技术和投资之道