【Go进阶—数据结构】channel

channel 是 Golang 提供的 goroutine 间的通信方式，可以让一个 goroutine 发送特定值到另一个 goroutine。

特性

通道没有缓冲区，或者有缓冲区但缓冲区没有数据时，从通道读取数据会阻塞，直到有协程向通道中写入数据。类似地，通道没有缓冲区，或者缓冲区已满时，向通道写入数据也会阻塞，直到有协程从通道读取数据。对于值为 nil 的通道，无论读写都会阻塞，而且是永久阻塞。

使用内置函数 close 可以关闭通道，尝试向已关闭的通道发送数据会触发 panic，但此时仍然可读。通道读取的表达式最多有两个返回值：

x, ok := <-ch

第一个变量表示读出的数据，第二个变量表示是否成功读取了数据，它的值只跟通道缓冲区中是否有数据有关，与通道的关闭状态无关。

实现原理

数据结构

源码 src/runtime/chan.go:hchan 定义了 channel 的数据结构：

type hchan struct {
    qcount   uint           // 当前队列中剩余元素个数
    dataqsiz uint           // 环形队列长度，即可以存放的元素个数
    buf      unsafe.Pointer // 环形队列指针
    elemsize uint16         // 每个元素的大小
    closed   uint32         // 标识关闭状态
    elemtype *_type         // 元素类型
    sendx    uint           // 队列下标，指示元素写入时存放到队列中的位置
    recvx    uint           // 队列下标，指示元素从队列的该位置读出
    recvq    waitq          // 等待读消息的 goroutine 队列
    sendq    waitq          // 等待写消息的 goroutine 队列
    lock mutex              // 互斥锁，chan 不允许并发读写
}

可以看出 channel 由队列、类型信息、goroutine 等待队列组成。

环形队列

channel 内部实现了一个环形队列作为其缓冲区，队列的长度是创建 channel 时指定的。下图展示了一个可缓存 6 个元素的 channel 示意图：

dataqsiz 表明了队列长度为6，即可缓存6个元素；
buf 指向队列的内存地址；
qcount 表示队列中还有两个元素；
sendx 表示后续写入的数据存储的位置，取值为 [0, 6)；
recvx 表示读取数据的位置, 取值为[0, 6)。

类型信息

一个 channel 只能传递一种类型的值：

elemtype 代表类型，用于数据传递过程中的赋值；
elemsize 代表类型大小，用于在buf中定位元素位置。

等待队列

从 channel 读取数据时，如果没有缓冲区或者缓冲区为空，则当前协程会被阻塞，并被加入 recvq 队列。向 channel 写入数据时，如果没有缓冲区或者缓冲区已满，则当前协程同样会被阻塞，然后加入到 sendq 的队列。处于等待队列中的协程会在其他协程操作 channel 时被唤醒。

下图展示了一个没有缓冲区的 channel，并有几个协程正在阻塞等待读取数据：

相关操作

创建通道

创建 channel 的过程实际上就是初始化 hchan 结构，类型信息和缓冲区长度由 make 语句传入，buf 的大小则由元素大小和缓冲区长度共同决定。

源码 src/runtime/chan.go 中定义了创建 channel 的函数 makechan()，精简版的代码如下所示：

func makechan(t *chantype, size int) *hchan {    
    mem, overflow := math.MulUintptr(elem.size, uintptr(size))

    var c *hchan
    switch {
    case mem == 0:
        c = (*hchan)(mallocgc(hchanSize, nil, true))
        c.buf = c.raceaddr()
    case elem.ptrdata == 0:
        c = (*hchan)(mallocgc(hchanSize+mem, nil, true))
        c.buf = add(unsafe.Pointer(c), hchanSize)
    default:
        c = new(hchan)
        c.buf = mallocgc(mem, elem, true)
    }

    c.elemsize = uint16(elem.size)
    c.elemtype = elem
    c.dataqsiz = uint(size)

    return c
}

发送数据

发送数据的操作最终都转化成了 chansend() 函数，主要代码和逻辑如下：

func chansend(c *hchan, ep unsafe.Pointer, block bool, callerpc uintptr) bool {
    // 如果通道为 nil，非阻塞式发送的话直接返回 false，否则将当前协程挂起
    if c == nil {
        if !block {
            return false
        }
        gopark(nil, nil, waitReasonChanSendNilChan, traceEvGoStop, 2)
        throw("unreachable")
    }
 
    // 对于非阻塞式发送，如果通道未关闭且没有缓冲空间的话，直接返回 false
    if !block && c.closed == 0 && full(c) {
        return false
    }

    // 加锁，并发安全
    lock(&c.lock)

    // 如果通道关闭了，直接 panic
    if c.closed != 0 {
        unlock(&c.lock)
        panic(plainError("send on closed channel"))
    }

    // 如果接收队列不为空，直接将要发送的数据发送到队首的 goroutine
    if sg := c.recvq.dequeue(); sg != nil {
        send(c, sg, ep, func() { unlock(&c.lock) }, 3)
        return true
    }

    // 对于缓冲区还有空闲的 channel，拷贝数据到缓冲区，维护相关信息
    if c.qcount < c.dataqsiz {
        qp := chanbuf(c, c.sendx)
        if raceenabled {
            raceacquire(qp)
            racerelease(qp)
        }
        typedmemmove(c.elemtype, qp, ep)
        c.sendx++
        if c.sendx == c.dataqsiz {
            c.sendx = 0
        }
        c.qcount++
        unlock(&c.lock)
        return true
    }

    // 没有缓冲空间时，发送方会挂起，并根据当前 goroutine 构造一个 sudog 结构体添加到 sendq 队列中
    gp := getg()
    mysg := acquireSudog()
    mysg.releasetime = 0
    if t0 != 0 {
        mysg.releasetime = -1
    }

    mysg.elem = ep
    mysg.waitlink = nil
    mysg.g = gp
    mysg.isSelect = false
    mysg.c = c
    gp.waiting = mysg
    gp.param = nil
    c.sendq.enqueue(mysg)

    gopark(chanparkcommit, unsafe.Pointer(&c.lock), waitReasonChanSend, traceEvGoBlockSend, 2)

    // 省略被唤醒时部分代码

    return true
}

读取数据

读取数据的操作最终是转化成了 chanrecv() 函数，主要逻辑如下：

// selected 和 received 返回值分别代表是否可被 select 语句命中以及是否读取到了数据
func chanrecv(c *hchan, ep unsafe.Pointer, block bool) (selected, received bool) {
    // 如果 channel 为 nil，非阻塞式读取直接返回，否则直接挂起
    if c == nil {
        if !block {
            return
        }
        gopark(nil, nil, waitReasonChanReceiveNilChan, traceEvGoStop, 2)
        throw("unreachable")
    }

    // 非阻塞模式并且没有消息可读（没有缓冲区或者缓冲区为空），如果 channel 未关闭直接返回
    if !block && empty(c) {
        if atomic.Load(&c.closed) == 0 {
            return
        }

        if empty(c) {
            if raceenabled {
                raceacquire(c.raceaddr())
            }
            if ep != nil {
                typedmemclr(c.elemtype, ep)
            }
            return true, false
        }
    }

    // 加锁
    lock(&c.lock)

    // channel 已关闭并且没有消息可读（没有缓冲区或者缓冲区为空），会接收到零值，typedmemclr 会根据类型清理相应地址的内存
    if c.closed != 0 && c.qcount == 0 {
        if raceenabled {
            raceacquire(c.raceaddr())
        }
        unlock(&c.lock)
        if ep != nil {
            typedmemclr(c.elemtype, ep)
        }
        return true, false
    }

    // 等待发送队列不为空，如果是非缓冲型 channel，直接拷贝发送者的数据，否则接收队首的数据，并将发送者的数据移动到环形队列尾部
    if sg := c.sendq.dequeue(); sg != nil {
        recv(c, sg, ep, func() { unlock(&c.lock) }, 3)
        return true, true
    }

    // 缓冲型 channel，buf 里有元素，可以正常接收
    if c.qcount > 0 {
        // Receive directly from queue
        qp := chanbuf(c, c.recvx)
        if raceenabled {
            raceacquire(qp)
            racerelease(qp)
        }
        if ep != nil {
            typedmemmove(c.elemtype, ep, qp)
        }
        typedmemclr(c.elemtype, qp)
        c.recvx++
        if c.recvx == c.dataqsiz {
            c.recvx = 0
        }
        c.qcount--
        unlock(&c.lock)
        return true, true
    }

    // 被阻塞的情况，构造一个 sudog 结构体，保存到 channel 的等待接收队列，并将当前 goroutine 挂起
    gp := getg()
    mysg := acquireSudog()
    mysg.releasetime = 0
    if t0 != 0 {
        mysg.releasetime = -1
    }

    mysg.elem = ep
    mysg.waitlink = nil
    gp.waiting = mysg
    mysg.g = gp
    mysg.isSelect = false
    mysg.c = c
    gp.param = nil
    c.recvq.enqueue(mysg)

    atomic.Store8(&gp.parkingOnChan, 1)
    gopark(chanparkcommit, unsafe.Pointer(&c.lock), waitReasonChanReceive, traceEvGoBlockRecv, 2)

    // 省略被唤醒时部分代码
    
    return true, !closed
}

关闭通道

关闭某个 channel，最终会执行函数 closechan()，核心代码如下：

func closechan(c *hchan) {
    // 如果 channel 为 nil，直接 panic
    if c == nil {
        panic(plainError("close of nil channel"))
    }

    // 加锁，如果 channel 已关闭，直接 panic
    lock(&c.lock)
    if c.closed != 0 {
        unlock(&c.lock)
        panic(plainError("close of closed channel"))
    }

    c.closed = 1

    var glist gList

    // 释放等待接收队列中，向需要返回值的接收者返回相应的零值
    for {
        sg := c.recvq.dequeue()
        if sg == nil {
            break
        }
        if sg.elem != nil {
            typedmemclr(c.elemtype, sg.elem)
            sg.elem = nil
        }
        if sg.releasetime != 0 {
            sg.releasetime = cputicks()
        }
        gp := sg.g
        gp.param = nil
        if raceenabled {
            raceacquireg(gp, c.raceaddr())
        }
        glist.push(gp)
    }

    // 释放等待发送队列，相关的 goroutine 会触发panic
    for {
        sg := c.sendq.dequeue()
        if sg == nil {
            break
        }
        sg.elem = nil
        if sg.releasetime != 0 {
            sg.releasetime = cputicks()
        }
        gp := sg.g
        gp.param = nil
        if raceenabled {
            raceacquireg(gp, c.raceaddr())
        }
        glist.push(gp)
    }
    unlock(&c.lock)

    // ...
}

常见应用

定时任务

这种用法需要与 timer 结合，分为两种：超时控制和定时执行。

如果需要执行某项操作，但又不想它耗费太长时间，想给它一个超时限制，可以这么做：

select {
    case <-time.After(100 * time.Millisecond):
    case <-s.stopc:
        return false
}

等待 100 ms 后，如果 s.stopc 还没有读出数据或者被关闭，就直接结束。

定时执行某个任务也比较简单，例如每隔 1 秒种，执行一次定时任务：

func worker() {
    ticker := time.Tick(1 * time.Second)
    for {
        select {
        case <- ticker:
            // 执行任务
        }
    }
}

解耦生产者与消费者

使用一个 channel 保存任务，启动 n 个 goroutine 作为工作协程池，这些协程工作在一个无限循环里，从该 channel 读取任务并执行：

func main() {
    taskCh := make(chan int, 100)
    go worker(taskCh)

    for i := 0; i < 10; i++ {
        taskCh <- i
    }

    select {
    case <-time.After(time.Hour):
    }
}
func worker(taskCh <-chan int) {
    const N = 5

    for i := 0; i < N; i++ {
        go func(id int) {
            for {
                task := <- taskCh
                fmt.Printf("finish task: %d by worker %d\n", task, id)
                time.Sleep(time.Second)
            }
        }(i)
    }
}

控制并发数

有时需要定时执行几百个任务，但是并发数又不能太高，这时就可以通过 channel 来控制并发数。比如下面的例子：

var limit = make(chan int, 3)

func main() {
    // …………
    for _, w := range work {
        go func() {
            limit <- 1
            w()
            <-limit
        }()
    }
    // …………
}

构建一个容量为 3 的 channel，遍历任务列表，每个任务启动一个 goroutine，真正执行任务的动作在 w() 中完成。在执行 w() 之前，先要从 limit 中拿“许可证”，拿到许可证之后，才能执行 w()，并且在执行完任务，要将“许可证”归还。要注意的是，如果 w() 发生 panic，那“许可证”可能就还不回去了，因此需要使用 defer 来保证。

【Go进阶—数据结构】channel

特性

实现原理

数据结构

环形队列

类型信息

等待队列

相关操作

创建通道

发送数据

读取数据

关闭通道

常见应用

定时任务

解耦生产者与消费者

控制并发数

与昊

引用和评论

用 Go 写一个简单消息队列（六）：服务器实现

腾讯 tRPC-Go 教学——（5）filter、context 和日志组件

Go slice切片使用教程，一次通关！

gozero限流、熔断、降级如何实现？面试的时候怎么回答？

腾讯 tRPC-Go 教学——（1）搭建服务

如何系统地入门学习stm32？

一文弄懂用Go实现MCP服务