诞生

(我们为什么需要gmp模型)

我们知道,早期的操作系统操作系统是单进程的。后来引入了并发的思想,发展为多进程/多线程操作系统,操作系统可以通过时间片在多个进程之间切换。然而,在多个进程之间进行切换,是需要切换成本的。

在引入协程之前,我们需要回顾一下进程和线程的概念。
进程,是软件的执行副本,是分配资源的基础单位。每个进程有自己的进程控制块,代码,数据。
线程,是轻量级的线程,是调度和执行的基本单位。(这里单指内核态线程),每个线程有自己的寄存器和栈。

时间与空间

在传统的多线程并发模型中,轻量级的线程只需进行寄存器和栈等上下文的切换就可以完成多个任务的并发执行。然而,随着并发量越来越高,有些局限性开始展现出来。

随着并发量的上涨,切换的频率越来越高,线程的切换开销开始显露不足
随着并发量的上涨,需要越来越多的线程,内存占用也越来越大

因此,在高并发的需求下,协程因此诞生了,也就是golang中的groutine。

在时间上,平均每次协程切换的开销是 120ns 左右,相对于进程切换的开销大约 3.5us,大约是其的三十分之一
在空间上,协程初始化创建的时候为其分配的栈有 2KB,而线程栈一般在4-8M左右。

那么,为什么协程可以这么轻量呢。

在传统的多线程中,线程与进程的关系是固定的,每个线程必定从属于一个进程。而到了协程,为了去掉更多的枷锁,协程是不依赖于某个固定的线程的,协程可以自由切换而不比。换而言之,golang在用户空间与内核空间之间创建了一层新的映射,而这,就是gmp模型。
image.png

概念

(gmp是什么)
gmp=groutine+machine+processor

G

(1) g 即goroutine,是golang中对协程的抽象;
(2) g有自己的运行栈、状态、以及执行的任务函数(用户通过go func指定);
(3) g需要绑定到p才能执行,在g的视角中,p就是它的cpu.

M

(1) m 即machine,是golang 中对线程的抽象;
(2) m的数量是动态的,golang语言中默认最大值为10000,也可以用runtime/debug包中的SetMaxThreads函数来设置
(3) ⼀个M阻塞,会创建⼀个新的M。如果有M空闲,那么就会回收或者睡眠。

P

(1) p即 processor,是golang 中的调度器;
(2) p是 gmp的中枢,借由p承上启下,实现g 和m之间的动态有机结合;
(3)对g而言,p是其cpu,g只有被p调度,才得以执行;
(4)对m而言,p是其执行代理,为其提供必要信息的同时(可执行的g、内存分配情况等),并隐藏了繁杂的调度细节;
(5) p 的数量决定了g最大并行数量,可由用户通过GOMAXPROCS进行设定(超过CPu核数时无意义).也可以在程序中通过runtime.GOMAXPROCS() 来设置

gmp模型图片
image.png

调度

调度策略1 work steal
自己的本地队列为空时,会去别的本地队列偷取一半,保证有任务可以执行。

调度策略2 hand off
当一个绑定了M的G发生阻塞,会创建/唤醒

调度策略3 并行
最多有GOMAXPROCS个线程分布在多个CPU上同时运⾏

调度策略4 抢占
在Go中,⼀个goroutine最多占⽤CPU 10ms,防⽌其他goroutine被饿死

调度策略5 全局队列
当M执⾏work stealing从其他P偷不到G时,它可以从全局G队列获取G。


wric
10 声望3 粉丝