在Go程序中defer特别常见,通常用来执行一些清理工作,需要注意defer先入后出特性(先声明的后执行);panic意味着一些出乎意料的错误发生,Go程序在panic异常退出的时候,会打印运行时栈方便排查问题;panic的错误可以被recover捕获,从而避免Go程序的退出,但是要注意recover只能在defer中,其他任何地方声明的recover是不能捕获panic的。
panic/defer/recover基本使用
Go程序的defer具备延后执行的能力,因此通常用来执行一些清理工作,例如文件的关闭,锁的释放等等。如下面事例所示:
package main
import "sync"
var lock = sync.Mutex{}
func main() {
//1.接受到请求
//2.处理请求
doRequest()
//3.请求响应
}
//请求不能并行执行,所以需要加锁
func doRequest() {
lock.Lock()
defer lock.Unlock()
//临界区代码逻辑
//这么执行也行,但是如果临界区出现panic,锁将无法释放
//lock.Unlock()
}
语句defer lock.Unlock()并没有立即执行锁的释放操作,而是声明了一个延后执行操作,当doRequest函数返回时,会执行当前函数声明的defer操作,也就是doRequest函数返回时,才真正的释放锁。为什么要这么写呢?一般不是加锁,临界区代码,释放锁吗?想想如果临界区代码出现panic呢?这时候还能执行锁的释放操作吗?而一旦锁没有成功释放,后续其他请求不就全部阻塞了?
这一点一定要切记,针对一些资源的关闭,锁的释放等操作,一定在defer执行,否则就有可能出现死锁,资源泄露等等情况。
我们看到,doRequest执行完毕返回时,才真正执行defer声明,那如果一个函数内声明了多个defer呢?函数返回时defer的执行顺序是怎么样的呢?如下面的事例:
package main
import "fmt"
func main() {
for i := 0; i < 5; i ++ {
defer fmt.Println(i)
}
}
这段程序输出什么呢?其实这里涉及两个问题:1)defer执行顺序;2)defer传参问题。需要注意的是,在声明defer fmt.Println时,参数i作为fmt.Println函数的输入参数,值已经明确了,且封装进interface数据类型,所以最终执行fmt.Println函数时,输出的是5个不同的值。另外,defer是先声明后执行的,所以最终执行顺序应该反着来看,输出 4-3-2-1-0。
panic意味着一些出乎意料的错误发生,Go程序在panic异常退出的时候,会打印运行时栈方便排查问题,例如map如果没有初始化,执行操作会panic;空指针引用也会panic;数组越界也会panic等等。如下面程序所示:
package main
func main() {
var data map[string]int
data["test"] = 1
}
/*
panic: assignment to entry in nil map
goroutine 1 [running]:
main.main()
/test.go:6 +0x2e
*/
当然,我们也可以通过panic函数手动抛出panic,注意Go程序在遇到panic时可是会异常退出的,一般为了避免程序退出,我们会使用recover捕获panic,只是需要记得recover只能在defer中。如下面程序所示:
package main
import "fmt"
func main() {
defer func() {
if rec := recover(); rec != nil {
//捕获到panic,记录日志等
fmt.Println(rec)
}
}()
panic("this is a panic")
}
//this is a panic
recover在Go程序作为HTTP服务时特别有用,总不能因为一个HTTP请求处理异常,导致整个服务退出吧?通常我们在使用recover捕获到panic时,会记录一些日志,包括运行时栈数据,以及HTTP请求,方便排查问题。
实现原理
通过上面介绍,我们基本了解了panic/defer/recover的基本使用,不过思考下,为什么defer是先声明后执行的呢?Go语言如何保证在函数返回时,执行当前函数内声明的defer呢?recover为什么只能在defer中呢?假设A协程抛出panic,在B协程能使用recover捕获到吗?
在深入研究panic/defer/recover实现原理之前,我们先介绍下其对应的底层实现方法:
//参考文件runtime/panic.go
// Create a new deferred function fn, which has no arguments and results.
// The compiler turns a defer statement into a call to this.
func deferproc(fn func())
// deferprocStack queues a new deferred function with a defer record on the stack.
func deferprocStack(d *_defer)
// The implementation of the predeclared function panic.
func gopanic(e any)
// The implementation of the predeclared function recover.
func gorecover(argp uintptr) any
// deferreturn runs deferred functions for the caller's frame.
// The compiler inserts a call to this at the end of any
// function which calls defer.
func deferreturn()
看到deferreturn函数的注释,基本也就明白了Go语言如何保证在函数返回时执行当前函数内声明的defer。在编译阶段,如果检测到当前函数声明了defer,则会在函数末尾添加deferreturn函数调用,该函数遍历当前函数声明的defer并执行:
func deferreturn() {
gp := getg()
for {
d := gp._defer
if d == nil {
return
}
//defer链表存储在当前协程G,d.sp=sp说明defer就是在当前函数声明的
sp := getcallersp()
if d.sp != sp {
return
}
fn := d.fn
d.fn = nil
gp._defer = d.link
freedefer(d)
fn()
}
}
从deferreturn函数定义可以看到,defer链表是存储在当前协程G上的,所以在遍历过程中需要判断defer是否声明在当前函数,怎么判断呢?基于栈顶寄存器sp,在将defer加入到协程G链表时,记录了声明该defer时候的栈顶寄存器sp(也就是当前函数栈顶)。
貌似从函数deferreturn的实现看不出来为什么defer是先声明后执行的,不过基本能确定协程G上维护了一个defer链表,那么在新增defer节点时,头插法是不是对应的就是栈呢?我们简单看看deferproc函数的实现逻辑(deferprocStack类似):
func deferproc(fn func()) {
gp := getg()
d := newdefer()
//头插法
d.link = gp._defer
gp._defer = d
d.fn = fn
//设置函数栈顶寄存器sp以及指令寄存器pc
d.sp = getcallersp()
d.pc = getcallerpc()
return0()
}
还有一个问题,panic是怎么触发程序退出的呢?recover为什么只能在defer中呢?假设A协程抛出panic,在B协程能使用recover捕获到吗?我们先看看gopanic函数的实现逻辑:
func gopanic(e any) {
//遍历当前协程defer链表
for {
d := gp._defer
if d == nil {
break
}
//执行defer
d.fn()
pc := d.pc
sp := unsafe.Pointer(d.sp)
//recover捕获,恢复程序执行
if p.recovered {
gp.sigcode0 = uintptr(sp)
gp.sigcode1 = pc
mcall(recovery)
}
}
//打印栈桢,exit(2)退出
fatalpanic(gp._panic) // should not return
}
在触发panic时,Go语言遍历当前协程defer链表,如果其中某个defer执行recover捕获了异常,则恢复程序执行,否则最后通过exit(2)退出。看到这里基本也能猜出来,gorecover函数肯定会设置p.recovered=true。另外,由于Go语言遍历的是当前协程defer链表,所以其他协程中defer+recover是无法捕获该panic的,而且如果recover不在defer中也是无法捕获的。
最后一个问题,recover捕获了panic,恢复程序执行后,下一条执行的指令是什么呢?其实可以直观的想想,当执行到某一个defer并且当前defer捕获了异常,一般情况什么时候执行defer呢?函数执行完毕返回之前!那假设某一个defer执行了,并且需要恢复程序正常执行流程,那怎么办?继续执行当前协程的defer显然不合适,这不是正常流程,只能按照当前defer所在函数执行结束返回的逻辑往下走了,也就是继续执行当前defer所在函数内声明的defer,如果没有,函数返回,返回到哪?当然是调用该函数的地方了!
package main
import "fmt"
func main() {
test()
fmt.Println("test end")
}
func test() {
defer fmt.Println("defer 1")
defer func() {
fmt.Println("defer 2")
if rec := recover(); rec != nil {
fmt.Println(rec)
}
}()
defer fmt.Println("defer 3")
panic("this is a panic")
}
/*
defer 3
defer 2
this is a panic
defer 1
test end
*/
仔细观察deferproc函数最后一行代码return0(),刚才省略了其注释:
// deferproc returns 0 normally.
// a deferred func that stops a panic
// makes the deferproc return 1.
// the code the compiler generates always
// checks the return value and jumps to the
// end of the function if deferproc returns != 0.
如果deferproc返回1,跳转到函数返回处执行(deferreturn)。这怎么实现的呢?怎么返回1呢?deferproc不是在声明defer的时候就执行了吗?程序又是怎么跳转到这里而且还能返回1呢?defer内捕获到panic后,通过mcall(recovery)恢复了程序的执行(gopanic函数实现),就是这一行代码,跳转到了deferproc函数下一行代码,并且设置了返回值1
func recovery(gp *g) {
//结合gopanic + deferproc函数,这里的sp以及pc(就是调用deferproc函数时的寄存器地址)
sp := gp.sigcode0
pc := gp.sigcode1
gp.sched.sp = sp
gp.sched.pc = pc
//设置返回值为1
gp.sched.ret = 1
//跳转
gogo(&gp.sched)
}
recovery函数设置寄存器sp以及pc,以及返回值ret=1,跳转到该上下文继续执行程序。这里的pc就是调用deferproc函数时的寄存器地址,也就是deferproc下一行指令,就是这一行指令判断了返回值如果为1,跳转到函数末尾执行deferreturn。当然这一行指令一般情况是看不到的,只能看汇编后的代码:
package main
import "fmt"
func main() {
defer fmt.Println(1)
fmt.Println("hello world")
}
//go tool compile -S -N -l test.go
/*
0x00a3 00163 (test.go:6) CALL runtime.deferprocStack(SB)
0x00a8 00168 (test.go:6) TESTL AX, AX
0x00aa 00170 (test.go:6) JNE 288
0x0109 00265 (test.go:9) CALL runtime.deferreturn(SB)
0x010e 00270 (test.go:9) MOVQ 192(SP), BP
0x0116 00278 (test.go:9) ADDQ $200, SP
0x011d 00285 (test.go:9) RET
0x011e 00286 (test.go:9) NOP
0x0120 00288 (test.go:6) CALL runtime.deferreturn(SB)
0x0125 00293 (test.go:6) MOVQ 192(SP), BP
0x012d 00301 (test.go:6) ADDQ $200, SP
0x0134 00308 (test.go:6) RET
*/
总结
本篇文章主要介绍panic/defer/recover的基本使用以及实现原理,要切记针对一些资源的关闭,锁的释放等操作,一定在defer执行,否则就有可能出现死锁,资源泄露等等情况;另外,在程序可能出现panic的地方,记得添加defer+recover,不然你的程序在遇到panic时可是会退出的。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。