PHP之引用计数内存管理机制和垃圾回收机制

Xavier

引用赋值

$a = 'apple';
$b = &$a;

上述代码中,我将一个字符串赋值给变量a,然后将a的引用赋值给了变量b。显然,这个时候的内存指向应该是这样的:

$a -> 'apple' <- $b

a和b指向了同一块内存区域(变量容器 zval ),我们通过 var_dump($a, $b) 得到 string(5) "apple" string(5) "apple" ,这是我们预期的结果。

unset函数 与 引用计数

unset 函数

假如我想将 'apple' 这个字符串从内存中释放掉。我是这么做的:

unset($a);

但是通过再次打印 $a $b 两变量的信息,我得到了这样的结果:Notice: Undefined variable: astring(5) "apple" 。奇怪,$a $b 指向同一个变量容器,又明明将$a释放了,为什么$b还是'apple'

其实是这样的,unset()只是将一个变量符号a(指针)销毁了,并没有释放掉那个变量容器,所以执行完操作之后,内存指向只是变成了这样:

'apple' <- $b

引用计数

引用计数 (reference count)是每个变量容器中都会存放的一条信息,它表示当前变量容器正被多少个变量符号所引用。

正如之前的例子,unset()并没有释放变量所指向的变量容器,而只是将变量符号销毁了。同时,将变量容器中的 引用计数 减1,当引用计数为0时,也就是说当变量容器不被任何变量引用时,便会触发php的垃圾回收(错误) ,它便会被释放(正确)。

更正上述的一个小错误: 这种单纯的引用计数方式是 php 5.2 之前的内存管理机制,称不上是垃圾回收机制,垃圾回收机制是 php 5.3 才引入的,垃圾回收机制为的是解决这种单纯的引用计数内存管理机制的缺陷(即 循环引用导致的内存泄漏,下文会进行讲解)

回到正题,我们用代码来验证一下先前的结论:

$a = 'apple';
$b = &$a;

$before = memory_get_usage();
unset($a);
$after = memory_get_usage();

var_dump($before - $after);  // 结果为int(0),变量容器的引用计数为1,没有释放
$a = 'apple';
$b = &$a;

$before = memory_get_usage();
unset($a, $b);
$after = memory_get_usage();

var_dump($before - $after);  // 结果为int(24),变量容器的引用计数为0,得到释放

直接释放

那要怎样做才能真正释放掉 'apple' 所占用的内存呢?

利用上述方法,我们可以在 unset($a) 之后再 unset($b) ,将变量容器的所有引用都销毁,引用计数减为0了,自然就被释放掉了。

当然,还有更直接的方法:

$a = null;

直接赋值 null 会将 $a 所指向的内存区域置空,并将引用计数归零,内存便被释放。

脚本执行结束后的内存

对于一般的web程序来说(fpm模式下),php的执行是单线程同步阻塞型的,当脚本执行结束之后,脚本内使用的所有内存都会被释放。那么,我们手动去释放内存到底有意义吗?

其实关于这个问题,早有解答,推荐大家看一下鸟哥 @laruence 2012年发表的一篇文章:

请手动释放你的资源(Please release resources manually)

引用计数内存管理机制的缺陷:循环引用

现在我们来讲讲之前提到的引用计数内存管理机制的缺陷。

当一个变量容器的引用计数为0时,php会进行垃圾回收。但是,你可想过,有一种情况会导致一个变量容器的引用计数永远不会被减为0,举个例子:

$a = ['one'];
$a[] = &$a;

我们看到,$a数组第二个元素就是它本身。那么,存放数组的这个变量容器的引用计数为2,一个引用是变量a,另一个引用是这个数组的第二个元素 - 索引1

图片描述

那么,如果这时我们 unset($a) ,存放数组的变量容器的引用计数会减1,但还有1个引用,就是数组的元素 1 ,现在引用结构变成了这样:

图片描述

由于变量容器的引用计数没有变为0,所以不能被释放,而且这时又没有外部其他变量符号引用它,用户也没有办法去清除这个结构,这时它就会一直驻留在内存之中。

所以如果代码中存在大量的这种结构和操作,最终会导致内存损耗甚至泄漏。这就是 循环引用 带来的内存无法释放的问题。

庆幸的是,fpm模式下,当请求的脚本执行结束,php会释放所有脚本中使用到的内存,包括这个结构。但是,如果是守护进程下的php程序呢?比如swoole。这个php需要解决的急迫问题(已经解决,见下文)。

PHP 5.3.0 引入的同步算法

传统上,像以前的 php 用到的引用计数内存机制,无法处理循环引用的内存泄漏。然而 5.3.0 PHP 使用文章 » 引用计数系统中的同步周期回收(Concurrent Cycle Collection in Reference Counted Systems) 中的同步算法,解决了这个内存泄漏问题,这种算法就是PHP的垃圾回收机制。

具体算法的实现和流程有些许复杂,请阅读官方文档,这里不再赘述,另附上几个算法流程讲解的文章链接,讲得比较直白:

http://php.net/manual/zh/feat... 官方文档
http://www.cnblogs.com/leoo2s...
https://blog.csdn.net/phpkern...

最后,还是引用鸟哥文章的这两段来说明问题:

在PHP5.2以前, PHP使用引用计数(Reference count)来做资源管理, 当一个zval的引用计数为0的时候, 它就会被释放. 虽然存在循环引用(Cycle reference), 但这样的设计对于开发Web脚本来说, 没什么问题, 因为Web脚本的特点和它追求的目标就是执行时间短, 不会长期运行. 对于循环引用造成的资源泄露, 会在请求结束时释放掉. 也就是说, 请求结束时释放资源, 是一种补救措施(backup).

然而, 随着PHP被越来越多的人使用, 就有很多人在一些后台脚本使用PHP, 这些脚本的特点是长期运行, 如果存在循环引用, 导致引用计数无法及时释放不用的资源, 则这个脚本最终会内存耗尽退出.

所以在PHP5.3以后, 我们引入了GC, 也就是说, 我们引入GC是为了解决用户无法解决的问题.

阅读 2.9k

Xavier 的技术博客
最近的关注重心: 1. 云原生 (Docker、Kubernetes) 2. 微服务 (网关 Kong、服务通讯 gRPC、通讯格式 Pro...

最近的关注重心:

407 声望
25 粉丝
0 条评论
你知道吗?

最近的关注重心:

407 声望
25 粉丝
文章目录
宣传栏