背景:我在模仿Swoole
实现一个扩展。起初个人觉得只需要保存C
栈就行了,因为PHP
代码的执行是靠C
代码来解释执行的,所以,如果C
程序的上下文被保存了,那么PHP
的上下文自然会被保存。比如PHP
的EG(stack)
也是通过C
程序的一个变量找到的。
但是,我昨天遇到了一个bug
,应该是和我没有正确处理PHP
栈导致的。但是我不确定是否是这个原因。
我的协程库代码在: https://github.com/php-extens...
测试脚本是:
<?php
study_event_init();
Sgo(function ()
{
$serv = new Study\Coroutine\Server("127.0.0.1", 8080);
while (1)
{
$connfd = $serv->accept();
Sgo(function ($serv, $connfd)
{
$buf = $serv->recv($connfd);
$responseStr = "HTTP/1.1 200 OK\r\nContent-Type: text/html\r\nConnection: close\r\nContent-Length: 11\r\n\r\nhello world\r\n";
$serv->send($connfd, $responseStr);
$serv->close($connfd);
}, $serv, $connfd);
}
});
study_event_wait();
这个脚本做的事情也是比较简单的。一个短链接服务器,向客户端发送一个HTTP
包就主动断开与客户端的连接。
然后,我用ab
去压测:
ab -c 2 -n 10000 127.0.0.1:8080/
服务器这边会报段错误:
[2019-09-20 01:23:19] TRACE zim_study_coroutine_server_coro_accept: sockfd[4] in /root/codeDir/cppCode/study/study_server_coro.cc on line 65.
[2019-09-20 01:23:19] TRACE wait_event: sockfd[4] in /root/codeDir/cppCode/study/src/coroutine/socket.cc on line 102.
Segmentation fault
~/codeDir/cppCode/study #
用gdb
调试发现是在释放协程栈的时候出错了:
Program received signal SIGSEGV, Segmentation fault.
0x0000555555a20588 in ?? ()
(gdb) bt
#0 0x0000555555a20588 in ?? ()
#1 0x00007ffff78d137f in study::PHPCoroutine::create_func (arg=<optimized out>) at /root/codeDir/cppCode/study/study_coroutine.cc:113
#2 0x00007ffff78d259b in study::Context::context_func (arg=0x55555667e4f0) at /root/codeDir/cppCode/study/src/coroutine/context.cc:51
#3 0x00007ffff78d25d1 in make_fcontext () at /root/codeDir/cppCode/study/thirdparty/boost/asm/make_x86_64_sysv_elf_gas.S:64
#4 0x0000000000000000 in ?? ()
(gdb)
也就是代码:
zend_vm_stack stack = EG(vm_stack);
efree(stack); // 出问题的地方
出错了。
如果我把代码:
efree(stack);
给注释掉,就不会报段错误了。所以我猜测是和PHP
栈有关。(C
栈切换应该是没有问题的,因为我单独把C
程序拿出来跑,写了个和PHP
代码对应的C
服务器程序,是不会出现问题的)
而且,一旦我用valgrind
去检查内存情况,就不会出现这个段错误了:
~/codeDir/cppCode/study # valgrind --track-origins=yes php test.php
==8470== Warning: client switching stacks? SP change: 0x5954e50 --> 0x1ffeffcf10
==8470== to suppress, use: --max-stackframe=137328492736 or greater
==8470== Warning: client switching stacks? SP change: 0x1ffeffcfc0 --> 0x5954e50
==8470== to suppress, use: --max-stackframe=137328492912 or greater
==8470== further instances of this message will not be shown.
但是,这个时候,压测的时间就会变得比较久。
我为前辈们准备了一份Dockerfile
,可以直接跑起一个可用的环境,在目录docker
里面。这个问题搞了好几天了,希望前辈可以指点一下,我的程序到底是哪里出了问题。
今天我保存了
PHP
栈,bug
解决了。后续得学习一下PHP
执行流,加深理解。有小伙伴遇到类似的问题,也可以试着去保存一下PHP
栈。