python中fork的代价

映天蓝

164112

发布于
2014-09-18

通常在java开发中采用单进程多线程的方式开发，因为JVM实在是太大了。但是在python中由于gil的原因，采用多线程方式无法很好的利用多核，那这样出了协程以外，就只能采用fork的方式了。

python中fork的代价有多大？

python

阅读 4.7k

2 个回答

得票最新

spacewander

5.6k4722

发布于
2014-10-07

✓ 已被采纳

我纯粹来作为字面党回答下楼主“Python中fork的代价有多大”：

写一段C++的代码和Python的代码，都是做同样的事，fork10000次，每次创建子进程后立刻结束子进程。

#!/usr/bin/env python
# coding: utf-8

import time
import os

start = time.time()
for i in range(10000):
    pid = os.fork()
    if pid == 0:
        os._exit(0)
print time.time() - start # 单位为秒

#include <ctime>
#include <iostream>
#include <unistd.h>

int main()
{
    int pid;
    std::clock_t c_start = std::clock();
    for (int i = 0; i < 10000; ++i) {
        if ((pid = fork()) == 0) {
            _exit(0);
        }
    }
    std::cout << (std::clock() - c_start) / 1000 <<" ms\n";
    return 0;
}

结果：python版本用时3秒左右，C++版本用时700多毫秒。python ：c++为4倍左右。
考虑到一般情况下python跟c++在运行效率上的差异，这个差距算是很好了。

c++是直接使用系统调用fork函数，所以python中fork的代价现在应该很明了。

背影和茶

470226

发布于
2014-10-07

python多线程确实存在无法有效利用多核的情况。可以采用多进程方式，用multiprocessing这个库。不需要你去手动的fork。此外python的fork底层应该调用的就是linux的fork系统调用，所以代价不会很大。
关于multiprocessing，下面是一段示例代码：

from multiprocessing import Pool

def worker(src):
    handle(src)

if __name__ == "__main__":
    pool = Pool(100)
    src_list = get_src_list()
    ret = pool(worker, src_list)
    print(ret)

上面就是一个100进程的进程池，src_list是待处理的数据，进程池会自动把其中项目分配给不同的worker进程去处理，可以有效利用多核。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python中fork的代价

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

python中fork的代价

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？