Python Process/Thread 概念整理

kid_learning

进程与线程 并发与并行

进程与线程

  首先要理解的是,我们的软件都是运行在操作系统之上,操作系统再控制硬件,比如 处理器、内存、IO设备等。操作系统为了向上层应用程序提供 简单一致 的机制来控制复杂而又大相径庭的低级硬件设备 抽象出 进程 的概念。进程是比较重量级的操作系统资源,它拥有独立的内存空间,而在 现代操作系统中为了实现在一个进程中执行多种任务,因此实现了 线程。 一个 进程 可以由多个 线程组成,每个 线程 是一个执行单元,线程 运行在 进程 的上下文环境中,并共享 同样的代码和全局数据。
我们经常说的 多线程 就是指的 在一个进程内有多个线程在执行任务,在实际开发中,开发者写的代码其实都是在线程的环境中执行的,而在多线程开发中,经常涉及到 一些 线程安全的问题,简单的看下进程 和 线程占有的资源情况

  简单的理解 线程安全 的问题:多线程程序在运行时候,可能会同时对一个变量进行操作,操作的时候,一般线程会将这个变量的值 copy 到 自身线程的巨变变量中,再进行操作,此时可能就会发生 读写时数据不同步(数据已经被其他线程操作了,自身线程操作时读取的值已经是旧的了)的问题。

并发与并行  

  进程 可以申请和拥有系统资源,进程是一个实体,程序的执行依赖于、主存(存放程序和程序处理的数据) CPU(执行代码) 等…(比如IO),而进程相当于一个环境,是控制这些操作系统硬件的实体,在操作系统中,一个系统上可以运行多个进程,运行的进程一般是多于运行它们的CPU 个数的, 所以通常一个CPU 可能需要运行多个进程任务,一个CPU 就像是一个工人,他一个时间节点只能做一件事情,所以 CPU 得频繁的在多个 进程中切换(上下文切换),这种现象就是并发执行。
  并行执行的概念是指 多个程序在多个CPU上同时执行,“并行” 概念是 并发 概念的一个子集,我们可以编写一个 并行程序,但是如果没有足够的 CPU 来执行,那么最终就变成了并发执行

并发:同时有很多任务需要做,可以串行执行也可以并行执行
并行:可以同时(严格意义上的)做多个任务


作者:zhuoxiuwu
来源:CSDN
原文:https://blog.csdn.net/zhuoxiu...
版权声明:本文为博主原创文章,转载请附上博文链接!

----------------------------------------
----------------------------------------

有句行话: “python下多线程是鸡肋,推荐使用多进程!”
为什么呢?

看两点:
1、GIL是什么?GIL的全称是Global Interpreter Lock(全局解释器锁),来源是python设计之初的考虑,为了数据安全所做的决定。

2、每个CPU在同一时间只能执行一个线程(在单核CPU下的多线程其实都只是并发,不是并行,并发和并行从宏观上来讲都是同时处理多路请求的概念。但并发和并行又有区别,并行是指两个或者多个事件在同一时刻发生;而并发是指两个或多个事件在同一时间间隔内发生。)

在Python多线程下,每个线程的执行方式:
1.获取GIL
2.执行代码直到sleep或者是python虚拟机将其挂起。
3.释放GIL

可见,某个线程想要执行,必须先拿到GIL,我们可以把GIL看作是“通行证”,并且在一个python进程中,GIL只有一个。拿不到通行证的线程,就不允许进入CPU执行。
所以python里,无论如何都没法GIL导致的同一时间只能执行一个线程的问题,所以效率依然不尽如人意。

又有名言: “python下想要充分利用多核CPU,就用多进程”。
这又是为什么呢?

原因是:每个进程有各自独立的GIL,互不干扰,这样就可以真正意义上的并行执行,所以在python中,多进程的执行效率优于多线程(仅仅针对多核CPU而言)。

作者:知我莫言
来源:知乎
原文:https://zhuanlan.zhihu.com/p/...

自己总结一下:

一个process只有一个GIL
一个process可以理解成 a bundle of threads

一个 CPU core 在某一时刻,只能有一个thread。
因此一个 CPU core 在某一时刻,自然也只能有一个Process。

但是不同的cpu core可以同时有同一个Process
假设有 4核CPU 和 4个process
CPU0,CPU1,CPU2, CPU3 可以同时处理 process0

阅读 1.5k
13 声望
0 粉丝
0 条评论
13 声望
0 粉丝
文章目录
宣传栏