GIL

Queue

标准库queue模块，提供FIFO的Queue、LIFO的队列、优先队列
Queue类是线程安全的，使用于多线程间安全的交换数据。内部使用Lock和Condition

为什么讲魔术方法时，说实现容器的大小，不准确
如果不加锁，是不可能获得准确的大小的，因为你刚读取到一个大小，还没有取走，就有可能被其他线程改了
Queue类的size虽然加了锁，但是，依然不能保证立即保证立即get、put就能成功，因为读取大小和get、put方法是分开的

import queue

q = queue.Queue(8)

if q.qsize == 7:
    q.put()  # 上下两句可能被打断

if q.qsize() == 1:
    q.get() # 未必会成功

GIL全局解释器锁

Cpython在解释器进程级别有一把锁，叫做GIL全局解释器锁
GIL保证Cpython进程中，只有一个线程执行字节码。甚至是在多核CPU的情况下，也是如此

Cpython中
IO密集型，由于线程阻塞，就会调度其他线程；
CPU密集型，当前线程可能会连续的获得GIL，导致其它线程几乎无法使用CPU
在CPython中由于GIL存在，IO密集型，使用多线程；CPU密集型，使用多进程，绕开GIL

新版CPython正在努力优化GIL的问题，但不是移除
如果非要使用多线程的效率问题，请绕行，选择其它语言erlang、Go等

python中绝大多数内置数据结构的读写都是原子操作
由于GIL的存在，Python的内置数据类型在多线程编程的时候就变成安全的了，但是实际上它们本身不是线程安全类型的
保留GIL的原因：
Guido坚持的简单哲学，对于初学者门槛低，不需要高深的系统知识也能安全、简单的使用Python
而且移除GIL，会降低CPython单线程的执行效率

测试下面2个程序

import logging
import datetime

logging.basicConfig(level=logging.INFO, format="%(thread)s %(message)s")
start = datetime.datetime.now()

# 计算
def calc():
    sum = 0
    for _ in range(1000000000):
        sum += 1

calc()
calc()
calc()
calc()
calc()

delta = (datetime.datetime.now() - start).total_seconds()
logging.info(delta)

import threading
import logging
import datetime

logging.basicConfig(level=logging.INFO, format="%(thread)s %(message)s")
start = datetime.datetime.now()

# 计算
def calc():
    sum = 0
    for _ in range(1000000000):
        sum += 1

t1 = threading.Thread(target=calc)
t2 = threading.Thread(target=calc)
t3 = threading.Thread(target=calc)
t4 = threading.Thread(target=calc)
t5 = threading.Thread(target=calc)
t1.start()
t2.start()
t3.start()
t4.start()
t5.start()

t1.join()
t2.join()
t3.join()
t4.join()
t5.join()

delta = (datetime.datetime.now() - start).total_seconds()
logging.info(delta)

从两段程序测试的结果来看，CPython中多线程根本没有任何优势，和一个线程执行时间相当。因为GIL的存在，尤其是像上面的计算密集型程序

文章作者: gloo

文章连结:

微信扫一扫

Gloo

GIL

Queue

GIL全局解释器锁