作者:小K
来源:麦叔编程
❝
上期我给大家介绍了什么是线程安全和线程非安全,今天带大家深入了解下为什么会存在这两种情况。
❞
原子操作
大家还记得数据库的事务正确执行的四个基本要素ACID吗?
因为ACID的存在,数据库的事务被执行之后,要么全都完成(commit),要么全都不完成(rollback),不会存在部分完成,或错误完成的情况。
其中,原子性(Atomicity)是保障这个特性重要的要素,就像原子不能被分割那样。
在Python中,「原子操作(操作原子性)是保证线程安全最重要的因素。」
❝
原子操作:一旦操作开始,就要一直运行到结束,没有任何线程调度机制能打断它的操作。
❞
如何判断是否是原子操作
上一篇的例子中,我们通过运行代码可知zero += 1和zero -= 1是线程非安全操作。
那么有什么办法在能不运行代码的阶段去找到它呢?
「可以用dis模块分析。」
from dis import diszero = 0def operation(): global zero zero += 1 zero -= 1dis(operation)
运行代码:
28 0 LOAD_GLOBAL 0 (zero) 2 LOAD_CONST 1 (1) 4 INPLACE_ADD 6 STORE_GLOBAL 0 (zero) 29 8 LOAD_GLOBAL 0 (zero) 10 LOAD_CONST 1 (1) 12 INPLACE_SUBTRACT 14 STORE_GLOBAL 0 (zero) 16 LOAD_CONST 0 (None) 18 RETURN_VALUE
zero += 1操作 对应:
12 INPLACE_SUBTRACT14 STORE_GLOBAL 0 (zero)
zero -= 1操作 对应:
4 INPLACE_ADD6 STORE_GLOBAL 0 (zero)
这一行的代码其实在解释器中是分两次去执行的,在多线程的情况下就可能导致「计算」(INPLACE_ADD)完成了但是线程切换到别处去了,「赋值」STORE_GLOBAL没有按顺序被执行到,所以引起了线程非安全操作。
「看完线程非安全操作的dis代码,我们再看看线程安全操作的dis代码:」
from dis import dislst = []def operation(): global lst lst.append("maishu") lst.pop()dis(operation)
运行代码:
26 0 LOAD_GLOBAL 0 (lst) 2 LOAD_METHOD 1 (append) 4 LOAD_CONST 1 ('maishu') 6 CALL_METHOD 1 8 POP_TOP 27 10 LOAD_GLOBAL 0 (lst) 12 LOAD_METHOD 2 (pop) 14 CALL_METHOD 0 16 POP_TOP 18 LOAD_CONST 0 (None) 20 RETURN_VALUE
lst.append("maishu")操作 对应:
8 POP_TOP
lst.pop()操作 对应:
16 POP_TOP
只有一行语句就完成了对lst的操作,所以不怕线程怎么去切换。
不信?
上多线程,再把锁去了跑几次:
import threadinglst = []def operation(): global lst for i in range(3000000): lst.append("maishu") lst.pop() th1 = threading.Thread(target = operation)th2 = threading.Thread(target = operation)th1.start()th2.start()th1.join()th2.join()print(lst)
运行N次之后:
附录
附上常见的线程安全操作和线程非安全操作
线程安全操作
L.append(x)L1.extend(L2)x = L[i]x = L.pop()L1[i:j] = L2L.sort()x = yx.field = yD[x] = yD1.update(D2)D.keys()
线程非安全操作
i = i+1L.append(L[-1])L[i] = L[j]D[x] = D[x] + 1