最近python这么火,大家是不是也都在用啊。对于小编这种小白来说,对于python的一切都很迷茫,又很好奇,这不就看见了这样一篇文章:当python 中混进一只薛定谔的猫……为此,小编还专门去问了度娘python和薛定谔的猫有啥关系。如果你也想知道的话,跟小编一起来看吧。
以下文章来源: Python猫
作者:豌豆花下猫
图片来源:pexels
Python 是一门强大的动态语言,那动态体现在哪里,强大又体现在哪里呢?
除了好的方面,Python 的动态性是否还藏着一些使用陷阱呢,有没有办法识别与避免呢?
沿着它的动态特性话题,猫哥有几篇文章依次探及了:动态修改变量、动态定义函数、动态执行代码等内容,然而,当混合了变量赋值、动态赋值、命名空间、作用域、函数的编译原理等等内容时,问题就可能会变得非常棘手。
因此,这篇文章将前面一些内容融汇起来,再做一次延展的讨论,希望能够理清一些使用的细节,更深入地探索 Python 语言的奥秘。
先看看这一个例子:
# 例0 def foo(): exec('y = 1 + 1') z = locals()['y'] print(z) foo() # 输出:2
exec() 函数的代码块中定义了变量 y,这个值可以被随后的 locals() 取到,在赋值后也打印了出来。然而,在这个例子的基础上,只需做出小小的改变,结果就可能大不相同了。
# 例1 def foo(): exec('y = 1 + 1') y = locals()['y'] print(y) foo() # 报错:KeyError: 'y'
把前例的 z 改为 y ,就报错了。其中,KeyError 指的是在字典中不存在对应的 key 。为什么会这样呢,新赋值的变量是 y 或者 z,为什么对结果有这么不同的影响?
试试把 exec 去掉,不报错!
# 例2 def foo(): y = 1 + 1 y = locals()['y'] print(y) foo() # 2
问题:直接对 y 赋值,跟动态地在 exec() 中赋值,会对 locals() 取值产生怎样的影响?
再试试对例 1 的 locals() 先赋值,还是报错:
# 例3 def foo(): exec('y = 1 + 1') boc = locals() y = boc['y'] print(y) foo() # KeyError: 'y'
先做一次赋值,难道没有用么?也不是,如果把赋值的顺序调前,就不报错了:
# 例4 def foo(): boc = locals() exec('y = 1 + 1') y = boc['y'] print(y) foo() # 2
也就是说,locals() 的值并不是固定的,它的值与调用时的上下文相关,调用 locals() 的时机至关重要。
然而,如果想要验证一下,在函数中增加一个 locals() 的打印,这个动作却会影响到最终的执行结果。
# 例5 def foo(): boc = locals() exec('y = 1 + 1') print(locals()) y = boc['y'] print(y) foo() # {'boc': {...}} # KeyError: 'y'
这到底是怎么回事呢?
以上例子在细微之处有较大的不同,主要由于以下知识点的影响:
1、变量的声明与赋值
2、locals() 取值与修改的逻辑
3、locals() 字典与局部命名空间的关系
4、函数的编译,抽象语法树的解析
注意:exec() 函数有两个缺省的参数 globals() 与 locals() (与内置函数同名),起的是限定字符串参数中变量的作用,若添加出来,只会增加以上例子的复杂度,因此,我们都做缺省处理,这里讨论的是 exec() 只有一个参数的情况。
在某些编程语言中,变量的声明与赋值是可以分开的,例如在声明时写 int a ,需要赋值时,再写 a = 1 ,当然也可不拆分,则是 int a = 1 。
对应到 Python 中,情况就不同了,这两个动作在书写时是合二为一的。首先它不用指定变量的类型,任何时候都不需要(也不能)在变量前加类型(如 int),其次,声明与赋值过程无法拆分书写,即只能写成 a = 1 这样。看起来它跟其它语言的赋值写法一样,但实际上,它的效果是 int a = 1 。
这虽然是一种便利,但也隐藏了一个不易察觉的陷阱(划重点):当看到 a = 1 时,你无法确定 a 是初次声明的,还是已被声明过的。
关于 locals() 的创建过程,在《Python 动态赋值的陷阱》文中有所分析,locals() 字典是局部命名空间的代理,它会采集局部作用域的变量,代码运行期若动态修改局部变量,只会影响该字典,并不会影响真正的局部作用域的变量。因此,当再次调用 locals() 时,由于重新采集,则动态修改的内容会被丢弃。
运行期的局部命名空间不可改变,这意味着 exec() 函数中的变量赋值不会对它产生影响,但 locals() 字典是可变的,会受到 exec() 函数的影响。
关于函数的编译,我在《Python与家国天下》中写到了对抽象语法树的分析,Python 在编译时就确定了局部作用域内合法的变量名,在运行时再与内容绑定。作用域内变量的解析跟它的执行顺序无关,更与是否会被执行无关。
以上内容是前提,友情提示,如你有理解模糊之处,请先阅读对应的文章。接下来则是基于这些内容而作的分析。
我不敢保证每个细节都准确无误,但这个分析力求达到深入浅出、面面俱到、逻辑自恰,而且顺便幽默有趣……
例 0 中,局部作用域内虽然没有 ‘y’,但 exec() 函数动态创建了它,因此动态地写入了 locals() 字典中,所以能查找到而不报错。
例 1 中,exec() 不影响局部作用域,即此时 y 未在局部作用域内做过声明与赋值,接下来的一句才是第一次在局部作用域中对 y 作声明与赋值 !
y = locals()['y'] ,等号左侧在做声明,只要等号右侧的结果成立,整个声明与赋值的过程就成立。右侧需在 locals() 字典中查找 y 对应的值。
在创建 locals() 字典时,由于局部作用域内有变量 y 的声明,因此我们首先在其中采集到了 y,而不必在 exec() 函数的动态结果中查找。这就有了字典的一个 key,接着要匹配这个 key 对应的值,也即 y 所绑定的值。
但是,刚才说了这是 y 的第一次赋值,并未完成呢,因此 y 并无有效的绑定值。
矛盾出现了,这里有点绕,我们理一下:左侧的 y 等着完成赋值,因此需要右侧的执行结果;而右侧的字典需要使用到 y 的值,因此就依赖着左侧的 y 完成赋值。两边的操作都未完成,但双方都需要依赖对方先完成,这是个无法破解的死局。
可以说,y 的值是一团混沌,它必然等于 “locals()['y']” ,然而只有解开这团代码才能确切得到结果——只有打开笼子才知道结果,你是否想到了薛定谔的那只猫呢?
locals() 字典虽然拿到了 y 的名,却拿不到它的实,空欢喜一场,所以报 KeyError。
例 3 同理,未完成赋值就使用,所以报错。
例 2 中,y 在二次赋值的过程时,局部命名空间中已经存在着有效的 y 等于 2,因此 locals() 查找到它而用于赋值,所以不报错。
至于例 4,它跟例 3 只差了一个执行顺序,为什么不会报错呢?还有更奇怪的,在例 4 上再加一个打印(例5),理应不会影响结果,可事实却是又报错了,为什么?
例 4 中,boc = locals() 这句同样存在循环引用的问题,因此执行后的字典中没有 y,接着 exec() 这句动态地修改了 locals(),执行后 boc 的结果是 {'y' : 2},因此再下一句的 boc['y'] 能查找到结果,而不报错。
例 4 与例 3 的 ”y = boc['y']“ ,虽然都是第一次在局部作用域中声明与赋值 y,但例 4 的 boc 已被 exec() 修改过,因此它能取到实实在在的值,就不再有循环引用的问题了。
接着看例 5,第一个 locals() 还是存在循环引用现象,接着 exec() 往字典中写入变量 y,但是,第二个 locals() 又触发了新的创建字典过程,会把 exec() 的执行结果覆盖,因此进入第二轮循环引用,导致报错。
例 5 与例 4 的不同在于,它是根据局部作用域重新生成的字典,其效果等同于例 3。
另外,请特别注意打印的结果:{'boc': {…}} 。
这个结果说明,第二个 locals() 是一个字典,而且它只有唯一的 key 是 ’boc‘,而 ’boc‘ 映射的是第一个 locals() 字典,也即是 {…} 。这个写法表示它内部出现了循环引用,直观地证实了前面的所有分析。
字典内部出现循环引用 ,这个现象极其罕见!前面虽然做了分析,但看到这里的时候,不知道你是否觉得不可思议?
之所以第一次的循环引用能被记录下来,原因在于我们没有试图去取出 ’y‘ 的值,而第二个循环引用则由于取值报错而无法记录下来。
这个例子告诉大家:薛定谔的猫混入了 Python 的字典中,而且答案是,打开笼子,这只猫就会死亡。
字典的循环引用现象在几个例子中扮演了极其重要的角色,但是往往被人忽视。之所以难以被人觉察,原因还是前面划重点的内容:当看到 a = 1 时,你无法确定 a 是初次声明的,还是已被声明过的。
在《Python与家国天下》文中,猫哥分析了两类经典的报错:name 'x' is not defined、local variable 'x' referenced before assignment。它们通常也是由于声明与赋值不分,而导致的失察。
本文中的 KeyError 实际上就是“local variable 'y' referenced before assignment”,y已defined 而未 assigned,导致 reference 时报错。
已赋值还是未赋值,这是个问题。也是一只猫。
最后,尽管这只猫在暗中捣了大乱,我们还是要感谢它:感谢它串联了其它知识被我们“一锅端”,感谢它为这篇抽象烧脑的文章挠出了几分活泼生动的趣味……(以及,感谢它带来的标题灵感,不知道有多少人是冲着标题而阅读的?)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动决策的时代,掌握多样的数据分析方法,就如同拥有了开启宝藏的多把钥匙,能帮助我们从海量数据中挖掘出关键信息,本 ...
2025-03-06在备考 CDA 考试的漫漫征途上,拥有一套契合考试大纲的优质模拟题库,其重要性不言而喻。它恰似黑夜里熠熠生辉的启明星,为每一 ...
2025-03-05“纲举目张,执本末从。”若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关 ...
2025-03-04以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-04在现代商业环境中,数据分析师的角色愈发重要。数据分析师通过解读数据,帮助企业做出更明智的决策。因此,考取数据分析师证书成为了许多人提升职业竞争力的选择。本文将详细介绍考取数据分析师证书的过程,包括了解证书种类和 ...
2025-03-03在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2025-03-03数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-03-032025年刚开启,知乎上就出现了一个热帖: 2024年突然出现的经济下行,使各行各业都感觉到压力山大。有人说,大环境越来越不好了 ...
2025-03-03大数据分析师培训旨在培养学员掌握大数据分析的基础知识、技术及应用能力,以适应企业对数据分析人才的需求。根据不同的培训需求 ...
2025-03-03小伙伴们,最近被《哪吒2》刷屏了吧!这部电影不仅在国内掀起观影热潮,还在全球范围内引发了关注,成为中国电影崛起的又一里程 ...
2025-03-03以下的文章内容来源于张彦存老师的专栏,如果您想阅读专栏《Python 数据可视化 18 讲(PyEcharts、Matplotlib、Seaborn)》,点 ...
2025-02-28最近,国产AI模型DeepSeek爆火,其创始人梁文峰走进大众视野。《黑神话:悟空》制作人冯骥盛赞DeepSeek为“国运级别的科技成果” ...
2025-02-271.统计学简介 听说你已经被统计学劝退,被Python唬住……先别着急划走,看完这篇再说! 先说结论,大多数情况下的学不会都不是知 ...
2025-02-27“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩稳定, ...
2025-02-26在数据分析工作中,你可能经常遇到这样的问题: 从浏览到消费的转化率一直很低,那到底该优化哪里呢? 如果你要投放广告该怎么 ...
2025-02-25近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的,尤 ...
2025-02-25挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-25在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-25以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-25“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-25