Python3 查缺补漏:3、Python 中的“特权种族”是什么?

本贴最后更新于 2133 天前,其中的信息可能已经斗转星移

前几天,某个学习群里有小伙伴问了一个关于 id()的问题。事后,猫猫想起 Python 中一些常用对象的内存地址是共用的,但是具体是哪些却忘了。于是,猫猫意识到这是我知识薄弱之处,有提升空间,便进行了一番学习。

今天,猫猫把学习到的部分内容总结出来,分享给大家。阅读本文,大家可以学到如下内容:

1、对象的 Id 是什么?
2、内置 id()函数是什么?
3、共用 Id 的内存分配策略?特权种族?

学习群里的一道问题

首先,看看小伙伴贴出的代码:

In [1]: a[1,2,3] In [2]: id(a) Out[2]: 2399283020744 In [3]: id(a.append(4)) Out[3]: 1417427824 In [4]: a.append(4) In [5]: id(a) Out[5]: 2399283020744

他的问题是:为何第二个 id 值(1417427824)不等于其它两个的 id 值(2399283020744)?还有这个 id 值(1417427824)到底是谁的 id?

现在公布答案:第二个 id 值(1417427824)是 None 的 id,只要打印 id(None)就能看出来;至于为啥是 None 的 id,因为列表的 append()方法返回值是 None,而 id(a.append(4))等价于取这个 append 操作的返回值的 id,也就是说 id(a.append(4))等价于是 id(None)。

对象 Id 与 id()函数

python 的对象有三要素:Id(identity,身份标识)、Type(类型标识)和 Value(对象的值)。

其中,Value 通常是一个对象能被直接“看到”的部分,而 Id 及 Type 则是相对底层的维度,无法直接“看到”。举个例子(“>>>”表示输出结果):

Object1=2018 Object2="2018" # Object1的value是2018(数字) # Object2的value是“2018”(字符串) id(Object1) >>>2399282764784 id(Object2) >>>2399281922600 type(Object1) >>>int type(Object2) >>>str

如上所述,我们建立了对象三要素与三个内置函数的联系:Id&id()、Type&type()、Value&str()。今天,猫猫先跟大家一起来学习 id()函数,今后再继续学习其它两个。

1、id()函数释义

id()是 python 内置的函数,它专门用于获取对象的内存地址,内存地址是一个整型数值,在该对象的生命周期内是唯一且恒定的。语法:id([object])。

2、比较 Id 的两种方式

通常有两种比较对象 Id 的方式(is、id()比较),请看例子:

l1 = [1, 2, 3 ]l2 = [1, 2, 3] In [43]: l1 is l2  Out[43]: False In [46]: id(l1)==id(l2) Out[46]: False # 两者Id不相等,因为: In [44]: id(l1) Out[44]: 2399279725576 In [45]: id(l2) Out[45]: 2399282938056

is 判断语句是判断两个对象的内存地址,也就等价于先取 id(),再做数值比较。

3、不要与 Value 的比较方式混淆

Value 的比较符号用双等号“==”,上例中比较 l1 和 l2 的 Value 要写成“l1 == l2”,明显两者的 Value 是相等的。按照约定俗成的习惯,我们把 Value 值相等的两个对象称为“相等”,而把 Id 值相等的两个对象称为“相同”。

所以,准确地说,上例的 l1 与 l2 相等,但是他们不相同,l1==l2,但 l1 is not l2。

特权种族:共用内存的对象

每个对象被创建出来的时候,就会确定其 Id 标识,也就是给它分配内存地址。通常来说,新对象的内存地址也是新的,会从未分配的可用地址中取。

但是,为了提高内存利用效率,对于一些常用的对象,如一些数值较小的数字对象、布尔值对象、None 对象、较短的字符串对象等等,python 采取共用对象内存的分配策略。

# 新分配内存地址的例子 ww=[1,2] ee=[1,2] id(ww)==id(ee)  >>>False a=2018 b=2018 id(a)==id(b)  >>>False # 共用内存地址的例子 a=100 b=100 id(a)==id(b)  >>>True f1=True f2=Trueid (f1)==id(f2)  >>>True n1=None n2=None id(n1)==id(n2)  >>>True s="python_cat" t="python_cat" id(s)==id(t)  >>>True

这就意味着,python 中出现了“特权种族”,运行环境早早就为它们分配好了内存地址,一旦要创建新的对象时,先去特权种族中查找,有 Type 和 Value 相等的对象,则新对象不分配新的内存空间,而是指向已有对象。

“特权种族”的存在,使得我们不需要频繁创建这些对象,既能提高已分配内存的使用率,又减少了创建对象、分配新内存的损耗。

对于共用内存地址的数字对象的取值范围,根据这篇文章《Python 中神秘的-5 到 256》(链接见文末)对 python 源码的分析,文中有如下结论:

Python 中,对于整数对象,如果其值处于[-5,256]的闭区间内,则值相同的对象是同一个对象。

对于共用内存地址的字符串对象的取值范围,学习了几篇对 python 源码分析的文章后(链接见文末),猫猫总结出大致有以下结论:

Python 中,字符串使用 Intern 机制实现内存地址共用,长度不超过 20,且仅包括下划线、数字、字母的字符串才会被 intern;涉及字符串拼接时,编译期优化结果会与运行期计算结果不同。

# 编译对字符串拼接的影响 s1 = "hell" s2 = "hello" "hell" + "o" is s2  >>>True s1 + "o" is s2  >>>False # "hell" + "o"在编译时变成了"hello", # 而s1+"o"因为s1是一个变量,在运行时才拼接,所以没有被intern

参考阅读:
《Python 中神秘的-5 到 256》
(https://zhuanlan.zhihu.com/p/33907983)
《Python 中字符串的 intern 机制》
https://www.cnblogs.com/greatfish/p/6045088.html)
《Python 中字符串的 intern 机制》
https://mrcuriosity.org/python-string-intern.html)
原文:
https://mp.weixin.qq.com/s?__biz=MzUyOTk2MTcwNg==&mid=2247483714&idx=1&sn=a396be77a5742106cbf9cbbef5ca7334&scene=21#wechat_redirect

  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    554 引用 • 675 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...