问题:Python中小字符串是如何定义的?
问题来源:在《编写高质量代码:改善Python程序的91个建议》一书中,读到——“这是Python中的string interning(字符串驻留)机制所决定的:对于较小的字符串,为了提高系统性能会保留其值的一个副本,当创建新的字符串的时候直接指向该副本即可”。所用示例如下:
a = 'Hi'
b = 'Hi'
print(id(a)) # 1695290453680
print(id(b)) # 1695290453680
a = 'I am using long string for testing'
b = 'I am using long string for testing'
print(id(a)) # 1695286542032
print(id(b)) # 1695286541936
但我用如下示例:
a = 'IamusinglongstringfortestingIamusinglongstringfortesting'
b = 'IamusinglongstringfortestingIamusinglongstringfortesting'
print(id(a)) # 1695290445984
print(id(b)) # 1695290445984
上面这个示例中字符串看起来比书中长了很多,按书中说法依然被认为是较小的字符串啊。
不是大小的问题,这个是字符串的驻留,可以看下这篇文章https://blog.csdn.net/handsomekang/article/details/41170685
"""
答案在源码stringobject.h中的注释可以找到,
/* ... ... This is generally restricted tostrings that "looklike" Python identifiers, although the intern() builtincan be used to force interning of any string ... ... */
也就是说,只对那些看起来像是python标识符的进行intern。
————————————————
版权声明:本文为CSDN博主「mattkang」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/handsomekang/article/details/41170685
"""
```python
```
在驻留池中,仅包含下划线(_)、字母 和 数字 的长度不高过 20 的字符串才能驻留。
>>> e = 'a b'
>>> f = 'a b'
>>> id(e)
1584270162480
>>> id(f)
1584270178800
>>> id('a b')
1584270178864