iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python字符串驻留技术的示例分析
  • 132
分享到

python字符串驻留技术的示例分析

2023-06-15 04:06:35 132人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

小编给大家分享一下python字符串驻留技术的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!前言每种编程语言为了表现出色,并且实现卓越的性能,都需要有大量

小编给大家分享一下python字符串驻留技术的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

前言

每种编程语言为了表现出色,并且实现卓越的性能,都需要有大量编译器级与解释器级的优化

由于字符串是任何编程语言中不可或缺的一个部分,因此,如果有快速操作字符串的能力,就可以迅速地提高整体的性能。

在本文中,我们将深入研究 Python 的内部实现,并了解 Python 如何使用一种名为字符串驻留(String Interning)的技术,实现解释器的高性能。本文的目的不仅在于介绍 Python 的内部知识,而且还旨在使读者能够轻松地浏览 Python 的源代码;因此,本文中将有很多出自CPython的代码片段。

全文提纲如下:

python字符串驻留技术的示例分析

1、什么是“字符串驻留”?

字符串驻留是一种编译器/解释器的优化方法,它通过缓存一般性的字符串,从而节省字符串处理任务的空间和时间。

这种优化方法不会每次都创建一个新的字符串副本,而是仅为每个适当的不可变值保留一个字符串副本,并使用指针引用之。每个字符串的唯一拷贝被称为它的intern,并因此而得名 String Interning。

String Interning 一般被译为“字符串驻留”或“字符串留用”,在某些语言中可能习惯用 String Pool(字符串常量池)的概念,其实是对同一种机制的不同表述。intern 作为名词时,是“实习生、实习医生”的意思,在此可以理解成“驻留物、驻留值”。

查找字符串 intern 的方法可能作为公开接口公开,也可能不公开。现代编程语言如 Java、Python、PHP、Ruby、Julia 等等,都支持字符串驻留,以使其编译器和解释器做到高性能。

python字符串驻留技术的示例分析

2、为什么要驻留字符串?

字符串驻留提升了字符串比较的速度。如果没有驻留,当我们要比较两个字符串是否相等时,它的时间复杂度将上升到 O(n),即需要检查两个字符串中的每个字符,才能判断出它们是否相等。

但是,如果字符串是固定的,由于相同的字符串将使用同一个对象引用,因此只需检查指针是否相同,就足以判断出两个字符串是否相等,不必再逐一检查每个字符。由于这是一个非常普遍的操作,因此,它被典型地实现为指针相等性校验,仅使用一条完全没有内存引用的机器指令。

字符串驻留减少了内存占用。Python 避免内存中充斥多余的字符串对象,通过享元设计模式共享和重用已经定义的对象,从而优化内存占用。

3、Python的字符串驻留

像大多数其它现代编程语言一样,Python 也使用字符串驻留来提高性能。在 Python 中,我们可以使用is运算符,检查两个对象是否引用了同一个内存对象。

因此,如果两个字符串对象引用了相同的内存对象,则is运算符将得出True,否则为False。

 >>> 'python' is 'python'

  True

我们可以使用这个特定的运算符,来判断哪些字符串是被驻留的。在 CPython 的,字符串驻留是通过以下函数实现的,声明在 unicodeobject.h 中,定义在 unicodeobject.c 中。

Pyapi_FUNC(void) PyUnicode_InternInPlace(PyObject **);

为了检查一个字符串是否被驻留,CPython 实现了一个名为PyUnicode_CHECK_INTERNED的宏,同样是定义在 unicodeobject.h 中。

这个宏表明了 Python 在PyASCIiobject结构中维护着一个名为interned的成员变量,它的值表示相应的字符串是否被驻留。

#define PyUnicode_CHECK_INTERNED(op) \      (((PyASCIIObject *)(op))->state.interned)

4、字符串驻留的原理

在 CPython 中,字符串的引用被一个名为interned的 Python 字典所存储、访问和管理。 该字典在第一次调用字符串驻留时,被延迟地初始化,并持有全部已驻留字符串对象的引用。

4.1 如何驻留字符串?

负责驻留字符串的核心函数是PyUnicode_InternInPlace,它定义在 unicodeobject.c 中,当调用时,它会创建一个准备容纳所有驻留的字符串的字典interned,然后登记入参中的对象,令其键和值都使用相同的对象引用。

以下函数片段显示了 Python 实现字符串驻留的过程。

void  PyUnicode_InternInPlace(PyObject **p)  {      PyObject *s = *p;        .........        // Lazily build the dictionary to hold interned Strings      if (interned == NULL) {          interned = PyDict_New();          if (interned == NULL) {              PyErr_Clear();              return;          }      }        PyObject *t;        // Make an entry to the interned dictionary for the      // given object      t = PyDict_SetDefault(interned, s, s);        .........       // The two references in interned dict (key and value) are      // not counted by refcnt.      // unicode_dealloc() and _PyUnicode_ClearInterned() take      // care of this.      Py_SET_REFCNT(s, Py_REFCNT(s) - 2);        // Set the state of the string to be INTERNED      _PyUnicode_STATE(s).interned = SSTATE_INTERNED_MORTAL;  }

4.2 如何清理驻留的字符串?

清理函数从interned字典中遍历所有的字符串,调整这些对象的引用计数,并把它们标记为NOT_INTERNED,使其被垃圾回收。一旦所有的字符串都被标记为NOT_INTERNED,则interned字典会被清空并删除。

这个清理函数就是_PyUnicode_ClearInterned,在unicodeobject.c 中定义。

void  _PyUnicode_ClearInterned(PyThreadState *tstate)  {      .........        // Get all the keys to the interned dictionary      PyObject *keys = PyDict_Keys(interned);        .........        // Interned Unicode strings are not forcibly deallocated;      // rather, we give them their stolen references back      // and then clear and DECREF the interned dict.        for (Py_ssize_t i = 0; i < n; i++) {          PyObject *s = PyList_GET_ITEM(keys, i);            .........            switch (PyUnicode_CHECK_INTERNED(s)) {          case SSTATE_INTERNED_IMMORTAL:              Py_SET_REFCNT(s, Py_REFCNT(s) + 1);              break;          case SSTATE_INTERNED_MORTAL:              // Restore the two references (key and value) ignored              // by PyUnicode_InternInPlace().              Py_SET_REFCNT(s, Py_REFCNT(s) + 2);              break;          case SSTATE_NOT_INTERNED:                        default:              Py_UNREACHABLE();          }            // marking the string to be NOT_INTERNED          _PyUnicode_STATE(s).interned = SSTATE_NOT_INTERNED;      }        // decreasing the reference to the initialized and      // access keys object.      Py_DECREF(keys);        // clearing the dictionary      PyDict_Clear(interned);        // clearing the object interned      Py_CLEAR(interned);  }

5、字符串驻留的实现

既然了解了字符串驻留及清理的内部原理,我们就可以找出 Python 中所有会被驻留的字符串。

为了做到这点,我们要做的就是在 CPython 源代码中查找PyUnicode_InternInPlace 函数的调用,并查看其附近的代码。下面是在 Python 中关于字符串驻留的一些有趣的发现。

5.1 变量、常量与函数名

CPython 对常量(例如函数名、变量名、字符串字面量等)执行字符串驻留。

以下代码出自codeobject.c,它表明在创建新的PyCode对象时,解释器将对所有编译期的常量、名称和字面量进行驻留。

PyCodeObject *  PyCode_NewWithPosOnlyArgs(int arGCount, int posonlyargcount, int kwonlyargcount,                            int nlocals, int stacksize, int flags,                            PyObject *code, PyObject *consts, PyObject *names,                            PyObject *varnames, PyObject *freevars, PyObject *cellvars,                            PyObject *filename, PyObject *name, int firstlineno,                            PyObject *linetable)  {        ........        if (intern_strings(names) < 0) {          return NULL;      }        if (intern_strings(varnames) < 0) {          return NULL;      }        if (intern_strings(freevars) < 0) {          return NULL;      }        if (intern_strings(cellvars) < 0) {          return NULL;      }        if (intern_string_constants(consts, NULL) < 0) {          return NULL;      }        ........    }

5.2 字典的键

CPython 还会驻留任何字典对象的字符串键。

当在字典中插入元素时,解释器会对该元素的键作字符串驻留。以下代码出自dictobject.c,展示了实际的行为。

有趣的地方:在PyUnicode_InternInPlace函数被调用处有一条注释,它问道,我们是否真的需要对所有字典中的全部键进行驻留?

int  PyDict_SetItemString(PyObject *v, const char *key, PyObject *item)  {      PyObject *kv;      int err;      kv = PyUnicode_FromString(key);      if (kv == NULL)          return -1;        // Invoking String Interning on the key      PyUnicode_InternInPlace(&kv);         err = PyDict_SetItem(v, kv, item);      Py_DECREF(kv);      return err;  }

5.3 任何对象的属性

Python 中对象的属性可以通过setattr函数显式地设置,也可以作为类成员的一部分而隐式地设置,或者在其数据类型中预定义。

CPython 会驻留所有这些属性名,以便实现快速查找。以下是函数PyObject_SetAttr的代码片段,该函数定义在文件object.c中,负责为 Python 对象设置新属性。

int  PyObject_SetAttr(PyObject *v, PyObject *name, PyObject *value)  {        ........        PyUnicode_InternInPlace(&name);        ........  }

5.4 显式地驻留

Python 还支持通过sys模块中的intern函数进行显式地字符串驻留。

当使用任何字符串对象调用此函数时,该字符串对象将被驻留。以下是sysmodule.c文件的代码片段,它展示了在sys_intern_impl函数中的字符串驻留过程。

static PyObject *  sys_intern_impl(PyObject *module, PyObject *s)  {        ........        if (PyUnicode_CheckExact(s)) {          Py_INCREF(s);          PyUnicode_InternInPlace(&s);          return s;      }        ........  }

以上是“python字符串驻留技术的示例分析”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网Python频道!

--结束END--

本文标题: python字符串驻留技术的示例分析

本文链接: https://www.lsjlt.com/news/277513.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python字符串驻留技术的示例分析
    小编给大家分享一下python字符串驻留技术的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!前言每种编程语言为了表现出色,并且实现卓越的性能,都需要有大量...
    99+
    2023-06-15
  • Python中的字符串驻留
    C#中的字符串驻留熟悉.NET的人都应该知道C#中的字符串驻留机制,.NET维护了一个驻留池,它会把在编译期间就相同的字符串只保留一份拷贝。如果仅在运行期间值才相同的字符串变量,.NET不会为这个2个相同的字符串变量指向同一份引用的。不过....
    99+
    2023-01-31
    字符串 Python
  • C#字符串内存驻留机制分析
    在这之前我写过一些文章来介绍关于字符串内存分配和驻留的文章,涉及到的观点主要有:字符串的驻留机制避免了对具有相同字符序列的字符串对象的重复创建;被驻留的字符串是不受GC管辖的,即被驻...
    99+
    2024-04-02
  • Python中字符串驻留指的是什么
    小编给大家分享一下Python中字符串驻留指的是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!python主要应用领域有哪些1、云计算,典型应用OpenSta...
    99+
    2023-06-14
  • 怎么在Python中清理驻留的字符串
    这期内容当中小编将会给大家带来有关怎么在Python中清理驻留的字符串,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。python可以做什么Python是一种编程语言,内置了许多有效的工具,Python几乎...
    99+
    2023-06-14
  • Python中字符串驻留的原理是什么
    这篇文章给大家介绍Python中字符串驻留的原理是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。python可以做什么Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂、容易...
    99+
    2023-06-14
  • Python中字符串驻留的机制是什么
    这篇文章主要介绍“Python中字符串驻留的机制是什么”,在日常操作中,相信很多人在Python中字符串驻留的机制是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python中字符串驻留的机制是什么”的疑...
    99+
    2023-07-05
  • 详解Python中神奇的字符串驻留机制
    目录1 什么是字符串驻留机制2 如何使用字符串驻留机制3 简单拼接驻留, 运行时不驻留4 总结5 全部代码今天有一个初学者在学习Python的时候又整不会了。 原因是以下代码: a ...
    99+
    2023-05-14
    Python字符串驻留机制 Python字符串驻留 Python字符串
  • Python字符串的创建和驻留机制详解
    目录字符串字符串驻留机制字符串驻留机制优缺点字符串   字符串在Python中是基本数据类型,是一个不可变的字符序列。 字符串驻留机制   仅保存一份相同且不可变字符串的方法,不同的...
    99+
    2024-04-02
  • .NET中的字符串驻留池介绍
    在.NET中,对于相同的字符串,.NET会将它们指向同一个地址,它们是相同的实例。.NET中的字符串并不会更新,当更改一个字符串变量时,由于字符串的不可变性,.NET实际上是新创建一...
    99+
    2024-04-02
  • .NET中的字符串驻留池是什么
    小编给大家分享一下.NET中的字符串驻留池是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!在.NET中,对于相同的字符串,.NET会将它们指向同一个地址,它们...
    99+
    2023-06-29
  • python字符串操作的示例分析
    这篇文章主要为大家展示了“python字符串操作的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“python字符串操作的示例分析”这篇文章吧。字符串操作...
    99+
    2024-04-02
  • python字符串乘法的示例分析
    这篇文章将为大家详细讲解有关python字符串乘法的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。字符串乘法在Python中,不仅可以乘以数字,还可以乘以字符串。例如:关于“python字符串乘法...
    99+
    2023-06-27
  • 使用python怎么实现一个驻留字符串
    使用python怎么实现一个驻留字符串?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。python可以做什么Python是一种编程语言,内置了许多有效的工具,Py...
    99+
    2023-06-14
  • 怎么在Python中判断字符串算法被驻留
    本篇文章为大家展示了怎么在Python中判断字符串算法被驻留,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、网络...
    99+
    2023-06-14
  • C#中字符串的内存分配与驻留池是什么
    这篇文章主要讲解了“C#中字符串的内存分配与驻留池是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“C#中字符串的内存分配与驻留池是什么”吧!刚开始学习C#的时候,就听说CLR对于Stri...
    99+
    2023-06-17
  • PHP中字符串的示例分析
    小编给大家分享一下PHP中字符串的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!前面几篇文章中,我们也有提到有关于PHP的字符串等相关问题,那么几天我们继...
    99+
    2023-06-15
  • Python字符串怎么创建和驻留机制是什么
    本篇内容主要讲解“Python字符串怎么创建和驻留机制是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python字符串怎么创建和驻留机制是什么”吧!字符串  字符串在Python中是基本数...
    99+
    2023-06-29
  • redis字符串类型的示例分析
    这篇文章主要介绍redis字符串类型的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!我们都知道redis是采用C语言开发,那么在C语言中表示string都是采用char[]数...
    99+
    2024-04-02
  • es6模板字符串的示例分析
    小编给大家分享一下es6模板字符串的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!具体如下作为前端开发者避免不了根据后台...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作