iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python性能优化的建议有哪些
  • 500
分享到

Python性能优化的建议有哪些

2023-06-02 11:06:32 500人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍“python性能优化的建议有哪些”,在日常操作中,相信很多人在Python性能优化的建议有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python性能优化的建议有哪些”的疑惑有所帮助!

这篇文章主要介绍“python性能优化的建议有哪些”,在日常操作中,相信很多人在Python性能优化的建议有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python性能优化的建议有哪些”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

1、优化算法时间复杂度

算法的时间复杂度对程序的执行效率影响最大,在Python中可以通过选择合适的数据结构来优化时间复杂度,如list和set查找某一个元素的时间复杂度分别是O(n)和O(1)。不同的场景有不同的优化方式,总得来说,一般有分治,分支界限,贪心,动态规划等思想。

2、减少冗余数据

如用上三角或下三角的方式去保存一个大的对称矩阵。在0元素占大多数的矩阵里使用稀疏矩阵表示。

3、合理使用copy与deepcopy

对于dictlist等数据结构的对象,直接赋值使用的是引用的方式。而有些情况下需要复制整个对象,这时可以使用copy包里的copy和deepcopy,这两个函数的不同之处在于后者是递归复制的。效率也不一样:(以下程序在ipython中运行)

import copy

a = range(100000)

%timeit -n 10 copy.copy(a) # 运行10次 copy.copy(a)

%timeit -n 10 copy.deepcopy(a)

10 loops, best of 3: 1.55 ms per loop

10 loops, best of 3: 151 ms per loop

timeit后面的-n表示运行的次数,后两行对应的是两个timeit的输出,下同。由此可见后者慢一个数量级。

4、使用dict或set查找元素

python dict和set都是使用hash表来实现(类似c++11标准库中unordered_map),查找元素的时间复杂度是O(1)

a = range(1000)

s = set(a)

d = dict((i,1) for i in a)

%timeit -n 10000 100 in d

%timeit -n 10000 100 in s

10000 loops, best of 3: 43.5 ns per loop

10000 loops, best of 3: 49.6 ns per loop

dict的效率略高(占用的空间也多一些)。

5、合理使用生成器(generator)和yield

%timeit -n 100 a = (i for i in range(100000))

%timeit -n 100 b = [i for i in range(100000)]

100 loops, best of 3: 1.54 ms per loop

100 loops, best of 3: 4.56 ms per loop

使用()得到的是一个generator对象,所需要的内存空间与列表的大小无关,所以效率会高一些。在具体应用上,比如set(i for i in range(100000))会比set([i for i in range(100000)])快。

但是对于需要循环遍历的情况:

%timeit -n 10 for x in (i for i in range(100000)): pass

%timeit -n 10 for x in [i for i in range(100000)]: pass

10 loops, best of 3: 6.51 ms per loop

10 loops, best of 3: 5.54 ms per loop

后者的效率反而更高,但是如果循环里有break,用generator的好处是显而易见的。yield也是用于创建generator:

def yield_func(ls):

    for i in ls:

        yield i+1

def not_yield_func(ls):

    return [i+1 for i in ls]

ls = range(1000000)

%timeit -n 10 for i in yield_func(ls):pass

%timeit -n 10 for i in not_yield_func(ls):pass

10 loops, best of 3: 63.8 ms per loop

10 loops, best of 3: 62.9 ms per loop

对于内存不是非常大的list,可以直接返回一个list,但是可读性yield更佳(人个喜好)。

python2.x内置generator功能的有xrange函数、itertools包等。

6、优化循环

循环之外能做的事不要放在循环内,比如下面的优化可以快一倍:

a = range(10000)

size_a = len(a)

%timeit -n 1000 for i in a: k = len(a)

%timeit -n 1000 for i in a: k = size_a

1000 loops, best of 3: 569 µs per loop

1000 loops, best of 3: 256 µs per loop

7、优化包含多个判断表达式的顺序

对于and,应该把满足条件少的放在前面,对于or,把满足条件多的放在前面。如:

a = range(2000)  

%timeit -n 100 [i for i in a if 10 < i < 20 or 1000 < i < 2000]

%timeit -n 100 [i for i in a if 1000 < i < 2000 or 100 < i < 20]    

%timeit -n 100 [i for i in a if i % 2 == 0 and i > 1900]

%timeit -n 100 [i for i in a if i > 1900 and i % 2 == 0]

100 loops, best of 3: 287 µs per loop

100 loops, best of 3: 214 µs per loop

100 loops, best of 3: 128 µs per loop

100 loops, best of 3: 56.1 µs per loop

8、使用join合并迭代器中的字符串

In [1]: %%timeit

   ...: s = ''

   ...: for i in a:

   ...:         s += i

   ...:

10000 loops, best of 3: 59.8 µs per loop

In [2]: %%timeit

s = ''.join(a)

   ...:

100000 loops, best of 3: 11.8 µs per loop

join对于累加的方式,有大约5倍的提升。

9、选择合适的格式化字符方式

s1, s2 = 'ax', 'bx'

%timeit -n 100000 'abc%s%s' % (s1, s2)

%timeit -n 100000 'abc{0}{1}'.fORMat(s1, s2)

%timeit -n 100000 'abc' + s1 + s2

100000 loops, best of 3: 183 ns per loop

100000 loops, best of 3: 169 ns per loop

100000 loops, best of 3: 103 ns per loop

三种情况中,%的方式是最慢的,但是三者的差距并不大(都非常快)。(个人觉得%的可读性最好)

10、不借助中间变量交换两个变量的值

In [3]: %%timeit -n 10000

    a,b=1,2

   ....: c=a;a=b;b=c;

   ....:

10000 loops, best of 3: 172 ns per loop

In [4]: %%timeit -n 10000

a,b=1,2

a,b=b,a

   ....:

10000 loops, best of 3: 86 ns per loop

使用a,b=b,a而不是c=a;a=b;b=c;来交换a,b的值,可以快1倍以上。

11、使用if is

a = range(10000)

%timeit -n 100 [i for i in a if i == True]

%timeit -n 100 [i for i in a if i is True]

100 loops, best of 3: 531 µs per loop

100 loops, best of 3: 362 µs per loop

使用 if is True 比 if == True 将近快一倍。

12、使用级联比较x < y < z

x, y, z = 1,2,3

%timeit -n 1000000 if x < y < z:pass

%timeit -n 1000000 if x < y and y < z:pass

1000000 loops, best of 3: 101 ns per loop

1000000 loops, best of 3: 121 ns per loop

x < y < z效率略高,而且可读性更好。

13、while 1 比 while True 更快

def while_1():

    n = 100000

    while 1:

        n -= 1

        if n <= 0: break

def while_true():

    n = 100000

    while True:

        n -= 1

        if n <= 0: break    

m, n = 1000000, 1000000

%timeit -n 100 while_1()

%timeit -n 100 while_true()

100 loops, best of 3: 3.69 ms per loop

100 loops, best of 3: 5.61 ms per loop

while 1 比 while true快很多,原因是在python2.x中,True是一个全局变量,而非关键字。

14、使用**而不是pow

%timeit -n 10000 c = pow(2,20)

%timeit -n 10000 c = 2**20

10000 loops, best of 3: 284 ns per loop

10000 loops, best of 3: 16.9 ns per loop

**就是快10倍以上!

15、使用 cProfile, cStringIO 和 cPickle等用c实现相同功能(分别对应profile, StringIO, pickle)的包

import cPickle

import pickle

a = range(10000)

%timeit -n 100 x = cPickle.dumps(a)

%timeit -n 100 x = pickle.dumps(a)

100 loops, best of 3: 1.58 ms per loop

100 loops, best of 3: 17 ms per loop

由c实现的包,速度快10倍以上!

16、使用最佳的反序列化方式

下面比较了eval, cPickle, JSON方式三种对相应字符串反序列化的效率:

import json

import cPickle

a = range(10000)

s1 = str(a)

s2 = cPickle.dumps(a)

s3 = json.dumps(a)

%timeit -n 100 x = eval(s1)

%timeit -n 100 x = cPickle.loads(s2)

%timeit -n 100 x = json.loads(s3)

100 loops, best of 3: 16.8 ms per loop

100 loops, best of 3: 2.02 ms per loop

100 loops, best of 3: 798 µs per loop

可见json比cPickle快近3倍,比eval快20多倍。

17、使用C扩展(Extension)

目前主要有CPython(python最常见的实现的方式)原生api, ctypes,Cython,cffi三种方式,它们的作用是使得Python程序可以调用由C编译成的动态链接库,其特点分别是:

CPython原生API: 通过引入Python.h头文件,对应的C程序中可以直接使用Python的数据结构。实现过程相对繁琐,但是有比较大的适用范围。

ctypes: 通常用于封装(wrap)C程序,让纯Python程序调用动态链接库(windows中的dll或Unix中的so文件)中的函数。如果想要在python中使用已经有C类库,使用ctypes是很好的选择,有一些基准测试下,python2+ctypes是性能最好的方式。

Cython: Cython是CPython的超集,用于简化编写C扩展的过程。Cython的优点是语法简洁,可以很好地兼容numpy等包含大量C扩展的库。Cython的使得场景一般是针对项目中某个算法或过程的优化。在某些测试中,可以有几百倍的性能提升。

cffi: cffi的就是ctypes在pypy(详见下文)中的实现,同进也兼容CPython。cffi提供了在python使用C类库的方式,可以直接在python代码中编写C代码,同时支持链接到已有的C类库。

使用这些优化方式一般是针对已有项目性能瓶颈模块的优化,可以在少量改动原有项目的情况下大幅度地提高整个程序的运行效率。

18、并行编程

因为GIL的存在,Python很难充分利用多核CPU的优势。但是,可以通过内置的模块multiprocessing实现下面几种并行模式:

多进程:对于CPU密集型的程序,可以使用multiprocessing的Process,Pool等封装好的类,通过多进程的方式实现并行计算。但是因为进程中的通信成本比较大,对于进程之间需要大量数据交互的程序效率未必有大的提高。

多线程:对于io密集型的程序,multiprocessing.dummy模块使用multiprocessing的接口封装threading,使得多线程编程也变得非常轻松(比如可以使用Pool的map接口,简洁高效)。

分布式:multiprocessing中的Managers类提供了可以在不同进程之共享数据的方式,可以在此基础上开发出分布式的程序。

不同的业务场景可以选择其中的一种或几种的组合实现程序性能的优化。

19、终级大杀器:PyPy

PyPy是用RPython(CPython的子集)实现的Python,根据官网的基准测试数据,它比CPython实现的Python要快6倍以上。快的原因是使用了Just-in-Time(JIT)编译器,即动态编译器,与静态编译器(如GCc,javac等)不同,它是利用程序运行的过程的数据进行优化。由于历史原因,目前pypy中还保留着GIL,不过正在进行的STM项目试图将PyPy变成没有GIL的Python。

如果python程序中含有C扩展(非cffi的方式),JIT的优化效果会大打折扣,甚至比CPython慢(比Numpy)。所以在PyPy中最好用纯Python或使用cffi扩展。

随着STM,Numpy等项目的完善,相信PyPy将会替代CPython。

20、使用性能分析工具

除了上面在ipython使用到的timeit模块,还有cProfile。cProfile的使用方式也非常简单: python -m cProfile filename.py,filename.py 是要运行程序的文件名,可以在标准输出中看到每一个函数被调用的次数和运行的时间,从而找到程序的性能瓶颈,然后可以有针对性地优化。

到此,关于“Python性能优化的建议有哪些”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

--结束END--

本文标题: Python性能优化的建议有哪些

本文链接: https://www.lsjlt.com/news/229934.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python性能优化的建议有哪些
    这篇文章主要介绍“Python性能优化的建议有哪些”,在日常操作中,相信很多人在Python性能优化的建议有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python性能优化的建议有哪些”的疑惑有所帮助!...
    99+
    2023-06-02
  • .NET程序的性能要领和优化建议有哪些
    本篇文章给大家分享的是有关.NET程序的性能要领和优化建议有哪些,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。提供了一些性能优化的建议,这些经验来自于使用托管代码重写C# 和 ...
    99+
    2023-06-17
  • sql的优化建议有哪些呢
    本篇文章给大家分享的是有关sql的优化建议有哪些呢,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。1、硬件层相关优化  1.1、CPU相关  在...
    99+
    2024-04-02
  • HTML5中SEO优化的建议有哪些
    这篇文章给大家分享的是有关HTML5中SEO优化的建议有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。举个例子<title>淘宝网 - 淘!我喜欢</title>使...
    99+
    2023-06-09
  • python性能优化的方法有哪些
    Python性能优化的方法有:1. 使用更高效的算法和数据结构:选择合适的算法和数据结构可以减少时间和空间复杂度,从而提高性能。2....
    99+
    2023-09-08
    python
  • python性能优化技巧有哪些
    小编给大家分享一下python性能优化技巧有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!性能优化技巧1. 限制CPU和内存使用量如果Python程序占用资源...
    99+
    2023-06-27
  • CSS编写时的高性能以及高维护性代码优化建议有哪些
    今天就跟大家聊聊有关CSS编写时的高性能以及高维护性代码优化建议有哪些,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。性能,这个词如今被炒的很热,也是...
    99+
    2024-04-02
  • Python开发建议:如何优化代码性能
    Python开发建议:如何优化代码性能引言:Python是一种易于学习和使用的编程语言,但在处理大规模数据和复杂计算时,它的性能可能会受到限制。本文将介绍一些优化Python代码性能的方法和技巧,帮助开发人员提高程序效率,从而加快代码运行速...
    99+
    2023-11-22
    代码优化技巧 Python性能优化 性能调优技巧
  • PHP7有哪些性能优化
    这篇文章主要介绍“PHP7有哪些性能优化”,在日常操作中,相信很多人在PHP7有哪些性能优化问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”PHP7有哪些性能优化”的疑惑有所帮助!接下来,请跟着小编一起来学习吧...
    99+
    2023-06-17
  • CSS图片优化的相关建议有哪些
    CSS图片优化的相关建议有哪些,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。  CSS图片优化就是尽量压缩图片的大小,加快页面加载速度,这对于...
    99+
    2024-04-02
  • web网页头部优化建议有哪些
    这篇文章给大家介绍web网页头部优化建议有哪些,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。logo优化:logo图片尽量小。2.一般情况下是作为背景放入的。2.肯定加h2标签(提权)4.搜索引擎对文本链接最友好。 &...
    99+
    2023-06-08
  • python代码性能优化技巧有哪些
    python优化代码性能技巧:1.优化字符串;2.减少循环;3.优化算法;python中优化代码性能的技巧有以下几种优化字符串python中字符串对象是不可改变的,在对字符串进行拼接等操作时,会产生一个新的字符串对象,从而会在一定程度上影响...
    99+
    2024-04-02
  • C#中Span相关的性能优化建议
    目录引言什么是Span关于String的一段性能提升测试代码最终性能对比写在最后引言 C# 是一门现代化的编程语言,与Java十分的相似。熟练的开发者甚至能三天无缝切换到Java。...
    99+
    2024-04-02
  • 提高Python性能的一些建议
        最近换住的地方,网费到期,有两个星期没更新博客了,博客还是要坚持写的,有时候工作时遇到了相关问题,查看相关博客,还是能够得到一些思路或者灵感。虽然写篇博客要话费不少时间(我一般要花一个半小时到两个小时之间),但是这中间码字呀、归纳总...
    99+
    2023-01-31
    性能 建议 Python
  • JavaScript性能优化的方法有哪些
    这篇文章主要讲解了“JavaScript性能优化的方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“JavaScript性能优化的方法有哪些”吧! ...
    99+
    2024-04-02
  • mongodb性能优化的技巧有哪些
    以下是一些MongoDB性能优化的技巧: 索引优化:使用合适的索引可以大大提高查询性能。使用explain()命令来分析查询性能...
    99+
    2023-10-25
    mongodb
  • Mysql高性能优化技能有哪些
    这篇文章主要介绍Mysql高性能优化技能有哪些,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!数据库命令规范所有数据库对象名称必须使用小写字母并用下划线分割所有数据库对象名称禁止使用m...
    99+
    2024-04-02
  • Java的性能优化细节有哪些
    今天小编给大家分享一下Java的性能优化细节有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1. 尽量在合适的场合使用单...
    99+
    2023-06-04
  • vps性能优化的方法有哪些
    1. 优化服务器配置:根据应用需求和实际使用情况调整服务器配置,包括CPU、内存、磁盘空间等,以提高服务器性能。2. 使用缓存技术:...
    99+
    2023-05-23
    vps性能优化 vps
  • php性能优化的方法有哪些
    有以下几种常用的 PHP 性能优化方法:1. 使用缓存:通过使用缓存技术,将一些常用的计算结果或数据库查询结果缓存起来,减少重复的计...
    99+
    2023-09-26
    php
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作