iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >20招让你的Python飞起来!
  • 826
分享到

20招让你的Python飞起来!

飞起Python 2022-06-04 18:06:07 826人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

今天分享的这篇文章,文字不多,代码为主。绝对干货,童叟无欺,主要分享了提升 python 性能的 20 个技巧,教你如何告别慢Python。原文作者 开元,全栈程序员,使用 Python, Java, PH

今天分享的这篇文章,文字不多,代码为主。绝对干货,童叟无欺,主要分享了提升 python 性能的 20 个技巧,教你如何告别慢Python。原文作者 开元,全栈程序员,使用 Python, Java, PHPc++

1. 优化算法时间复杂度

算法的时间复杂度对程序的执行效率影响最大,在Python中可以通过选择合适的数据结构优化时间复杂度,如list和set查找某一个元素的时间复杂度分别是O(n)和O(1)。不同的场景有不同的优化方式,总得来说,一般有分治,分支界限,贪心,动态规划等思想。

2. 减少冗余数据

如用上三角或下三角的方式去保存一个大的对称矩阵。在0元素占大多数的矩阵里使用稀疏矩阵表示。

3. 合理使用copy与deepcopy

对于dict和list等数据结构的对象,直接赋值使用的是引用的方式。而有些情况下需要复制整个对象,这时可以使用copy包里的copy和deepcopy,这两个函数的不同之处在于后者是递归复制的。效率也不一样:(以下程序在ipython中运行)


import copy
a = range(100000)
%timeit -n 10 copy.copy(a) # 运行10次 copy.copy(a)

%timeit -n 10 copy.deepcopy(a)
10 loops, best of 3: 1.55 ms per loop
10 loops, best of 3: 151 ms per loop

timeit后面的-n表示运行的次数,后两行对应的是两个timeit的输出,下同。由此可见后者慢一个数量级。

4. 使用dict或set查找元素

Python dict和set都是使用hash表来实现(类似c++11标准库中unordered_map),查找元素的时间复杂度是O(1)。


a = range(1000)
s = set(a)
d = dict((i,1) for i in a)
%timeit -n 10000 100 in d
%timeit -n 10000 100 in s
10000 loops, best of 3: 43.5 ns per loop
10000 loops, best of 3: 49.6 ns per loop

dict的效率略高(占用的空间也多一些)。

5. 合理使用生成器(generator)和yield


%timeit -n 100 a = (i for i in range(100000))
%timeit -n 100 b = [i for i in range(100000)]
100 loops, best of 3: 1.54 ms per loop
100 loops, best of 3: 4.56 ms per loop

使用()得到的是一个generator对象,所需要的内存空间与列表的大小无关,所以效率会高一些。在具体应用上,比如set(i for i in range(100000))会比set([i for i in range(100000)])快。

但是对于需要循环遍历的情况:


%timeit -n 10 for x in (i for i in range(100000)): pass
%timeit -n 10 for x in [i for i in range(100000)]: pass

10 loops, best of 3: 6.51 ms per loop
10 loops, best of 3: 5.54 ms per loop

后者的效率反而更高,但是如果循环里有break,用generator的好处是显而易见的。yield也是用于创建generator:


def yield_func(ls):
  for i in ls:
    yield i+1

def not_yield_func(ls):
  return [i+1 for i in ls]

ls = range(1000000)
%timeit -n 10 for i in yield_func(ls):pass

%timeit -n 10 for i in not_yield_func(ls):pass

10 loops, best of 3: 63.8 ms per loop
10 loops, best of 3: 62.9 ms per loop

对于内存不是非常大的list,可以直接返回一个list,但是可读性yield更佳(人个喜好)。
python2.x内置generator功能的有xrange函数、itertools包等。

6. 优化循环

循环之外能做的事不要放在循环内,比如下面的优化可以快一倍:


a = range(10000)
size_a = len(a)
%timeit -n 1000 for i in a: k = len(a)
%timeit -n 1000 for i in a: k = size_a
1000 loops, best of 3: 569 µs per loop
1000 loops, best of 3: 256 µs per loop

7. 优化包含多个判断表达式的顺序

对于and,应该把满足条件少的放在前面,对于or,把满足条件多的放在前面。如:


a = range(2000) 
%timeit -n 100 [i for i in a if 10 < i < 20 or 1000 < i < 2000]
%timeit -n 100 [i for i in a if 1000 < i < 2000 or 100 < i < 20]   
%timeit -n 100 [i for i in a if i % 2 == 0 and i > 1900]
%timeit -n 100 [i for i in a if i > 1900 and i % 2 == 0]
100 loops, best of 3: 287 µs per loop
100 loops, best of 3: 214 µs per loop
100 loops, best of 3: 128 µs per loop
100 loops, best of 3: 56.1 µs per loop

8. 使用join合并迭代器中的字符串


In [1]: %%timeit
  ...: s = ''
  ...: for i in a:
  ...:     s += i
  ...:
10000 loops, best of 3: 59.8 µs per loop

In [2]: %%timeit
s = ''.join(a)
  ...:
100000 loops, best of 3: 11.8 µs per loop

join对于累加的方式,有大约5倍的提升。

9. 选择合适的格式化字符方式


s1, s2 = 'ax', 'bx'

%timeit -n 100000 'abc%s%s' % (s1, s2)
%timeit -n 100000 'abc{0}{1}'.fORMat(s1, s2)
%timeit -n 100000 'abc' + s1 + s2
100000 loops, best of 3: 183 ns per loop
100000 loops, best of 3: 169 ns per loop
100000 loops, best of 3: 103 ns per loop

三种情况中,%的方式是最慢的,但是三者的差距并不大(都非常快)。(个人觉得%的可读性最好)

10. 不借助中间变量交换两个变量的值


In [3]: %%timeit -n 10000
  a,b=1,2
  ....: c=a;a=b;b=c;
  ....:
10000 loops, best of 3: 172 ns per loop

In [4]: %%timeit -n 10000

a,b=1,2a,b=b,a
  ....:
10000 loops, best of 3: 86 ns per loop

使用a,b=b,a而不是c=a;a=b;b=c;来交换a,b的值,可以快1倍以上。

11. 使用if is


a = range(10000)
%timeit -n 100 [i for i in a if i == True]
%timeit -n 100 [i for i in a if i is True]
100 loops, best of 3: 531 µs per loop
100 loops, best of 3: 362 µs per loop

使用 if is True 比 if == True 将近快一倍。

12. 使用级联比较x < y < z


x, y, z = 1,2,3

%timeit -n 1000000 if x < y < z:pass
%timeit -n 1000000 if x < y and y < z:pass

1000000 loops, best of 3: 101 ns per loop
1000000 loops, best of 3: 121 ns per loop

x < y < z效率略高,而且可读性更好。

13. while 1 比 while True 更快


def while_1():
  n = 100000
  while 1:
    n -= 1
    if n <= 0: break

def while_true():
  n = 100000
  while True:
    n -= 1
    if n <= 0: break

m, n = 1000000, 1000000

%timeit -n 100 while_1()
%timeit -n 100 while_true()
100 loops, best of 3: 3.69 ms per loop
100 loops, best of 3: 5.61 ms per loop

while 1 比 while true快很多,原因是在python2.x中,True是一个全局变量,而非关键字。

14. 使用**而不是pow


%timeit -n 10000 c = pow(2,20)
%timeit -n 10000 c = 2**20

10000 loops, best of 3: 284 ns per loop
10000 loops, best of 3: 16.9 ns per loop

**就是快10倍以上!

15. 使用 cProfile, cStringIO 和 cPickle等用c实现相同功能(分别对应profile, Stringio, pickle)的包


import cPickle
import pickle
a = range(10000)
%timeit -n 100 x = cPickle.dumps(a)
%timeit -n 100 x = pickle.dumps(a)
100 loops, best of 3: 1.58 ms per loop
100 loops, best of 3: 17 ms per loop

由c实现的包,速度快10倍以上!

16. 使用最佳的反序列化方式

下面比较了eval, cPickle, JSON方式三种对相应字符串反序列化的效率:


import json
import cPickle
a = range(10000)
s1 = str(a)
s2 = cPickle.dumps(a)
s3 = json.dumps(a)
%timeit -n 100 x = eval(s1)
%timeit -n 100 x = cPickle.loads(s2)
%timeit -n 100 x = json.loads(s3)
100 loops, best of 3: 16.8 ms per loop
100 loops, best of 3: 2.02 ms per loop
100 loops, best of 3: 798 µs per loop

可见json比cPickle快近3倍,比eval快20多倍。

17. 使用C扩展(Extension)

目前主要有CPython(python最常见的实现的方式)原生api, ctypes,Cython,cffi三种方式,它们的作用是使得Python程序可以调用由C编译成的动态链接库,其特点分别是:

CPython原生API: 通过引入Python.h头文件,对应的C程序中可以直接使用Python的数据结构。实现过程相对繁琐,但是有比较大的适用范围。
ctypes: 通常用于封装(wrap)C程序,让纯Python程序调用动态链接库(windows中的dll或Unix中的so文件)中的函数。如果想要在python中使用已经有C类库,使用ctypes是很好的选择,有一些基准测试下,python2+ctypes是性能最好的方式。
Cython: Cython是CPython的超集,用于简化编写C扩展的过程。Cython的优点是语法简洁,可以很好地兼容numpy等包含大量C扩展的库。Cython的使得场景一般是针对项目中某个算法或过程的优化。在某些测试中,可以有几百倍的性能提升。
cffi: cffi的就是ctypes在pypy(详见下文)中的实现,同进也兼容CPython。cffi提供了在python使用C类库的方式,可以直接在python代码中编写C代码,同时支持链接到已有的C类库。
使用这些优化方式一般是针对已有项目性能瓶颈模块的优化,可以在少量改动原有项目的情况下大幅度地提高整个程序的运行效率。

18. 并行编程

因为GIL的存在,Python很难充分利用多核CPU的优势。但是,可以通过内置的模块multiprocessing实现下面几种并行模式:

多进程:对于CPU密集型的程序,可以使用multiprocessing的Process,Pool等封装好的类,通过多进程的方式实现并行计算。但是因为进程中的通信成本比较大,对于进程之间需要大量数据交互的程序效率未必有大的提高。
多线程:对于IO密集型的程序,multiprocessing.dummy模块使用multiprocessing的接口封装threading,使得多线程编程也变得非常轻松(比如可以使用Pool的map接口,简洁高效)。
分布式:multiprocessing中的Managers类提供了可以在不同进程之共享数据的方式,可以在此基础上开发分布式的程序。
不同的业务场景可以选择其中的一种或几种的组合实现程序性能的优化。

19. 终级大杀器:PyPy

PyPy是用RPython(CPython的子集)实现的Python,根据官网的基准测试数据,它比CPython实现的Python要快6倍以上。快的原因是使用了Just-in-Time(JIT)编译器,即动态编译器,与静态编译器(如GCc,javac等)不同,它是利用程序运行的过程的数据进行优化。由于历史原因,目前pypy中还保留着GIL,不过正在进行的STM项目试图将PyPy变成没有GIL的Python。

如果python程序中含有C扩展(非cffi的方式),JIT的优化效果会大打折扣,甚至比CPython慢(比Numpy)。所以在PyPy中最好用纯Python或使用cffi扩展。

随着STM,Numpy等项目的完善,相信PyPy将会替代CPython。

20. 使用性能分析工具

除了上面在ipython使用到的timeit模块,还有cProfile。cProfile的使用方式也非常简单:python -m cProfile filename.py,filename.py 是要运行程序的文件名,可以在标准输出中看到每一个函数被调用的次数和运行的时间,从而找到程序的性能瓶颈,然后可以有针对性地优化。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持编程网。

--结束END--

本文标题: 20招让你的Python飞起来!

本文链接: https://www.lsjlt.com/news/14121.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 20招让你的Python飞起来!
    今天分享的这篇文章,文字不多,代码为主。绝对干货,童叟无欺,主要分享了提升 Python 性能的 20 个技巧,教你如何告别慢Python。原文作者 开元,全栈程序员,使用 Python, Java, PH...
    99+
    2022-06-04
    飞起 Python
  • 一招让你的Win XP飞起来
    Microsoft Windows XP操作系统一经推出,就以美观的交互界面打动了广大计算机用户,再加上优异的总体性能(包括显著缩短了启动和继续使用的时间,以及应用程序的快速响应),使得很多用户纷纷将自己的操作系统升级...
    99+
    2023-05-24
    XP飞起来 Win XP
  • Java 异步编程:如何让你的程序飞起来?
    在现代软件开发中,很多应用程序都需要处理大量的数据和请求,这些操作可能会造成程序的阻塞和延迟。为了避免这种情况,我们可以采用异步编程的方式,使得程序能够更快速地响应用户的请求,从而提高系统的性能和稳定性。 在 Java 编程语言中,异步编...
    99+
    2023-09-29
    异步编程 打包 load
  • GO语言响应缓存详解:让你的网站飞起来!
    随着互联网的快速发展,网站的性能优化变得越来越重要。而响应缓存是一种常用的优化方式,它可以大幅度提高网站的访问速度。本文将详细介绍GO语言中响应缓存的实现方式和应用场景。 什么是响应缓存 在讲解响应缓存之前,我们先来了解一下HTTP协议中...
    99+
    2023-10-28
    响应 教程 缓存
  • 如何用好Java枚举让你的工作效率飞起来
    目录1.概览2.自定义枚举方法3.使用 == 比较枚举类型4.在 switch 语句中使用枚举类型5.枚举类型的属性,方法和构造函数6.EnumSet and EnumMap6.1....
    99+
    2022-11-12
  • 精通ASP编程算法,让你的网站速度飞起来!
    ASP是一种非常流行的网站开发技术,但是它的性能却经常被人诟病。如果你想让你的网站速度更快,那么就需要精通ASP编程算法。在本文中,我们将介绍一些常见的ASP编程算法,并提供一些演示代码,以帮助你更好地了解它们。 算法一:使用缓存 ASP缓...
    99+
    2023-07-02
    编程算法 索引 numy
  • 你知道吗?PHP 缓存和 numpy 打包可以让你的网站飞起来!
    PHP 缓存和 numpy 打包是两种非常有用的技术,可以让你的网站飞起来。PHP 缓存可以大大提高网站的性能,而 numpy 打包可以极大地减少数据传输的时间。在本文中,我们将介绍如何使用这两种技术来提高你的网站性能。 PHP 缓存 PH...
    99+
    2023-06-03
    缓存 numpy 打包
  • 让Python性能起飞的技巧有哪些
    这篇文章主要讲解了“让Python性能起飞的技巧有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“让Python性能起飞的技巧有哪些”吧!如何测量程序的执行时间关于 Python 如何精确...
    99+
    2023-06-29
  • 轻松搞定Spring集成缓存,让你的应用程序飞起来!
    Spring集成缓存 缓存接口开启注解缓存注解使用@Cacheable@CachePut@CacheEvict@Caching@CacheConfig 缓存存储使用 ConcurrentH...
    99+
    2023-10-03
    spring 缓存 java
  • 让Python代码飞起来,高手必用十个VSCode插件
    作为一名 Python 程序员,VSCode 中的插件能够帮助我们更高效地进行开发,提高代码的质量和效率。在这篇文章中,我将为大家推荐一些常用的 Python VSCode 插件,希望能够帮助大家更好地利用 VSCode 进行 Python...
    99+
    2023-05-14
    程序员 Python VSCode
  • 详解让Python性能起飞的15个技巧
    目录前言如何测量程序的执行时间1.使用map()进行函数映射2.使用set()求交集3.使用sort()或sorted()排序4.使用collections.Counter()计数5...
    99+
    2022-11-13
  • 还在为 Python 并发编程烦恼?试试这些 bash 函数,让你的程序飞起来!
    Python 是一种非常流行的编程语言,但是在处理大量数据时,Python 的速度有时候可能会成为瓶颈,特别是在处理大量并发请求的时候。这时候,我们需要使用并发编程技术来提高程序的性能,而 Python 也提供了许多并发编程的库,如 thr...
    99+
    2023-07-08
    并发 bash 函数
  • 让Python代码加速起飞的方法有哪些
    本篇内容介绍了“让Python代码加速起飞的方法有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1. 了解你的内置函数这一技巧有助于节省...
    99+
    2023-06-15
  • windows系统优化--使你的计算机飞起来
    使你的计算机飞起来 1、加速网上邻居   在Windows XP中访问网上邻居是相当恼人的,系统会搜索自己的共享目录和可作为网络共享的打印机以及计划任务中和网络相关的计划任务,然后才显示出来,显然这样速度就会比Windo...
    99+
    2023-05-23
    windows - 计算机 系统
  • 你知道吗?ASP 缓存 重定向 关键字可以让你的网站速度飞起!
    随着互联网的发展,越来越多的网站和应用程序需要处理大量的数据和请求。因此,网站的性能和速度变得尤为重要。如果你想让你的网站更快,那么缓存、重定向和关键字是三个你应该考虑的重要因素。 在ASP中,缓存是一种将数据存储在内存中以供以后访问的技...
    99+
    2023-08-08
    缓存 重定向 关键字
  • android转场动画,让你的APP瞬间绚丽起来
    友好的交互体验能够吸引眼球,android API 21(5.0)后系统内置了Activity之间的切换动画,不仅可以让用户看起来舒服,而且实现起来也特别简单。 一、通过overridePendingTransition实现转场动画...
    99+
    2022-06-06
    app 动画 Android
  • 使用NumPy和数组解决PHP缓存问题,让您的网站飞起来!
    PHP是一种流行的服务器端编程语言,它的灵活性和易用性吸引了许多网站的开发者。然而,PHP也因为它的解释性和动态编译方式而被诟病,这使得PHP的性能表现并不理想。其中一个性能瓶颈就是PHP的缓存问题。在本篇文章中,我们将介绍使用NumPy...
    99+
    2023-08-13
    缓存 数组 numpy
  • 怎么写出让人看起来很优雅舒服的python代码
    这篇文章将为大家详细讲解有关怎么写出让人看起来很优雅舒服的python代码,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。很多新手在开始学一门新的语言的时候,往往会忽视一些不应该忽视的细节,比...
    99+
    2023-06-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作