广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python中使用矢量化替换循环
  • 936
分享到

python中使用矢量化替换循环

循环python中替换 2023-05-14 21:05:02 936人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

所有编程语言都离不开循环。因此,默认情况下,只要有重复操作,我们就会开始执行循环。但是当我们处理大量迭代(数百万/十亿行)时,使用循环是一种犯罪。您可能会被困几个小时,后来才意识到它行不通。这就是在 python 中实现矢量化变得非常关键的

所有编程语言都离不开循环。因此,默认情况下,只要有重复操作,我们就会开始执行循环。但是当我们处理大量迭代(数百万/十亿行)时,使用循环是一种犯罪。您可能会被困几个小时,后来才意识到它行不通。这就是在 python 中实现矢量化变得非常关键的地方。

图片


什么是矢量化?

矢量化是在数据集上实现 (NumPy) 数组操作的技术。在后台,它将操作一次性应用于数组或系列的所有元素(不同于一次操作一行的“for”循环)。

接下来我们使用一些用例来演示什么是矢量化。

求数字之和

##使用循环
import time 
start = time.time()

 
# iterative sum
total = 0
# iterating through 1.5 Million numbers
for item in range(0, 1500000):
total = total + item


print('sum is:' + str(total))
end = time.time()

print(end - start)

#1124999250000
#0.14 Seconds
## 使用矢量化
import numpy as np

start = time.time()

# vectorized sum - using numpy for vectorization
# np.arange create the sequence of numbers from 0 to 1499999
print(np.sum(np.arange(1500000)))

end = time.time()

print(end - start)


##1124999250000
##0.008 Seconds

与使用范围函数的迭代相比,矢量化的执行时间减少了约 18 倍。在使用 pandas DataFrame 时,这种差异将变得更加显著。

数学运算

在数据科学中,在使用 Pandas DataFrame 时,开发人员使用循环通过数学运算创建新的派生列。

在下面的示例中,我们可以看到对于此类用例,用矢量化替换循环是多么容易。

DataFrame 是行和列形式的表格数据。

我们创建一个具有 500 万行和 4 列的 pandas DataFrame,其中填充了 0 到 50 之间的随机值。

图片

import numpy as np 
import pandas as pd 
df = pd.DataFrame(np.random.randint( 0 , 50 , size=( 5000000 , 4 )), columns=( 'a' , 'b' , 'c' , 'd ' )) 
df.shape 
# (5000000, 5)
 df.head()

创建一个新列“ratio”来查找列“d”和“c”的比率。

## 循环遍历
import time 
start = time.time() 

# 使用 iterrows 遍历 DataFrame 
for idx, row in df.iterrows(): 
# 创建一个新列
df.at[idx, 'ratio' ] = 100 * (row[ "d" ] / row[ "c" ]) 
end = time.time() 
print (end - start) 
### 109 秒
## 使用矢量化
start = time.time() 
df[ "ratio" ] = 100 * (df[ "d" ] / df[ "c" ]) 

end = time.time() 
print (end - start) 
### 0.12 秒

我们可以看到 DataFrame 的显著改进,与Python 中的循环相比,矢量化操作所花费的时间几乎快 1000 倍。

If-else 语句

我们实现了很多需要我们使用“If-else”类型逻辑的操作。我们可以轻松地将这些逻辑替换为 python 中的矢量化操作。

让我们看下面的例子来更好地理解它(我们将使用我们在用例 2 中创建的 DataFrame):

想象一下,我们要根据现有列“a”上的某些条件创建一个新列“e”

## 使用循环
import time 
start = time.time() 

# 使用 iterrows 遍历 DataFrame 
for idx, row in df.iterrows(): 
if row.a == 0 : 
df.at[idx, 'e' ] = row.d 
elif ( row.a <= 25 ) & (row.a > 0 ): 
df.at[idx, 'e' ] = (row.b)-(row.c) 
else : 
df.at[idx, 'e' ] = row.b + row.c 

end = time.time() 

print (end - start) 
### 耗时:166 秒
## 矢量化
start = time.time() 
df[ 'e' ] = df[ 'b' ] + df[ 'c' ] 
df.loc[df[ 'a' ] <= 25 , 'e' ] = df [ 'b' ] -df[ 'c' ] 
df.loc[df[ 'a' ]== 0 , 'e' ] = df[ 'd' ]end = time.time()
打印(结束 - 开始)
## 0.29007707595825195 秒

与使用 if-else 语句的 python 循环相比,向量化操作所花费的时间快 600 倍。

解决机器学习/深度学习网络

深度学习要求我们解决多个复杂的方程式,而且需要解决数百万和数十亿行的问题。在 Python 中运行循环来求解这些方程式非常慢,矢量化是最佳解决方案。

例如,计算以下多元线性回归方程中数百万行的 y 值:


我们可以用矢量化代替循环。

图片

m1、m2、m3……的值是通过使用与 x1、x2、x3……对应的数百万个值求解上述等式来确定的

图片

图片

import numpy as np 
# 设置 m 的初始值
m = np.random.rand( 1 , 5 ) 

# 500 万行的输入值
x = np.random.rand( 5000000 , 5 )
## 使用循环
import numpy as np
m = np.random.rand(1,5)
x = np.random.rand(5000000,5)

total = 0
tic = time.process_time()

for i in range(0,5000000):
total = 0
for j in range(0,5):
total = total + x[i][j]*m[0][j] 

zer[i] = total 

toc = time.process_time()
print ("Computation time = "+ str ((toc - tic)) + "seconds" ) 

####计算时间 = 27.02 秒
## 矢量化
tic = time.process_time() 

#dot product
np.dot(x,mT) 

toc = time.process_time() 
print ( "计算时间 = " + str ((toc - tic)) + "seconds" ) 

####计算时间 = 0.107 秒

np.dot 在后端实现向量化矩阵乘法。与 Python 中的循环相比,它快 165 倍。

结论

python 中的矢量化速度非常快,无论何时我们处理非常大的数据集,都应该优先于循环。

图片

随着时间的推移开始实施它,您将习惯于按照代码的矢量化思路进行思考。

以上就是python中使用矢量化替换循环的详细内容,更多请关注编程网其它相关文章!

--结束END--

本文标题: python中使用矢量化替换循环

本文链接: https://www.lsjlt.com/news/205920.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python中使用矢量化替换循环
    所有编程语言都离不开循环。因此,默认情况下,只要有重复操作,我们就会开始执行循环。但是当我们处理大量迭代(数百万/十亿行)时,使用循环是一种犯罪。您可能会被困几个小时,后来才意识到它行不通。这就是在 python 中实现矢量化变得非常关键的...
    99+
    2023-05-14
    循环 python中 替换
  • 如何使用HTML5进行SVG矢量图形替换
    这篇文章主要讲解了“如何使用HTML5进行SVG矢量图形替换”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何使用HTML5进行SVG矢量图形替换”吧! ...
    99+
    2022-10-19
  • 如何使用R语言替换for循环
    这篇文章将为大家详细讲解有关如何使用R语言替换for循环,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。R语言中,for循环运行比较慢for(i in 1:1000){pr...
    99+
    2023-06-14
  • python如何使用list comprehension代替原始的for循环
    小编给大家分享一下python如何使用list comprehension代替原始的for循环,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!使用list comprehension代替原始的for循环假设我们想要创建一个具...
    99+
    2023-06-27
  • python中while循环怎么使用
    在Python中,可以使用while循环来重复执行一段代码,直到满足一定的条件为止。while循环的语法格式如下:```python...
    99+
    2023-08-25
    python while
  • 如何使用Python中的for循环
    如何使用Python中的for循环Python是一种简单易用的编程语言,其中的for循环是非常常用的工具之一。通过使用for循环,我们可以循环遍历一系列的数据,进行有效的处理和操作,提高代码的效率。下面,我将通过具体的代码示例,介绍如何使用...
    99+
    2023-10-25
    Python 使用 for循环
  • 如何使用Python中的while循环
    如何使用Python中的while循环在Python编程中,循环是非常重要的概念之一。循环可以帮助我们重复执行一段代码,直到满足指定条件为止。其中,while循环是一种被广泛使用的循环结构之一。通过使用while循环,我们可以根据条件的真假...
    99+
    2023-10-22
    Python编程 while循环 Python循环
  • 在Python的while循环中使用else以及循环嵌套的用法
    循环使用 else 语句 在 python 中,for … else 表示这样的意思,for 中的语句和普通的没有区别,else 中的语句会在循环正常执行完(即 for 不是通过 break 跳出而中断的)...
    99+
    2022-06-04
    嵌套 Python
  • python中for循环语句如何使用
    在Python中,for循环用于迭代一个可迭代对象(如列表、元组、字符串等)中的元素。语法结构:```for 变量 in 可迭代对象...
    99+
    2023-09-14
    python
  • python中append怎么在for循环使用
    在Python中,可以通过使用append()方法将元素添加到列表中。在for循环中使用append()方法的一种常见方法是将循环变...
    99+
    2023-10-18
    python
  • 怎么在python中使用for…in循环
    这期内容当中小编将会给大家带来有关怎么在python中使用for…in循环,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。python可以做什么Python是一种编程语言,内置了许多有效的工具,Python...
    99+
    2023-06-14
  • 怎么在python中使用事件循环
    这篇文章将为大家详细讲解有关怎么在python中使用事件循环,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;...
    99+
    2023-06-14
  • 怎么在linux中使用命令批量替换内容
    本篇文章给大家分享的是有关怎么在linux中使用命令批量替换内容,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。比如要将所有包含abc文件里面的abc替换为def find -t...
    99+
    2023-06-10
  • python中for循环的多种使用实例
    目录前言for循环迭代字符串for打印数字注意for循环不能迭代数值类型for循环打印数字的话要借用range函数for循环可用来初始化列表简单的往列表里添加数据列表推导式总结前言 ...
    99+
    2022-11-11
  • 怎么在python中使用while循环语句
    这期内容当中小编将会给大家带来有关怎么在python中使用while循环语句,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究...
    99+
    2023-06-14
  • 怎么在Python中利用for循环初始化数组
    这篇文章给大家介绍怎么在Python中利用for循环初始化数组,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。python是什么意思Python是一种跨平台的、具有解释性、编译性、互动性和面向对象的脚本语言,其最初的设计...
    99+
    2023-06-14
  • JavaScript变量or循环中的var和let怎么使用
    这篇“JavaScript变量or循环中的var和let怎么使用”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面...
    99+
    2022-10-19
  • Python中怎么利用列表推导式实现轻量级循环
    这期内容当中小编将会给大家带来有关Python中怎么利用列表推导式实现轻量级循环,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。单循环[i for i in rang...
    99+
    2023-06-15
  • Python中如何在for循环中同时使用两个变量和两个控制条件
    Python中如何在for循环中同时使用两个变量和两个控制条件 在C语言中常常遇到for循环使用两个变亮和两个控制条件的情况,比如我要输出矩阵对角线元素的坐标时 例如输出: 0,01,12,23,3....
    99+
    2023-10-05
    python 开发语言
  • python中间结果尽量使用imap/ifilter代替map/filter
    这篇文章主要介绍了python中间结果尽量使用imap/ifilter代替map/filter,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。...
    99+
    2022-10-19
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作