广告
返回顶部
首页 > 资讯 > 后端开发 > Python >使用Python加速数据分析的10个简单技巧分别是什么
  • 107
分享到

使用Python加速数据分析的10个简单技巧分别是什么

2023-06-16 21:06:49 107人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

这期内容当中小编将会给大家带来有关使用python加速数据分析的10个简单技巧分别是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。提示和技巧,尤其是在编程领域,可能是非常有用的。有时,一个小技巧可以节

这期内容当中小编将会给大家带来有关使用python加速数据分析的10个简单技巧分别是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

提示和技巧,尤其是在编程领域,可能是非常有用的。有时,一个小技巧可以节省时间和生命。一个小的快捷方式或附加组件有时会被证明是天赐之物,并能真正提高生产力。因此,下面是我最喜欢的一些提示和技巧,我将它们以本文的形式一起使用和编译。有些可能是我们相当熟悉的,有些可能是新的,但我确信它们将在你下一次处理数据分析项目时派上用场。

1.分析pandas数据帧

Profiling(分析)是一个帮助我们理解数据的过程,而pandas Profiling就是执行这一过程的Python包。这是一种对Pandas  Dataframe(数据帧)进行探索性数据分析的简便、快速的方法。Pandas的df.describe()和df.info()函数通常用作EDA过程的第一步。但是,它只提供了一个非常基本的数据概览,对于大型数据集的情况并没有多大帮助。另一方面,Pandas  Profiling(分析)函数使用df.profile_report()对pandas数据帧进行了扩展,以便快速进行数据分析。它用一行代码显示了很多信息,在交互式html报告中也是如此。

对于一个给定的数据集,pandas profiling(分析)包会计算以下统计数据:

使用Python加速数据分析的10个简单技巧分别是什么

Pandas Profiling 包计算出的统计数据。

安装

使用Python加速数据分析的10个简单技巧分别是什么

用法

我们来使用古老的titanic数据集来演示多功能python分析器的功能。

使用Python加速数据分析的10个简单技巧分别是什么

编者注:本文发布一周后,Pandas-Profiling发布了一个重大的升级版本——2.0.0。语法发生了一些变化,事实上,它的功能已经包含在pandas本身中了,并且报告也变得更加全面。下面是最新的用法语法:

Usage

要在 Jupyter notebook中显示报告,请运行以下代码:

使用Python加速数据分析的10个简单技巧分别是什么

你只需要这一行代码就可以在一个Jupyter notebook中显示数据分析报告。报告非常详细,包括了必要的图表。

使用Python加速数据分析的10个简单技巧分别是什么

你也可以使用以下代码将这个报告输出到一个交互式HTML文件中。

使用Python加速数据分析的10个简单技巧分别是什么
使用Python加速数据分析的10个简单技巧分别是什么

2.为pandas 图表带来交互性

Pandas有一个内置的.plot()函数,它是DataFrame类的一部分。然而,使用该函数呈现的可视化效果并不具有交互性,这使得它的吸引力降低。相反,也不能排除使用pandas.  datafram  .plot()函数绘制图表的方便性。如果我们不需要对代码进行重大修改,就可以使用pandas绘制出像plotly那样的交互式图表,那会怎么样呢?实际上,你可以使用Cufflinks库做到这一点。

Cufflinks库结合了plotly的强大功能和pandas的灵活性,便于轻松绘图。现在我们来看看如何安装这个库并让它在pandas中运行。

安装

使用Python加速数据分析的10个简单技巧分别是什么

用法

使用Python加速数据分析的10个简单技巧分别是什么

是时候看看使用Titanic数据集展开的神奇之处了。

使用Python加速数据分析的10个简单技巧分别是什么
使用Python加速数据分析的10个简单技巧分别是什么
df.iplot() 对比 df.plot()

右边的可视化显示的是静态图表,而左边的图表是交互式的,并且更加详细,所有这些都没有对语法进行任何重大更改。

3. 一点魔法

魔法命令是Jupyter  Notebook中的一组方便的函数,旨在解决标准数据分析中的一些常见问题。你可以通过%lsmagic命令来查看所有可用的魔法命令。

使用Python加速数据分析的10个简单技巧分别是什么
所有可用魔法函数的列表

魔法命令有两种类型: line magics(行魔法)和cell  magics(单元魔法),前者以单个%字符作为前缀,并在一行输入上进行操作;后者与两个%%前缀关联,并在多行输入上进行操作。如果将魔法函数的选项设置为1时,不需要键入初始%就可调用它。

我们来看看在常见的数据分析任务中可能有用的一些魔法函数:

% pastebin

%pastebin将代码上传到Pastebin并返回其url。Pastebin是一个在线内容托管服务,我们可以在其中存储纯文本,如源代码片段,然后可以将url与他人共享。事实上,GitHub  GISt也类似于Pastebin,尽管它有版本控制。

我们假设有一个包含以下内容的python脚本file.py:

使用Python加速数据分析的10个简单技巧分别是什么

在Jupyter Notebook中使用%pastebin生成一个pastebin的url地址。

使用Python加速数据分析的10个简单技巧分别是什么

%matplotlib notebook

%matplotlib inline函数用于在Jupyter  notebook中呈现静态matplotlib绘图。尝试用notebook替换inline部分,你就可以轻松获得可缩放和可调整大小的绘图。确保在导入matplotlib库之前调用该函数。

使用Python加速数据分析的10个简单技巧分别是什么

%matplotlib inline 对比 %matplotlib notebook

%run

%run函数会在一个notebook中运行一个python脚本。

使用Python加速数据分析的10个简单技巧分别是什么

%%writefile

%%writefile 会将单元格的内容写入文件。这里的代码将被写入一个名为foo.py的文件,并保存在当前目录中。

使用Python加速数据分析的10个简单技巧分别是什么

%%latex

%%latex函数会将单元格的内容呈现为LaTeX。它对在单元格中编写数学公式和方程很有用。

使用Python加速数据分析的10个简单技巧分别是什么

4.发现和消除错误

Interactive  debugger(交互式调试器)也是一个magic函数,但是我已经将它单独归为一类。如果在运行代码单元格时出现异常,请在一个新行中键入%debug并运行它。这会打开一个交互式调试环境,它会将你带到异常发生的位置。你还可以检查程序中分配的变量的值,并在这里执行操作。要退出这个调试器,请按q。

使用Python加速数据分析的10个简单技巧分别是什么

5. 打印输出也可以很漂亮

如果你想为你的数据结构生成美观的表示形式,pprint是首选模块。它在打印字典或JSON数据时特别有用。我们来看一个同时使用print和pprint显示输出的例子。

使用Python加速数据分析的10个简单技巧分别是什么
使用Python加速数据分析的10个简单技巧分别是什么

6. 让注释突出显示。

我们可以在Jupyter  Notebook中使用信息提示/备注框来醒目显示一些重要的或任何需要突出的东西。注释的颜色取决于你指定的提示类型。你只需在需要高亮显示的单元格中添加以下任何或所有代码即可。

蓝色信息提示框: 信息

使用Python加速数据分析的10个简单技巧分别是什么

黄色信息提示框: 警告

使用Python加速数据分析的10个简单技巧分别是什么

绿色提示框: 成功

使用Python加速数据分析的10个简单技巧分别是什么

红色提示框: 危险

使用Python加速数据分析的10个简单技巧分别是什么

7.打印一个单元格中的所有输出

假设有一个含有以下代码行的Jupyter Notebook单元格:

使用Python加速数据分析的10个简单技巧分别是什么

只打印最后一个输出是单元格的一个正常属性,而对于其他输出,我们需要添加print()函数。事实上,我们只要在notebook的顶部添加以下代码片段,就可以打印出所有输出。

使用Python加速数据分析的10个简单技巧分别是什么

现在所有的输出一个接一个的被打印出。

使用Python加速数据分析的10个简单技巧分别是什么

还原到原始设置:

使用Python加速数据分析的10个简单技巧分别是什么

8.使用‘i’选项运行Python脚本

从命令行运行python脚本的一种典型方法是: python hello.py。但是,如果你在运行相同的脚本时添加一个附加的-i,例如python -i  hello.py,它会提供更多的优点。我们来一探究竟。

首先,一旦程序结束,python并不会退出解释器。因此,我们可以检查变量的值和程序中定义的函数的正确性。

使用Python加速数据分析的10个简单技巧分别是什么

其次,我们可以很容易地使用以下代码调用python调试器,因为我们仍然在解释器中:

使用Python加速数据分析的10个简单技巧分别是什么

这会将我们带到异常发生的位置,然后我们就可以处理代码。

使用Python加速数据分析的10个简单技巧分别是什么

这个技巧的初始来源。(Http://www.bnikolic.co.uk/blog/python-running-cline.html )

9.自动对代码进行注释

Ctrl/Cmd + / 会自动注释单元格中选定的行。再次敲击该组合键将取消对同一行代码的注释。

使用Python加速数据分析的10个简单技巧分别是什么

10.能删除是人,能恢复是神。

你是否曾经不小心删除了Jupyter Notebook中的一个单元格?如果是,那么这里有一个快捷方式可以撤消此删除操作。

  • 如果你删除了一个单元格的内容,按CTRL/CMD+Z可以很容易地恢复它

  • 如果你需要恢复一个全部删除的单元格,请点击ESC+Z或EDIT > Undo Delete Cells

使用Python加速数据分析的10个简单技巧分别是什么

结论

我列出了在使用Python和JupyterNotebook时收集到的主要技巧。

上述就是小编为大家分享的使用Python加速数据分析的10个简单技巧分别是什么了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注编程网Python频道。

--结束END--

本文标题: 使用Python加速数据分析的10个简单技巧分别是什么

本文链接: https://www.lsjlt.com/news/285152.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 使用Python加速数据分析的10个简单技巧分别是什么
    这期内容当中小编将会给大家带来有关使用Python加速数据分析的10个简单技巧分别是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。提示和技巧,尤其是在编程领域,可能是非常有用的。有时,一个小技巧可以节...
    99+
    2023-06-16
  • 加速Python数据分析的小技巧分别有哪些
    这期内容当中小编将会给大家带来有关加速Python数据分析的小技巧分别有哪些,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。有时候,一点小小的黑客行为可以节省时间,挽救生命。一个小小的快捷方式或附加组件有时...
    99+
    2023-06-16
  • 8个Python高效数据分析的技巧分别是哪些
    这期内容当中小编将会给大家带来有关8个Python高效数据分析的技巧分别是哪些,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。不管是参加Kaggle比赛,还是开发一个深度学习应用,***步总是数据分析。介绍...
    99+
    2023-06-17
  • Python中简单易用的并行加速技巧是什么
    本文小编为大家详细介绍“Python中简单易用的并行加速技巧是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python中简单易用的并行加速技巧是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。使用job...
    99+
    2023-07-06
  • 解决Kubernetes Pod故障的5个简单技巧分别是什么
    本篇文章为大家展示了解决Kubernetes Pod故障的5个简单技巧分别是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。在很多情况下,你可能会发现Kubernetes中的应用程序没有正确地部署...
    99+
    2023-06-16
  • CSS网页布局中简单实用八个技巧分别是什么
    今天就跟大家聊聊有关CSS网页布局中简单实用八个技巧分别是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。和大家重点学习一下CSS网页布局非常有用...
    99+
    2022-10-19
  • Python的两个实用冷技巧分别是什么
    这期内容当中小编将会给大家带来有关Python的两个实用冷技巧分别是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。一. 记得刚开始工作的时候,老大给我们上 C++ 基础课,告诉我们字符串字面量可以换行...
    99+
    2023-06-17
  • 优化SQL SELECT语句性能的6个简单技巧分别是什么
    本篇文章给大家分享的是有关优化SQL SELECT语句性能的6个简单技巧分别是什么,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。SELECT语...
    99+
    2022-10-19
  • Python爬虫的8个常用技巧分别是什么
    这篇文章将为大家详细讲解有关Python爬虫的8个常用技巧分别是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。python作为一门高级编程语言,它的定位是优雅、明确和简单。我学用pyth...
    99+
    2023-06-04
  • 6个使用KeePassX保护密码的技巧分别是什么
    本篇文章为大家展示了6个使用KeePassX保护密码的技巧分别是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。虽然安全是个深奥的主题,但是你可以遵循几个简单的日常习惯来减小攻击面。本文将解释确保...
    99+
    2023-06-04
  • 大数据Hadoop技术在银行的七个应用分别是什么
    大数据Hadoop技术在银行的七个应用分别是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。诈骗侦测(Fraud detection):...
    99+
    2022-10-19
  • 用Python做数据科学时容易忘记的八个要点分别是什么
    本篇文章给大家分享的是有关用Python做数据科学时容易忘记的八个要点分别是什么,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。  如果你发觉自己在编程时一次又一次地查找相同的问...
    99+
    2023-06-02
  • Oracle数据库隐含参数使用的五个原则和四个建议分别是什么
    这期内容当中小编将会给大家带来有关Oracle数据库隐含参数使用的五个原则和四个建议分别是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。隐含参数是数据库参数名中前缀为...
    99+
    2022-10-19
  • Python中NumPy库的优势是什么?如何使用它来提高数据分析的效率?
    随着数据分析的广泛应用,数据科学家们在处理数据时需要使用各种工具和库。Python是其中一个非常流行的语言,它的开源生态系统中有很多优秀的数据处理库。其中,NumPy库是一个非常重要的数据处理库,它提供了高效的多维数组和矩阵运算功能。本文...
    99+
    2023-09-15
    关键字 数据类型 numy
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作