iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >2017,最受欢迎的 15 大 Pyth
  • 448
分享到

2017,最受欢迎的 15 大 Pyth

最受欢迎Pyth 2023-01-31 02:01:17 448人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

 2017,最受欢迎的 15 大 python 库有哪些? 本文作者:林立宏 2017-06-22 19:23 雷锋网按:本文作者为 ActiveWizards 的数据顾问 IGor Bobriakov,雷锋网林立宏与 Raey R


2017,最受欢迎的 15 大 python 库有哪些?
本文作者:林立宏 2017-06-22 19:23

雷锋网按:本文作者为 ActiveWizards 的数据顾问 IGor Bobriakov,雷锋网林立宏与 Raey Raey Li 编译。

2017,最受欢迎的 15 大 Python 库有哪些?

Igor Bobriakov

近年来,Python 在数据科学行业扮演着越来越重要的角色。因此,我根据近来的使用体验,在本文中列出了对数据科学家、工程师们最有用的那些库。

由于这些库都开源了,我们从GitHub上引入了提交数,贡献者数和其他指标,这可以作为库流行程度的参考指标。

核心库

1. NumPy (提交数: 15980, 贡献者数: 522)

当开始处理Python中的科学任务,Python的SciPy Stack肯定可以提供帮助,它是专门为Python中科学计算而设计的软件集合(不要混淆SciPy库,它是SciPy Stack的一部分,和SciPy Stack的社区)这样我们开始来看一下吧。然而,SciPy Stack相当庞大,其中有十几个库,我们把焦点放在核心包上(特别是最重要的)。

关于建立科学计算栈,最基本的包是Numpy(全称为Numerical Python)。它为Python中的n维数组和矩阵的操作提供了大量有用的功能。该库提供了NumPy数组类型的数学运算向量化,可以改善性能,从而加快执行速度。

2. SciPy (提交数: 17213, 贡献者数: 489)

SciPy是一个工程和科学软件库。雷锋网(公众号:雷锋网)再次提醒,你需要理解SciPy Stack和SciPy库之间的区别。

SciPy包含线性代数,优化,集成和统计的模块。SciPy库的主要功能是建立在NumPy上,从而它的数组大量的使用了NumPy的。它通过其特定子模块提供有效的数值例程,并作为数字积分、优化和其他例程。SciPy的所有子模块中的功能都有详细的说明 ——又是一个SciPy非常有帮助的点。

3. pandas (提交数: 15089, 贡献者数:762)

Pandas是一个Python包,旨在通过“标记”和“关系”数据进行工作,简单直观。Pandas是数据整理的完美工具。它设计用于快速简单的数据操作,聚合和可视化

库中有两个主要的数据结构

  • “系列”(Series),一维

    2017,最受欢迎的 15 大 Python 库有哪些?

  • “数据帧”(Data Frames),二维

    2017,最受欢迎的 15 大 Python 库有哪些?

例如,当您要从这两种类型的结构中接收到一个新的Dataframe时,通过传递一个Series,您将收到一个单独的行到DataFrame的DF:

2017,最受欢迎的 15 大 Python 库有哪些?

 这里稍微列出了你可以用Pandas做的事情:

  • 轻松删除并添加数据帧(DataFrame)中的列

  • 将数据结构转换为数据帧(DataFrame)对象

  • 处理丢失的数据,表示为NaN

  • 功能强大的分组

Google趋势记录

2017,最受欢迎的 15 大 Python 库有哪些?

trends.google.com

gitHub请求历史记录

2017,最受欢迎的 15 大 Python 库有哪些?

datascience.com/trends 

可视化

4.Matplotlib (提交数: 21754, 贡献者数: 588) 

又一个SciPy Stack核心软件包以及 Python库,Matplotlib为轻松生成简单而强大的可视化而量身定制。它是一个顶尖的软件(在NumPy,SciPy和Pandas的帮助下),它使Python成为像MatLab或Mathematica这样的科学工具的竞争对手。

然而,这个库是低层级的,这意味着你需要编写更多的代码才能达到高级的可视化效果,而且通常会比使用更多的高级工具付出更多的努力,但总体上这些努力是值得的。

只要付出一点你就可以做任何可视化:

  • 线图

  • 散点图

  • 条形图和直方图

  • 饼状图;

  • 茎图

  • 轮廓图

  • 场图

  • 频谱图

还有使用Matplotlib创建标签,网格,图例和许多其他格式化实体的功能。基本上,一切都是可定制的。

该库由不同的平台支持,并使用不同的GUI套件来描述所得到的可视化。不同的IDE(如IPython)都支持Matplotlib的功能。

还有一些额外的库可以使可视化变得更加容易。

2017,最受欢迎的 15 大 Python 库有哪些?

5. Seaborn (提交数: 1699, 贡献者数: 71)

Seaborn主要关注统计模型的可视化;这种可视化包括热图,这些热图(heat map)总结数据但仍描绘整体分布。Seaborn基于Matplotlib,并高度依赖于此。

 2017,最受欢迎的 15 大 Python 库有哪些?

 6. Bokeh (提交数: 15724, 贡献者数: 223)

另一个很不错的可视化库是Bokeh,它针对交互式可视化。与以前的库相比,它独立于Matplotlib。正如我们提到的,Bokeh的主要焦点是交互性,它通过现代浏览器以数据驱动文档(d3.js)的风格呈现。

2017,最受欢迎的 15 大 Python 库有哪些?

7. Plotly (提交数: 2486, 贡献者数: 33)

最后,关于Plotly的话。它是一个基于WEB用于构建可视化的工具箱,提供api给一些编程语言(Python在内)。在plot.ly网站上有一些强大的、上手即用的图形。为了使用Plotly,你将需要设置API密钥。图形将在服务器端处理,并发布到互联网,但有一种方法可以避免。

2017,最受欢迎的 15 大 Python 库有哪些?

Google趋势记录

2017,最受欢迎的 15 大 Python 库有哪些?

trends.google.com

GitHub请求历史记录

2017,最受欢迎的 15 大 Python 库有哪些?

datascience.com/trends

机器学习

8. SciKit-Learn (提交数:21793, 贡献者数:842)

Scikits是Scikits Stack额外的软件包,专为像图像处理和机器学习辅助等特定功能而设计。对于机器学习辅助,scikit-learn是所有软件包里最突出的一个。它建立在SciPy之上,并大量利用它的数学运算。

scikit-learn给常见的机器学习算法公开了一个简洁、一致的接口,可简单地将机器学习带入生产系统中。该库中集成了有质量的代码和良好的文档、简单易用并且十分高效,是使用Python进行机器学习的实际行业标准。

深度学习—— Keras / Tensorflow / Theano

在深度学习方面,Python中最着名和最便的库之一是Keras,它可以在TensorFlow或Theano框架上运行。让我们来看一下它们的一些细节。 

9.Theano. (提交数:25870, 贡献者数:300) 

首先让我们谈谈Theano。

Theano是一个Python软件包,它定义了与NumPy类似的多维数组,以及数学运算和表达式。此库是被编译的,可实现在所有架构上的高效运行。最初由蒙特利尔大学机器学习组开发,它主要用于满足机器学习的需求。

值得注意的是,Theano紧密结合了NumPy在低层次上的运算 。另外,该库还优化了GPU和CPU的使用,使数据密集型的计算平台性能更佳。

效率和稳定性微调保证了即使在数值很小的情况下,仍有更精确的结果,例如,即使只给出x的最小值,log(1 + x)仍能计算出合理的结果。

10. TensorFlow. (提交数: 16785,贡献者数: 795)

TensorFlow来自Google的开发人员,它是数据流图计算的开源库,为机器学习不断打磨。它旨在满足谷歌对训练神经网络的高需求,并且是基于神经网络的机器学习系统DistBelief的继任者。然而,TensorFlow并不限制于谷歌的科学应用范围 – 它可以通用于多种多样的现实应用中。 

TensorFlow的关键特征是它的多层节点系统,可以在大型数据集上快速训练神经网络。这为谷歌的语音识别和图像对象识别提供了支持。

11. Keras. (提交数: 3519,贡献者数: 428)

最后我们来看看Keras。它是一个用Python编写的开源的库,用于在高层的接口上构建神经网络。它简单易懂,具有高级可扩展性。Keras使用Theano或TensorFlow作为后端,但微软现在正努力整合CNTK(微软的认知工具包)作为新的后端。

设计中的简约方法旨在通过建立紧凑型系统进行快速、简便的实验。

Keras真的容易上手,并在持续完善它的快速原型能力。它完全用Python编写,可被高度模块化和扩展。尽管它以易上手、简单和以高层次为导向,但是Keras足够有深度并且足够强大,去支持复杂的模型。

谷歌发展趋势历史

2017,最受欢迎的 15 大 Python 库有哪些?

trends.google.com

GitHub请求历史记录

2017,最受欢迎的 15 大 Python 库有哪些?

datascience.com/trends

自然语言处理

12. NLTK (提交数: 12449,贡献者数: 196)

这个库的名称“Natural Language Toolkit”,代表自然语言工具包,顾名思义,它用于符号学和统计学自然语言处理(NLP) 的常见任务。 NLTK旨在促进NLP及相关领域(语言学,认知科学人工智能等)的教学和研究,目前受到重点关注。

NLTK的功能允许很多操作,例如文本标记,分类和标记,实体名称识别,建立语料库,可以显示语言内部和各句子间的依赖性、词根、语义推理等。所有的构建模块都可以为不同的任务构建复杂的研究系统,例如情绪分析,自动总结。

13. Gensim (提交数: 2878,贡献者数: 179)

它是一个用于Python的开源库,为有向量空间模型和主题模型的工作提供了使用工具。这个库是为了高效处理大量文本而设计的,所以不仅可以进行内存处理,还可以通过广泛使用NumPy数据结构和SciPy操作来获得更高的效率。Gensim高效也易于使用。

Gensim旨在与原始和非结构化的数字文本一起使用。 它实现了诸如hierarchical Dirichlet processes(HDP),潜在语义分析(LSA)和潜在Dirichlet分配(LDA)之类的算法,以及tf-idf,随机预测,Word2vec和document2vec,便于检查一组文档中有重复模式的文本 (通常称为语料库)。所有的算法均是无监督的,意味着不需要任何参数,唯一的输入只有语料库。 

谷歌发展趋势历史

2017,最受欢迎的 15 大 Python 库有哪些?

trends.google.com

GitHub请求历史记录

2017,最受欢迎的 15 大 Python 库有哪些?

datascience.com/trends

数据挖掘,统计学

14. scrapy (提交数: 6325,贡献者数: 243)

Scrapy库是用于从网络结构化检索数据(如联系人信息或URL),可以用来设计crawling程序(也称为蜘蛛bots)。

它是开源的,使用用Python编写的。最开始只是如它的名字暗示的一样,只用来做scraping,但是它现在已经在完整的框架中发展,能够从API采集数据并作为通用的crawlers了。

该库在界面设计中标榜着“不要重复自己”  它推荐用户们编写泛化得到、可被重复使用的通用代码,从而构建和扩展大型的crawlers。

Scrapy的架构围绕着Spider class构建,这其中包含了crawler追从的一套指令。

 15. Statsmodels (提交数: 8960,贡献者数: 119) 

你可能从名字就猜出大概了,statsmodels使用户能够通过使用各种统计模型的估算方法进行数据挖掘,并执行统计判断和分析。

 许多有用的特征是可被描述的,并通过使用线性回归模型,广义线性模型,离散选择模型,鲁棒线性模型,时间序列分析模型,各种估计方法得出统计结果。

这个库还提供了广泛的标定功能,专门用于大数据统计中的性能优化工作。 

总结

许多数据科学家和工程师认为这些库是顶级的,并值得关注,或者需要或多或少了解它们。 以下是每个库在Github上的详细统计资料:

当然,这不是完全详尽的列表,还有许多其他的库和框架也是值得关注。一个很好的例子是SciKit的不同软件包各自专注一个特定的领域,如SciKit-Image是用于处理图像的。

--结束END--

本文标题: 2017,最受欢迎的 15 大 Pyth

本文链接: https://www.lsjlt.com/news/186734.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 2017,最受欢迎的 15 大 Pyth
     2017,最受欢迎的 15 大 Python 库有哪些? 本文作者:林立宏 2017-06-22 19:23 雷锋网按:本文作者为 ActiveWizards 的数据顾问 Igor Bobriakov,雷锋网林立宏与 Raey R...
    99+
    2023-01-31
    最受欢迎 Pyth
  • 探讨2018年最受欢迎的15顶级Pyth
    近日,数据科学网站 KDnuggets 评选出了顶级 Python 库 Top15,领域横跨数据科学、数据可视化、深度学习和机器学习。如果本文有哪些遗漏,你可以在评论区补充。   图 1:根据 GitHub star...
    99+
    2023-01-30
    最受欢迎 Pyth
  • 为什么C#最受欢迎
    这篇文章主要讲解了“为什么C#最受欢迎”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“为什么C#最受欢迎”吧!微软赞助的 .NET 基金会发布了一份 .NET 现状调查的报告。这是 .NET ...
    99+
    2023-06-15
  • 最受欢迎的vim插件有哪些
    这篇文章主要介绍了最受欢迎的vim插件有哪些的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇最受欢迎的vim插件有哪些文章都会有所收获,下面我们一起来看看吧。先来个福利: Pathogen首先,可能不是所有人都熟...
    99+
    2023-06-27
  • Java和Django:NPM面试中最受欢迎的技能
    Java和Django:NPM面试中最受欢迎的技能 随着技术的不断发展,越来越多的公司开始注重招聘具有多项技能的人才,而在NPM(Node.js Package Manager)的面试中,Java和Django成为了最受欢迎的技能之一。本文...
    99+
    2023-07-07
    npm 面试 django
  • 最受欢迎的Python开源框架有哪些
    本文小编为大家详细介绍“最受欢迎的Python开源框架有哪些”,内容详细,步骤清晰,细节处理妥当,希望这篇“最受欢迎的Python开源框架有哪些”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。1.DjangoDja...
    99+
    2023-06-27
  • Python中最受欢迎的科学类库有哪些
    本篇内容主要讲解“Python中最受欢迎的科学类库有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python中最受欢迎的科学类库有哪些”吧!Python有以下三个特点:易用性和灵活性、全行...
    99+
    2023-06-27
  • 有哪些受欢迎的Python库
    本篇内容介绍了“有哪些受欢迎的Python库”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!NumPyNumPy是一个主要用于数据分析、科学计...
    99+
    2023-06-16
  • 大带宽服务器为什么受欢迎
    大带宽服务器受欢迎的原因:1、使用大带宽服务器建站能够有效提高访问速度,从而给予访客用户良好的体验感;2、大带宽服务器带宽资源丰富,能够满足流量消耗较大的网站需求,有效降低服务器瘫痪和宕机的风险;3、使用大带宽服务器能够提高安全性,由于带宽...
    99+
    2024-04-02
  • 五个最受欢迎的Go语言课程推荐
    在当今信息技术迅速发展的时代,学习一门编程语言已经成为许多人的选择。其中,Go语言凭借其卓越的性能和简洁的语法成为了很多人的首选。而要学习一门新的编程语言,一门优质的课程是必不可少的。在这篇文章中,我将向大家...
    99+
    2024-01-30
    Go语言入门 高级Go编程 并发编程技术
  • 最受IT公司欢迎的30款开源软件
    红帽发布2019年企业开源调查报告Part1 web服务器1、Nginx2、Lighttpd3、Tomcat4、Apache HTTP ServerPart2 大数据与云计算5、Hadoop6、Docker7、Spark8、Storm9、C...
    99+
    2023-08-03
  • NPM 上最受欢迎的 Go 函数库是什么?
    在NPM上,Go语言的函数库越来越受欢迎,因为它们提供了许多有用的功能,可以帮助开发人员更快地构建应用程序。那么,NPM上最受欢迎的Go函数库是什么呢?本文将介绍一些最受欢迎的Go函数库。 Go-JS Go-JS是一个用于创建交互式图表...
    99+
    2023-08-22
    npm 函数 javascript
  • Linux服务器上的PHP框架:哪个最受欢迎?
    PHP是一种广泛使用的编程语言,特别是在Web开发中。为了更好地组织代码和提高开发效率,PHP框架应运而生。在Linux服务器上,使用PHP框架可以更好地管理代码和提供更好的性能。但是,众所周知,市场上有很多PHP框架可供选择,那么哪个是...
    99+
    2023-11-11
    框架 linux linux
  • ASP、npm、git,哪个是最受欢迎的开发技术?
    在当今的技术领域中,开发技术迅速发展,不断涌现出新的技术,人们也不断地在探索和使用各种开发技术,以提高生产力和效率。ASP、npm、git是目前最为流行的开发技术之一,但哪一个更受欢迎呢?在本文中,我们将探讨这个问题,同时展示一些演示代码...
    99+
    2023-08-14
    npm git 开发技术
  • 亚马逊最受欢迎服务器是哪个国家
    亚马逊最受欢迎的服务器位于美国。AWS(Amazon Web Services)是亚马逊公司的云计算平台,提供了一系列的云计算服务,包括计算、存储、数据库、分析、机器学习、人工智能、物联网、安全等服务。AWS在全球范围内拥有众多的数据中心,...
    99+
    2023-10-27
    亚马逊 最受欢迎 服务器
  • 受欢迎的JavaScript框架有哪些
    小编给大家分享一下受欢迎的JavaScript框架有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!10. AureliaAu...
    99+
    2024-04-02
  • ASP、Django、Apache:哪种编程框架的算法最受欢迎?
    在现代软件开发中,选择合适的编程框架是非常重要的。不同的编程框架有着不同的优缺点,它们也适用于不同的场景和应用程序类型。在本文中,我们将探讨三种最受欢迎的编程框架:ASP、Django和Apache,以及它们在算法方面的应用。 ASP是微...
    99+
    2023-08-23
    django apache 编程算法
  • 受欢迎的Linux发行版有哪些
    这篇文章给大家分享的是有关受欢迎的Linux发行版有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Mint Linux因为其优秀的用户界面和精选的附带软件,Mint成了Linux家族的一个新星。它有两个版本:...
    99+
    2023-06-16
  • Linux系统最受欢迎的10个可视化工具介绍
    这篇文章主要讲解了“Linux系统最受欢迎的10个可视化工具介绍”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Linux系统最受欢迎的10个可视化工具介绍”吧!1.MySQL Workben...
    99+
    2023-06-16
  • 最受Web开发者欢迎的NoSQL和关系型数据库!
    Web应用离不开数据库,目前市场上有种类繁多数据库可供开发者选择,例如SQL、NoSQL、键值、图谱数据库等等。关于不同数据库在开发者中的受欢迎程度也是仁者见仁智者见智,但是通过统计亚马逊这样的公共云平台...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作