广告
返回顶部
首页 > 资讯 > 后端开发 > Python >常用数据科学Python库有哪些
  • 795
分享到

常用数据科学Python库有哪些

2023-06-15 18:06:00 795人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

本篇内容介绍了“常用数据科学python库有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Pandaspandas库[3]对于致力于探索

本篇内容介绍了“常用数据科学python库有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

Pandas

pandas库[3]对于致力于探索性数据分析的数据科学家来说是一个必不可少的库。顾名思义,它使用pandas来分析你的数据,或者更具体地说,pandas数据帧。

以下是一些你可以从html报表中访问和查看的功能:

  • 类型推断

  • 唯一值

  • 缺少值

  • 分位数统计(例如,中位数)

  • 描述性统计

  • 直方图

  • 相关性(如皮尔逊)

  • 文本分析

如何安装?

使用pip:

pip install -U pandas-profiling[notebook] jupyter nbextension enable --py widgetsnbextension  这种方式对我也很管用:  pip install pandas-profiling import pandas_profiling

例子:

下面是我们可以从profile report功能访问的可视化示例之一。可以看到一个易于理解的彩色的相关性可视化图。

常用数据科学Python库有哪些

局限性:

如果有一个大的数据集,这个概要报告可能需要相当长的时间。我的解决方案是要么简单地使用较小的数据集,要么对整个数据集进行采样。

NLTK

通常与nltk相关的术语是NLP,或者自然语言处理,它是数据科学(和其他学科)的一个分支,它更容易地包含对文本的处理。导入nltk之后,你可以更轻松地分析文本。

以下是你可以使用nltk访问的一些功能:

  • 标记化文本(例如,[“标记化”,“文本”])

  • 词性标记

  • 词干提取和词形还原

如何安装:

pip install nltk import nltk

例子:

import nltk  thing_to_tokenize = “a long sentence with Words”  tokens = nltk.word_tokenize(thing_to_tokenize)  tokens  returns:  [“a”, “long”, “sentence”, “with”, “words”]

我们需分开每个单词,以便对其进行分析。

在某些情况下需要分隔单词。然后它们可以被标记、计数,机器学习算法的新指标可以使用这些输入来创建预测。利用nltk的另一个有用的特性是文本可以用于情感分析。情感分析在很多企业中都很重要,尤其是那些有客户评论的企业。现在我们讨论情感分析,让我们看看另一个有助于快速情感分析的库。

TextBlob

TextBlob[8]与nltk有很多相同的优点,但是它的情感分析功能非常出色。除了分析之外,它还具有利用朴素贝叶斯和决策树支持分类的功能。

以下是你可以使用TextBlob访问的一些功能:

  • 标记化

  • 词性标注

  • 分类

  • 拼写更正

  • 情感分析

如何安装:

pip install textblob  from textblob import TextBlob

例子:

情感分析:

review = TextBlob(“here is a great text blob about wonderful Data Science”)  review.sentiment  returns:  Sentiment(polarity=0.80, subjectivity = 0.44)

正常浮点范围为[-1.0,1.0],而积极情感介于[0.0,1.0]之间。

分类:

from textblob.classifiers import NaiveBayesClassifier  training_data = [(‘sentence example Good one’, ‘pos’), (‘sentence example great two’, ‘pos’), (‘sentence example bad three’, ‘neg’), (‘sentence example worse four’, ‘neg’)]  testing_data = [(‘sentence example good’, ‘pos’), (‘sentence example great’, ‘pos’)]  cl = NaiveBayesClassifier(training_data)

你可以使用这个分类器对文本进行分类,该分类器将返回“pos”或“neg”输出。

这些来自textblob的简单代码提供了非常强大和有用的情感分析和分类。

pyLDAvis

另一个使用NLP的工具是pyLDAvis[10]。它是一个交互式主题模型可视化工具的库。例如,当我使用LDA(潜Dirichlet分布)执行主题模型时,我通常会看到单元格中的主题输出,这可能很难阅读。然而当它出现在一个很好的视觉总结中时,它会更有益,也更容易消化,就像pyLDAvis一样。

以下是你可以使用pyLDAvis访问的一些功能:

  • 显示了前30个最突出的术语

  • 有一个交互式调整器,允许你滑动相关性度量

  • 显示x轴上的PC1和y轴上的PC2的热门主题

  • 显示与大小对应的主题

总的来说,这是一种让人印象深刻的主题可视化方式,这是其他任何库都无法做到的。

如何安装:

pip install pyldavis  import pyldavis

例子:

为了看到最好的例子,这里有一个Jupyter Notebook[11]参考资料,它展示了这个数据科学库的许多独特和有益的特性:  https://nbviewer.jupyter.org/GitHub/bmabey/pyLDAvis/blob/master/notebooks/pyLDAvis_overview.ipynb

NetworkX

这个数据科学包NetworkX[13],将其优势集中在生物、社会和基础设施网络可视化上。

以下是你可以使用NetworkX访问的一些功能:

  • 创建图形、节点和边

  • 检验图的元素

  • 图结构

  • 图的属性

  • 多重图

  • 图形生成器和操作

如何安装:

pip install networkx  import networkx

例子:

创建图形

import networkx  graph = networkx.Graph()

你可以与其他库协作,例如matplotlib.pyplot也可以创建图形的可视化(以数据科学家习惯于看到的方式)。

“常用数据科学Python库有哪些”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: 常用数据科学Python库有哪些

本文链接: https://www.lsjlt.com/news/281320.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 常用数据科学Python库有哪些
    本篇内容介绍了“常用数据科学Python库有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!PandasPandas库[3]对于致力于探索...
    99+
    2023-06-15
  • 常用的Python数据科学库有哪些
    本篇内容主要讲解“常用的Python数据科学库有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“常用的Python数据科学库有哪些”吧!  1、Pandas ...
    99+
    2022-10-19
  • 有哪些实用的数据科学Python库
    这篇文章主要介绍了有哪些实用的数据科学Python库的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇有哪些实用的数据科学Python库文章都会有所收获,下面我们一起来看看吧。一、Wget从网络上提取数据是数据科学...
    99+
    2023-07-06
  • 数据科学领域常用的Python包有哪些
    这篇文章主要介绍“数据科学领域常用的Python包有哪些”,在日常操作中,相信很多人在数据科学领域常用的Python包有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”数据科学领域常用的Python包有哪些...
    99+
    2023-06-02
  • 有哪些Python数据科学软件包
    本篇内容介绍了“有哪些Python数据科学软件包”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!№1:Gleam您听说过Plotly,听说过M...
    99+
    2023-06-16
  • 数据科学家该了解的Python自动库有哪些
    本篇内容主要讲解“数据科学家该了解的Python自动库有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“数据科学家该了解的Python自动库有哪些”吧!1.auto-sklearnauto-s...
    99+
    2023-06-16
  • 有哪些Python库可助你构建数据科学应用程序
    今天就跟大家聊聊有关有哪些Python库可助你构建数据科学应用程序,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。数据科学三分天下,Python占其一。下面,将会介绍7个Python库...
    99+
    2023-06-15
  • python科学计算常用的数学科学计算库是什么
    这篇文章给大家分享的是有关python科学计算常用的数学科学计算库是什么的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。python的五大特点是什么python的五大特点:1.简单易学,开发程序时,专注的是解决问题...
    99+
    2023-06-14
  • 学习Python常用的库有哪些
    本篇内容介绍了“学习Python常用的库有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1、Urllib38.93亿次下载Urllib3...
    99+
    2023-07-06
  • 实用的数据科学Python库有什么功能
    本篇内容介绍了“实用的数据科学Python库有什么功能”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1. 获取数据获取数据是解决数据科学问题...
    99+
    2023-06-16
  • Python数据科学Matplotlib图库的用法
    这篇文章主要讲解了“Python数据科学Matplotlib图库的用法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python数据科学Matplotlib图库的用法”吧!Matplotli...
    99+
    2023-06-20
  • Python中最受欢迎的科学类库有哪些
    本篇内容主要讲解“Python中最受欢迎的科学类库有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python中最受欢迎的科学类库有哪些”吧!Python有以下三个特点:易用性和灵活性、全行...
    99+
    2023-06-27
  • Numpy 数组在数据科学中的应用有哪些?
    Numpy 是 Python 中的一个重要的科学计算库,其最重要的功能之一就是提供了多维数组对象——Numpy 数组。Numpy 数组在数据科学中有着广泛的应用,下面就让我们来看看它的一些常见用法。 数组的创建 我们可以使用 nump...
    99+
    2023-10-24
    数组 unix numpy
  • Python 数据科学 Matplotlib图库详解
    Matplotlib 是 Python 的二维绘图库,用于生成符合出版质量或跨平台交互环境的各类图形。 图形解析与工作流 图形解析  工作流 Matplotlib 绘图的基本步骤: 1  准备数...
    99+
    2022-06-02
    Python 数据科学 Matplotlib Python Matplotlib库
  • 有哪些提高数据科学工作效率并节省时间的Python库
    本文小编为大家详细介绍“有哪些提高数据科学工作效率并节省时间的Python库”,内容详细,步骤清晰,细节处理妥当,希望这篇“有哪些提高数据科学工作效率并节省时间的Python库”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习...
    99+
    2023-07-06
  • 常用的Python机器学习库有哪些
    常用的Python机器学习库有以下几个:1. NumPy:用于处理大型多维数组和矩阵的数值运算库。2. Pandas:提供了高性能、...
    99+
    2023-09-21
    机器学习 Python
  • 大数据对科学研究的影响有哪些
    本篇内容介绍了“大数据对科学研究的影响有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  著名数据库专家吉姆·格雷(Jim Gray)博...
    99+
    2023-06-02
  • Python中常见的科学类库怎么用
    这篇文章主要介绍“Python中常见的科学类库怎么用”,在日常操作中,相信很多人在Python中常见的科学类库怎么用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python中常见的科学类库怎么用”的疑惑有所...
    99+
    2023-06-27
  • python常用机器学习及深度学习库有哪些
    本篇内容介绍了“python常用机器学习及深度学习库有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!前言目前,随着人工智能的大热,吸引了...
    99+
    2023-06-30
  • Python常见的数据分析库有哪些
    这篇文章主要介绍“Python常见的数据分析库有哪些”,在日常操作中,相信很多人在Python常见的数据分析库有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python常见的数据分析库有哪些”的疑惑有所...
    99+
    2023-06-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作