iis服务器助手广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python sklearn CountVectorizer如何使用
  • 925
分享到

Python sklearn CountVectorizer如何使用

2023-07-05 15:07:02 925人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

本篇内容介绍了“python sklearn CountVectorizer如何使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够

本篇内容介绍了“python sklearn CountVectorizer如何使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

简介

CountVectorizer官方文档。

将一个文档集合向量化为为一个计数矩阵。

如果不提供一个先验字典,不使用分析器做某种特征选择,那么特征的数量将等于通过分析数据发现的词汇量。

数据预处理

两种方法:1.可以不分词直接投入模型;2.可以先将中文文本进行分词。

两种方法产生的词汇会非常不同。在后面会具体给出示范。

import jiebaimport refrom sklearn.feature_extraction.text import CountVectorizer#原始数据text = ['很少在公众场合手机外放',        '大部分人都还是很认真去学习的',        '他们会用行动来',        '无论你现在有多颓废,振作起来',        '只需要一点点地改变',        '你的外在和内在都能焕然一新']#提取中文text = [' '.join(re.findall('[\u4e00-\u9fa5]+',tt,re.S)) for tt in text]#分词text = [' '.join(jieba.lcut(tt)) for tt in text]text

Python sklearn CountVectorizer如何使用

构建模型

训练模型

#构建模型vectorizer = CountVectorizer()#训练模型X = vectorizer.fit_transfORM(text)

所有词汇:model.get_feature_names()

#所有文档汇集后生成的词汇feature_names = vectorizer.get_feature_names()print(feature_names)

不分词生成的词汇

Python sklearn CountVectorizer如何使用

分词后生成的词汇

Python sklearn CountVectorizer如何使用

计数矩阵:X.toarray()

#每个文档相对词汇量出现次数形成的矩阵matrix = X.toarray()print(matrix)

Python sklearn CountVectorizer如何使用

#计数矩阵转化为DataFramedf = pd.DataFrame(matrix, columns=feature_names)df

Python sklearn CountVectorizer如何使用

词汇索引:model.vocabulary_

print(vectorizer.vocabulary_)

Python sklearn CountVectorizer如何使用

Python sklearn CountVectorizer如何使用”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: Python sklearn CountVectorizer如何使用

本文链接: https://www.lsjlt.com/news/352875.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python sklearn CountVectorizer如何使用
    本篇内容介绍了“Python sklearn CountVectorizer如何使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够...
    99+
    2023-07-05
  • 如何在Python中使用SKlearn包
    本篇文章给大家分享的是有关如何在Python中使用SKlearn包,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。1、SKlearn 是什么  Sklearn(全称 SciKit...
    99+
    2023-06-15
  • 如何在Python项目中使用Sklearn
    如何在Python项目中使用Sklearn?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。1.Sklearn简介Scikit-learn(sklearn)是机器学习中常用的第三方...
    99+
    2023-06-06
  • Python sklearn中的K-Means聚类如何使用
    这篇文章主要讲解了“Python sklearn中的K-Means聚类如何使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python sklearn中的K-Means...
    99+
    2023-07-04
  • python如何导入sklearn模块
    要导入sklearn模块,可以使用以下代码: from sklearn import 模块名 或者可以导入具体的子模块或函数: f...
    99+
    2024-02-29
    python sklearn
  • Python sklearn中的make_blobs()函数怎么使用
    这篇“Python sklearn中的make_blobs()函数怎么使用”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看...
    99+
    2023-07-05
  • Python中使用sklearn进行特征降维的方法
    目录特征降维特征选择过滤式①低方差特征过滤②相关系数③主成分分析特征降维 0维 标量 1维 向量 2维 矩阵 概念 降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组&ld...
    99+
    2023-05-17
    Python sklearn特征降维 Python sklearn Python特征降维
  • 怎么使用python sklearn画出决策树并保存为PDF
    本篇内容介绍了“怎么使用python sklearn画出决策树并保存为PDF”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!利用sk...
    99+
    2023-07-02
  • Python sklearn库三种常用编码格式实例
    目录OneHotEncoder独热编码实例LabelEncoder标签编码实例OrdinalEncoder特征编码实例OneHotEncoder独热编码实例 class sklear...
    99+
    2024-04-02
  • python数据分析之用sklearn预测糖尿病
    目录一、数据集描述二、准备工作三、实验环境和工具四、预测分析4.1探索性数据分析五、可视化分析六、构建baseline七、数据预处理八、离群值处理九、缺失值处理十、特征工程十一、数据...
    99+
    2024-04-02
  • Python Sklearn中超实用的隐藏功能有哪些
    这篇文章主要介绍“Python Sklearn中超实用的隐藏功能有哪些”,在日常操作中,相信很多人在Python Sklearn中超实用的隐藏功能有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对...
    99+
    2023-07-02
  • Bug小能手系列(python)_9: 使用sklearn库报错 module ‘numpy‘ has no attribute ‘int‘
    AttributeError: module 'numpy' has no attribute 'int'. 0. 错误介绍1. 环境介绍2. 问题分析3. 解决方法3.1 调用解决3.2 库...
    99+
    2023-09-14
    python bug sklearn
  • python httpx如何使用
    什么是 HttpxHttpx 是一个 Python 库,它提供了一个现代化的、易于使用的 HTTP 客户端和服务器。Httpx 可以与 Python 的异步框架协同工作,并支持 WebSocket 和 HTTP/2。Httpx 具有极佳的性...
    99+
    2023-05-14
    Python httpx
  • python如何使用plt.suptitle()
    这篇文章给大家分享的是有关python如何使用plt.suptitle()的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。plt.suptitle()真个图形添加标题:plt.fi...
    99+
    2024-04-02
  • python如何使用plt.tight_layout()
    这篇文章给大家分享的是有关python如何使用plt.tight_layout()的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。plt.tight_layout()在绘制多个图形...
    99+
    2024-04-02
  • python如何使用to_csv
    这篇文章主要为大家展示了“python如何使用to_csv”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“python如何使用to_csv”这篇文章吧。to_cs...
    99+
    2024-04-02
  • python如何使用find_element_by_css_selector()
    这篇文章给大家分享的是有关python如何使用find_element_by_css_selector()的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。find_element_by_css_selec...
    99+
    2023-06-17
  • python如何使用find_element_by_link_text()
    小编给大家分享一下python如何使用find_element_by_link_text(),希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!find_element_by_link_text()1.定位百度页面上"...
    99+
    2023-06-17
  • python如何使用pprint
    这篇文章将为大家详细讲解有关python如何使用pprint,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。pprintPython 的默认print函数完成了它的工作。但是如果尝试使用print函数打印出...
    99+
    2023-06-27
  • python argparse如何使用
    这篇文章主要介绍“python argparse如何使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“python argparse如何使用”文章能帮助大家解决问题。一、前言ar...
    99+
    2023-07-05
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作