Python sklearn CountVectorizer如何使用

2023-07-05 15:07:02 925人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

本篇内容介绍了“python sklearn CountVectorizer如何使用”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够

本篇内容介绍了“python sklearn CountVectorizer如何使用”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

简介

CountVectorizer官方文档。

将一个文档集合向量化为为一个计数矩阵。

如果不提供一个先验字典，不使用分析器做某种特征选择，那么特征的数量将等于通过分析数据发现的词汇量。

数据预处理

两种方法：1.可以不分词直接投入模型；2.可以先将中文文本进行分词。

两种方法产生的词汇会非常不同。在后面会具体给出示范。

import jiebaimport refrom sklearn.feature_extraction.text import CountVectorizer#原始数据text = ['很少在公众场合手机外放',        '大部分人都还是很认真去学习的',        '他们会用行动来',        '无论你现在有多颓废，振作起来',        '只需要一点点地改变',        '你的外在和内在都能焕然一新']#提取中文text = [' '.join(re.findall('[\u4e00-\u9fa5]+',tt,re.S)) for tt in text]#分词text = [' '.join(jieba.lcut(tt)) for tt in text]text

Python sklearn CountVectorizer如何使用

构建模型

训练模型

#构建模型vectorizer = CountVectorizer()#训练模型X = vectorizer.fit_transfORM(text)

所有词汇：model.get_feature_names()

#所有文档汇集后生成的词汇feature_names = vectorizer.get_feature_names()print(feature_names)

不分词生成的词汇

Python sklearn CountVectorizer如何使用

分词后生成的词汇

Python sklearn CountVectorizer如何使用

计数矩阵：X.toarray()

#每个文档相对词汇量出现次数形成的矩阵matrix = X.toarray()print(matrix)

Python sklearn CountVectorizer如何使用

#计数矩阵转化为DataFramedf = pd.DataFrame(matrix, columns=feature_names)df

Python sklearn CountVectorizer如何使用

词汇索引：model.vocabulary_

print(vectorizer.vocabulary_)

Python sklearn CountVectorizer如何使用

“Python sklearn CountVectorizer如何使用”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站，小编将为大家输出更多高质量的实用文章！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python sklearn CountVectorizer如何使用

本文链接: https://www.lsjlt.com/news/352875.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python sklearn CountVectorizer如何使用

本篇内容介绍了“Python sklearn CountVectorizer如何使用”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够...

99+

2023-07-05
如何在Python中使用SKlearn包

本篇文章给大家分享的是有关如何在Python中使用SKlearn包，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。1、SKlearn 是什么　　Sklearn（全称 SciKit...

99+

2023-06-15
如何在Python项目中使用Sklearn

如何在Python项目中使用Sklearn？相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。1.Sklearn简介Scikit-learn(sklearn)是机器学习中常用的第三方...

99+

2023-06-06
Python sklearn中的K-Means聚类如何使用

这篇文章主要讲解了“Python sklearn中的K-Means聚类如何使用”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Python sklearn中的K-Means...

99+

2023-07-04
python如何导入sklearn模块

要导入sklearn模块，可以使用以下代码： from sklearn import 模块名或者可以导入具体的子模块或函数： f...

99+

2024-02-29

python sklearn
Python sklearn中的make_blobs()函数怎么使用

这篇“Python sklearn中的make_blobs()函数怎么使用”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这篇文章能有所收获，下面我们一起来看看...

99+

2023-07-05
Python中使用sklearn进行特征降维的方法

目录特征降维特征选择过滤式①低方差特征过滤②相关系数③主成分分析特征降维 0维标量 1维向量 2维矩阵概念降维是指在某些限定条件下，降低随机变量（特征）个数，得到一组&ld...

99+

2023-05-17

Python sklearn特征降维 Python sklearn Python特征降维
怎么使用python sklearn画出决策树并保存为PDF

本篇内容介绍了“怎么使用python sklearn画出决策树并保存为PDF”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！利用sk...

99+

2023-07-02
Python sklearn库三种常用编码格式实例

目录OneHotEncoder独热编码实例LabelEncoder标签编码实例OrdinalEncoder特征编码实例OneHotEncoder独热编码实例 class sklear...

99+

2024-04-02
python数据分析之用sklearn预测糖尿病

目录一、数据集描述二、准备工作三、实验环境和工具四、预测分析4.1探索性数据分析五、可视化分析六、构建baseline七、数据预处理八、离群值处理九、缺失值处理十、特征工程十一、数据...

99+

2024-04-02
Python Sklearn中超实用的隐藏功能有哪些

这篇文章主要介绍“Python Sklearn中超实用的隐藏功能有哪些”，在日常操作中，相信很多人在Python Sklearn中超实用的隐藏功能有哪些问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对...

99+

2023-07-02
Bug小能手系列(python)_9: 使用sklearn库报错 module ‘numpy‘ has no attribute ‘int‘

AttributeError: module 'numpy' has no attribute 'int'. 0. 错误介绍1. 环境介绍2. 问题分析3. 解决方法3.1 调用解决3.2 库...

99+

2023-09-14

python bug sklearn
python httpx如何使用

什么是 HttpxHttpx 是一个 Python 库，它提供了一个现代化的、易于使用的 HTTP 客户端和服务器。Httpx 可以与 Python 的异步框架协同工作，并支持 WebSocket 和 HTTP/2。Httpx 具有极佳的性...

99+

2023-05-14

Python httpx
python如何使用plt.suptitle()

这篇文章给大家分享的是有关python如何使用plt.suptitle()的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。plt.suptitle()真个图形添加标题：plt.fi...

99+

2024-04-02
python如何使用plt.tight_layout()

这篇文章给大家分享的是有关python如何使用plt.tight_layout()的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。plt.tight_layout()在绘制多个图形...

99+

2024-04-02
python如何使用to_csv

这篇文章主要为大家展示了“python如何使用to_csv”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“python如何使用to_csv”这篇文章吧。to_cs...

99+

2024-04-02
python如何使用find_element_by_css_selector()

这篇文章给大家分享的是有关python如何使用find_element_by_css_selector()的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。find_element_by_css_selec...

99+

2023-06-17
python如何使用find_element_by_link_text()

小编给大家分享一下python如何使用find_element_by_link_text()，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！find_element_by_link_text()1.定位百度页面上"...

99+

2023-06-17
python如何使用pprint

这篇文章将为大家详细讲解有关python如何使用pprint，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。pprintPython 的默认print函数完成了它的工作。但是如果尝试使用print函数打印出...

99+

2023-06-27
python argparse如何使用

这篇文章主要介绍“python argparse如何使用”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“python argparse如何使用”文章能帮助大家解决问题。一、前言ar...

99+

2023-07-05