iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python词频统计的两种方法详解
  • 842
分享到

Python词频统计的两种方法详解

2024-04-02 19:04:59 842人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

目录统计文件里每个单词的个数思路:想法成立开始实践方法一:方法二:总结统计文件里每个单词的个数 思路: 分别统计文档中的单词,与出现的次数 用两个列表将其保存起来,最后再用zip(

统计文件里每个单词的个数

思路:

分别统计文档中的单词,与出现的次数

用两个列表将其保存起来,最后再用zip()函数连接输出**

想法成立开始实践

方法一:


# 导入文件
with open("passage.txt", 'r') as file:
    dates = file.readlines()
# 处理
Words = []
for i in dates:
    words += i.replace("\n", "").split(" ")  # 用空字符来代替换行 words +是为了不被覆盖无+将只有最后一条数据
    # print(i.replace("\n","").split(" "))
setWords = list(set(words))  # 集合自动去重
num = []  # 统计一个单词出现的次数
for k in setWords:
    count = 0
    for j in words:
        if k == j:
            count = count + 1
    num.append(count)
print(num)
print(setWords)
# 输出
for x, y in zip(setWords, num):  # 将两个列表用zip结合
    print(x + ":" + str(y))、

效果图:

在这里插入图片描述

方法二:

此方法用来字典,较前一个相对简洁一点


# 导入
with open("passage.txt", 'r') as file:
    dates = file.readlines()
# 处理
words = []
for i in dates:
    words += i.replace("\n", "").split(" ")
    # print(i.replace("\n","").split(" "))
# setWords=list(set(words))  #可以不用这个
print(words)
print("-" * 40)
# print(setWords)
diccount = dict()
for i in words:
    if (i not in diccount):
        diccount[i] = 1  # 第一遍字典为空 赋值相当于 i=1,i为words里的单词
        # print(diccount)
    else:
        diccount[i] = diccount[i] + 1  # 等不在里面的全部遍历一遍赋值就都在里面了,我们再来记数
print(diccount)

效果图:

在这里插入图片描述

统计的文档

在这里插入图片描述

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注编程网的更多内容!

--结束END--

本文标题: Python词频统计的两种方法详解

本文链接: https://www.lsjlt.com/news/159248.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python词频统计的两种方法详解
    目录统计文件里每个单词的个数思路:想法成立开始实践方法一:方法二:总结统计文件里每个单词的个数 思路: 分别统计文档中的单词,与出现的次数 用两个列表将其保存起来,最后再用zip(...
    99+
    2024-04-02
  • Python统计词频的几种方法小结
    目录方法一:运用集合去重方法方法二:运用字典统计方法三:使用计数器本文介绍python统计词频的几种方法,供大家参考 方法一:运用集合去重方法 def word_count1(wo...
    99+
    2023-03-01
    Python统计词频 Python 文本词频统计
  • Python统计词频的方法有哪些
    本文小编为大家详细介绍“Python统计词频的方法有哪些”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python统计词频的方法有哪些”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。方法一:运用集合去重方法&nb...
    99+
    2023-07-05
  • Python词频统计的方法有哪些
    这篇文章将为大家详细讲解有关Python词频统计的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。统计文件里每个单词的个数思路:分别统计文档中的单词,与出现的次数用两个列表将其保存起来,最后再用z...
    99+
    2023-06-21
  • python中文分词+词频统计的实现步骤
    目录前言一、文本导入二、使用步骤1.引入库2.读入数据3.取出停用词表4.分词并去停用词(此时可以直接利用python原有的函数进行词频统计)5. 输出分词并去停用词的有用...
    99+
    2024-04-02
  • Python比较两个日期的两种方法详解
    目录datetimestrptime之前我们曾经分享过:Python获取某一日期是“星期几”的6种方法!实际上,在我们使用Python处理日期/时间的时候,经...
    99+
    2024-04-02
  • Python 详解爬取并统计CSDN全站热榜标题关键词词频流程
    前言 最近在出差,发现住的宾馆居然有小强。所以出差无聊之际,写了点爬虫的代码玩玩,问就是应景。本篇文章主要是爬取CSDN全站综合热榜的100个标题,然后分词提取关键词,统计一下词频。...
    99+
    2024-04-02
  • Python识别二维码的两种方法详解
    目录前言pyzbar + PILcv2前言 最近在搜寻资料时,发现了一则10年前的新闻:二维码将成线上线下关键入口。从今天的移动互联网来看,支付收款码/健康码等等与我们息息相关,二维...
    99+
    2024-04-02
  • Python jieba中文分词与词频统计的操作案例
    这篇文章给大家分享的是有关Python jieba中文分词与词频统计的操作案例的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、...
    99+
    2023-06-08
  • 使用Python统计代码运行时间的两种方法
    目录前言方法1(推荐):通过代码统计步骤补充完整示例方法2:通过Pycharm编辑器总结前言 Python代码想统计运行时间有很多种方法,这里介绍比较常用的2种方法。方法1,通过代码...
    99+
    2022-12-23
    python代码运行时间 python统计代码运行时间
  • Python pip更新的两种方式详解
    目录1. 直接采用命令行模式更新1.1 搜索框搜索cmd,然后以管理员模式打开1.2 执行命令1.3 查看更新后的版本2. 在第一种安装失败的情况下,可以选择此方法2.1 卸载原先的...
    99+
    2023-02-13
    python pip更新 pip更新语句 怎么升级python的pip
  • Python获取网络时间戳的两种方法详解
    目录方法一代码实现调用方法返回结果方法二代码实现调用方法返回结果在我们进行注册码的有效期验证时,通常使用获取网络时间的方式来进行比对。 以下为获取网络时间的几种方式。 方法一 需要的...
    99+
    2024-04-02
  • 在markdown中添加视频的两种方法
    查看专栏目录 Network 灰鸽宝典专栏主要关注服务器的配置,前后端开发环境的配置,编辑器的配置,网络服务的配置,网络命令的应用与配置,windows常见问题的解决等。 ...
    99+
    2024-01-21
    markdown视频 markdown添加视频
  • 详解Python单元测试的两种写法
    目录一、前言二、实现1.doctest2.unittest一、前言 python的两个单元测试包分别是 doctest 和 unittest,这两个包的使用起来各有长处,适用于不同的...
    99+
    2024-04-02
  • 详解Python实现图像分割增强的两种方法
    方法一 import random import numpy as np from PIL import Image, ImageOps, ImageFilter from skim...
    99+
    2024-04-02
  • 详解python连接telnet和ssh的两种方式
    目录Telnet 连接方式ssh连接方式Telnet 连接方式 #!/usr/bin/env python # coding=utf-8 import time import...
    99+
    2024-04-02
  • Java实现Excel转PDF的两种方法详解
    目录一、使用spire转化PDF1、使用spire将整个Excel文件转为PDF2、指定单个的sheet页转为PDF二、使用jacob实现Excel转PDF(推荐使用)1、环境准备2...
    99+
    2024-04-02
  • python实现单例的两种方法解读
    目录python 实现单例的方法第一种方法:使用基类第二种方法:使用装饰器python 单例对象单列模式总结python 实现单例的方法 第一种方法:使用基类 New 是真正创建实例...
    99+
    2023-03-02
    python实现单例 python单例 python单例方法
  • python list的两种排序方法
    python提供了对list排序两种方法 1.使用list内建函数sort排序 list.sort(key=None,reverse=False) eg: In [57]: l=[27,47,3,42,19,9] In [58...
    99+
    2023-01-31
    两种 方法 python
  • Python+OpenCV读写视频的方法详解
    目录读视频,提取帧接口函数:cv2.VideoCapture()获取视频信息使用set(cv2.CAP_PROP_POS_FRAMES)读取指定帧读取函数(重点)将图像写为视频示例f...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作