Python实现统计文章阅读量的方法详解

Python统计文章阅读量 Python文章阅读量 Python 文章阅读量 2023-02-14 15:02:35 807人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

目录前言实现代码效果图前言写这次博客其实事出有因，前几天呢，一个非常优秀的学姐在QQ空间里晒了自己的CSDN博客的总阅读量，达到了7万+，很厉害了，而且确实她的博文都是精髓，我就也

前言

写这次博客其实事出有因，前几天呢，一个非常优秀的学姐在QQ空间里晒了自己的CSDN博客的总阅读量，达到了7万+，很厉害了，而且确实她的博文都是精髓，我就也想来看看我的博客总阅读量了，看看什么时候能达到人家的高度，但是博客园偏偏就没有这个功能（CSDN是可以直接在首页看的）。于是乎，想尽一切办法，要来统计阅读量了，看看别人写的使用其他的统计工具，把代码放在博客园的公告栏，我也就放了个站长联盟的统计代码（具体操作可以百度，免费申请账号的），虽然，它统计的数据更多，但是呢，它只能统计我从使用这个工具之后的访问量，也就是，到现在为止，我的所有博客到底拥有多少的阅读量，还是没能统计出来，那不还是没解决问题嘛，这就很尴尬了。。。

坐在电脑前，发了一会呆，突然，想起来，哎，这下学的python爬虫或许可以派上用场了，于是乎，我就开始了愉快的爬虫统计阅读量之路，其实也很简单，抓取博客园博文的每一页，然后利用xpath解析出阅读量，然后进行加和就行了，为了做持久化，随时看看阅读量的增加情况，我就写入了一个文本文件，每次就两行内容，查询时间和总阅读量，当然，我在控制台可以清晰的查看每页每条博文的阅读量。这下可总算是把问题解决了，182篇博文，总阅读量：35205，差不多是学姐的一半，继续努力，看明年毕业时能不能达到学姐的高度，下面是最终的代码，当然还有很多不足之处，希望大家多多指教

实现代码

#导入需要的模块
import time
import requests
from lxml import etree

#进行UA伪装
headers={
    "User-agent":"Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/79.0.3945.130 Safari/537.36"
}
#创建文件，存储爬到的数据，做持久化,以追加的方式打开，可读可写
fp=open('./counter.txt','a+',encoding = 'utf-8')
#记录当前查询时间
select_time=time.strftime('%Y.%m.%d %H:%M:%S ',time.localtime(time.time()))
fp.write('查询的时间为：'+select_time+'\n')
def spider():
    #总阅读量
    counts=0
    #分页爬取数据加和
    for page_num in range(1,20):
        #设置url
        url="https://www.cnblogs.com/andrew3/default.html?page=%d"
        new_url=fORMat(url%page_num)
        #获取页面数据
        page_text=requests.get(url=new_url,headers=headers).text
        tree=etree.HTML(page_text)
        #解析数据，得到每页每篇博文的阅读量
        count_list=tree.xpath('//div[@class="forFlow"]/div/div[@class="postDesc"]/span[1]/text()')
        print(count_list)
        #每一页的阅读量
        sum=0
        #计算每页的阅读量
        for i in range(len(count_list)):
            sum+=int(count_list[i][3:len(count_list[i])-1])
        #计算总阅读量
        counts+=sum
        #打印每页每篇博文的阅读量
        print(sum,counts)
    #总阅读量持久化
    fp.write("总阅读量为：%s" % counts + '\n')
#关闭文件，释放资源
def close_file():
    fp.close()
def main():
    spider()
    close_file()
if __name__ == '__main__':
    main()

效果图

到此这篇关于python实现统计文章阅读量的方法详解的文章就介绍到这了,更多相关Python统计文章阅读量内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python实现统计文章阅读量的方法详解

本文链接: https://www.lsjlt.com/news/196025.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python实现统计文章阅读量的方法详解

目录前言实现代码效果图前言写这次博客其实事出有因，前几天呢，一个非常优秀的学姐在QQ空间里晒了自己的CSDN博客的总阅读量，达到了7万+，很厉害了，而且确实她的博文都是精髓，我就也...

99+

2023-02-14

Python统计文章阅读量 Python文章阅读量 Python 文章阅读量
详解php实现统计浏览量的方法

随着互联网的迅速发展，网站的访问量也越来越成为一个关键的指标。网站管理员想要通过准确的统计数据了解访问者的行为和喜好，从而为网站的改进和优化提供有力的依据。而浏览量作为网站访问量的一个重要指标，如何准确地统计并分析浏览量就成为一个比较困扰管...

99+

2023-05-14

php
如何在微信公众号上用PHP实现阅读量统计

如何在微信公众号上用PHP实现阅读量统计随着微信公众号的普及和发展，许多企业和个人开始关注公众号的阅读量。阅读量是衡量一篇文章受欢迎程度的重要指标，对于公众号主来说，了解阅读量可以帮助他们更好地了解读者的兴趣和需求，进而调整内容和策略。本文...

99+

2023-10-28

PHP 微信公众号阅读量统计
C#实现读写CSV文件的方法详解

目录CSV文件标准文件示例RFC 4180简化标准读写CSV文件使用CsvHelper使用自定义方法总结项目中经常遇到CSV文件的读写需求，其中的难点主要是CSV文件的解析。本文会介...

99+

2024-04-02
基于Python实现文章信息统计的小工具

目录前言程序主程序 main.py爬虫模块 spider.py持久化模块 store.py执行结果前言博客园在个人首页有一个简单的博客数据统计，以博客园官方的首页为例：但是这些...

99+

2023-02-14

Python文章信息统计工具 Python信息统计工具 Python信息统计
Python读取.py文件的方法详解

python读取.py文件的方法有三种：通过open()函数、pathlib模块以及importlib模块导入模块。这些方法允许读取.py文件的内容并将其用于各种目的，如执行模块或使用其...

99+

2024-04-03

python 读取.py文件
Typecho插件实现添加文章目录的方法详解

目录添加文章标题锚点显示文章目录添加文章目录样式定位到文章定位到目录我的长博文不少，比较影响阅读体验，有必要添加一个文章目录功能。相比 Wordpress， Typecho 的插件就...

99+

2023-02-19

Typecho添加文章目录 Typecho添加目录 Typecho目录
实例详解PHP统计代码行数及文件数量的方法

本篇文章主要给大家介绍有关PHP统计的相关知识，聊聊怎么用PHP来实现统计代码行数以及文件数量，希望对需要的朋友有所帮助！用PHP统计代码行数和文件数量有时候我们需要统计代码行数和文件数量（比如申请软著），我们可以用 PHP 进行统计。首先...

99+

2023-05-14

php
python实现读取excel表格详解方法

目录一、python读取excel表格数据1、读取excel表格数据常用操作2、xlrd模块主要操作3、读取单元格内容为日期时间的方式4、读取合并单元格的数据二、python写入ex...

99+

2024-04-02
C语言实现读取CSV文件的方法详解

１、每一次只能读取同一种数据类型，不能读取字符串。２、第次读取会返回一个　CSV数据结构，有源数据和二维数组，行列数信息３、可以转换二维数组，但总大小不能变 123.csv M...

99+

2022-12-21

C语言读取CSV文件 C语言读取CSV C语言 CSV
Java实现读取Jar文件属性的方法详解

目录一、题目描述-读取Jar文件属性1、题目2、解题思路3、代码详解一、题目描述-读取Jar文件属性 1、题目做一个读取jar文件的内容和功能的工具。 2、解题思路创建一个类：R...

99+

2022-11-13

Java读取Jar文件属性 Java Jar文件属性 Java Jar文件
Python词频统计的两种方法详解

目录统计文件里每个单词的个数思路：想法成立开始实践方法一：方法二：总结统计文件里每个单词的个数思路：分别统计文档中的单词，与出现的次数用两个列表将其保存起来，最后再用zip(...

99+

2024-04-02
Python实现读取文件的方法总结

目录序言1、方法介绍2、默认读取3、处理一个文件4、处理批量文件5、读取与备份6、重定向替换7、进阶总结序言哈喽兄弟们，今天咱们来了解一下 fileinput 。说到filei...

99+

2024-04-02
Python读取大量Excel文件并跨文件批量计算平均值的方法

本文介绍基于Python语言，实现对多个不同Excel文件进行数据读取与平均值计算的方法~ 编程网推荐学习python书籍首先，让我们来看一下具体需求：目...

99+

2023-02-02

Python读取大量Excel文件 python批量读取Excel文件 python读取Excel文件
WPF实现绘制统计图(柱状图)的方法详解

目录前言实现代码效果预览前言有小伙伴提出需要实现统计图。由于在WPF中没有现成的统计图控件，所以我们自己实现一个。 PS：有更好的方式欢迎推荐。实现代码一、创建...

99+

2024-04-02
Java实现统计在线人数功能的方法详解

目录1. 监听器的简介2. Java监听器的类型(1)ServletContextListener(2)HttpSessionListener(3)ServletRequestLis...

99+

2024-04-02
Python+Opencv实现物体尺寸测量的方法详解

目录1、效果展示2、项目介绍3、项目搭建4、utils.py文件代码展示与讲解5、项目代码展示与讲解6、项目资源7、项目总结1、效果展示我们将以两种方式来展示我们这个项目的效果。 ...

99+

2024-04-02
Python实现文本特征提取的方法详解

目录1.字典文本特征提取 DictVectorizer()1.1 one-hot编码1.2 字典数据转sparse矩阵2.英文文本特征提取3.中文文本特征提取4. TF-IDF 文本...

99+

2024-04-02
python实现单例的两种方法解读

目录python 实现单例的方法第一种方法：使用基类第二种方法：使用装饰器python 单例对象单列模式总结python 实现单例的方法第一种方法：使用基类 New 是真正创建实例...

99+

2023-03-02

python实现单例 python单例 python单例方法
Python实现读取大量Excel文件并跨文件批量计算平均值

本文介绍基于Python语言，实现对多个不同Excel文件进行数据读取与平均值计算的方法。首先，让我们来看一下具体需求：目前有一个文件夹，其中存放了大量Excel文件；文件名称是每...

99+

2023-02-02

Python读取Excel Python计算平均值 Python Excel 平均值