iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python脚本自动下载小说
  • 717
分享到

Python脚本自动下载小说

脚本小说Python 2023-01-31 02:01:11 717人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

        本人喜欢在网上看小说,一直使用的是小说下载阅读器,可以自动从网上下载想看的小说到本地,比较方便。最近在学习python的爬虫,受此启发,突然就想到写一个爬取小说内容的脚本玩玩。于是,通过在逐浪上面分析源代码,找出结构特点之后

        本人喜欢在网上看小说,一直使用的是小说下载阅读器,可以自动从网上下载想看的小说到本地,比较方便。最近在学习python爬虫,受此启发,突然就想到写一个爬取小说内容的脚本玩玩。于是,通过在逐浪上面分析源代码,找出结构特点之后,写了一个可以爬取逐浪上小说内容的脚本。

        具体实现功能如下:输入小说目录页的url之后,脚本会自动分析目录页,提取小说的章节名和章节链接地址。然后再从章节链接地址逐个提取章节内容。现阶段只是将小说从第一章开始,每次提取一章内容,回车之后提取下一章内容。其他网站的结果可能有不同,需要做一定修改。在逐浪测试过正常。

        分享此代码,一是做个记录,方便自己以后回顾。二么也想抛砖引玉,希望各路大神不吝赐教。

        下面是我用来测试的页面:Http://book.zhulang.com/263736/

效果如下:

wKioL1VmgJbzfHcNAARBWDxslYA371.jpg


实现的源代码如下,请各位指教:


#-*-coding:utf8-*-
#!/usr/bin/Python
# Python:      2.7.8
# PlatfORM:    windows
# Program:     Get Novels From Internet
# Author:      wucl
# Description: Get Novels
# Version:     1.0
# History:     2015.5.27  完成目录和url提取
#              2015.5.28  完成目录中正则提取第*章,提取出章节链接并下载。在逐浪测试下载无误。

from bs4 import BeautifulSoup
import urllib2,re

def get_menu(url):
    """Get chapter name and its url"""
    user_agent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:39.0) Gecko/20100101 Firefox/39.0"
    headers = {'User-Agent':user_agent}
    req = urllib2.Request(url,headers = headers)
    page = urllib2.urlopen(req).read()
    soup = BeautifulSoup(page)
    novel = soup.find_all('title')[0].text.split('_')[0]     # 提取小说名
    menu = []
    all_text = soup.find_all('a',target="_blank")   # 提取记载有小说章节名和链接地址的模块
    regex=re.compile(ur'\u7b2c.+\u7ae0')          # 中文正则匹配第..章,去除不必要的链接
    for title in all_text:
        if re.findall(regex,title.text):
            name = title.text
            x = [name,title['href']]
            menu.append(x)       # 把记载有小说章节名和链接地址的列表插入列表中                
    return menu,novel

def get_chapter(name,url):
    """Get every chapter in menu"""
    html=urllib2.urlopen(url).read()
    soup=BeautifulSoup(html)
    content=soup.find_all('p')     # 提取小说正文
    return content[0].text
    
    
    

if __name__=="__main__":
    url=raw_input("""Input the main page's url of the novel in ZhuLang\n        Then Press Enter to Continue\n""")
    if url:
        menu,title=get_menu(url)
        print title,str(len(menu))+'\n     Press Enter To Continue   \n'     # 输出获取到的小说名和章节数
        for i in menu:
            chapter=get_chapter(i[0],i[1])
            raw_input()
            print '\n'+i[0]+'\n'        
            print chapter
            print '\n'


--结束END--

本文标题: Python脚本自动下载小说

本文链接: https://www.lsjlt.com/news/186687.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python脚本自动下载小说
            本人喜欢在网上看小说,一直使用的是小说下载阅读器,可以自动从网上下载想看的小说到本地,比较方便。最近在学习Python的爬虫,受此启发,突然就想到写一个爬取小说内容的脚本玩玩。于是,通过在逐浪上面分析源代码,找出结构特点之后...
    99+
    2023-01-31
    脚本 小说 Python
  • python爬虫之小说网站--下载小说(
    python爬虫之小说网站--下载小说(正则表达式) 思路: 1.找到要下载的小说首页,打开网页源代码进行分析(例:https://www.kanunu8.com/files/old/2011/2447.html) 2.分析自己要得到的内...
    99+
    2023-01-30
    爬虫 小说网站 小说
  • 如何编写ftp自动下载文件脚本
    这篇文章主要讲解了“如何编写ftp自动下载文件脚本”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何编写ftp自动下载文件脚本”吧!代码如下:cd /home/oracle/ftpdatas...
    99+
    2023-06-08
  • Python自动更新脚本
    本脚本主要针对python2.6升级至python2.7.12,并且解决了升级后不能使用yum的问题。添加了ipython功能##########################!/bin/bash path="/home/tools" i...
    99+
    2023-01-31
    自动更新 脚本 Python
  • python自动化脚本nginx_status
    运维自动化,已经成为运维必不可少的一部分,下面附上自己写的监控nginx_status脚本,大神轻喷#!/usr/bin/python # coding: utf-8 import urllib.request...
    99+
    2023-01-30
    脚本 python nginx_status
  • Linux下Oracle自动备份脚本
    #!/bin/bash export ORACLE_HOME=/usr/local/instantclient_11_2export PATH=$ORACLE_HOME:$PATHexport TNS_AD...
    99+
    2024-04-02
  • 【Python】京东自动下单抢购脚本——双十一购物小技巧
    最近种草一款富士📷已久,但限于富士产能,一直都没有等到开放购买,在尝试几次定闹钟到点准时抢购后,果断放弃,于是花了一个周末时间写了一个简易脚本,终于成为一名合格的“富家子弟”。 ...
    99+
    2023-09-03
    python java 抢购 抢购脚本 京东
  • 写一个Python脚本自动爬取Bilibili小视频
    目录实验环境准备 API 寻找 && 提取 代码实现 项目链接 我身边的很多小伙伴们在朋友圈里面晒着出去游玩的照片,简直了,人多的不要不要的,长城被堵到水泄不通,老实...
    99+
    2024-04-02
  • 如何利用Python实现自动扫雷小脚本
    小编给大家分享一下如何利用Python实现自动扫雷小脚本,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一、准备工作1.扫雷游戏我是win10,没有默认的扫雷,所以...
    99+
    2023-06-15
  • Linux下如何使用Shell脚本实现ftp的自动上传下载
    小编给大家分享一下Linux下如何使用Shell脚本实现ftp的自动上传下载,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!1. ftp自动登录批量下载文件。代码如下:#####从ftp服务器上的/home/data 到 本...
    99+
    2023-06-09
  • 下载安装脚本
    1. 下载宝塔面板安装包 首先,你需要从宝塔官网下载适用于你的服务器操作系统的安装包。宝塔面板支持多种操作系统,包括 CentOS、Ubuntu、Debian、Fedora 等。 2. 安装宝塔面板 下载完成后,你可以通过 SSH 登录到...
    99+
    2023-10-26
    脚本
  • Python大佬手把手教你如何自制小说下载器
    下面是一个简单的Python代码示例,演示如何自制一个小说下载器:```pythonimport requestsfrom bs4 ...
    99+
    2023-09-21
    Python
  • Python自动化脚本有哪些
    本篇内容主要讲解“Python自动化脚本有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python自动化脚本有哪些”吧!10个杀手级应用的Python自动化脚本01、图像优化器这个伟大的自...
    99+
    2023-07-05
  • 开机自动运行python脚本
    1、新建rc.localtouch /etc/rc.d/rc.localvim /etc/rc.d/rc.local#!/bin/bash#下面是需要执行的脚本2、赋予可执行权限chmod +x /etc/rc.d/rc.local3、编辑...
    99+
    2023-01-31
    脚本 自动运行 python
  • python实现自动抢课脚本
    自动抢课脚本使用手册 @danteking dating from 2021.12.7 and last updating at 2021.12.8 gitee仓库 github仓库 借助pyaut...
    99+
    2023-09-08
    python 脚本语言 图像识别
  • Python多线程如何下载有声小说
    这篇文章跟大家分析一下“Python多线程如何下载有声小说”。内容详细易懂,对“Python多线程如何下载有声小说”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习“Python多线程...
    99+
    2023-06-17
  • 八个超级好用的Python自动化脚本(小结)
    目录1、自动化阅读网页新闻2、自动化数据探索3、自动发送多封邮件4、将 PDF 转换为音频文件5、从列表中播放随机音乐6、智能天气信息7、长网址变短网址8、清理下载文件夹每天你都可能...
    99+
    2024-04-02
  • Python实现一键下载视频脚本
    目录需求解决方案代码总结需求 小编通常会上一些专业的视频网站比如腾讯视频、优酷,在上面看电影、电视剧。这些网站有个优点,可以缓存视频,在通勤路上比如地铁就可以愉快的刷剧了,因为地铁上...
    99+
    2024-04-02
  • shell脚本实现自动化下载并检测ftp文件备份
    本篇内容介绍了“shell脚本实现自动化下载并检测ftp文件备份”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!实现代码:#!/bin/bas...
    99+
    2023-06-09
  • python自动打卡脚本怎么写
    编写一个Python自动打卡脚本可以参考以下步骤:1. 导入所需的库:`requests`用于发送HTTP请求,`time`用于设置...
    99+
    2023-08-17
    python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作