首页 > 资讯 > 后端开发 > Python >怎么用python代码实现爬取奥特曼图片

711

分享到

怎么用python代码实现爬取奥特曼图片

2023-06-29 04:06:30 711人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要讲解了“怎么用python代码实现爬取奥特曼图片”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么用Python代码实现爬取奥特曼图片”吧！爬取网址：Http://www.ult

这篇文章主要讲解了“怎么用python代码实现爬取奥特曼图片”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么用Python代码实现爬取奥特曼图片”吧！

爬取网址：Http://www.ultramanclub.com/allultraman/

使用工具：PyCharm，requests

进入网页

怎么用python代码实现爬取奥特曼图片

打开开发者工具

怎么用python代码实现爬取奥特曼图片

点击 Network

怎么用python代码实现爬取奥特曼图片

刷新网页，获取信息

怎么用python代码实现爬取奥特曼图片

其中的Request URL就是我们所爬取的网址

滑到最下有一个User-Agent，复制

怎么用python代码实现爬取奥特曼图片

向服务器发送请求

怎么用python代码实现爬取奥特曼图片

200意味着请求成功

使用 response.text 获取文本数据

怎么用python代码实现爬取奥特曼图片

可以看到有些乱码

使用encode转换

import requests url = 'http://www.ultramanclub.com/allultraman/' headers = {    'User-Agent':'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/98.0.4758.82 Safari/537.36'} response = requests.get(url = url,headers=headers)html = response.textHtml=html.encode('iso-8859-1').decode('gbk')print(Html)

怎么用python代码实现爬取奥特曼图片

接下来开始爬取需要的数据

使用Xpath获得网页链接

要使用Xpath必须先导入parsel包

import requestsimport parsel def get_response(html_url):    headers = {        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.82 Safari/537.36'    }     response = requests.get(url = html_url,headers=headers)    return response url = 'http://www.ultramanclub.com/allultraman/'response = get_response(url)html=response.text.encode('iso-8859-1').decode('gbk')selector = parsel.Selector(html) period_hrefs = selector.xpath('//div[@class="btn"]/a/@href')  #获取三个时代的网页链接 for period_href in period_hrefs:    print(period_href.get())

怎么用python代码实现爬取奥特曼图片

可以看到网页链接不完整，我们手动给它添加上去period_href = 'http://www.ultramanclub.com/allultraman/' + period_href.get()

怎么用python代码实现爬取奥特曼图片

进入其中一个网页

怎么用python代码实现爬取奥特曼图片

跟之前的操作一样，用Xpath获取奥特曼的网页信息

for period_href in period_hrefs:    period_href = 'http://www.ultramanclub.com/allultraman/' + period_href.get()    # print(period_href)    period_response = get_response(period_href).text    period_html = parsel.Selector(period_response)    lis = period_html.xpath('//div[@class="ultraheros-Contents_Generations"]/div/ul/li/a/@href')    for li in lis:        print(li.get())

运行后同样发现链接不完整

怎么用python代码实现爬取奥特曼图片

li = 'http://www.ultramanclub.com/allultraman/' + li.get().replace('./','')

怎么用python代码实现爬取奥特曼图片

拿到网址后继续套娃操作,就可以拿到图片数据

怎么用python代码实现爬取奥特曼图片

png_url = 'http://www.ultramanclub.com/allultraman/' + li_selector.xpath('//div[@class="left"]/figure/img/@src').get().replace('../','')

怎么用python代码实现爬取奥特曼图片

完整代码

import requestsimport parselimport os dirname = "奥特曼"if not os.path.exists(dirname):     #判断是否存在名称为奥特曼的文件夹，没有就创建    os.mkdir(dirname)  def get_response(html_url):    headers = {        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.82 Safari/537.36'    }     response = requests.get(url = html_url,headers=headers)    return response url = 'http://www.ultramanclub.com/allultraman/'response = get_response(url)html=response.text.encode('iso-8859-1').decode('gbk')selector = parsel.Selector(html) period_hrefs = selector.xpath('//div[@class="btn"]/a/@href')  #获取三个时代的网页链接 for period_href in period_hrefs:    period_href = 'http://www.ultramanclub.com/allultraman/' + period_href.get()     period_html = get_response(period_href).text    period_selector = parsel.Selector(period_html)    lis = period_selector.xpath('//div[@class="ultraheros-Contents_Generations"]/div/ul/li/a/@href')    for li in lis:        li = 'http://www.ultramanclub.com/allultraman/' + li.get().replace('./','')     #获取每个奥特曼的网址        # print(li)        li_html = get_response(li).text        li_selector = parsel.Selector(li_html)        url = li_selector.xpath('//div[@class="left"]/figure/img/@src').get()        # print(url)         if url:            png_url = 'http://www.ultramanclub.com/allultraman/' + url.replace('.', '')            png_title =li_selector.xpath('//ul[@class="lists"]/li[3]/text()').get()            png_title = png_title.encode('iso-8859-1').decode('gbk')            # print(li,png_title)            png_content = get_response(png_url).content            with open(f'{dirname}\\{png_title}.png','wb') as f:                f.write(png_content)            print(png_title,'图片下载完成')        else:            continue

怎么用python代码实现爬取奥特曼图片

当爬到奈克斯特奥特曼的时候，就会返回None，调了半天，也没搞懂，所以用if url：语句跳过了奈克斯特奥特曼，有没有大佬知道原因

url = li_selector.xpath('//div[@class="left"]/figure/img/@src').get()

感谢各位的阅读，以上就是“怎么用python代码实现爬取奥特曼图片”的内容了，经过本文的学习后，相信大家对怎么用python代码实现爬取奥特曼图片这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是编程网，小编将为大家推送更多相关知识点的文章，欢迎关注！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 怎么用python代码实现爬取奥特曼图片

本文链接: https://www.lsjlt.com/news/322372.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

怎么用python代码实现爬取奥特曼图片

这篇文章主要讲解了“怎么用python代码实现爬取奥特曼图片”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么用python代码实现爬取奥特曼图片”吧！爬取网址：http://www.ult...

99+

2023-06-29
用python实现爬取奥特曼图片实例

爬取网址：http://www.ultramanclub.com/allultraman/ 使用工具：pycharm，requests 进入网页打开开发者工具点击 Netwo...

99+

2024-04-02
python爬取百度图片代码

import json import itertools import urllib import requests import os import re import sys word=input("请输入关键字：") path="./...

99+

2023-01-31

代码图片 python
python百行代码实现汉服圈图片爬取

目录分析网站子链接获取获取标题和图片地址保存图片主函数平时旅游的时候，在旅游景区我们经常可以看到穿各种服饰去拍照的游客，也不会刻意多关注。前两天浏览网页无意看到一个网站，看到穿汉服的...

99+

2024-04-02
如何使用python百行代码实现汉服圈图片爬取

这篇文章主要介绍如何使用python百行代码实现汉服圈图片爬取，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！分析网站网址如下：https://www.aihanfu.com/zixun/tushang-1/这是第一页...

99+

2023-06-25
Python自动爬取图片并保存实例代码

目录一、准备工作二、代码实现三、总结一、准备工作用python来实现对百度图片的爬取并保存，以情绪图片为例，百度搜索可得到下图所示 f12打开源码在此处可以看到这...

99+

2024-04-02
Node.js实现爬取网站图片的示例代码

目录涉及知识点cheerio简介什么是cheerio 安装cheerio准备工作核心代码示例截图涉及知识点开发一个小爬虫，涉及的知识点如下所示： https模块，主要是用户获取网络...

99+

2024-04-02
Python怎么实现微博动态图片爬取

本篇内容主要讲解“Python怎么实现微博动态图片爬取”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Python怎么实现微博动态图片爬取”吧!我们找到微博在浏览器上面用于手机端的调试的APL，如...

99+

2023-06-29
怎么用Python爬取某图网的图片

本篇内容介绍了“怎么用Python爬取某图网的图片”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！相信很多设计小伙伴有好的灵感，但是没有好的设...

99+

2023-06-15
Node.js怎么实现爬取网站图片

这篇文章主要介绍“Node.js怎么实现爬取网站图片”，在日常操作中，相信很多人在Node.js怎么实现爬取网站图片问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Node.js怎么实现爬取网站图片”的疑惑有所...

99+

2023-06-29
python爬虫怎么获取图片

这篇文章主要讲解了“python爬虫怎么获取图片”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“python爬虫怎么获取图片”吧！首先导入库给文件加入头信息，伪装成模拟浏览器访问实现翻页翻页多...

99+

2023-06-02
怎么使用python爬取网页图片

本篇内容介绍了“怎么使用python爬取网页图片”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！在现在这个信息爆炸的时代，要想高效的获取数据，...

99+

2023-07-02
python爬虫怎么批量爬取百度图片

这篇文章将为大家详细讲解有关python爬虫怎么批量爬取百度图片，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。Python主要用来做什么Python主要应用于：1、Web开发；2、数据科学研究；3、网络爬...

99+

2023-06-14
只用50行Python代码爬取网络美女高清图片

目录一、技术路线二、获取网页信息三、网页爬取分析四、网页详情页链接获取五、依据图片链接保存图片六、main()函数七、完整代码一、技术路线 requests：网页请求 Beautif...

99+

2024-04-02
怎么用python代码实现图片去摩尔纹

1、前言当感光元件像素的空间频率与影像中条纹的空间频率接近时，可能产生一种新的波浪形的干扰图案，即所谓的摩尔纹。传感器的网格状纹理构成了一个这样的图案。若图案中的细条状结构与传感器的结构呈小角度交叉，则会在图像中产生明显的干扰效应。这种现象...

99+

2023-05-16

Python
Python实现微博动态图片爬取详解

由于微博的网页端有反爬虫，需要登录，所以我们换个思路，曲线救国。我们找到微博在浏览器上面用于手机端的调试的APL，如何找到呢？我这边直接附上微博的手机端的地址：https://...

99+

2024-04-02
怎么利用Python批量爬取网页图片

你可以使用Python的requests库来发起HTTP请求，并使用BeautifulSoup库来解析HTML文档以获取图片的URL...

99+

2023-09-27

Python
怎么用python爬取一组小姐姐图片

本篇内容主要讲解“怎么用python爬取一组小姐姐图片”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“怎么用python爬取一组小姐姐图片”吧!引入库import timeimport&...

99+

2023-06-26
怎么用Python代码实现新闻爬虫

本篇内容介绍了“怎么用Python代码实现新闻爬虫”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！新闻源：Reddit我们可以通过Reddit...

99+

2023-06-16
python怎么实现图片特效处理

这篇文章主要介绍了python怎么实现图片特效处理的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇python怎么实现图片特效处理文章都会有所收获，下面我们一起来看看吧。前言：对于图片处理，在日常生活中我们常常...

99+

2023-06-29