广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python爬虫urllib中的异常模块如何处理
  • 574
分享到

python爬虫urllib中的异常模块如何处理

2023-06-30 12:06:26 574人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍“python爬虫urllib中的异常模块如何处理”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“python爬虫urllib中的异常模块如何处理”文章能帮助大家解决问题。urllib

这篇文章主要介绍“python爬虫urllib中的异常模块如何处理”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“python爬虫urllib中的异常模块如何处理”文章能帮助大家解决问题。

    urllib中的异常处理

    在我们写爬虫程序时,若出现url中的错误,那么我们就无法爬取我们想要的内容,对此,我们引入了urllib中的异常处理。

    url的组成部分

    URL由6个部分组成:eg:

    https://www.baidu.com/s?wd=易烊千玺

    • 协议(Http/https)

    • 主机(www.baidu.com)

    • 端口号(80/443)

    • 路径(s)

    • 参数(wd=易烊千玺)

    • 锚点

    常见的端口号:

    http(80) https(443) mysql(3306) oracle(1521) redis(6379) mongodb(27017)

    URLError

    通常来说,URLError报错通常为url地址中主机部分的错误:

    实例:

    url = 'https://www.baidu.com1/'

    运行结果:

    urllib.error.URLError: <urlopen error [Errno 11001] getaddrinfo failed

    HTTPError

    这个异常的通常是url地址中参数或是路径的错误。

    实例:

    url = 'https://www.jianshu.com/p/3388cf148dba1'

    运行结果:

    urllib.error.HTTPError: HTTP Error 404: Not Found

    简介

    • HTTPError类是URLError类的子类

    • 导入的包urllib.error.HTTPError/urllib.error.URLError

    • http错误:http错误是针对浏览器无法连接到服务器而增加的出来的错误提示,引导并告诉浏览者该页是出了什么问题。

    • 通过urllib发送请求的时候,有可能会发送失败,这个时候如果想让你的代码更健壮,可以通过try -except进行捕获异常。

    Urllib.error 模块

    urllib.error 模块为 urllib.request 所引发的异常定义了异常类,基础异常类是 URLError。

    urllib.error 包含了两个方法,URLError 和 HTTPError。

    URLError 是 OSError 的一个子类,用于处理程序在遇到问题时会引发此异常(或其派生的异常)。

    HTTPError 是 URLError 的一个子类,用于处理特殊 HTTP 错误例如作为认证请求的时候,包含的属性 code 为 HTTP 的状态码, reason 为引发异常的原因,headers 为导致 HTTPError 的特定 HTTP 请求的 HTTP 响应头。

    异常处理

    用try except语句块捕获并处理异常,其基本语法结构如下所示:

    try:可能产生异常的代码块

    except [ (Error1, Error2, &hellip; ) [as e] ]:处理异常的代码块1

    except [ (Error3, Error4, &hellip; ) [as e] ]:处理异常的代码块2

    except [Exception]:处理其它异常

    实例:

    原url= &lsquo;https://www.jianshu.com/p/3388cf148dba&rsquo;

    源码

    import urllib.requestimport urllib.errorurl = 'https://www.jianshu.com1/p/3388cf148dba'# url的组成 eg:https://www.baidu.com/s?wd=易烊千玺# 1.协议(http/https) 2.主机(www.baidu.com) 3.端口号(80/443) 4.路径(s) 5.参数(wd=易烊千玺) 6.锚点#  常见的端口号# http(80) https(443) Mysql(3306) oracle(1521) Redis(6379) mongoDB(27017)headers = {'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/98.0.4758.102 Safari/537.36'}try:    request = urllib.request.Request(url = url,headers = headers)    response = urllib.request.urlopen(request)    content = response.read().decode('utf8')    print(content)except urllib.error.HTTPError:    print('HTTP异常,请稍后!')except urllib.error.URLError:    print('URL异常,请稍后!')

    URLError

    url = &lsquo;https://www.jianshu.com1/p/3388cf148dba&rsquo;

    运行结果:

    python爬虫urllib中的异常模块如何处理

    HTTPError

    url = &lsquo;https://www.jianshu.com/p/3388cf148dba111&rsquo;

    运行结果:

    python爬虫urllib中的异常模块如何处理

    关于“Python爬虫urllib中的异常模块如何处理”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网Python频道,小编每天都会为大家更新不同的知识点。

    --结束END--

    本文标题: python爬虫urllib中的异常模块如何处理

    本文链接: https://www.lsjlt.com/news/328715.html(转载时请注明来源链接)

    有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

    本篇文章演示代码以及资料文档资料下载

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档
    猜你喜欢
    • python爬虫urllib中的异常模块处理
      目录urllib中的异常处理url的组成部分URLErrorHTTPError简介Urllib.error 模块异常处理urllib中的异常处理 在我们写爬虫程序时,若出现url中的...
      99+
      2022-11-11
    • python爬虫urllib中的异常模块如何处理
      这篇文章主要介绍“python爬虫urllib中的异常模块如何处理”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“python爬虫urllib中的异常模块如何处理”文章能帮助大家解决问题。urllib...
      99+
      2023-06-30
    • Python中urllib爬虫、request模块和parse模块的示例分析
      小编给大家分享一下Python中urllib爬虫、request模块和parse模块的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!urlliburlli...
      99+
      2023-06-14
    • python爬虫urllib库中parse模块urlparse的使用方法
      这篇文章主要介绍了python爬虫urllib库中parse模块urlparse的使用方法,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。在python爬虫urllib库中,u...
      99+
      2023-06-14
    • Python异常处理如何才能写得优雅(retrying模块)
      目录前言不负责任版本简单处理版本改进处理版本安装与使用安装使用总结前言 在写程序时,我们会经常碰到程序出现异常,这时候我们就不得不处理这些异常,以保证程序的健壮性。 处理异常的版本有...
      99+
      2022-11-13
    • 如何在Python中处理网络爬虫的问题
      如何在Python中处理网络爬虫的问题网络爬虫是获取互联网上信息的重要方式,而Python作为一种简单易用且功能强大的编程语言,被广泛用于网络爬虫开发。本文将介绍如何在Python中处理网络爬虫的问题,并提供具体的代码示例。一、网络爬虫的基...
      99+
      2023-10-22
      Python 网络爬虫 处理问题
    • 解析Node.js异常处理中domain模块的使用方法
      NodeJS 提供了 domain 模块,可以简化异步代码的异常处理。在介绍该模块之前,我们需要首先理解“域”的概念。简单的讲,一个域就是一个 JS 运行环境,在一个运行环境中,如果一个异常没有被捕获,将作...
      99+
      2022-06-04
      使用方法 模块 异常
    • 如何在Python中处理异常处理的问题
      如何在Python中处理异常处理的问题异常是程序中的错误,当程序出现异常时,可以使用异常处理机制来捕获和处理这些异常,以保证程序的正常运行。Python提供了丰富而强大的异常处理机制,可以通过try-except语句来捕获并处理异常。下面将...
      99+
      2023-10-22
      Python 异常处理
    • node 中如何使用Async异步处理模块
      今天就跟大家聊聊有关node 中如何使用Async异步处理模块,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。Async异步处理模块!以下是小sam的...
      99+
      2022-10-19
    • 如何在Python中进行异常处理
      目录一、抛出异常和自定义异常1、raise语句2、自定义异常类型二、捕捉异常1、捕捉多个异常2、获取异常信息三、finally子句一、抛出异常和自定义异常 Python中使用用异常对...
      99+
      2022-11-13
    • 如何在Python中处理异常情况
      如何在Python中处理异常情况,需要具体代码示例异常处理是编程中非常重要的一部分。当程序执行过程中遇到错误或异常情况时,如果没有相应的处理机制,程序很可能会崩溃或产生不可预测的结果。Python提供了一套强大的异常处理机制,使得我们可以优...
      99+
      2023-10-22
      错误处理 异常处理 异常捕获
    • 如何理解Python常用模块中常用内置函数
      如何理解Python常用模块中常用内置函数,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Python作为计算机语言中常用的语言,它具有十分强大的功能,但是你知道...
      99+
      2023-06-17
    • 如何使用python爬虫采集网站时ip被封的处理
      这篇文章给大家分享的是有关如何使用python爬虫采集网站时ip被封的处理的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。python是什么意思Python是一种跨平台的、具有解释性、编译性、互动性和面向对象的脚本...
      99+
      2023-06-14
    • 如何使用Python中的异常处理机制
      如何使用Python中的异常处理机制异常处理是编程中非常重要的一部分,它可以帮助我们在程序出现错误时优雅地处理这些错误,防止程序崩溃并提供相应的错误信息。Python提供了强大的异常处理机制,本文将介绍如何在Python中使用异常处理。tr...
      99+
      2023-10-22
      Python 异常处理
    • 如何模拟请求工具curl的异常处理
      小编给大家分享一下如何模拟请求工具curl的异常处理,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!日常开发过程中,使用curl进...
      99+
      2022-10-19
    • Java中的InstantiationException异常该如何处理
      在Java中,InstantiationException异常通常会在使用反射创建实例时抛出,当无法创建一个类的实例时会抛出该异常。...
      99+
      2023-08-24
      java
    • jstorm中bolt是如何处理异常的
      jstorm中bolt是如何处理异常的?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。BasicBoltExecutor源码:  public vo...
      99+
      2023-05-31
      jstorm bolt st
    • 如何处理Go语言中的异常处理问题?
      如何处理Go语言中的异常处理问题?Go语言是一种由谷歌开发的编程语言,它以其简洁、高效、并发安全的特点受到了广泛的关注和应用。在日常的开发工作中,异常处理是一个不可避免的问题。本文将介绍一些在Go语言中处理异常的方法,并提供具体的代码示例。...
      99+
      2023-10-22
      Go语言 异常处理 问题处理
    • 如何在Python中使用Selenium对异常进行处理
      这篇文章主要介绍了如何在Python中使用Selenium对异常进行处理,编程网小编觉得不错,现在分享给大家,也给大家做个参考,一起跟随编程网小编来看看吧!python是什么意思Python是一种跨平台的、具有解释性、编译性、互动性和面向对...
      99+
      2023-06-06
    • 如何在python中使用try-except方法处理异常
      这篇文章给大家介绍如何在python中使用try-except方法处理异常,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、网络爬虫;...
      99+
      2023-06-14
    软考高级职称资格查询
    编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
    • 官方手机版

    • 微信公众号

    • 商务合作