python爬虫urllib库中parse模块urlparse的使用方法

2023-06-14 16:06:34 335人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要介绍了python爬虫urllib库中parse模块urlparse的使用方法，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。在python爬虫urllib库中，u

这篇文章主要介绍了python爬虫urllib库中parse模块urlparse的使用方法，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。

在python爬虫urllib库中，urllib.parse是url解析模块，提供了很多解析和组建 URL 的方法，其中urlunparse() 方法通过长度为6的可迭代对象，组建URL。

一、urlparse() 方法

可以将 URL 解析成 ParseResult 对象,实现url的识别和分段。

标准链接格式为：scheme://netloc/path;params?query#fragment

二、urlparse将url拆分为六个部分

urlparse(url, scheme='', allow_fragments=True)

三、参数说明

urlstring：必填，待解析的url；

scheme：默认的协议，如Http，https。链接没有协议信息时生效；

allow_fragments：是否忽略fragment，如果设置False，fragment部分会被忽略，解析为path、params或者query的一部分，而fragment部分为空。当URL不包含params和query时候，fragment会被解析为path一部分；

四、拆分六个部分为：

协议（scheme）

域名（netloc）

路径（path）

路径参数（params）

查询参数（query）

片段（fragment）

五、使用实例

from urllib.parse import urlparse# 该方法可以实现URL的识别和分段result = urlparse('http://www.baidu.com/index.html;user?id=5#comment')# 这里我们利用urlparse()方法进行了一个URL的解析。首先，输出了解析结果的类型，然后将结果也输出出来。print(type(result), result)

输出

E:\WEBSpider\venv\Scripts\Python.exe E:/WebSpider/3_1_3.py<class 'urllib.parse.ParseResult'> ParseResult(scheme='http', netloc='www.baidu.com', path='/index.html', params='user', query='id=5', fragment='comment')

感谢你能够认真阅读完这篇文章，希望小编分享的“python爬虫urllib库中parse模块urlparse的使用方法”这篇文章对大家有帮助，同时也希望大家多多支持编程网，关注编程网Python频道，更多相关知识等着你来学习!

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python爬虫urllib库中parse模块urlparse的使用方法

本文链接: https://www.lsjlt.com/news/272702.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python爬虫urllib库中parse模块urlparse的使用方法

这篇文章主要介绍了python爬虫urllib库中parse模块urlparse的使用方法，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。在python爬虫urllib库中，u...

99+

2023-06-14
Python中urllib爬虫、request模块和parse模块的示例分析

小编给大家分享一下Python中urllib爬虫、request模块和parse模块的示例分析，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！urlliburlli...

99+

2023-06-14
python爬虫之请求模块urllib的基本使用

目录前言urllib的子模块HttpResponse常用方法与属性获取信息urlli.parse的使用(一般用于处理带中文的url)✅爬取baidu官网HTML源代码✅添加请求头信息...

99+

2022-11-10
使用Python的urllib和urllib2模块制作爬虫的实例教程

urllib 学习python完基础,有些迷茫.眼睛一闭,一种空白的窒息源源不断而来.还是缺少练习,遂拿爬虫来练练手.学习完斯巴达python爬虫课程后,将心得整理如下,供后续翻看.整篇笔记主要分以下几个部...

99+

2022-06-04

爬虫实例教程模块
python爬虫使用request库处理cookie的方法

这篇文章给大家分享的是有关python爬虫使用request库处理cookie的方法的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。python是什么意思Python是一种跨平台的、具有解释性、编译性、互动性和面向...

99+

2023-06-14
Python中使用urllib2模块编写爬虫的简单上手示例

提起python做网络爬虫就不得不说到强大的组件urllib2。在python中正是使用urllib2这个组件来抓取网页的。urllib2是Python的一个获取URLs(Uniform Resource ...

99+

2022-06-04

爬虫示例上手
python中elasticsearch_dsl模块的使用方法

目录前言连接elasticsearchelasticsearch_dsl.Searchquery方法filter方法index方法elasticsearch_dsl.queryela...

99+

2022-11-11
python中sys模块的使用方法

小编给大家分享一下python中sys模块的使用方法，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！python有哪些常用库python常用的库：1.requesuts；2.scrapy；3.pillow；4.twisted...

99+

2023-06-14
Python中concurrent.futures模块的使用方法

这篇文章主要介绍了Python中concurrent.futures模块的使用方法，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。1、说明标准库为我们提供了concurrent...

99+

2023-06-15
ansible作为python模块库使用的方法实例

前言 ansible是新出现的自动化运维工具，基于Python开发，集合了众多运维工具（puppet、cfengine、chef、func、fabric）的优点，实现了批量系统配置、批量程序部署、批量运行命...

99+

2022-06-04

实例模块方法
详解Python中Addict模块的使用方法

目录介绍1.安装2.用法3.要牢记的事情4.属性，如键、item等5.默认值6.转化为普通字典7.计数8.更新9.Addict 是怎么来的介绍 Addit 是一个Python模块，除...

99+

2022-11-11
使用Python中的tkinter模块作图的方法

python简述： Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。自从20世纪90年代初Python语言诞生至今，它逐渐被广泛应用于处理系统管理任务和Web编程。Python[1]已经...

99+

2022-06-04

模块方法 Python
一文详解Python中itertools模块的使用方法

目录chain(*iterables)combinations(iterable: Iterable, r)combinations_with_replacement(it...

99+

2023-03-22

Python itertools模块使用 Python itertools模块 Python itertools
Python中的模块heapq以及使用方法详解

python中的 heapq 模块 1、heapq 的两个函数：nlargest() 和 nsmallest() 1.1 nlargest(n, iterable, key=None) 函数功能：获...

99+

2023-09-01

python 开发语言队列栈 heapq
Python中schedule模块定时任务的使用方法(2)

目录1 设置时间间隔随机数2 设置定时任务执行到指定时间3 计算当前到下一次执行的时间差单位为秒上一篇文章Python中schedule模块关于定时任务使用方法 1 设置时间间隔随机...

99+

2022-11-11
Python模块对Redis数据库的连接与使用方法介绍

这篇文章主要讲解了“Python模块对Redis数据库的连接与使用方法介绍”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“Python模块对Redis数据库的连接与使用方法介绍”吧！下面看看P...

99+

2023-06-20
详解Python中使用base64模块来处理base64编码的方法

base64模块是用来作base64编码解码的。这种编码方式在电子邮件中是很常见的。它可以把不能作为文本显示的二进制数据编码为可显示的文本信息。编码后的文本大小会增大1/3。闲话不说了，base64模块...

99+

2022-06-04

详解模块方法
git-github子模块仓库更新及git中submodule子模块的添加、使用和删除方法是什么

这篇文章主要介绍“git-github子模块仓库更新及git中submodule子模块的添加、使用和删除方法是什么”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“git-github子模块仓库更新及g...

99+

2023-07-05