广告
返回顶部
首页 > 资讯 > 后端开发 > Python >urllib高级用法--登陆和cookies的使用
  • 914
分享到

urllib高级用法--登陆和cookies的使用

高级urllibcookies 2023-01-30 22:01:06 914人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

对于一些更高级的操作(比如Cookies处理,代理设置,登陆验证),urllib怎么实现?需要更强大的工具Handler登场了,有专门处理登录验证的,有处理Cookies的,用处理代理设置的,几乎做到Http请求的所有事情。Handler子

对于一些更高级的操作(比如Cookies处理,代理设置,登陆验证),urllib怎么实现?需要更强大的工具Handler登场了,有专门处理登录验证的,有处理Cookies的,用处理代理设置的,几乎做到Http请求的所有事情。


Handler子类继承BaseHandler 类

HITPDefaultErrorHandler :用于处理Http响应错误,错误都会抛出 HTTPError 类型的异常。

HTTPRedirectHandler :用于处理重定向。

HTTPCookieProcessor :用于处理Cookies。

ProxyHandler :用于设置代理,默认代理为空。

HTTPPassWordMgr :用于管理密码,它维护了用户名和密码的表。

HTTPBasicAuthHandler :用于管理认证,如果一个链接打开时需要认证,那么可以用它来解决认证问题.

更多详情参考:https://docs.python.org/3/library/urllib.request.html#urllib.request.BaseHandler


利用Handler来构建Opener

验证:有些网站打开就会提示输入用户名和密码,验证成功后才能查看页面

blob.png


这样的请求页面,怎么办?借助HTTPBasicAuthHandler 就可以完成,完整代码如下:

#!/usr/bin/env Pythoncoding: utf-8
from urllib.request import HTTPPasswordMgrWithDefaultRealm
from urllib.request import HTTPBasicAuthHandler
from urllib.request import build_opener
from urllib.request import URLError

username = 'root'
password = '123456'
url = 'http://localhost:5000'

p = HTTPPasswordMgrWithDefaultRealm()
p.add_password(None, url, username, password)
auth_handler = HTTPBasicAuthHandler(p)
opener = build_opener(auth_handler)

try:
    ret = opener.open(url)
    html = ret.read().decode('utf8')
    print(html)
except URLError as e:
    print(e.reason)

运行结果,可以看到已经登录成功

blob.png



代理IP的使用

在写爬虫的时候,免不了要使用代理,如果要添加代理,可以这样做:

from urllib.request import ProxyHandler,build_opener
from urllib.error import URLError

proxy_handler = ProxyHandler({
    'http': 'http://163.158.203.206:8080',
})
opener = build_opener(proxy_handler)
try:
    response = opener.open('https://www.baidu.com')
    print(response.read().decode('utf8'))
except URLError as e:
    print(e.reason)

注释:使用了ProxyHandler,其参数是一个字典,键为协议类型(HTTP或者HTTPS等),value是代理链接,可以添加多个代理,利用Handler及build_opener()方法构造一个Opener,之后发送请求即可。



Cookies

Cookies的处理就需要相关的Handler了

实例:怎么获取网站的Cookies

代码如下:

import http.cookiejar
import urllib.request

cookie = http.cookiejar.CookieJar()
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open('http://www.baidu.com')
for item in cookie:
    print(item.name + "=" + item.value)

运行结果如下:

blob.png

这里输出了每条Cookie的名称和值


如何输出成文件格式呢?代码如下:

import http.cookiejar
import urllib.request

filename = 'cookies.txt'
cookie = http.cookiejar.MozillaCookieJar(filename)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open('http://www.baidu.com')
cookie.save(ignore_discard=True, ignore_expires=True)

运行程序后,生成cookies.txt文件,内容如下:

blob.png



另外,LWPCookieJar同样可以读取和保存Cookies,但是保存的格式和MozillaCookieJar不一样,要保存成LWP格式的Cookies文件,可以在声明时就改为:cookie = http.cookiejar.LWPCookieJar(filename),代码如下:

import http.cookiejar
import urllib.request

filename = 'cookies.txt'
cookie = http.cookiejar.LWPCookieJar(filename)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open('http://www.baidu.com')
cookie.save(ignore_discard=True, ignore_expires=True)

运行后,生成cookies.txt文件内容如下:

blob.png



生成Cookies文件后,怎样从文件中读取并利用呢?

下面以LWPCookieJar格式为例来看一下:

import http.cookiejar
import urllib.request

cookie = http.cookiejar.LWPCookieJar()
cookie.load('cookies.txt', ignore_discard=True, ignore_expires=True)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)
response = opener.open('http://www.baidu.com')
print(response.read().decode('utf8'))

运行结果如下:

blob.png


注释:这里调用load()方法来读取本地的Cookies文件,获取到了Cookies的内容,前提是首先生成了LWPCookieJar格式的Cookies,并保存成文件,然后读取Cookies使用同样的方法构建Handler和Opener即可完成操作

这些是urllib库中request模块的基本用法,想知道更多,可以参考:

官方文档说明:https://docs.python.org/3/library/urllib.request.html#basehandler-objects


--结束END--

本文标题: urllib高级用法--登陆和cookies的使用

本文链接: https://www.lsjlt.com/news/179182.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • urllib高级用法--登陆和cookies的使用
    对于一些更高级的操作(比如Cookies处理,代理设置,登陆验证),urllib怎么实现需要更强大的工具Handler登场了,有专门处理登录验证的,有处理Cookies的,用处理代理设置的,几乎做到http请求的所有事情。Handler子类...
    99+
    2023-01-30
    高级 urllib cookies
  • 使用dos破除windowsxp登陆密码的方法
    用DOS启 del c:Windowssystem32configsam copy c:windwos epairsam (有个空格)c:windowssystem32config 然后重启进入Windows,有个提示不...
    99+
    2023-06-04
    windowsxp登陆密码 dos windowsxp 登陆密码 方法
  • 使用Post方法模拟登陆爬取网页的实现方法
    最近弄爬虫,遇到的一个问题就是如何使用post方法模拟登陆爬取网页。下面是极简版的代码:import java.io.BufferedReader;import java.io.InputStreamReader;import java.i...
    99+
    2023-05-31
    java post 模拟登陆
  • mysql中如何使用limit的高级用法
    本文主要给大家简单讲讲mysql中如何使用limit的高级用法,相关专业术语大家可以上网查查或者找一些相关书籍补充一下,这里就不涉猎了,我们就直奔主题吧,希望mysql中如何使用limit的高级用法这篇文章...
    99+
    2022-10-18
  • JavaScript的高级概念和用法详解
    目录1. 闭包2. 函数绑定3.使用命名空间4. 判断属性是否存在5. 解构赋值6.遍历对象属性7. 过滤数组8. 消除重复值9. 判断是否数组10. 转换数字和字符串11. 转换为...
    99+
    2022-11-13
  • Laravel中where的高级使用方法
    这篇文章主要介绍了Laravel中where的高级使用方法,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。有时候项目中需要进行多个字段搜索就可以用到此方法在Larav...
    99+
    2023-06-08
  • Java高级之HashMap中的entrySet()方法使用
    目录基本使用原理剖析总结基本使用 entrySet()方法得到HashMap中各个键值对映射关系的集合。 然后Map.Entry中包含了getKey()和getValue()方法获取...
    99+
    2023-03-22
    Java HashMap Java entrySet()方法 Java HashMap entrySet()方法
  • linux下rsync的基础介绍和高级用法
    这篇文章主要介绍“linux下rsync的基础介绍和高级用法”,在日常操作中,相信很多人在linux下rsync的基础介绍和高级用法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”linux下rsync的基础介...
    99+
    2023-06-05
  • Linux 下nmon的高级使用方法有哪些
    这篇文章主要介绍了Linux 下nmon的高级使用方法有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。nmon是一种在AIX与各种Linux操作系统上广泛使用的监控与分析...
    99+
    2023-06-27
  • Java中ModelMapper的高级使用方法有哪些
    本篇内容介绍了“Java中ModelMapper的高级使用方法有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!ModelMapper 高...
    99+
    2023-06-29
  • 使用Python完成SAP客户端的打开和系统登陆功能
    最近小爬一直思忖着如何将以前写的一些半自动化程序转为全自动化,这其中就涉及到SAP的打开和登录过程。我们都知道,SAP原生的“脚本录制和回放”功能是在用户进入...
    99+
    2022-11-11
  • 使用高斯Redis实现二级索引的方法
    目录一、背景二、场景一:词典补全2.1 基本方案2.2 与频率相关的词典补全三、场景二:多维索引3.1 数据编码3.2 添加新元素3.3 查询四、总结一、背景 提起索引,第一印象就是数据库的名词,但是,高斯Redis也可...
    99+
    2022-07-08
    Redis二级索引 Redis二级索引使用 高斯Redis索引
  • Java高级之HashMap中的entrySet()方法怎么使用
    本篇内容主要讲解“Java高级之HashMap中的entrySet()方法怎么使用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Java高级之HashMap中的entrySet()方法怎么使用”...
    99+
    2023-07-05
  • python中的logging模块的简单应用和高级使用
    目录简单使用日志格式输出到文件处理程序(Handler)过滤器(Filter)高级使用日志回溯日志轮换日志缓冲总结简单使用 在 Python 中,可以使用内置的 logging 模块...
    99+
    2023-05-17
    python logging模块 logging应用
  • 亚马逊卖家使用云服务器登陆账号注册的解决方法
    1. 确保云服务器网络连接正常 在使用云服务器登陆账号注册之前,首先要确保云服务器的网络连接正常。可以通过 ping 命令或者访问其他网站来测试网络连接是否正常。如果网络连接存在问题,可以尝试重启云服务器或者联系云服务提供商进行故障排查。...
    99+
    2023-10-27
    亚马逊 卖家 解决方法
  • 正则表达式高级用法之分组的使用教程
    目录分组的使用场景分组的使用方法捕获组分组的使用实例javascript 获取分组内容java 获取分组内容小结补充:正则表达式分组及常见的方法总结分组的使用场景 在书写正则表达式时...
    99+
    2022-11-13
  • linux怎么使用rsync的高级用法进行大型备份
    这篇文章给大家分享的是有关linux怎么使用rsync的高级用法进行大型备份的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。基础的 rsync 命令通常足够来管理你的 Linux 备份,但是额外的选项使大型备份集更...
    99+
    2023-06-16
  • 如何使用Python完成SAP客户端的打开和系统登陆功能
    本篇内容介绍了“如何使用Python完成SAP客户端的打开和系统登陆功能”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!我们都知道,SAP原生...
    99+
    2023-06-30
  • 如何在PHP中使用NumPy的高级编程算法?
    在PHP中使用NumPy的高级编程算法是一个非常有用的技能。NumPy是Python中用于科学计算的一个重要库,它提供了许多高级的数学函数和算法,而PHP是一种流行的编程语言,用于创建Web应用程序和动态网站。在本篇文章中,我们将探讨如何在...
    99+
    2023-10-25
    numpy 编程算法 numy
  • Laravel中的where高级使用方法实例讲解
    有时候项目中需要进行多个字段搜索就可以用到此方法 在Laravel中的可以同时使用多个where,所以我们可以每个字段分配一个where() 然后在每个...
    99+
    2022-11-11
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作