Python 官方文档:入门教程 => 点击学习
1、Request函数 1)用法:urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable]) 2)作用:用于构造Request对象,可以传递d
1、Request函数
1)用法:urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable])
2)作用:用于构造Request对象,可以传递data数据,添加请求头(headers)等,构造好后作为urllib2.urlopen()的参数。
3)参数解释:
headers = {'User-Agent':'Mozilla/5.0 (X11; U; Linux i686)Gecko/20071127 Firefox/2.0.0.11'}
origin_req_host表示请求方的主机域名或者ip地址。
4)举例:
import urllib
import urllib2
url = 'Http://www.weibo.cn/'
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; windows NT)'
h = { 'User-Agent' : user_agent }
req = urllib2.Request(url,headers=h)
response = urllib2.urlopen(req)
print response.read()
2、urlopen函数
1)用法:urllib2.urlopen(url[, data[, timeout[, cafile[, capath[, cadefault[, context]]]]])
2)作用:这个函数可以像urllib.urlopen()那样以url做参数。也能以Request实例为参数,即用一个Request对象(下文构造方法)来映射你提出的HTTP请求。在最简单的使用形式中,你将要请求的地址创建一个Request对象,这个Request对象中可以设置传输数据、headers等。通过调用urlopen并传入Request对象,将返回一个file-like对象。另外,urllib2还提供了接口来处理一般情况,例如:基础验证,cookies,代理和其他,它们通过handlers和openers的对象实现。
req= urllib2.Request(url, data,headers)
response = urllib2.urlopen(req,timeout=3) #timeout表示超时时间设置。
3)参数解释:
url表示目标网页地址,可以是字符串,也可以是请求对象Request
data表示post方式提交给目标服务器的参数
data = urllib.urlencode(data)
4)举例:
import urllib,urllib2
action_url="http://www.xxxxxx.com/post" #用于测试post的网址,返回提交的数据
values={'name':"alice",'age':20}
data=urllib.urlencode(values) #对表单数据编码
rqst=urllib2.Request(action_url,data) #构造request请求
response=urllib2.urlopen(rqst) #模拟提交表单数据到url并获得响应
5)返回值处理:
response.read() #返回页面内容
response.info() #返回网页信息
response.geturl() #返回连接地址
3、build_opener函数
1)用法:build_opener([handler1 [ handler2, ... ]])
2)作用:urllib2.urlopen()函数不支持验证、cookie或者其它HTTP高级功能。要支持这些功能,必须使用build_opener()函数创建自定义Opener对象。
3)参数解释:
handler是Handler实例,常用的有HTTPBasicAuthHandler、HTTPCookieProcessor、ProxyHandler等。
build_opener ()返回的对象具有open()方法,与urlopen()函数的功能相同。
如果要修改http报头,可以用:
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
opener.open('http://www.example.com/')
转载链接:https://www.jianshu.com/p/e320add10e33
--结束END--
本文标题: python中urllib2库使用
本文链接: https://www.lsjlt.com/news/182989.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
下载Word文档到电脑,方便收藏和打印~
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0