Python 官方文档:入门教程 => 点击学习
URL的一般格式(带方括号[]的为可选项)protocol://hostname[:port]/path/[;parameters][?query]#fragmentprotocol 为协议:Http,https,ftp,file,ed2k
URL的一般格式(带方括号[]的为可选项)
protocol://hostname[:port]/path/[;parameters][?query]#fragment
protocol 为协议:Http,https,ftp,file,ed2k
hostname 为域名或者是ip地址
[port] 为可选参数 端口,一般http的默认端口为80,https为443
/path/ 为路劲,具体地址,如目录或者文件名等
import urllib.request 导入urllib.request模块
response = urllib.request.urlopen('URL') 打开目标网站,URL=目标网站地址
html = response.read() 读取一个网站
html = html.decode("utf-8") 解码为utf-8
一个完整实例
import urllib.request
response = urllib.request.urlopen('https://www.baidu.com')
html = response.read()
html = html.decode("utf-8")
print(html)
--结束END--
本文标题: python爬虫之 URL的一般格式
本文链接: https://www.lsjlt.com/news/178925.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0