广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python爬取代理IP
  • 125
分享到

Python爬取代理IP

PythonIP 2023-01-31 06:01:25 125人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

环境python3.6#!/usr/bin/env python #-*-coding=utf-8 -*- #AUTHOR:duwentao import requests import re i = input("请输入你要爬取第

环境python3.6

#!/usr/bin/env python
#-*-coding=utf-8 -*-
#AUTHOR:duwentao


import requests

import re

i = input("请输入你要爬取第几页:")
url = "https://www.kuaidaili.com/free/inha/" + i +"/"

print("获取代理IP地址")

header = {

    "User-Agent":"Mozilla/5.0 (windows NT 10.0; WOW64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0"
}

reponse = requests.get(url,header)
reponse.encoding='utf-8'
html = reponse.text


#p = r'<tr><td data-title="IP">(.*?)</td><td data-title="PORT">(.*?)</td><td data-title="匿名度">(.*?)</td><td data-title="类型">(.*?)</td><td data-title="位置">(.*?)</td><td data-title="响应速度">(.*?)</td><td data-title="最后验证时间">(.*?)</td></tr>'

ip = r'<td data-title="IP">(.*?)</td>'
IP = re.findall(ip,html,re.M|re.S)

dk = r'<td data-title="PORT">(.*?)</td>'
DK = re.findall(dk,html,re.M|re.S)


f=open("ip_list.txt","a")
for ip in IP:
    IP_LIST = ip + ":" + DK[IP.index(ip)] + "\n"
    f.write(IP_LIST)

f.close()

print("保存完毕")

--结束END--

本文标题: Python爬取代理IP

本文链接: https://www.lsjlt.com/news/190582.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python爬取代理IP
    环境Python3.6#!/usr/bin/env python #-*-coding=utf-8 -*- #AUTHOR:duwentao import requests import re i = input("请输入你要爬取第...
    99+
    2023-01-31
    Python IP
  • 利用Python爬取可用的代理IP
    前言 就以最近发现的一个免费代理IP网站为例:http://www.xicidaili.com/nn/。在使用的时候发现很多IP都用不了。 所以用Python写了个脚本,该脚本可以把能用的代理IP检测出来。...
    99+
    2022-06-04
    Python IP
  • 如何用Python爬虫抓取代理IP
    本篇文章为大家展示了如何用Python爬虫抓取代理IP,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。不知道大家在访问网站的时候有没有遇到过这样的状况就是被访问的网站会给出一个提示,提示的显示是“访问...
    99+
    2023-06-02
  • python2.7爬取可用代理IP
    import urllib2import randomimport timeimport re#from lxml import etree  #第三方模块def get_proxy(page):headers = {'User-Agent...
    99+
    2023-01-31
    IP
  • 利用python爬取软考试题之ip自动代理
    前言 最近有个软件专业等级考试,以下简称软考,为了更好的复习备考,我打算抓取www.rkpass.cn网上的软考试题。 首先讲述一下我爬取软考试题的故(keng)事(shi)。现在我已经能自动抓取某一个模块...
    99+
    2022-06-04
    试题 软考 python
  • Python 爬虫IP代理池的实现
    Python 爬虫IP代理池的实现 很多时候,如果要多线程的爬取网页,或者是单纯的反爬,我们需要通过代理 IP来进行访问。下面看看一个基本的实现方法。 代理 IP ...
    99+
    2022-10-18
  • python 爬虫如何使用代理IP
    作为一名数据采集者,我们都是知道,一个网站要是频繁访问都会被封IP,那要怎么解决这个问题呢?不可能一直频繁的更换设备,不光数据不能同步,这些设备的成本也是无法预计的,所以这个时候就需要代理IP了。以亿牛云(https://www.16yun...
    99+
    2023-06-02
  • 爬虫过程中代理ip的获取方法
    本篇内容主要讲解“爬虫过程中代理ip的获取方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“爬虫过程中代理ip的获取方法”吧!1、利用爬虫脚本每天定期抓取代理网站上的免费ip,或者购买一定数量的...
    99+
    2023-06-20
  • 爬虫爬取过程中代理IP会遇到什么问题
    小编给大家分享一下爬虫爬取过程中代理IP会遇到什么问题,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!学爬虫数据,必然是爬虫和反爬虫的对抗。用代理ip做反爬虫还是比...
    99+
    2023-06-14
  • python: 抓取免费代理ip
    通过抓取西刺网免费代理ip实现代理爬虫: from bs4 import BeautifulSoup import requests import random import telnetlib requests = requests.se...
    99+
    2023-01-31
    python ip
  • Python爬虫代理IP池实现方法
    在公司做分布式深网爬虫,搭建了一套稳定的代理池服务,为上千个爬虫提供有效的代理,保证各个爬虫拿到的都是对应网站有效的代理IP,从而保证爬虫快速稳定的运行,当然在公司做的东西不能开源出来。不过...
    99+
    2022-06-04
    爬虫 方法 Python
  • Python爬虫实现搭建代理ip池
    目录前言一、User-Agent二、发送请求三、解析数据四、构建ip代理池,检测ip是否可用五、完整代码总结前言 在使用爬虫的时候,很多网站都有一定的反爬措施,甚至在爬取大量的数据或...
    99+
    2022-11-11
  • Python爬虫所需要的爬虫代理ip是什么
    本篇内容主要讲解“Python爬虫所需要的爬虫代理ip是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python爬虫所需要的爬虫代理ip是什么”吧!1 代理类型代理IP一共可以分成4种类型...
    99+
    2023-06-02
  • 使用爬虫怎么获取代理服务器ip
    使用爬虫怎么获取代理服务器ip?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。1、使用爬虫脚本每天定期抓取代理网站上的ip,并将其写入MongoDB或其他数据库。这个表格是原始表...
    99+
    2023-06-14
  • 快速获取爬虫代理ip资源的方法
    今天小编给大家分享的是快速获取爬虫代理ip资源的方法,相信很多人都不太了解,为了让大家更加了解,所以给大家总结了以下内容,一起往下看吧。一定会有所收获的哦。第三方平台。许多平台都有一些免费的ip。比如无限制的套餐,每次基于频率可以获得免费的...
    99+
    2023-06-15
  • Python 网页爬虫原理及代理 IP 使用
    目录 前言 一、Python 网页爬虫原理 二、Python 网页爬虫案例 步骤1:分析网页 步骤2:提取数据 步骤3:存储数据 三、使用代理 IP 四、总结 前言 随着互联网的发展,网络上的信息量变得越来越庞大。对于数据分析人员和研究...
    99+
    2023-09-14
    python 爬虫 tcp/ip
  • 干货Python爬虫如何设置代理IP
    在Python爬虫中设置代理IP可以通过使用第三方库如requests或urllib库来实现。以下是一个使用requests库设置代...
    99+
    2023-09-21
    Python
  • python爬虫用代理ip有什么用途?
    数据信息采集离不开Python爬虫,而python爬虫离不开代理ip,他们的结合可以做的事情很多,如搜索引擎、采集数据、广告过滤等,Python爬虫还可以用于数据分析,在数据的抓取方面可以产生的作用巨大! Python爬虫是由架构组成部分...
    99+
    2023-01-31
    有什么 爬虫 用途
  • python爬虫ip代理池的搭建方法
    这篇文章主要讲解了“python爬虫ip代理池的搭建方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python爬虫ip代理池的搭建方法”吧!1、选择合适的代理软件并进行ip过滤。总共有2...
    99+
    2023-06-20
  • python爬虫怎么从ip池获取随机IP
    本篇内容主要讲解“python爬虫怎么从ip池获取随机IP”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python爬虫怎么从ip池获取随机IP”吧!ip池里有很多ip,有些不能正常使用。当出现...
    99+
    2023-06-20
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作