python 淘宝爬虫小实例

2024-04-02 19:04:59 846人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

兄弟们，双十一剁手了吗？购物虽快乐，但是别过度了，毕竟很多降价不是真的降价，眼睛擦亮了~ 今天来试试爬一下某宝，这玩意学会了做外包的话，还是值几个钱的。环境/模块介绍 pyt

兄弟们，双十一剁手了吗？购物虽快乐，但是别过度了，毕竟很多降价不是真的降价，眼睛擦亮了~

在这里插入图片描述

今天来试试爬一下某宝，这玩意学会了做外包的话，还是值几个钱的。

在这里插入图片描述

环境/模块介绍

python 3.8 使用的环境
PyCharm 使用的编辑器
selenium 浏览器驱动的第三方模块
csv 数据保存的模块
time 时间模块, 可以用于程序的延迟
random 随机数模块

下载操作浏览器驱动的第三方模块
对应视频教程：

Python：双十火热进行中，教你带你用Python继续剁手


selenium  pip install selenium

解释我基本都写在注释了，我就偷个懒不在写了。


from selenium import WEBdriver
import time  # 时间模块, 可以用于程序的延迟
import random  # 随机数模块
from constants import TAO_USERNAME1, TAO_PASSWord1
import csv  # 数据保存的模块



def search_product(keyword):
    """搜索商品数据, 登录用户"""
    driver.find_element_by_xpath('//*[@id="q"]').send_keys(keyword)
    time.sleep(random.randint(1, 3))  # 尽量避免人机检测  随机延迟

    driver.f
def parse_data():
    """解析商品数据"""
    divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfx"]/div/div')  #  所有的div标签

    for div in divs:
        try:
            info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text
            price = div.find_element_by_xpath('.//strong').text + '元'
            deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text
            name = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text
            location = div.find_element_by_xpath('.//div[@class="location"]').te'.//div[@class="pic"]/a').get_attribute('href')

            print(info, price, deal, name, location, detail_url)

            # 保存
            with open('某宝.csv', mode='a', encoding='utf-8', newline='') as f:
                csv_write = csv.writer(f)
                csv_write.writerow([info, price, deal, name, location, detail_url])
        except:
            continue


word = input('请输入你要搜索商品的关键字:')
# 创建一个浏览器
driver = webdriver.Chrome()

# selenium操作的浏览器被识别了, 无法登录
# 修改浏览器的部分属性, 绕过检测
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument",
            {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => false})"""})


# 执行自动化浏览器的操作
driver.get('https://www.taobao.com/')
driver.implicitly_wait(10)  # 设置浏览器的等待,加载数据
driver.maximize_window()  # 最大化浏览器


# 调用商品搜索的函数
search_product(word)

for page in range(100): # 012
    print(f'\n==================正在抓取第{page + 1}页数据====================')
    url = f'Https://s.taobao.com/search?q=%E5%B7%B4%E9%BB%8E%E4%B8%96%E5%AE%B6&s={page * 44}'
    # 解析商品数据
    parse_data()
    time.sleep(random.randint(1, 3))  # 尽量避免人机检测  随机延迟

兄弟们快去试试吧！Python学习视频，解答，电子书都可以私信我领取

到此这篇关于python 淘宝爬虫小实例的文章就介绍到这了,更多相关python 淘宝爬虫内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python 淘宝爬虫小实例

本文链接: https://www.lsjlt.com/news/156649.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python 淘宝爬虫小实例

兄弟们，双十一剁手了吗？购物虽快乐，但是别过度了，毕竟很多降价不是真的降价，眼睛擦亮了~ 今天来试试爬一下某宝，这玩意学会了做外包的话，还是值几个钱的。环境/模块介绍 pyt...

99+

2022-11-12
python淘宝爬虫的实现方法教程

这篇文章主要介绍“python淘宝爬虫的实现方法教程”，在日常操作中，相信很多人在python淘宝爬虫的实现方法教程问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”python淘宝爬虫的实现方法教程”的疑惑有所...

99+

2023-06-25
通过淘宝数据爬虫学习python scrapy requests与response对象

目录Request 对象Response 对象ItemPipelineLinkExtractor 提取链接爬虫编码时间Request 对象在 scrapy 中 Request 对象...

99+

2022-11-11
python 爬取淘宝模特信息

通过本篇博文，介绍一下我对指定信息进行爬取的时候的思路，顺便贴一下代码。一、首先获取想要爬取的网站的url链接的规则变化可以看出来该网站页面的url结构简单，变化的只是https://mm.taobao.com/json/reques...

99+

2023-01-31

模特淘宝信息
Python-爬虫小计

# -*-coding:utf8-*-import requestsfrom bs4 import BeautifulSoupimport timeimport osimport urllibimport reimport jsonrequ...

99+

2023-01-30

小计爬虫 Python
python爬虫实例（urllib&Be

python 2.7.6urllib:发送报文并得到responseBeautifulSoup：解析报文的body（html）#encoding=UTF-8 from bs4 import BeautifulSoup from urllib...

99+

2023-01-31

爬虫实例 python
Python爬虫实例分析

今天小编给大家分享一下Python爬虫实例分析的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。环境搭建既然用python，那么...

99+

2023-06-03
Python爬虫实战之爬取某宝男装信息

目录知识点介绍实现步骤1. 分析目标网站2. 获取单个商品界面3. 获取多个商品界面4. 获取商品信息5. 保存到MySQL数据库完整代码知识点介绍本次爬取用到的知识点有: 1. ...

99+

2022-11-12
Python爬虫实战之如何采集淘宝商品信息并导入EXCEL表格

本篇内容主要讲解“Python爬虫实战之如何采集淘宝商品信息并导入EXCEL表格”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Python爬虫实战之如何采集淘宝商品信息并导入EXCEL表格”吧!...

99+

2023-06-16
如何用python+selenium爬取淘宝美食

今天就跟大家聊聊有关如何用python+selenium爬取淘宝美食，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。前言今天为大家介绍一个利用Python的selenium打开浏览器的...

99+

2023-06-02
Node.js 实现简单小说爬虫实例

最近因为剧荒，老大追了爱奇艺的一部网剧，由丁墨的同名小说《美人为馅》改编，目前已经放出两季，虽然整部剧槽点满满，但是老大看得不亦乐乎，并且在看完第二季之后跟我要小说资源，直接要奔原著去看结局…… 随手搜了...

99+

2022-06-04

爬虫实例简单
Python爬虫基础之初次使用scrapy爬虫实例

项目需求在专门供爬虫初学者训练爬虫技术的网站（http://quotes.toscrape.com)上爬取名言警句。创建项目在开始爬取之前，必须创建一个新的Scrapy项目。进入您打算存储代码的目录中，运行下列...

99+

2022-06-02

Python scrapy框架 Python爬虫
怎样用Python爬取淘宝评论数据

今天就跟大家聊聊有关怎样用Python爬取淘宝评论数据，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。【项目准备工作】准备Pycharm，下载安装等，不会安装的，可以回复：pytho...

99+

2023-06-01
Python爬虫项目--爬取某宝男装信息

本次爬取用到的知识点有: 1. selenium 2. pymysql 3 pyquery 正文 1. 分析目标网站 1. 打开某宝首页, 输入"男装"后点击"搜索", 则跳转到"男装"的搜索界面. 2. 空白处"右击"再点击"检查"审...

99+

2023-01-30

爬虫男装项目
Python网络爬虫实例讲解

聊一聊Python与网络爬虫。 1、爬虫的定义爬虫：自动抓取互联网数据的程序。 2、爬虫的主要框架爬虫程序的主要框架如上图所示，爬虫调度端通过URL管理器获取待爬取的URL链接，若URL管理器中存在待...

99+

2022-06-04

爬虫实例网络
python爬虫中xpath实例分析

这篇文章主要介绍“python爬虫中xpath实例分析”，在日常操作中，相信很多人在python爬虫中xpath实例分析问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”python爬虫中xpath实例分析”的疑...

99+

2023-06-29
Python爬虫实例：爬取猫眼电影——破

字体反爬字体反爬也就是自定义字体反爬，通过调用自定义的字体文件来渲染网页中的文字，而网页中的文字不再是文字，而是相应的字体编码，通过复制或者简单的采集是无法采集到编码后的文字内容的。现在貌似不少网站都有采用这种反爬机制，我们通过猫眼...

99+

2023-01-30

爬虫猫眼实例
小众实用的Python 爬虫库RoboBrowser

目录1. 前言2. 安装及用法3. 实战一下3-1 打开目标网站3-2 自动化表单提交3-3 数据爬取4. 最后1....

99+

2022-11-11
node.js实现博客小爬虫的实例代码

前言爬虫，是一种自动获取网页内容的程序。是搜索引擎的重要组成部分，因此搜索引擎优化很大程度上就是针对爬虫而做出的优化。这篇文章介绍的是利用node.js实现博客小爬虫，核心的注释我都标注好了，可以自行理...

99+

2022-06-04

爬虫实例代码
Python爬虫案例分析

本篇内容介绍了“Python爬虫案例分析”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！一、论述这几个案例以前是给一些想进入Pyt...

99+

2023-06-17