iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >ChatGPT帮我自动编写Python爬虫脚本的详细过程
  • 946
分享到

ChatGPT帮我自动编写Python爬虫脚本的详细过程

ChatGPT自动编写Python爬虫脚本ChatGPT编写Python爬虫 2023-02-16 12:02:22 946人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

目录1、爬取知乎上的专栏文章2. 爬取京东某商品的评论3.继续更多的测试都知道最近ChatGPT聊天机器人爆火,我也想方设法注册了账号,据说后面要收费了。 ChatGPT是一种基于大

都知道最近ChatGPT聊天机器人爆火,我也想方设法注册了账号,据说后面要收费了。

ChatGPT是一种基于大语言模型的生成式ai,换句话说它可以自动生成类似人类语言的文本,把梳理好的有逻辑的答案呈现在你面前,这完全不同于传统搜索工具

ChatGPT不光可以回答人文、科学、情感等传统问题,还可以写代码、改bug,程序员可就急了,简直是在抢饭碗,所以网上出现各种ChatGPT让你失业的焦虑言论。

俗话说“百闻不如一见”,我试着让ChatGPT用python去写爬虫脚本,看它到底行不行?

1、爬取知乎上的专栏文章

提问:

帮我用Python写代码爬取网站

ChatGPT:

图片

把给到的代码放进PyCharm中跑一遍,发现没有报错,且打印出了内容。

import requests
from bs4 import BeautifulSoup

url = "https://zhuanlan.zhihu.com/p/595050104"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")

title = soup.find("h1", class_="Post-Title").text.strip()
body = soup.find("div", class_="Post-RichText").text.strip()

print("Title:", title)
print("Body:", body)

图片

虽然说ChatGPT给出的代码可以执行,但它也提到由于爬取的网站会随时变更,也就是HTML会变动,所以代码可能需要调整才能正常工作。

凡是写过爬虫的同学应该都能理解,人工写的爬虫代码也没法一劳永逸,需要随时改。

这一点ChatGPT提示的很有道理。

后来我测试了medium、百家号上的文章,ChatGPT提供的代码形式几乎和上面一致,没法直接执行获取结果,需要微调后才能跑。

2. 爬取京东某商品的评论

为了给ChatGPT增加难度,我试着让它去爬取某电商网站的用户评论

提问:

请用python写代码爬取这个京东商品的所有用户评论 Https://item.jd.com/13652780.html

ChatGPT:

图片

可能这个网页是动态页面,ChatGPT提供的方法并不能爬取评论。

我接着问:

爬取的结果是空值怎么办?

ChatGPT:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nnDP8sph-1676473447460)(null)]

ChatGPT提供了3种可能存在的原因,但并没有帮我修改代码。

于是我又问:

还是空值 请帮我重新写代码爬取

ChatGPT:

图片

这次就牛掰了,它重新用selenium写了爬虫代码,并告诉我爬取动态网页需要模拟浏览器行为,因此得用selenium技术。

我没有运行去测试代码正确与否,但ChatGPT确实惊艳到我了,能够前后关联对话内容,并给出正确的解决方法。

3.继续更多的测试

上面只是蜻蜓点水的玩玩,ChatGPT就已经吸引到我,

我准备多花时间去测试ChatGPT应对各种爬虫的解决方案,以及它对bug的修复能力。

仅仅从写代码层面看,ChatGPT已经可以媲美中高级程序员的水平了,而且它的知识范畴远超人类最厉害的程序员

ChatGPT能够根据对话生成人想要的内容,这是AI巨大的突破,未来它的应用之广难以想象。

到此这篇关于ChatGPT 帮我自动编写 Python 爬虫脚本的文章就介绍到这了,更多相关ChatGPT自动编写 Python 爬虫脚本内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: ChatGPT帮我自动编写Python爬虫脚本的详细过程

本文链接: https://www.lsjlt.com/news/196393.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • ChatGPT帮我自动编写Python爬虫脚本的详细过程
    目录1、爬取知乎上的专栏文章2. 爬取京东某商品的评论3.继续更多的测试都知道最近ChatGPT聊天机器人爆火,我也想方设法注册了账号,据说后面要收费了。 ChatGPT是一种基于大...
    99+
    2023-02-16
    ChatGPT自动编写 Python 爬虫脚本 ChatGPT编写 Python 爬虫
  • chatGPT教我写compose函数的详细过程
    目录0 前言1 结果2 chatGPT过程概略3 最后0 前言 昨天希望实现一个通用的compose函数,能够接受同步函数与异步函数,并且通过异步函数同步执行来是吸纳compose函...
    99+
    2023-02-23
    chatGPT写compose函数 chatGPT compose函数
  • 使用Gitee自动化部署python脚本的详细过程
    目录一、前期准备1.1 安装环境二、python代码2.1 源码2.2 注意事项一、前期准备 1.1 安装环境 1、安装python3 2、打开命令行安装selenium pip...
    99+
    2024-04-02
  • 编写Python自动化脚本的方法教程
    这篇文章主要介绍“编写Python自动化脚本的方法教程”,在日常操作中,相信很多人在编写Python自动化脚本的方法教程问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”编写Python自动化脚本的方法教程”的疑...
    99+
    2023-06-16
  • Python实现自动填写脚本流程详解
    目录前言环境使用模块使用本次案例代码实现思路最终效果代码实现前言 环境使用 Python 3.8Pycharm 模块使用 import requests —> 数据...
    99+
    2024-04-02
  • 基于python编写的shell脚本详细讲解
    今天同事叫我编写一个shell脚本。话说,虽然我受*nix的影响甚深,但是对于*nix 里随处可见的sh脚本却是讨厌之极。为什么讨厌呢?首先是因为sh脚本那莫名其妙的语法,感觉就像随...
    99+
    2024-04-02
  • Python 自制简单版《我的世界》的详细过程
    《我的世界 Minecraft》大家应该都听说过,但你有没有想过自己写一个这样的游戏呢?太难、太复杂了?也许吧,但是不试一试你怎么知道能不能成呢? 国外有位叫fogleman的开发者...
    99+
    2024-04-02
  • Python在自动化和脚本编程中的应用
    Python是一种高级编程语言,它具有简单易懂的语法结构和强大的库支持,使其成为许多开发者和工程师首选的编程语言之一。Python在自动化和脚本编程领域有着广泛的应用,本文将探讨Pyt...
    99+
    2024-02-23
    自动化 python 脚本
  • APPium+Python编写真机移动端自动化脚本的项目实践
    目录前置条件连接设备脚本编写初始化设备参数操作命令脚本运行前置条件 完成软件和环境的安装后就可以开始移动端自动化脚本的编写了。 连接设备 手机打开USB调试模式,连接手机。此时去命令...
    99+
    2024-04-02
  • Selenium+Python自动化脚本环境搭建的全过程
    目录一、Python环境搭建1、下载安装包2、验证是否安装成功、以及是否有pip3、安装Selenium libraries二、安装谷歌浏览器和WebDriver1、安装谷歌浏览器2...
    99+
    2024-04-02
  • 使用python怎么编写一个自动生成sql语句的脚本
    这篇文章主要介绍了使用python怎么编写一个自动生成sql语句的脚本,此处通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考价值,需要的朋友可以参考下:python是什么意思Python是一种跨平台的、具有解释性、编译性、...
    99+
    2023-06-06
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作