iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python3网络爬虫入门知识点有哪些
  • 315
分享到

Python3网络爬虫入门知识点有哪些

2024-04-02 19:04:59 315人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

本篇内容介绍了“python3网络爬虫入门知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  

本篇内容介绍了“python3网络爬虫入门知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

  网络爬虫简介

  网络爬虫,也叫网络蜘蛛(WEB?Spider)。它根据网页地址(URL)爬取网页内容,而网页地址(URL)就是我们在浏览器中输入的网站链接。比如:它就是一个URL。

  1、审查元素

  在浏览器的地址栏输入URL地址,在网页处右键单击,找到检查。(不同浏览器的叫法不同,Chrome浏览器叫做检查,Firefox浏览器叫做查看元素,但是功能都是相同的)

  我们可以看到,右侧出现了一大推代码,这些代码就叫做html。什么是HTML?举个容易理解的例子:我们的基因决定了我们的原始容貌,服务器返回的HTML决定了网站的原始容貌。

  为啥说是原始容貌呢?因为人可以整容啊!扎心了,有木有?那网站也可以"整容"吗?可以!请看下图:

  我能有这么多钱吗?显然不可能。我是怎么给网站"整容"的呢?就是通过修改服务器返回的HTML信息。我们每个人都是"整容大师",可以修改页面信息。我们在页面的哪个位置点击审查元素,浏览器就会为我们定位到相应的HTML位置,进而就可以在本地更改HTML信息。

  再举个小例子:我们都知道,使用浏览器"记住密码"的功能,密码会变成一堆小黑点,是不可见的。可以让密码显示出来吗?可以,只需给页面"动个小手术"!以淘宝为例,在输入密码框处右键,点击检查。

  可以看到,浏览器为我们自动定位到了相应的HTML位置。将下图中的passWord属性值改为text属性值(直接在右侧代码处修改):

  我们让浏览器记住的密码就这样显现出来了:

  说这么多,什么意思呢?浏览器就是作为客户端从服务器端获取信息,然后将信息解析,并展示给我们的。我们可以在本地修改HTML信息,为网页"整容",但是我们修改的信息不会回传到服务器,服务器存储的HTML信息不会改变。刷新一下界面,页面还会回到原本的样子。这就跟人整容一样,我们能改变一些表面的东西,但是不能改变我们的基因。

  2、简单实例

  网络爬虫的第一步就是根据URL,获取网页的HTML信息。在python3中,可以使用urllib.request和requests进行网页爬取。

  urllib库是Python内置的,无需我们额外安装,只要安装了Python就可以使用这个库。requests库是第三方库,需要我们自己安装。

  requests库强大好用,所以本文使用requests库获取网页的HTML信息。requests库的GitHub地址:

  (1)requests安装

  ?

  在cmd中,使用如下指令安装requests:

  pip install requests

  或者:

  easy_install requests

  (2)简单实例

  requests库的基础方法如下:

  首先,让我们看下requests.get()方法,它用于向服务器发起GET请求,不了解GET请求没有关系。我们可以这样理解:get的中文意思是得到、抓住,那这个requests.get()方法就是从服务器得到、抓住数据,也就是获取数据。让我们看一个例子(以 为例)来加深理解:

  # -*- coding:UTF-8 -*-

  import?requests

  if?__name__ == '__main__':

  ?target = ''

  ?req = requests.get(url=target)

  ?print(req.text)

  requests.get()方法必须设置的一个参数就是url,因为我们得告诉GET请求,我们的目标是谁,我们要获取谁的信息。

“Python3网络爬虫入门知识点有哪些”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: Python3网络爬虫入门知识点有哪些

本文链接: https://www.lsjlt.com/news/88504.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python3网络爬虫入门知识点有哪些
    本篇内容介绍了“Python3网络爬虫入门知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  ...
    99+
    2024-04-02
  • java网络爬虫的基础知识有哪些
    这篇文章主要介绍“java网络爬虫的基础知识有哪些”,在日常操作中,相信很多人在java网络爬虫的基础知识有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”java网络爬虫的基础知识有哪些”的疑惑有所帮助!...
    99+
    2023-06-16
  • Python反爬虫的知识点有哪些
    这篇文章主要介绍了Python反爬虫的知识点有哪些的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python反爬虫的知识点有哪些文章都会有所收获,下面我们一起来看看吧。一、为什么要反爬虫在设计反爬虫系统之前,我...
    99+
    2023-06-17
  • Python爬虫突破反爬虫机制知识点有哪些
    这篇文章主要介绍“Python爬虫突破反爬虫机制知识点有哪些”,在日常操作中,相信很多人在Python爬虫突破反爬虫机制知识点有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python爬虫突破反爬虫机制...
    99+
    2023-06-25
  • linux入门知识点有哪些
    这篇文章给大家分享的是有关linux入门知识点有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。linux目录架构 / 根目录 /bin 常用的命令 binary file 的目錄 /boot 存放系统启动时必...
    99+
    2023-06-13
  • Netty入门知识点有哪些
    本篇内容介绍了“Netty入门知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Java NIO再说Netty 之前先简单了解下Ja...
    99+
    2023-06-19
  • FreeMarker入门知识点有哪些
    本文小编为大家详细介绍“FreeMarker入门知识点有哪些”,内容详细,步骤清晰,细节处理妥当,希望这篇“FreeMarker入门知识点有哪些”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。FreeMarker是...
    99+
    2023-06-26
  • Redux入门知识点有哪些
    这篇文章主要为大家展示了“Redux入门知识点有哪些”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Redux入门知识点有哪些”这篇文章吧。Redux是什么?一个...
    99+
    2024-04-02
  • DIV入门知识点有哪些
    本篇内容介绍了“DIV入门知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!DIV入门简介DIV ...
    99+
    2024-04-02
  • PHP入门知识点有哪些
    小编给大家分享一下PHP入门知识点有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一、 首要条件你首先必须要有一个正在工作着的支持PHP的web服务...
    99+
    2023-06-17
  • JRuby入门知识点有哪些
    本篇内容主要讲解“JRuby入门知识点有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“JRuby入门知识点有哪些”吧!一、JRuby入门引言Ruby是现在编程界讨论得正热火朝天的一种语言。这...
    99+
    2023-06-17
  • shell入门知识点有哪些
    这篇文章主要讲解了“shell入门知识点有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“shell入门知识点有哪些”吧!背景一句话概括就是:shell编程就是对一堆Linux命令的逻辑化...
    99+
    2023-06-28
  • Git入门知识点有哪些
    今天小编给大家分享一下Git入门知识点有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。版本控制什么是版本控制(版本迭代,...
    99+
    2023-06-29
  • ThinkPHP6.0入门知识点有哪些
    本篇内容主要讲解“ThinkPHP6.0入门知识点有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“ThinkPHP6.0入门知识点有哪些”吧!一.框架介绍ThinkPHP是一个免费开源的,快...
    99+
    2023-07-02
  • html入门知识点有哪些
    本文小编为大家详细介绍“html入门知识点有哪些”,内容详细,步骤清晰,细节处理妥当,希望这篇“html入门知识点有哪些”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。   一、...
    99+
    2024-04-02
  • jQuery入门知识点有哪些
    这篇文章主要介绍“jQuery入门知识点有哪些”,在日常操作中,相信很多人在jQuery入门知识点有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”jQuery入门知识点有...
    99+
    2024-04-02
  • ReactJs入门知识点有哪些
    本篇内容主要讲解“ReactJs入门知识点有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“ReactJs入门知识点有哪些”吧!   一、ReactJS简介...
    99+
    2024-04-02
  • JSF入门知识点有哪些
    本篇内容主要讲解“JSF入门知识点有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“JSF入门知识点有哪些”吧!JSF是java web 的标准,可能会取代jsp 时代。JSF直译过来就是Ja...
    99+
    2023-06-17
  • Django入门知识点有哪些
    本篇内容介绍了“Django入门知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Django入门:基本知识熟悉python和dja...
    99+
    2023-06-18
  • TypeScript入门知识点有哪些
    这篇文章主要介绍“TypeScript入门知识点有哪些”,在日常操作中,相信很多人在TypeScript入门知识点有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Type...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作