iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python爬虫入门教程 1-100 C
  • 531
分享到

Python爬虫入门教程 1-100 C

爬虫入门教程Python 2023-01-30 23:01:35 531人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

简介 你好,当你打开这个文档的时候,我知道,你想要的是什么! python爬虫,如何快速的学会python爬虫,是你最期待的事情,可是这个事情应该没有想象中的那么容易,况且你的编程底子还不一定好,这套课程,没有你想要的Python基础,没

简介

你好,当你打开这个文档的时候,我知道,你想要的是什么! python爬虫,如何快速的学会python爬虫,是你最期待的事情,可是这个事情应该没有想象中的那么容易,况且你的编程底子还不一定好,这套课程,没有你想要的Python基础,没有变量,循环,数组等基础知识,因为我不想在那些你可以直接快速学会的地方,去浪费你的时间。

好了,这套课程是基于python3.0 以上写的,操作系统我使用的是Centos7+ 所以里面的好多内容可能和你的不一样,当然也会导致许多问题的解决和你的不同,所以有的问题,需要你自己百度或者FQ解决啦,祝你碰到N多的BUG。O(∩_∩)O

接下来的第一步是什么?

安装一个虚拟机,因为你的电脑99%是windows的,所以你需要一个软件叫做 VMware 然后,下载地址 在2018年5月10日这一天,我百度到的是

Http://www.wuleba.com/309.html 在这个网址里面有这款软件的下载和你懂的。

然后,我接着百度到了一个CentOS7的操作系统

软件下载之后的名字

软件下载之后的名字

准备工作做好了,接下来就是需要你需要完成的操作了

首先,安装VM这款软件,并且把它"pojie"掉.(当有一天,你赚到了钱,记得在去买一下这款软件,支持一下)

安装软件,全部使用默认选项即可,这个地方因为简单到不需要我写了,有问题大家可以自行解决。

安装完毕之前的最后一步
这里写图片描述

CentOS 7 安装

接下来就进入CentOS的安装了

安装过程中几个关键点位,要确定好

选择中文,下一步

这里写图片描述

红框的几个地方请注意

这里写图片描述

修改成下图的样子
这里写图片描述

OK,我们已经做好配置了,接下来点击下一步,在下一步,你只需要配置一个root账户的密码就可以了

接下来就是几分钟的等待了,跟你电脑配置有关系,时间不等。

安装之后,打开CentOS操作系统,会出现一个嘿嘿的DOS命令窗口,输入账户root和你刚刚设置的密码,进入没有问题,完美~代表你的操作系统已经安装好了

接下来,为了方便我们后面的操作,我们要给我们的虚拟机安装一个GUI交互界面(也就是像windows一样的视窗操作软件)

安装的教程,我建议你观看 https://www.cnblogs.com/c-xiaohai/p/6509641.html 这个博主的,简单,清楚,一次成功。

如果失败了,怎么办,百度“如何安装gnome图形界面程序” 想办法啃下来。

当出现这样子的一些图标的时候,你成功了

这里写图片描述

好了,接下来说一下,你可能碰到的问题

  1. 你点击应用程序,里面找到一个叫做火狐浏览器的软件,然后打开,发现竟然无法上网?!

  2. 你发现竟然无法使用中文输入法?!nice 这个问题,自行解决,随便找找一堆解决方案。

好了,上面问题2解决了,那么解决一下问题1吧,这个问题首先确认一下你在一开始安装的时候,下面这个图配置的是否正确。

需要显示已连接
这里写图片描述

如果上图没有问题,那么99%的童鞋是可以上网的,那么还是有无法上网的,这时候,打开一个叫做终端的软件

这里写图片描述

输入代码

ping www.baidu.com

网络通畅
这里写图片描述

如果联网失败,敲入下图中的命令,如果联网成功,那么下面的内容,你直接跳过,去查看安装Python部分吧。

网络连接失败,修改方案

这里写图片描述

使用命令 ,注意,你的文件不一定叫ifcfg-ens33,可能叫 ifcgf-xxx 操作都一样

vi ifcfg-ens33

进入编辑页面 vi 的简单的操作

进入编辑状态请按键盘上的 i

退出编辑状态,请按键盘上的 ESC

然后输入 :wq 保存,退出,其他的命令用到在说吧。

图中有几个重点的地方,已经标注

这里写图片描述

首先看到你的文件中是否有 HWADDR=Mac地址 【MAC地址获取见下图】

如果没有,自己手动加上,这里使用的DHCP连接网络的方式,所以,你需要把BOOTPROTO="dhcp" 如果需要修改成 "static" 也可以,不过需要配置一些其他的内容

保存文件退出

获取MAC地址,注意图片中的标注

这里写图片描述

接下来 使用下面的命令重启网络服务

service network restart

在这里,你可能就重启成功了

如果失败,那么这个地方可能是一个非常大的坑了,网上的教程五花八门,但是大多数都是Copy一样的。

这里你可以按照各种教程去试一下,下面给大家几种常见的解决办法。

  1. 你自己电脑上面的两个服务没有开启

这里写图片描述

  1. CentOS操作系统中 NetworkManager 服务有冲突

这个需要在终端中解决

打开一个终端,输入如下命令

service NetworkManager stop  【回车】

chkconfig NetworkManager off   【回车】   

上面的命令是停止Network然后禁止开机启动,这样子在执行  service network restart  去尝试一下

安装Python

接下来就是我们的开发工具了,Python的安装

默认我们的CentOS已经给我们带了一个Python2

你可以直接使用

这里写图片描述

我们重新安装一下最新的Python3.0以上的版本,这里先安装一些基本的内容,CentOS使用 yum 安装程序

yum -y install zlib zlib-devel
yum -y install bzip2 bzip2-devel
yum -y install ncurses ncurses-devel
yum -y install readline readline-devel
yum -y install openssl openssl-devel
yum -y install openssl-static
yum -y install xz lzma xz-devel
yum -y install sqlite sqlite-devel
yum -y install gdbm gdbm-devel
yum -y install tk tk-devel

里面的 -y 是代表所有需要用户确认的地方选择yes不需要用户输入了

为了方便后面我们的Python3编译,还需要安装一个GCc编译器

yum -y install gcc

之后到python官网下载 https://www.python.org

终端运行以下命令

下载安装包

wget https://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz  

解压下载好的Python-3.x.x.tgz包

tar -zxvf Python-3.6.5.tgz  

进入解压后的目录,编译安装。

cd Python-3.6.5/
./configure --prefix=/usr/local/python3

make

    make

make install

make install

建立python3的软链

ln -s /usr/local/python3/bin/python3 /usr/bin/python3

OK到现在为止,你已经创建好了python3的环境了,在终端中尝试一下吧

这里写图片描述

接下来,你可能面临的一个问题就是安装setuptools和pip3的问题了,这个就留给大家自己解决去了。

最后输入一个 hello world 结束我们的1/100

print("hello,world")

--结束END--

本文标题: Python爬虫入门教程 1-100 C

本文链接: https://www.lsjlt.com/news/180461.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python爬虫入门教程 1-100 C
    简介 你好,当你打开这个文档的时候,我知道,你想要的是什么! Python爬虫,如何快速的学会Python爬虫,是你最期待的事情,可是这个事情应该没有想象中的那么容易,况且你的编程底子还不一定好,这套课程,没有你想要的Python基础,没...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 37-100
    爬前叨叨 2019年开始了,今年计划写一整年的博客呢~,第一篇博客写一下 一个外包网站的爬虫,万一你从这个外包网站弄点外快呢,呵呵哒 数据分析 官方网址为 https://www.clouderwork.com/ 进入全部项目列表页面...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 10-100
    图虫网-写在前面 经历了一顿噼里啪啦的操作之后,终于我把博客写到了第10篇,后面,慢慢的会涉及到更多的爬虫模块,有人问scrapy 啥时候开始用,这个我预计要在30篇以后了吧,后面的套路依旧慢节奏的,所以莫着急了,100篇呢,预计4~5个...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 18-100
    很高兴我这系列的文章写道第18篇了,今天写一个爬虫爱好者特别喜欢的网站煎蛋网http://jandan.net/ooxx,这个网站其实还是有点意思的,网站很多人写了N多的教程了,各种方式的都有,当然网站本身在爬虫爱好者的不断进攻下,也在...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 20-100
    美好的一天又开始了,今天咱继续爬取IT在线教育类网站,慕课网,这个平台的数据量并不是很多,所以爬取起来还是比较简单的 打开我们要爬取的页面,寻找分页点和查看是否是异步加载的数据。 进行了一些相应的分析,发现并没有异步数据,只需要模...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 47-100
    1. 准备下载软件 介绍一款爬虫辅助工具mitmproxy ,mitmproxy 就是用于MITM的proxy,MITM中间人攻击。说白了就是服务器和客户机中间通讯多增加了一层。跟Fiddler和Charles最大的不同就是,mitmpr...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 54-100
    爬虫背景 爬虫最核心的问题就是解决重复操作,当一件事情可以重复的进行的时候,就可以用爬虫来解决这个问题,今天要实现的一个基本需求是完成“博客园“ 博客的自动评论,其实原理是非常简单的,提炼一下需求 基本需求 登录博客园<不实现,登...
    99+
    2023-01-31
    爬虫 入门教程 Python
  • Python爬虫入门教程 59-100
    图片比对 昨天的博客已经将图片存储到了本地,今天要做的第一件事情,就是需要在两张图片中进行比对,将图片缺口定位出来 缺口图片 完整图片 计算缺口坐标 对比两张图片的所有RBG像素点,得到不一样像素点的x值,即要移动的距离 de...
    99+
    2023-01-31
    爬虫 入门教程 Python
  • Python爬虫入门教程 62-100
    学术搜索 学习理论的知识少不了去检索文献,好多文献为你的实操提供了合理的支撑,我所在的大学内网默认是有知网账户的,非常NICE 今天要完成的网站是 http://ac.scmor.com/ Google学术搜索是一个文献检索服务,目前主...
    99+
    2023-01-31
    爬虫 入门教程 Python
  • Python爬虫入门教程 41-100
    爬前叨叨 从40篇博客开始,我将逐步讲解一下手机APP的爬虫,关于这部分,我们尽量简化博客内容,在这部分中可能涉及到一些逆向,破解的内容,这部分尽量跳过,毕竟它涉及的东西有点复杂,并且偏离了爬虫体系太远,有兴趣的博友,可以一起研究下。 之...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 40-100
    爬前叨叨 第40篇博客吹响号角,爬取博客园博客~本文最终抓取到了从2010年1月1日到2019年1月7日的37W+文章,后面可以分析好多东西了呢 经常看博客的同志知道,博客园每个栏目下面有200页,多了的数据他就不显示了,最多显示4000...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 19-100
    从今天开始的几篇文章,我将就国内目前比较主流的一些在线学习平台数据进行抓取,如果时间充足的情况下,会对他们进行一些简单的分析,好了,平台大概有51CTO学院,CSDN学院,网易云课堂,慕课网等平台,数据统一抓取到mongodb里面,如果...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 21-100
    今天咱们抓取一下网易云课堂的课程数据,这个网站的数据量并不是很大,我们只需要使用requests就可以快速的抓取到这部分数据了。 你第一步要做的是打开全部课程的地址,找出爬虫规律, 地址如下: https://study.163.com...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 45-100
    1. Charles抓取兔儿故事背景介绍 之前已经安装了Charles,接下来我将用两篇博客简单写一下关于Charles的使用,今天抓取一下兔儿故事里面关于小猪佩奇的故事。 爬虫编写起来核心的重点是分析到链接,只要把链接分析到,剩下的就好...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 52-100
    写在前面 关于获取文章自动发送到邮箱,这类需求其实可以写好几个网站,弄完博客园,弄CSDN,弄掘金,弄其他的,网站多的是呢~哈哈 先从博客园开始,基本需求,获取python板块下面的新文章,间隔60分钟发送一次,时间太短估摸着没有多少新博...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 15-100
    石家庄政民互动数据爬取-写在前面 今天,咱抓取一个网站,这个网站呢,涉及的内容就是 网友留言和回复,特别简单,但是网站是gov的。网址为 http://www.sjz.gov.cn/col/1490066682000/index.html...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 25-100
    1. 知乎文章图片写在前面 今天开始尝试爬取一下知乎,看一下这个网站都有什么好玩的内容可以爬取到,可能断断续续会写几篇文章,今天首先爬取最简单的,单一文章的所有回答,爬取这个没有什么难度。 找到我们要爬取的页面,我随便选了一个 https...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 32-100
    1. B站博人传评论数据爬取简介 今天想了半天不知道抓啥,去B站看跳舞的小姐姐,忽然看到了评论,那就抓取一下B站的评论数据,视频动画那么多,也不知道抓取哪个,选了一个博人传跟火影相关的,抓取看看。网址: https://www.bilib...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 36-100
    爬前叨叨 2018年就要结束了,还有4天,就要开始写2019年的教程了,没啥感动的,一年就这么过去了,今天要爬取一个网站叫做酷安,是一个应用商店,大家可以尝试从手机APP爬取,不过爬取APP的博客,我打算在50篇博客之后在写,所以现在就放...
    99+
    2023-01-30
    爬虫 入门教程 Python
  • Python爬虫入门教程 44-100
    1. 第二款抓包工具Charles安装与使用 Charles和Fiddler一样,也是一款抓包工具,比Fiddler界面更加清晰,支持多平台 1.1 官方网址 https://www.charlesproxy.com/ 1.2 下载地址...
    99+
    2023-01-30
    爬虫 入门教程 Python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作