Pycharm安装scrapy及初始化爬虫项目的完整步骤

2024-04-02 19:04:59 849人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录一）安装scrapy：二）创建一个scrapy爬虫项目：三）开启PyCharm对scrapy框架的调试功能：总结一）安装scrapy： 1、打开cmd命令窗口，输入：pip in

一）安装scrapy：

1、打开cmd命令窗口，输入：pip install Scrapy。

2、安装成功之后会显示下面字符，表示未将scrapy设置到环境变量。

3、配置环境变量：右键我的电脑-->属性-->高级设置--->环境变量---->系统变量中的Path--->编辑--->添加--->将上文中黄色的路径添加到环境变量即可。

4、scrapy安装完毕。

二）创建一个scrapy爬虫项目：

1、创建一个普通的Pycharm项目，然后找到下面的terminal

2、输入命令scrapy startproject 模块名称(可以自己随便起，我以名为mine为例)，成功之后你会发现自己的项目中多了一个mine的包文件。

3、上述操作成功后终端会显示下图文字：此时我们输入cd那条命令。进入目标文件。

4、这时就可以创建爬虫目标文件啦，

输入scrapy genspider 爬取名网站域名

1、爬取名是自己随便起的，比如我要爬百度那么我就可以起名为baidu

2、网站域名就是去掉 https:www. 剩下的部分，以博客园的为例：

网址为：Https://www.cnblogs.com/

域名为 cnblogs.com

2和3操作截图：

5、此时我们会在目录里看见一个新的py文件：里自动生成如下代码：

三）开启pycharm对scrapy框架的调试功能：

由于pycharm没有创建scrapy框架的模块，所以我们想调试scrapy程序时要自己写一个小脚本来开启pycharm对scrapy的调试功能。

1、在与mine包同级条件下创建一个main.py文件：

2、mine文件将一下代码赋值进去：

import os
import sys
 
from scrapy.cmdline import execute
 
sys.path.append(os.path.dirname(os.path.abspath(__file__)))
execute(["scrapy", "crawl", "cnblog"])  # 第三个参数为自己创建的那个爬取的名称

这样就大功告成啦！

总结

到此这篇关于Pycharm安装scrapy及初始化爬虫项目的文章就介绍到这了,更多相关Pycharm安装scrapy初始化爬虫项目内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Pycharm安装scrapy及初始化爬虫项目的完整步骤

本文链接: http://www.lsjlt.com/news/119826.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Pycharm安装scrapy及初始化爬虫项目的完整步骤

目录一）安装scrapy：二）创建一个scrapy爬虫项目：三）开启pycharm对scrapy框架的调试功能：总结一）安装scrapy： 1、打开cmd命令窗口，输入：pip in...

99+

2024-04-02
vuevite之LogicFlow安装核心依赖及项目初始化详解

目录推荐几个好用的工具进入正题1. 初始化项目：2. 安装LogicFlow核心依赖：3. 初始化目录及容器：4. 导入LF核心模块和默认样式文件：5. 声明LF和容器对象并在挂在时...

99+

2023-01-09

vue vite LogicFlow安装 LogicFlow核心依赖
如何在vite初始化项目中安装scss以及scss的使用

目录1.scss安装 2.scss的简单使用 ...

99+

2022-11-13

在vite初始化的项目中安装scss vite安装scss
Python安装及建立虚拟环境的完整步骤

目录前言一、python安装二、建立虚拟环境三、安装jupyter notebook总结前言 Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990 年...

99+

2024-04-02
MySQL的安装步骤以及遇到的常见问题（完整版）

目录前言一、MySQL的卸载 1.1删除C盘上的相关文件（共三个） 1.2删除注册表 1.3删除MySQL80服务二、下载MySQL的安装包 1.1到官网自行下载 1.2直接下载三、安装四、常见问题 1.1安装前必须把相关文件...

99+

2023-10-25

mysql 数据库
MySQL5.7升级MySQL8.0的完整卸载与安装及连接Navicat的步骤

目录1、卸载mysql5.7.241.备份整个数据库文件2.停止MySQL服务3.控制面板卸载程序4.删除系统隐藏文件夹中的相应目录5.清理注册表2、安装MySQL8.0.283、连接Navicat总结1、卸载MySQL...

99+

2023-03-14

mysql5.7升级mysql8 mysql5.7升级到mysql8 mysql5.7升级8.0
在Nginx服务器上安装SSL证书完成HTTPS请求的步骤详解(springboot项目)

目录步骤1：下载证书到本地步骤2：（可选）在Nginx独立服务器上安装证书http本博客是在我完成了http重定向https配置之后来总结的,如有问题请大家见谅!如有问题请评论留言!...

99+

2024-04-02
基于Python的爬虫设计与数据分析（附源码、论文）免费赠送项目完整源码,可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案等

目录摘要 1 绪论 1.1课题背景 1.2研究目的及意义 1.3爬虫技术 1.4django框架介绍 2 1.5论文结构与章节安排 3 2 基于Python的爬虫设计与数据分析分析 4 2....

99+

2023-10-02

python 爬虫数据分析