广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python中常见的5种框架解读
  • 437
分享到

python中常见的5种框架解读

python常见框架python框架python常见框架解读 2022-12-19 09:12:23 437人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

目录python常见的框架有哪些1.scrapy框架2.crawley框架3.portia框架4.newspaper框架5.Python-Goose框架总结python常见的框架有哪

python常见的框架有哪些

1.scrapy框架

scrapy框架是一套比较成熟的python爬虫框架,是使用python开发的快速、高层次的信息爬取框架,可以高效率地爬取WEB页面并提取出我们关注的结构化数据。

scrapy框架的应用领域有许多,比如网络爬虫数据挖掘、数据监测、自动化测试等。

scrapy框架是一套开源的框架,开源也就意味着我们能够看到并且免费试用scrapy的所有代码。

2.crawley框架

crawley也是使用python开发出来的一款爬虫框架,该框架致力于改变人们从互联网中提取数据的方式,让大家可以更高效地从互联网中爬取对应内容。

crawley框架的主要特点有:

  • 1>高速爬取对应网站内容
  • 2> 可以将爬取到内容轻松地存储到数据库中,比如:postgres,Mysqloraclesqlite等数据库
  • 3>可以将爬取到的数据导出为JSON,xml等格式
  • 4>支持非关系型数据库,比如:mongoDB,couchdb等
  • 5>支持使用命令行工具
  • 6>可以使用你喜欢的工具提取数据,比如使用xpath或者pyquery等工具
  • 7>支持使用cookie登陆并访问哪些只有登陆才能够访问的网页
  • 8>简单易学

3.portia框架

portia框架是一款允许没有任何编程基础的用户可视化地爬取网页的爬虫框架,给出你要爬取的网页中感兴趣的数据内容,通过portia框架,可以将你所需要的信息从相似的网页中自动提取出来,如果需要,可以子啊GitHub上的主页进行获取。

如果需要,上百度自己查吧,具体的我就不写了。

4.newspaper框架

newspaper框架是一种用来提取新闻、文章以及内容分析的python爬虫框架。

更准确地说,newspaper是一个python的库,只不过这个库是由第三方开发的,可以归为一种框架。

newspaper框架在的主要特点:

  • 1>比较简单
  • 2>速度比较快
  • 3>支持多线程
  • 4>支持十多种语言

由此我们可以知道newspaper框架是轻量级框架,并且就爬取文章信息这一功能来说,使用起来很方便

5.Python-goose框架

coose本来是一款用java写的文章提取工具,Xavier Grangier用python重写了goose,并将重写后goose命名为python-goose。

所以,python-coose框架实现的功能同样是进行文章提取。

总结

以上是python常用的5种框架,这是我知道,如果各位大神,还有其他的 ,也可以留言,相互沟通,学习

另外后面3种框架可以再github上找到。希望能给大家一个参考,也希望大家多多支持编程网。

--结束END--

本文标题: python中常见的5种框架解读

本文链接: https://www.lsjlt.com/news/175196.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作