iis服务器助手广告
返回顶部
首页 > 资讯 > 后端开发 > Python >在Python中使用requests库爬取数据时返回为空如何解决
  • 600
分享到

在Python中使用requests库爬取数据时返回为空如何解决

2023-06-06 11:06:30 600人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

在python中使用requests库爬取数据时返回为空如何解决?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Python主要用来做什么Python主要应用于:

python中使用requests库爬取数据时返回为空如何解决?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

Python主要用来做什么

Python主要应用于:1、web开发;2、数据科学研究;3、网络爬虫;4、嵌入式应用开发;5、游戏开发;6、桌面应用开发。

html字段:

在Python中使用requests库爬取数据时返回为空如何解决

robots协议:

在Python中使用requests库爬取数据时返回为空如何解决

现在我们开始用python IDLE 爬取

在Python中使用requests库爬取数据时返回为空如何解决

import requestsr = requests.get("https://baike.so.com/doc/24368318-25185095.html")r.status_coder.text

结果分析,我们可以成功访问到该网页,但是得不到网页的结果。被360搜索识别,我们将headers修改。

在Python中使用requests库爬取数据时返回为空如何解决

输出有个小插曲,网页内容很多,我是想将前500个字符输出,第一次格式错了

import requestsheaders = {  'Cookie':'OCSSID=4df0bjva6j7ejussu8al3eqo03',  'User-Agent':'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36'         '(KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',}r = requests.get("Https://baike.so.com/doc/24368318-25185095.html", headers = headers)r.status_coder.text

接着我们对需要的内容进行爬取,用(.find)方法找到我们内容位置,用(.children)下行遍历的方法对内容进行爬取,用(isinstance)方法对内容进行筛选:

import requestsfrom bs4 import BeautifulSoupimport bs4headers = {  'Cookie':'OCSSID=4df0bjva6j7ejussu8al3eqo03',  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'         '(KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',}r = requests.get("https://baike.so.com/doc/24368318-25185095.html", headers = headers)r.status_coder.encoding = r.apparent_encodingsoup = BeautifulSoup(r.text, "html.parser")for tr in soup.find('tbody').children:if isinstance(tr, bs4.element.Tag):tds = tr('td')print([tds[0].string, tds[1].string, tds[2].string])

得到结果如下:

在Python中使用requests库爬取数据时返回为空如何解决

修改输出的数目,我们用Clist列表来存取所有城市的排名,将前20个输出代码如下:

import requestsfrom bs4 import BeautifulSoupimport bs4Clist = list() #存所有城市的列表headers = {  'Cookie':'OCSSID=4df0bjva6j7ejussu8al3eqo03',  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'         '(KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',}r = requests.get("https://baike.so.com/doc/24368318-25185095.html", headers = headers)r.encoding = r.apparent_encoding #将html的编码解码为utf-8格式soup = BeautifulSoup(r.text, "html.parser") #重新排版for tr in soup.find('tbody').children:   #将tbody标签的子列全部读取if isinstance(tr, bs4.element.Tag):  #筛选tb列表,将有内容的筛选出啦  tds = tr('td')  Clist.append([tds[0].string, tds[1].string, tds[2].string])for i in range(21):  print(Clist[i])

最终结果:

在Python中使用requests库爬取数据时返回为空如何解决

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注编程网Python频道,感谢您对编程网的支持。

--结束END--

本文标题: 在Python中使用requests库爬取数据时返回为空如何解决

本文链接: https://www.lsjlt.com/news/246654.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 在Python中使用requests库爬取数据时返回为空如何解决
    在Python中使用requests库爬取数据时返回为空如何解决?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Python主要用来做什么Python主要应用于:...
    99+
    2023-06-06
  • 在Python中使用os.path.exists()函数时返回false如何解决
    在Python中使用os.path.exists()函数时返回false如何解决?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。如下面所示,如果我们用file的readlin...
    99+
    2023-06-14
  • 在android使用PopupWindow时出现返回键消失如何解决
    在android使用PopupWindow时出现返回键消失如何解决?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。preparePopup方法。 public void sh...
    99+
    2023-05-31
    popupwindow android roi
  • 在AOP中使用@Around后无返回值如何解决
    这篇文章给大家介绍在AOP中使用@Around后无返回值如何解决,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。改成如下即可:@Around("point_update()")public ...
    99+
    2023-06-06
  • Vue3中使用reactive时后端有返回数据但dom没有更新如何解决
    本篇内容主要讲解“Vue3中使用reactive时后端有返回数据但dom没有更新如何解决”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Vue3中使用reactive时后端有返回数据但dom没有更...
    99+
    2023-07-05
  • 如何在 Golang 中使用数据库回调函数?
    非常抱歉,由于您没有提供文章标题,我无法为您生成一篇高质量的文章。请您提供文章标题,我将尽快为您生成一篇优质的文章。...
    99+
    2024-05-14
  • python如何使用XPath解析数据爬取起点小说网数据
    小编给大家分享一下python如何使用XPath解析数据爬取起点小说网数据,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!python的数据类型有哪些python的...
    99+
    2023-06-14
  • 如何在Python中使用pandas读取数据
    今天就跟大家聊聊有关如何在Python中使用pandas读取数据,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。一、三种数据文件的读取二、csv、tsv、txt 文件读取1)CSV文件...
    99+
    2023-06-15
  • 如何使用python实现简单爬取网页数据并导入MySQL中的数据库
    前言:要使用 Python 爬取网页数据并将数据导入 MySQL 数据库,您需要使用 Requests 库进行网页抓取,使用 BeautifulSoup 库对抓取到的 HTML 进行解析,并使用 PyMySQL 库与 MySQL 进行交互。...
    99+
    2023-10-18
    python 数据库 爬虫
  • 使用Python循环读取数据时内存不足如何解决
    使用Python循环读取数据时内存不足如何解决?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1.read()与readlines():随手搜索python读写文件的教程,很...
    99+
    2023-06-15
  • 如何在Python中使用实时数据类型?
    Python 是一种非常流行的编程语言,因为它易于上手,语法简单易懂,还有大量的库和工具可供使用。在 Python 中,实时数据类型是一种非常重要的概念,它可以帮助我们处理和分析实时数据流。在本文中,我们将介绍如何在 Python 中使用实...
    99+
    2023-10-23
    对象 实时 数据类型
  • 在 Golang 中保存到 MongoDB 时如何解决空数据值问题?
    在Golang中,保存数据到MongoDB时,经常会遇到空数据值的问题。当某个字段的值为空时,MongoDB默认会将其存储为null。然而,在实际应用中,我们可能更希望将其存储为一个特...
    99+
    2024-02-09
  • 在webview中调用goBack()方法返回时出现刷新闪白如何解决
    在webview中调用goBack()方法返回时出现刷新闪白如何解决?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。问题是:重写了onKeyDown()方法使其goBack(),...
    99+
    2023-05-31
    webview goback()
  • 使用mybatis执行SQL语句时有参数出现返回NULL值如何解决
    今天就跟大家聊聊有关使用mybatis执行SQL语句时有参数出现返回NULL值如何解决,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。原来的写法:<select id=...
    99+
    2023-05-31
    mybatis sql null
  • 如何解决Python语言应用在MySQL数据库中的问题
    这篇文章将为大家详细讲解有关如何解决Python语言应用在MySQL数据库中的问题,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Python语言在广泛的地方都有应用,在长时间的应用中有不少的...
    99+
    2023-06-17
  • 数据库调优中如何解决like ’%str’ 时索引不被使用
    这篇文章将为大家详细讲解有关数据库调优中如何解决like ’%str’ 时索引不被使用,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。索引1.  &...
    99+
    2024-04-02
  • 如何解决使用Kettle抽取数据时出现中文乱码问题
    这篇文章主要介绍如何解决使用Kettle抽取数据时出现中文乱码问题,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完! 数据从oracle抽取到mysql,数...
    99+
    2024-04-02
  • 使用Navicat连接MySql数据库时速度慢如何解决
    使用Navicat连接MySql数据库时速度慢如何解决?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。项目场景:操作MySql数据库问题描述:通过Navicat连接MySql数据...
    99+
    2023-06-06
  • 如何解决使用Hybris Commerce User API读取用户信息时电话字段没有返回问题
    小编给大家分享一下如何解决使用Hybris Commerce User API读取用户信息时电话字段没有返回问题,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!在使用Hybris Commerce User API读取一个u...
    99+
    2023-06-04
  • 在获取数据作为输出时,如何在同一列上使用多个条件?
    以下是我们编写查询的方法,该查询仅返回与同一列上的多个条件匹配的记录通过使用“OR”逻辑运算符众所周知,MySQL 的“OR”运算符比较两个表达式,如果其中一个表达式为 TRUE,则返回 TRUE。以下示例演示了如何对同一列上的多个条件使用...
    99+
    2023-10-22
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作