iis服务器助手广告广告
返回顶部
首页 > 资讯 > 精选 >基于pycharm的beautifulsoup4库怎么用
  • 698
分享到

基于pycharm的beautifulsoup4库怎么用

2023-06-26 06:06:47 698人浏览 泡泡鱼
摘要

这篇文章主要为大家展示了“基于PyCharm的beautifulsoup4库怎么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“基于pycharm的beautifulsoup4库怎么用”这篇文章

这篇文章主要为大家展示了“基于PyCharm的beautifulsoup4库怎么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“基于pycharm的beautifulsoup4库怎么用”这篇文章吧。

1.beautifulsoup4库安装

第一步:在控制台输入如下命令,安装beautifulsoup4库。

pip install beautifulsoup4

基于pycharm的beautifulsoup4库怎么用

第二步:在控制台输入如下命令,验证是否成功安装beautifulsoup4库。

基于pycharm的beautifulsoup4库怎么用

第三步:pycharm中,点击file——settings——project——python interpreter——点击+号——搜索beautifulsoup4——install package!

基于pycharm的beautifulsoup4库怎么用

这样就可以在.py文件中导入模块了!

2.beautifulsoup4库使用

import requests# 虽然库名叫做beautiful4 但是在导入时 使用的是其缩写bs4 其中BeautifulSoup是一个类名from bs4 import BeautifulSoupurl = 'https://www.baidu.com/s?'# 由于一般网站都是供用户访问 如果检测到User-Agent是黑客或者其他可能拒绝访问 故此处模拟浏览器headers = {    'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/97.0.4692.71 Safari/537.36'}response = requests.get(url=url, headers=headers)# 以防乱码 此处将其编码设置为utf-8 因为有中文response.encoding = 'utf-8'# print(response.text)# 使用的解析器是html.parser 注意是.奥soup = BeautifulSoup(response.text, 'html.parser')# 打印解析后的结果print(soup.prettify())

需要讲解的都在代码注释中了奥!

3.beautifulsoup4库基本元素

beautifulsoup4库是解析、遍历、维护“标签树”的功能库。

首先来看BeautifulSoup库解析器,前两个比较常用!

基于pycharm的beautifulsoup4库怎么用

再来看BeautifulSoup库的基本元素,可以这样理解,标签树和HTML以及BeautifulSoup是一样的,我们要看HTML的某些内容就使用BeautifulSoup的实例化对象查看即可。

基于pycharm的beautifulsoup4库怎么用

在上述代码的基础上,增加如下几行,结合基本元素的使用,可得到如图所示。

需要注意的是,.string可以跨标签,所以很有可能结果也为注释,为了区分是标签内的字符串还是注释,可以通过打印类型来判断。

基于pycharm的beautifulsoup4库怎么用

总结起来,可如下:

基于pycharm的beautifulsoup4库怎么用

基于pycharm的beautifulsoup4库怎么用

基于pycharm的beautifulsoup4库怎么用

基于pycharm的beautifulsoup4库怎么用

基于pycharm的beautifulsoup4库怎么用

接下来,看一下BeautifulSoup库的遍历,其中画红框的迭代遍历,可以用于for in循环中。

4.beautifulsoup4库的HTML查找方法

find_all( name , attrs , recursive , string , **kwargs )

find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件。

name 参数可以对名字为 name 的标签进行检索。

attrs参数可以对标签属性值为attrs的标签进行检索。

recursive参数表示是否对子孙全部检索,默认是TRUE,如果只想搜索当前节点的儿子信息,可以置其为FALSE。

string 参数可以标签中的字符串内容进行检索。

基于pycharm的beautifulsoup4库怎么用

5.补充JSONjavascript Object Notation)

我们学过js的或者java的,应该对Json不陌生吧!

Json是一种有类型的键值对!

需要注意的是,键和值都需要用"“括起来,如果值是整数,则可以不用”"!

如果值是多值,则可以用[,];如果值是键值对,则可以用{:,:,},可以嵌套使用。

基于pycharm的beautifulsoup4库怎么用

JSON一般用于接口,而YAML是无类型键值对,一般用于配置文件。

以上是“基于pycharm的beautifulsoup4库怎么用”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网精选频道!

--结束END--

本文标题: 基于pycharm的beautifulsoup4库怎么用

本文链接: https://www.lsjlt.com/news/307154.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 基于pycharm的beautifulsoup4库怎么用
    这篇文章主要为大家展示了“基于pycharm的beautifulsoup4库怎么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“基于pycharm的beautifulsoup4库怎么用”这篇文章...
    99+
    2023-06-26
  • 基于pycharm的beautifulsoup4库使用方法教程
    1.beautifulsoup4库安装 第一步:在控制台输入如下命令,安装beautifulsoup4库。 pip install beautifulsoup4 第三步:在py...
    99+
    2024-04-02
  • 如何进行基于pycharm的requests库使用
    本篇文章为大家展示了如何进行基于pycharm的requests库使用,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。requests库安装和导入cmd打开命令行,使用如下命令安装requests库。...
    99+
    2023-06-26
  • 详解基于pycharm的requests库使用教程
    目录requests库安装和导入requests库的get请求requests库的post请求requests库的代理requests库的cookie自动识别验证码requests库...
    99+
    2024-04-02
  • python beautifulsoup4模块怎么用
    本篇内容主要讲解“python beautifulsoup4模块怎么用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python beautifulsoup4模块怎么用”吧!...
    99+
    2023-06-30
  • pycharm怎么使用anaconda的库
    在 pycharm 中使用 anaconda 的库需要以下步骤:安装 anaconda添加 anaconda 解释器到 pycharm激活 anaconda 环境通过 conda ins...
    99+
    2024-04-18
    python pycharm
  • pycharm怎么使用numpy库
    在 pycharm 中使用 numpy 库需要先导入该库,然后创建 numpy 数组,接着执行数组操作,最后可使用可视化工具显示数组数据:导入 numpy 库:在设置中安装 numpy。...
    99+
    2024-04-04
    python pycharm
  • PyCharm的基本使用
    PyCharm是我一直在使用的python编辑器,今天具体讲一下PyCharm的使用。下载首先是下载PyCharm,PyCharm的下载地址:https://www.jetbrains.com/pycharm/这个是一个商业软件,大家可以选...
    99+
    2023-06-02
  • 怎么手写一个基于Proxy的缓存库
    本篇内容主要讲解“怎么手写一个基于Proxy的缓存库”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么手写一个基于Proxy的缓存库”吧!项目演进任何项目都不是...
    99+
    2024-04-02
  • pycharm怎么使用第三方库
    如何在 pycharm 中使用第三方库 在 PyCharm 中使用第三方库的步骤: 1. 安装库 在命令提示符或终端中使用 pip 命令:pip install 库名 在 PyCha...
    99+
    2024-04-18
    python pycharm
  • Python爬虫解析器BeautifulSoup4怎么使用
    这篇文章主要介绍“Python爬虫解析器BeautifulSoup4怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python爬虫解析器BeautifulSoup4怎么使用”文章能帮助大家解...
    99+
    2023-07-02
  • pycharm怎么加入库
    加入步骤:1、打开PyCharm并进入您的项目;2、在PyCharm的底部状态栏中,点击“Terminal”图标,打开终端窗口;3、在终端窗口中,使用pip命令来安装您需要的库;4、安装完成后,在PyCharm中编写代码并导入所需的库即可。...
    99+
    2023-12-09
    pycharm
  • pycharm怎么安装使用numpy pycharm安装numpy库的技巧
    首先点击file下面的settings选项,如下图所示 然后点击project interpreter选项,如下图所示 接着点击最右侧的加号按钮,如下图所示 然后输入numpy,选...
    99+
    2024-05-10
    pycharm
  • pycharm怎么使用pip安装库
    在PyCharm中使用pip安装库,可以按照以下步骤操作:1. 打开PyCharm,打开要安装库的Python项目。2. 在PyCh...
    99+
    2023-09-23
    pycharm
  • pycharm怎么安装库
    pycharm安装库的方法:1、使用PyCharm的Package管理工具,在项目解释器页面搜索需要的库,再对该库进行安装;2、使用PyCharm的命令行工具,打开终端或命令行窗口,输入“pip install [库的名称] ”命令,即可安...
    99+
    2023-12-09
    pycharm
  • 基于Golang怎么实现内存数据库
    今天小编给大家分享一下基于Golang怎么实现内存数据库的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。GO实现内存数据库实现...
    99+
    2023-07-05
  • 基于go语言的agent怎么用
    这篇文章给大家介绍基于go语言的agent怎么用,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。一 介绍     在构建数据库自动化运维系统的时候,数据库服务器上必须要有一个agent来执行...
    99+
    2023-06-04
  • 基于JQuery的Ajax方法怎么用
    这篇文章主要为大家展示了“基于JQuery的Ajax方法怎么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“基于JQuery的Ajax方法怎么用”这篇文章吧。如...
    99+
    2024-04-02
  • Python怎么使用BeautifulSoup4修改网页内容
    这篇文章主要介绍了Python怎么使用BeautifulSoup4修改网页内容的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python怎么使用BeautifulSoup4修改网页内容文章都会有所收获,下面我们...
    99+
    2023-06-30
  • pycharm怎么导入pandas库
    在 pycharm 中导入 pandas 库需要安装它(pip install pandas),重启 pycharm,然后使用 import pandas as pd 导入库。这样您就可...
    99+
    2024-04-25
    python pycharm
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作