广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python操作lxml库实战之Xpath篇
  • 567
分享到

Python操作lxml库实战之Xpath篇

python lxml xpathpython lxmlpython操作lxml 2022-12-23 12:12:00 567人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

目录​一、Xpath概述1、Xpath简介2、 Xpath的安装二、Xpath的常用规则1、路径查找2、节点查找3、未知节点4、获取节点中的文本5、选取多个路径总结​一、X

​一、Xpath概述

1、Xpath简介

Xpath(XML Path Language) 是一门在 XML 文档中查找信息的语言,可以用来在XML文档中对元素和属性进行遍历。XPath 用于在 XML 文档中通过元素和属性进行导航。其是一种路径语言(XML Path Language),用来确定XML文档中某部分的位置。

XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointerXSL间的语法模型。但是XPath很快的被开发者采用来当作小型*查询语言被广泛使用。

2、 Xpath的安装

Xpath只是 lxml 库中的一个模块,想要使用 Xpath 那么就需要安装 lxml 库

pip install lxml

二、Xpath的常用规则

1、路径查找

Xpath 的主要语法

2、节点查找

查找节点的一些语法

3、未知节点

当我们匹配时会出现路径不确定的情况,这个时候我们就要涉及到匹配未知节点。匹配未知节点也有对应的语法。

4、获取节点中的文本

通过 属性方法可以获取属性内的内容,但是位于节点之间的内容无法获取到,这个时候就可以通过 text() 与 string() 方法来获得其中的文本。

通过 text() 获取某个节点中的文本

In [1]: page.xpath('//li/a[3]/text()')
Out[1]: ['霸道总裁爱上我', '斗罗大陆']
#通过 text() 属性可以很轻松的获取标签之间的文本。

通过 string() 获取某个节点中的文本

In [1]: page.xpath('string(//li[1]/a[3])')
Out[1]: '霸道总裁爱上我'

5、选取多个路径

需要同时查找多个条件时可以通过在路径表达式中使用管道符("|"),选取若干个路径

In [1]: page.xpath('XXXXXXX | XXXXXXXtext()')
Out[1]: ['']

总结

到此这篇关于python操作lxml库实战之Xpath篇的文章就介绍到这了,更多相关Python操作lxml库Xpath篇内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python操作lxml库实战之Xpath篇

本文链接: https://www.lsjlt.com/news/175656.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作