iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python基础教程之正则表达式基本语法以及re模块
  • 301
分享到

Python基础教程之正则表达式基本语法以及re模块

语法基础教程模块 2022-06-04 19:06:08 301人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

什么是正则: 正则表达式是可以匹配文本片段的模式。 正则表达式'python'可以匹配'Python' 正则是个很牛逼的东西,python中当然也不会缺少。 所以今天的Python就跟大家一起讨论一下

什么是正则:

正则表达式是可以匹配文本片段的模式。

正则表达式'python'可以匹配'Python'

正则是个很牛逼的东西,python中当然也不会缺少。

所以今天的Python就跟大家一起讨论一下python中的re模块。

re模块包含对正则表达式的支持。

通配符

.表示匹配任何字符:

‘.ython'可以匹配'python'和'fython'

对特殊字符进行转义:

‘python.org'匹配‘python.org'

字符集

‘[pj]ython'能够匹配'python'和'jython'

反转字符集

‘[^abc]'可以匹配除了abc之外的任何字符

选择符

使用管道符号|

可选项

加上问好就变为了可选项:

r'(Http://)?(www.)?python.org‘只能匹配下面几种:

'http://www.python.org'
'http://python.org'
'www.python.org'
'python.org'

重复子模式

*:允许模式重复0次或多次
+:允许模式重复1次或多次
{m, n}允许模式重复m-n次

当然,正则语法规则很多,远不止上面的这些。但是我们只能点到为止了,因为这篇博客的目的是介绍Python中的模块,re模块。

re 模块使 Python 语言拥有全部的正则表达式功能。

compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。

re中重要的函数:

compile(pattern[, flags]) 根据包含正则表达式的字符串创建模式对象

search(pattern, string[, flags]) 在字符串中寻找模式

match(pattern, string[, flags]) 在字符串的开始处匹配模式

split(pattern, string[, maxsplit=0]) 根据匹配项分割字符串

findall(pattern, string) 列出字符串中模式的所有匹配项

sub(pat, rep, string[, count=0]) 字符串中所有pat的匹配项用repl替换

escape(string) 将字符串中所有特殊表达式字符转义

下面就进行简单的应用:

使用match


import re
print(re.match('www', 'www.runoob.com').span()) # 在起始位置匹配
print(re.match('com', 'www.runoob.com')) # 不在起始位置匹配

使用search


import re
print(re.search('www', 'www.runoob.com').span()) # 在起始位置匹配
print(re.search('com', 'www.runoob.com').span()) # 不在起始位置匹配

这时候需要停一下,match和search的区别呢?

看看结果先:

match例子中结果:

(0, 3)
None

search例子中结果:

(0, 3)
(11, 14)

match()函数只检测RE是不是在string的开始位置匹配,search()会扫描整个string查找匹配;
也就是说match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回none。

search()会扫描整个字符串并返回第一个成功的匹配。

使用sub

Python 的re模块提供了re.sub用于替换字符串中的匹配项。


#!/usr/bin/python
import re
phone = "2004-959-559 # This is Phone Number"
# Delete Python-style comments
num = re.sub(r'#.*$', "", phone)
print "Phone Num : ", num
# Remove anything other than digits
num = re.sub(r'D', "", phone) 
print "Phone Num : ", num

结果:

Phone Num : 2004-959-559
Phone Num : 2004959559

最后献上菊花:

^ 匹配字符串的开头
$ 匹配字符串的末尾。
. 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。
[...] 用来表示一组字符,单独列出:[amk] 匹配 'a','m'或'k'
[^...] 不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
re* 匹配0个或多个的表达式。
re+ 匹配1个或多个的表达式。
re? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
re{ n}
re{ n,} 精确匹配n个前面表达式。
re{ n, m} 匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a| b 匹配a或b
(re) G匹配括号内的表达式,也表示一个组
(?imx) 正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中的区域。
(?-imx) 正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
(?: re) 类似 (...), 但是不表示一个组
(?imx: re) 在括号中使用i, m, 或 x 可选标志
(?-imx: re) 在括号中不使用i, m, 或 x 可选标志
(?#...) 注释.
(?= re) 前向肯定界定符。如果所含正则表达式,以 ... 表示,在当前位置成功匹配时成功,否则失败。但一旦所含表达式已经尝试,匹配引擎根本没有提高;模式的剩余部分还要尝试界定符的右边。
(?! re) 前向否定界定符。与肯定界定符相反;当所含表达式不能在字符串当前位置匹配时成功
(?> re) 匹配的独立模式,省去回溯。
w 匹配字母数字
W 匹配非字母数字
s 匹配任意空白字符,等价于 [tnrf].
S 匹配任意非空字符
d 匹配任意数字,等价于 [0-9].
D 匹配任意非数字
A 匹配字符串开始
Z 匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串。c
z 匹配字符串结束
G 匹配最后匹配完成的位置。
b 匹配一个单词边界,也就是指单词和空格间的位置。例如, 'erb' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
B 匹配非单词边界。'erB' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
n, t, 等. 匹配一个换行符。匹配一个制表符。等
1...9 匹配第n个分组的子表达式。
10 匹配第n个分组的子表达式,如果它经匹配。否则指的是八进制字符码的表达式。

re的正则表达式语法

正则表达式语法表如下:

语法 意义 说明 "." 任意字符
"^" 字符串开始 '^hello'匹配'helloworld'而不匹配'aaaahellobbb' "$" 字符串结尾 与上同理 "*"
0 个或多个字符(贪婪匹配)
<*>匹配 "+"
1 个或多个字符(贪婪匹配)
与上同理
"?"
0 个或多个字符(贪婪匹配)
与上同理
*?,+?,??
以上三个取第一个匹配结果(非贪婪匹配) <*>匹配

--结束END--

本文标题: Python基础教程之正则表达式基本语法以及re模块

本文链接: https://www.lsjlt.com/news/15148.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python模块之re(正则表达式)
    匹配模式 re.ASCII同re.A,对应的内联标识为(a),用于向后兼容。使元字符\w, \W, \b, \B, \d, \D, \s和\S仅匹配ASCII字符。该模式只在string模式下有意义,在byte模式下将被忽略。 re.DE...
    99+
    2023-01-31
    模块 正则表达式 python
  • python--模块之re正则表达式
    简介: 正则表达式本身是一个小型的、高度专业化的编程语言,而在python中,通过内嵌集成re模块,我们可以通过直接调用来实现正则匹配。 正则表达式基础知识: --普通字符匹配自身 abc ----abc --元字符 . :匹...
    99+
    2023-01-30
    模块 正则表达式 python
  • 关于Python正则表达式模块之re模块
    目录前言:导入模块1.re.match() 函数(1)匹配单个字符(2)匹配多个字符 字符功能/说明位置*(3) 匹配开头和结尾2.re.search() 函数3.re.findal...
    99+
    2023-05-16
    Python正则表达式 Pythonre模块
  • Python正则表达式re模块讲解以及其案例举例
    目录一、re模块简介二、正则表达式的基本概念1、正则表达式的语法介绍:2、Python中的正则表达式模块3、re模块的部分方法三、正则表达式使用的实例总结一、re模块简介 Pytho...
    99+
    2024-04-02
  • js正则表达式基本语法
    正则表达式是一种用来匹配字符串的模式。下面是一些常用的正则表达式基本语法:1. 字面量语法:将正则表达式包含在两个斜杠之间,例如 `...
    99+
    2023-08-15
    Js
  • 正则表达式基本语法详解
    正则表达式是一种描述字符串模式的方法,可以用来匹配、查找和替换字符串。它是一种强大而灵活的工具,在文本处理和模式匹配中广泛应用。正则...
    99+
    2023-08-15
    正则表达式
  • Java正则表达式基础语法详解
    目录什么是正则表达式?字符范围匹配:元字符:多次重复匹配:定位匹配:总结什么是正则表达式? 1、正则表达式是检擦、匹配字符串的表达式 2、正则表达式是描述规则,主流语言都有良好支持...
    99+
    2024-04-02
  • python正则表达式re.search()的基本使用教程
    1 re.search() 的作用: re.search会匹配整个字符串,并返回第一个成功的匹配。如果匹配失败,则返回None  从源码里面可以看到re.search()方...
    99+
    2024-04-02
  • Python正则表达式的基本用法
    本篇内容介绍了“Python正则表达式的基本用法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!正则表达式中特殊的符号:“.” 表任意字符“^...
    99+
    2023-06-17
  • 一文搞懂正则表达式基础语法以及如何应用
    目录一、正则表达式1、基本介绍2、正则表达式语法二、正则语法1、字符匹配符、选择匹配符2、限定符3、定位符4、分组三、常用类1、基本介绍2、分组、捕获、反向引用3、String 类中...
    99+
    2024-04-02
  • Java正则表达式基础语法是什么
    Java正则表达式基础语法如下: 普通字符:普通字符包括大小写字母、数字和一些特殊字符,例如"abc123"。...
    99+
    2024-03-08
    java
  • 正则表达式基本语法是什么
    正则表达式是一种用于匹配字符串模式的工具,它由普通字符(例如字母、数字和符号)和特殊字符(称为元字符)组成。正则表达式的基本语法包括...
    99+
    2024-03-06
    正则表达式
  • Python 正则表达式基础知识点及实例
    1. 什么是正则表达式 正则表达式(Regular Expressions),也称为 “regex” 或 “regexp” 是使用单个字符串来描述、匹配一系列匹配某个句法规则的字符...
    99+
    2024-04-02
  • js正则表达式基本语法是什么
    JavaScript中正则表达式的基本语法如下:1. 字面量形式(常用):使用斜杠`/`将正则表达式包裹起来,例如`/pattern...
    99+
    2023-08-16
    js
  • 正则表达式的基本语法汇总篇(推荐!)
    目录1.正则表达式的基本语法1.1两个特殊符号 ‘^’ 和 ‘$’1.2 出现次数的表示符号 * + ?1.3 指定出现次数的范围 {...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作