iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python基础学习14----正则表达
  • 701
分享到

python基础学习14----正则表达

正则基础python 2023-01-30 22:01:35 701人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 在python中正则表达式被封装到了re模块,通过引入re模块来使用

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

python中正则表达式被封装到了re模块,通过引入re模块来使用正则表达式

re模块中有很多正则表达式处理函数,首先用findall函数介绍基本基本字符的含义

元字符有:.  \  *  +  ?  ^  $  |  {}  []  ()

findall函数

遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表

.  匹配任意除换行符"\n"外的字符

import re

temp=re.findall("a.c","abcdefaGCh")
print(temp)#['abc', 'agc']

*  匹配前一个字符0或多次

temp=re.findall("a*b","abcaaaaabcdefb")
print(temp)#['ab', 'aaaaab', 'b']

+  匹配前一个字符1次或无限次

temp=re.findall("a+b","abcaaaaabcdefb")
print(temp)#['ab', 'aaaaab']

?  匹配前一个字符0次或1次

temp=re.findall("a?b","abcaaaaabcdefb")
print(temp)#['ab', 'ab', 'b']

^  匹配字符串开头。在多行模式中匹配每一行的开头

temp=re.findall("^ab","abcaaaaabcdefb")
print(temp)#['ab']

$  匹配字符串末尾,在多行模式中匹配每一行的末尾

temp=re.findall("ab$","abcaaaaabcdefab")
print(temp)#['ab']

|  或。匹配|左右表达式任意一个,从左到右匹配,如果|没有包括在()中,则它的范围是整个正则表达式

temp=re.findall("abc|def","abcdef")
print(temp)#['abc', 'def']

{}  {m}匹配前一个字符m次,{m,n}匹配前一个字符m至n次,若省略n,则匹配m至无限次

temp=re.findall("a{3}","aabaaacaaaad")
print(temp)#['aaa', 'aaa']
temp=re.findall("a{3,5}","aaabaaaabaaaaabaaaaaa")
print(temp)#['aaa', 'aaaa', 'aaaaa', 'aaaaa']在获取了3个a后,若下一个还是a,并不会得到aaa,而是算下一个a

[]  字符集。对应的位置可以是字符集中任意字符。字符集中的字符可以逐个列出,也可以给出范围,如[abc]或[a-c]。[^abc]表示取反,即非abc,所有特殊字符在字符集中都失去其原有的特殊含义。用\反斜杠转义恢复特殊字符的特殊含义。

temp=re.findall("a[bcd]e","abcdefagch")
print(temp)#[]此时bcd为b或c或d
temp=re.findall("a[a-z]c","abcdefagch")
print(temp)#['abc', 'agc']
temp=re.findall("[^a]","aaaaabcdefagch")
print(temp)#['b', 'c', 'd', 'e', 'f', 'g', 'c', 'h']
temp=re.findall("[^ab]","aaaaabcdefagch")
print(temp)#['c', 'd', 'e', 'f', 'g', 'c', 'h']a和b都不会被匹配

()  被括起来的表达式将作为分组,从表达式左边开始每遇到一个分组的左括号“(”,编号+1.分组表达式作为一个整体,可以后接数量词。表达式中的|仅在该组中有效。

temp=re.findall("(abc){2}a(123|456)c","abcabca456c")
print(temp)#[('abc', '456')]
temp=re.findall("(abc){2}a(123|456)c","abcabca456cbbabcabca456c")
print(temp)#[('abc', '456'), ('abc', '456')]
#这里有()的情况中,findall会将该规则的每个()中匹配到的字符创放到一个元组中

要想看到被完全匹配的内容,我们可以使用一个新的函数search函数

search函数

在字符串内查找模式匹配,只要找到第一个匹配然后返回,如果字符串没有匹配,则返回None

 

temp=re.search("(abc){2}a(123|456)c","abcabca456c")
print(temp)#<re.Match object; span=(0, 11), match='abcabca456c'>
print(temp.group())#abcabca456c

 

\  转义字符,使后一个字符改变原来的意思

反斜杠后边跟元字符去除特殊功能;(即将特殊字符转义成普通字符)

temp=re.search("a\$","abcabca456ca$")
print(temp)#<<re.Match object; span=(11, 13), match='a$'>
print(temp.group())#a$

引用序号对应的字组所匹配的字符串。

即下面的\2为前边第二个括号中的内容,2代表第几个,从1开始

a=re.search(r'(abc)(def)gh\2','abcdefghabc abcdefghdef').group()
print(a)#abcdefghdef

反斜杠后边跟普通字符实现特殊功能;(即预定义字符)  

预定义字符有:\d \D \s \S \w \W \A \Z \b \B

预定义字符在字符集中仍有作用

\d  数字:[0-9]

temp=re.search("a\d+b","aaa234bbb")
print(temp.group())#a234b

\D  非数字:[^\d]

\s  匹配任何空白字符:[<空格>\t\r\n\f\v]

temp=re.search("a\s+b","aaa   bbb")
print(temp.group())#a   b

\S  非空白字符:[^\s]

\w  匹配包括下划线在内的任何字字符:[A-Za-z0-9_]

\W  匹配非字母字符,即匹配特殊字符

temp=re.search("\W","$")
print(temp.group())#$

\A  仅匹配字符串开头,同^

\Z  仅匹配字符串结尾,同$

\b  匹配\w和\W之间的边界

temp=re.search(r"\bas\b","a as$d")
print(temp.group())#$as

\B  [^\b]

下面介绍其他的re常用函数

compile函数

编译正则表达式模式,返回一个对象的模式

 

rule = re.compile("abc\d+\w")
str = "aaaabc6def"
temp = rule.findall(str)
print(temp)#['abc6d']

 

match函数

在字符串刚开始的位置匹配,和^功能相同

 

temp=re.match("asd","asdfasd")
print(temp.group())#asd

 

 

 finditer函数

将所有匹配到的字符串以match对象的形式按顺序放到一个迭代器中返回

 

temp=re.finditer("\d+","as11d22f33a44sd")
print(temp)#<callable_iterator object at 0x00000242EEEE9E48>
for i in temp:
    print(i.group())
#11
#22
#33
#44

 

split函数

用于分割字符串,将分割后的字符串放到一个列表中返回

如果在字符串的首或尾分割,将会出现一个空字符串

 

temp=re.split("\d+","as11d22f33a44sd55")
print(temp)#['as', 'd', 'f', 'a', 'sd', '']

 

使用字符集分割

如下先以a分割,再将分割后的字符串们以b分割,所以会出现3个空字符串

temp=re.split("[ab]","ab123b456ba789b0")
print(temp)#['', '', '123', '456', '', '789', '0']

sub函数 

将re匹配到的部分进行替换再返回新的字符串

temp=re.sub("\d+","_","ab123b456ba789b0")
print(temp)#ab_b_ba_b_

后边还可以再加一个参数表示替换次数,默认为0表示全替换

subn函数

将re匹配到的部分进行替换再返回一个装有新字符串和替换次数的元组

 

temp=re.subn("\d+","_","ab123b456ba789b0")
print(temp)#('ab_b_ba_b_', 4)

 

 

然后讲一下特殊分组

temp=re.search("(?P<number>\d+)(?P<letter>[a-zA-Z])","ab123b456ba789b0")
print(temp.group("number"))#123
print(temp.group("letter"))#b

以?P<name>的形式起名

temp=re.search("(?P<number>\d+)(?P<letter>[a-zA-Z]+)(?P=number)","ab123b123ba789b7789")
print(temp.group())#123b123

注意这里?P=number的两个分组必须匹配的一模一样,不只是规则一样,而是内容都一样

 

 最后说一下惰性匹配和贪婪匹配

temp=re.search("\d+","123456")
print(temp.group())#123456

此时为贪婪匹配,即只要符合就匹配到底

temp=re.search("\d+?","123456")
print(temp.group())#1

在后面加一个?变为惰性匹配,即只要匹配成功一个字符就结束匹配 

 

参考https://www.cnblogs.com/tina-Python/p/5508402.html

 

--结束END--

本文标题: python基础学习14----正则表达

本文链接: https://www.lsjlt.com/news/179569.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python基础学习14----正则表达
    正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 在python中正则表达式被封装到了re模块,通过引入re模块来使用...
    99+
    2023-01-30
    正则 基础 python
  • 正则表达式基础学习一文入门
    目录正则表达式是什么元字符贪婪匹配、非贪婪匹配和独占模式分组和引用四种匹配模式断言常用正则Demo正则表达式是什么 校验数据的有效性、查找符合要求的文本以及对文本进行切割和替换等操...
    99+
    2023-03-23
    正则表达式基础 正则表达式入门
  • python学习--正则表达式
    正则表达式是一种用来匹配字符串的强有力的工具它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。Python支持的正则表达式元字符和语法:语法说明实例完整匹配的字...
    99+
    2023-01-31
    正则表达式 python
  • Python re正则表达式学习
    一、re.match re.match 尝试从字符串的开始匹配一个模式,如:下面的例子匹配第一个单词。 import re   text = "JGood is a handsome boy, he is cool, c...
    99+
    2023-01-31
    正则表达式 Python
  • python re 正则表达式学习总结
    # -*- coding: utf-8 -*- import re import os #------------------------------------- re(正则表达式)模块 ------------------------...
    99+
    2023-01-31
    正则表达式 python
  • 【Java 基础篇】Java 正则表达式
    文章目录 导言一、正则表达式的基本概念二、使用正则表达式的步骤三、示例代码1. 匹配字符串2. 提取匹配的内容3. 替换字符串 总结 导言 正则表达式是一种强大的文本模式匹配工具...
    99+
    2023-09-18
    java 正则表达式 python
  • Python正则表达式基础知识有哪些
    本篇内容主要讲解“Python正则表达式基础知识有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python正则表达式基础知识有哪些”吧!1. 什么是正则表达式正则表达式(Regular E...
    99+
    2023-06-21
  • 正则表达式基础与常用验证表达式
    目录一、正则元字符1、 字符元字符2、重复元字符(量词)3、定位元字符4、分组和替换字符5、特殊字符6、需要转义的字符7、贪婪与非贪婪匹配8、常见正则表达式二、正则表达式应用举例1、...
    99+
    2024-04-02
  • Python 正则表达式基础知识点及实例
    1. 什么是正则表达式 正则表达式(Regular Expressions),也称为 “regex” 或 “regexp” 是使用单个字符串来描述、匹配一系列匹配某个句法规则的字符...
    99+
    2024-04-02
  • Golang 正则表达式学习与实践
    答案:go 语言的正则表达式功能强大,语法遵循 perl 变体,包括元字符、量词、字符组、分组,可用于模式匹配。实战案例:验证电子邮件地址:使用正则表达式验证电子邮件地址是否有效。替换字...
    99+
    2024-04-08
    golang 正则表达式
  • javascript学习笔记(五)正则表达式
    常用到的元字符有: •. 查找单个字符,除了换行和行结束符; •\w 匹配字母、汉字、数字、下划线等符号; •\s 匹配空白符(包含空格、制表符等...
    99+
    2022-11-21
    正则表达式
  • 【Java基础】Java正则表达式的使用
    文章目录 一、正则表达式规则1.字符类(只匹配一个字符)2.预定义字符(只匹配一个字符)3.数量词 二、使用方法三、例题演示 一、正则表达式规则 1.字符类(只匹配一个字符) [a...
    99+
    2023-09-29
    正则表达式 java jvm
  • 正则表达式基础命令有哪些
    这期内容当中小编将会给大家带来有关正则表达式基础命令有哪些,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。我们在工作中经常会用到正则表达式,下面为大家整理了一下常用的命令。正则字符的简要说明“^” : ^会...
    99+
    2023-06-28
  • Java正则表达式基础语法详解
    目录什么是正则表达式?字符范围匹配:元字符:多次重复匹配:定位匹配:总结什么是正则表达式? 1、正则表达式是检擦、匹配字符串的表达式 2、正则表达式是描述规则,主流语言都有良好支持...
    99+
    2024-04-02
  • Python语法学习之正则表达式怎么使用
    这篇文章主要介绍“Python语法学习之正则表达式怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python语法学习之正则表达式怎么使用”文章能帮助大家解决问题。要想成功的进行字符串的匹配需...
    99+
    2023-06-30
  • 怎么学好Python正则表达式
    这篇文章主要讲解了“怎么学好Python正则表达式”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么学好Python正则表达式...
    99+
    2024-04-02
  • Python正则表达式基本原理
    目录⭐️正则表达式  正则表达式是什么?🌟1.实例引入🌟2.match()✨匹配目标✨贪婪匹配🌟3.findall()🌟常用符号🌟特殊字符🌟总结⭐️正则表达式&n...
    99+
    2023-05-15
    Python正则表达式原理 Python正则表达式
  • WEB安全之PHP基础(九):正则表达式
    WEB安全之PHP基础(九):正则表达式 正则表达式正则表达式简介正则表达式的基本语法边界限制重复匹配模式选择符模式单元特殊字符模式匹配的顺序元字符表 正则表达式 正则表达式简介...
    99+
    2023-09-12
    php 正则表达式 开发语言
  • Java正则表达式基础语法是什么
    Java正则表达式基础语法如下: 普通字符:普通字符包括大小写字母、数字和一些特殊字符,例如"abc123"。...
    99+
    2024-03-08
    java
  • 正则表达式基础知识点有哪些
    这篇“正则表达式基础知识点有哪些”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“正则表达式基础知识点有哪些”文章吧。正则表达式...
    99+
    2023-07-05
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作