广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >C++使用正则表达式的详细教程
  • 109
分享到

C++使用正则表达式的详细教程

2024-04-02 19:04:59 109人浏览 薄情痞子
摘要

目录正则表达式RE库组件正则表达式的使用regex迭代器类型smatch相关操作子表达式子表达式用于数据验证子匹配操作regex_replace总结 正则表达式 正则表达式

正则表达式

正则表达式(regular expression)是一种描述字符序列的方法,是一种极其强大的计算工具

c++正则表达式库(RE库)定义在<regex>中,它包含多个组件。

RE库组件

 解释
regex表示有一个正则表达式的类
regex_match将一个字符序列与一个正则表达式匹配
regex_search寻找第一个与正则表达式匹配的子序列
regex_replace使用给定格式替换一个正则表达式
sregex_iterator迭代器适配器,调用regex_search来遍历一个string中所有匹配的子串
smatch容器类,保存在string中搜索的结果
ssub_matchstring中匹配的子表达式的结果

正则表达式的使用

#include <regex>
void test()
{
    //查找不是在字符c之后的ei组合存在的单词
	string pattern("[^c]ei");
	pattern = "[[:alpha:]]*" + pattern + "[[:alpha:]]*";
	regex r(pattern);
	smatch results;
	string test_str("receipt freind theif receive");
	if (regex_search(test_str, results, r))
		cout << results.str() << endl;//freind
}

regex迭代器类型

上面的程序只能查找第一个匹配到的单词,如果想获得所有匹配,可以使用sregex_iterator

for (sregex_iterator it(test_str.begin(),test_str.end(),r), end_it;it != end_it;++it) {
		cout << it->str() << endl;
}

输出:

freind
theif

for循环中定义了两个迭代器,it负责寻找匹配的单词,end_it是一个空迭代器,起到尾后迭代器的作用。

解引用迭代器会得到一个匹配结果的smatch对象。

除了得到匹配的smatch对象以外,还可以得到其上下文。

for (sregex_iterator it(test_str.begin(),test_str.end(),r), end_it;it != end_it;++it) {
	auto pos = it->prefix().length();
	pos = pos > 40 ? pos - 40 : 0;
	cout << it->prefix().str().substr(pos)
		<< "[ " << it->str() << " ]"
		<< it->suffix().str().substr(0, 40)
		<< endl;
}

输出:

receipt [ freind ] theif receive
 [ theif ] receive

使用prefix和suffix函数可以得到匹配之前和之后的ssub_match对象。

smatch相关操作

 解释
m.ready()若已通过regex_search或regex_match设置了m,则返回true;否则返回false
m.size()如果匹配失败,返回0;否则返回最近一次匹配的正则表达式中子表达式的数目
m.empty()若m.size()==0,返回true
m.prefix()一个ssub_match对象,表示当前匹配之前的序列
m.suffix()一个ssub_match对象,表示当前匹配之后的部分
m.fORMat()格式化输出
m.length(n)第n个匹配的子表达式的大小
m.position(n)第n个子表达式距序列开始的距离
m.str(n)第n个子表达式匹配的string
m[n]对应第n个子表达式的ssub_match对象
m.begin(),m.end()m中sub_match元素范围的迭代器
m.cbegin(),m.cend()m中sub_match元素范围的常量迭代器

这些操作也适用于cmatch、wsmatch、wcmatch和对应的子匹配对象。

子表达式

正则表达式中的模式通常包含一个或多个子表达式(subexpression)。

一个子表达式是模式的一部分,本身也具有意义。

正则表达式语法同常用小括号表示子表达式。

eg: 可以使用子表达式来匹配文件扩展名

regex r("([[:alnum:]]+)\\.(cpp|cxx|cc)$");

现在模式中有两个小括号表示的子表达式:

  • ([[:alnum:]]+) 匹配一个或多个数字字母序列
  • (cpp|cxx|cc) 匹配cpp或cxx或cc等扩展名

通过使用str(n)来打印子表达式

if (regex_search(filename, results, r))
		cout << results.str(1) << endl;//打印第一个子表达式

参数0代表整个对应的匹配,参数1表示第一个子表达式。

如,foo.cpp中,results.str(0)将保存foo.cpp,results.str(1)将保存foo。

子表达式用于数据验证

子表达式的一个常见用途是验证必须匹配特定格式的数据。

eg:匹配联通号码

中国联通号段:130、131、132、145、155、156、166、175、176、185、186、196

使用开源工具Regulex实现正则表达式设计可视化

void test02()
{
	//匹配联通号码
	string UnicomNumber("\\b(1)(3[0-2]|[4578]5|[5-9]6)(\\d{4})(\\d{4})\\b");
	regex r(UnicomNumber);
	string testNumbers("130123456789 23112345678 7602125 1320000 16512345678 14512345678 17612345678");
	for (sregex_iterator it(testNumbers.begin(), testNumbers.end(), r), end_it;it != end_it;++it) {
		cout << it->str() << endl;	
	}
}

结果:

1451234567817612345678

解释:

在模式UnicomNumber中,有4个子表达式

子表达式索引子表达式含义
子表达式1(1)匹配1
子表达式2(3[0-2]|[4578]5|[5-9]6)匹配30/31/32/45/55/75/85/56/66/76/86/96
子表达式3(\d{4})匹配任意4个数字
子表达式4(\d{4})匹配任意4个数字

此外,"\b"匹配单词边界,可以理解为空格与单词的分界线。"\d"匹配任意数字。[]内表示多选一,{n}表示匹配n个,子表达式内"|"表示或。

并且,在正则表达式语法中"\“具有转义作用,在C++中也有转义作用,因此,为了得到正则表达式中的”\",需要在string中额外加一个"\"。所以我们的表达式中会有"\\b"和"\\d"。

在正则匹配过程中,迭代器查找每一个号码,进行分析

号码分析
130123456789多了一位数字,单词边界匹配失败
23112345678子表达式1匹配失败
7602125子表达式1匹配失败
1320000子表达式3匹配失败(或者说是边界匹配失败?)
16512345678子表达式2匹配失败
14512345678匹配成功
17612345678匹配成功

子匹配操作

ssub_match的相关操作

 解释
matched一个public bool成员,指出此ssub_match是否匹配了
first,secondpublic数据成员,指向匹配序列首元素和尾后迭代器
length()匹配的大小
str()匹配的string
s = ssub将ssub_match对象转化为string对象

添加一段代码,测试一下matched成员

for (sregex_iterator it(testNumbers.begin(), testNumbers.end(), r), end_it;it != end_it;++it) {
	cout << it->str() << endl;	
	cout << "\t" << (*it)[4].matched << endl;
}

结果

14512345678
        1
17612345678
        1

这里的matched为true表示匹配到了,当然,UnicomNumber的子表达式并非是可选匹配的(用"?"跟在一个表达式后表示可以有1个或0个该表达式),所以它的四个子表达式全部匹配到了,若是可选表达式,可能会出现matched为false的情况。

regex_replace

正则表达式不仅用在查找给定序列方面,当我们想将查找到的序列替换为另一个序列时,可使用regex_replace。

eg:格式化输出电话号码

void test03()
{
	string UnicomNumber("\\b(1)(3[0-2]|[4578]5|[5-9]6)(\\d{4})(\\d{4})\\b");
	regex r(UnicomNumber);
	string fmt = "$1$2 $3 $4";
	string number = "14512345678";
	cout << regex_replace(number,r,fmt) << endl;
}

结果:

145 1234 5678

解释:

使用"$"后跟子表达式的索引号来表示一个特定的子表达式。

在"$1$2 $3 $4"中,希望子表达式1和2在一起,跟子表达式3和4之间都使用空格(" ")隔开。

参考资料

《C++ Primer 第5版》

总结 

到此这篇关于C++使用正则表达式的文章就介绍到这了,更多相关C++正则表达式使用内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: C++使用正则表达式的详细教程

本文链接: https://www.lsjlt.com/news/149816.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • C++使用正则表达式的详细教程
    目录正则表达式RE库组件正则表达式的使用regex迭代器类型smatch相关操作子表达式子表达式用于数据验证子匹配操作regex_replace总结 正则表达式 正则表达式...
    99+
    2022-11-13
  • Python正则表达式保姆式教学详细教程
    目录一、re模块1.导入re模块2.findall()的语法:二、正则表达式1.普通字符2.元字符(二)正则的使用1.编译正则2.正则对象的使用方法3.Match object 的操...
    99+
    2022-11-12
  • Python正则表达式的使用教程
    这篇文章主要介绍“Python正则表达式的使用教程”,在日常操作中,相信很多人在Python正则表达式的使用教程问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python正则表达式的使用教程”的疑惑有所帮助!...
    99+
    2023-06-16
  • C#使用正则表达式
    一.正则基础 1. []方括号表示匹配可以匹配方括号中的任意点单个字符,方括号只允许匹配单个字符。2. | 或表示两项之间的一个选择,它不能和方括号使用,只能和小括号使用。3. ()...
    99+
    2022-11-13
  • C++ 正则表达式的应用详解
    目录一、为什么要学正则表达式C++string处理:二、正则程序库(regex)正则文法:正则库:匹配(Match)搜索(Search)替换(Replace)一、为什么要学正则表达式...
    99+
    2022-11-12
  • C#正则表达式Regex用法详解
    目录一、正则表达式应用举例1、C#校验合法性:2、C#限制输入3、正则表达式匹配闭合HTML标签(支持嵌套)1、分组构造2、举例:二、.Net正则表达式测试器1、功能简介2、下载与安...
    99+
    2022-11-13
  • C#正则表达式与HashTable详解
    目录1、正则表达匹配规则转义字符限定字符分组()2、C#中正则表达式构建与匹配正则表达式的替换正则表达式拆分HashTable概述及元素添加Hashtable遍历Hashtable元...
    99+
    2022-11-13
  • 超详细讲解python正则表达式
    目录正则表达式1.1 正则表达式字符串1.1.1 元字符1.1.2 字符转义1.1.3 开始与结束字符1.2 字符类1.2.1 定义字符类1.2.2 字符串取反1.2.3 区间1.2...
    99+
    2022-11-12
  • 正则表达式语法详细介绍
    这篇文章主要介绍“正则表达式语法详细介绍”,在日常操作中,相信很多人在正则表达式语法详细介绍问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”正则表达式语法详细介绍”的疑惑有所帮助!接下来,请跟着小编一起来学习吧...
    99+
    2023-06-02
  • C++中正则表达式的使用方法详解
    目录介绍1. C++ 中的正则表达式 (Regex)1.1 范围规范1.2 重复模式2. C++正则表达式的例子3. C++正则表达式中使用的函数模板3.1 regex_match(...
    99+
    2022-11-13
  • Python中使用正则表达式及正则表达式匹配规则详解
    目录1 导库2 使用模板3 说明4 示例5 正则表达式匹配规则1 导库 import re 2 使用模板 re_pattern = re.compile(pattern, flags...
    99+
    2023-03-22
    Python正则表达式匹配规则 Python正则表达式
  • C++怎么使用正则表达式
    今天小编给大家分享一下C++怎么使用正则表达式的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。目正则表达式正则表达式(regu...
    99+
    2023-06-30
  • python正则表达式re.search()的基本使用教程
    1 re.search() 的作用: re.search会匹配整个字符串,并返回第一个成功的匹配。如果匹配失败,则返回None  从源码里面可以看到re.search()方...
    99+
    2022-11-12
  • python使用正则表达式(Regular Expression)方法超详细
    正则表达式是一种用于匹配、查找和提取字符串的强大工具。在Python中,我们可以使用内置的re模块来使用正则表达式。下面是一些常用的...
    99+
    2023-08-17
    Python
  • C#中如何使用正则表达式
    C#中如何使用正则表达式,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。***个:验证输入的字符串是否为数字/// <summary>  ...
    99+
    2023-06-17
  • C++中的正则表达式如何使用
    这篇文章主要介绍了C++中的正则表达式如何使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇C++中的正则表达式如何使用文章都会有所收获,下面我们一起来看看吧。介绍C++ 正则表达式教程解释了 C++ 中正则表...
    99+
    2023-06-30
  • VBS正则表达式后向引用的详细介绍
    本篇内容介绍了“VBS正则表达式后向引用的详细介绍”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!后向引用正则表达式一个最重要的特性就是将匹配...
    99+
    2023-06-09
  • java正则表达式匹配规则超详细总结
    目录1 单个字符的匹配规则如下:2 多个字符的匹配规则如下:3 复杂匹配规则主要有:4 提取匹配的字符串子段5 非贪婪匹配6 替换和搜索6.1 分割字符串6.2 搜索字符串6.3 替...
    99+
    2022-11-13
  • 正则表达式直接在EXCEL中使用的详细步骤
    目录一、提需求二、解决步骤三、结果呈现正则表达式,相信大家都不陌生。但在我们最常用的办公软件EXCEL中,目前没有可直接使用正则表达式的函数(至少10版本的EXCEL没有),那么今天...
    99+
    2022-11-11
  • Java中Lambda表达式的使用详细教程
    目录简介格式实例函数式接口lambda作为参数遍历集合创建线程排序简介 说明 本文用示例展示Lambda表达式的用法。同时也会介绍Lambda的相关知识。 Lambda表达式介绍 L...
    99+
    2022-11-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作