iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Java正则表达式API边界匹配
  • 545
分享到

Java正则表达式API边界匹配

2024-04-02 19:04:59 545人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

目录Boundary MatchersPattern Class MethodsPattern.CANON_EQPattern.CASE_INSENSITIVEPattern.COM

Boundary Matchers

Java regex api还支持边界匹配。如果我们关心在输入文本中匹配的确切位置,那么这就是我们要寻找的。在前面的示例中,我们关心的只是是否找到匹配项。

为了仅在文本开头所需的正则表达式为true时匹配,我们使用插入符号^。

此测试将失败,因为可以在开头找到文本dog:

@Test
public void givenText_whenMatchesAtBeginning_thenCorrect() {
    int matches = runTest("^dog", "dogs are friendly");
 
    assertTrue(matches > 0);
}

下面的测试将失败:

@Test
public void givenTextAndWrongInput_whenMatchFailsAtBeginning_
  thenCorrect() {
    int matches = runTest("^dog", "are dogs are friendly?");
 
    assertFalse(matches > 0);
}

为了仅在文本末尾所需的正则表达式为true时匹配,我们使用美元字符$。在以下情况下会找到匹配项:

@Test
public void givenText_whenMatchesAtEnd_thenCorrect() {
    int matches = runTest("dog$", "Man's best friend is a dog");
 
    assertTrue(matches > 0);
}

并且没有找到匹配:

@Test
public void givenTextAndWrongInput_whenMatchFailsAtEnd_thenCorrect() {
    int matches = runTest("dog$", "is a dog man's best friend?");
 
    assertFalse(matches > 0);
}

如果仅在单词边界处找到所需文本时才需要匹配,则在正则表达式的开头和结尾使用\\b正则表达式:

空格是单词边界:

@Test
public void givenText_whenMatchesAtWordBoundary_thenCorrect() {
    int matches = runTest("\\bdog\\b", "a dog is friendly");
 
    assertTrue(matches > 0);
}

行首的空字符串也是单词边界:

@Test
public void givenText_whenMatchesAtWordBoundary_thenCorrect2() {
    int matches = runTest("\\bdog\\b", "dog is man's best friend");
 
    assertTrue(matches > 0);
}

这些测试之所以通过,是因为字符串的开头以及文本之间的空格标记了单词边界,但是以下测试显示了相反的结果:

@Test
public void givenWrongText_whenMatchFailsAtWordBoundary_thenCorrect() {
    int matches = runTest("\\bdog\\b", "snoop dogg is a rapper");
 
    assertFalse(matches > 0);
}

一行中出现的两个单词字符不会标记单词边界,但我们可以通过更改正则表达式的结尾来查找非单词边界:

@Test
public void givenText_whenMatchesAtWordAndNonBoundary_thenCorrect() {
    int matches = runTest("\\bdog\\B", "snoop dogg is a rapper");
    assertTrue(matches > 0);
}

Pattern Class Methods

之前,我们只以基本方式创建了模式对象。然而,这个类有另一个compile方法的变体,它接受一组标志以及影响模式匹配方式的regex参数。

这些标志只是抽象的整数值。让我们重载test类中的runTest方法,以便它可以将标志作为第三个参数:

public static int runTest(String regex, String text, int flags) {
    pattern = Pattern.compile(regex, flags);
    matcher = pattern.matcher(text);
    int matches = 0;
    while (matcher.find()){
        matches++;
    }
    return matches;
}

在本节中,我们将了解不同的支持标志以及它们的使用方式。

Pattern.CANON_EQ

此标志启用canonical equivalence,当且仅当两个字符的完整规范分解匹配时,才会认为这两个字符匹配。

考虑带重音的Unicode字符é。它的复合代码点是u00E9。但是,Unicode的组成字符eu0065u0301也有单独的代码点。在这种情况下,合成字符u00E9与双字符序列u0065 u0301无法区分。

默认情况下,匹配不考虑规范等效:

@Test
public void givenRegexWithoutCanonEq_whenMatchFailsOnEquivalentUnicode_thenCorrect() {
    int matches = runTest("\u00E9", "\u0065\u0301");
 
    assertFalse(matches > 0);
}

但如果添加标志,则测试将通过:

@Test
public void givenRegexWithCanonEq_whenMatchesOnEquivalentUnicode_thenCorrect() {
    int matches = runTest("\u00E9", "\u0065\u0301", Pattern.CANON_EQ);
 
    assertTrue(matches > 0);
}

Pattern.CASE_INSENSITIVE

无论大小写,此标志都支持匹配。默认情况下,匹配会考虑大小写:

@Test
public void givenRegexWithDefaultMatcher_whenMatchFailsOnDifferentCases_thenCorrect() {
    int matches = runTest("dog", "This is a Dog");
 
    assertFalse(matches > 0);
}

因此,使用此标志,我们可以更改默认行为:

@Test
public void givenRegexWithCaseInsensitiveMatcher
  _whenMatchesOnDifferentCases_thenCorrect() {
    int matches = runTest(
      "dog", "This is a Dog", Pattern.CASE_INSENSITIVE);
 
    assertTrue(matches > 0);
}

我们还可以使用等效的嵌入标志表达式来实现相同的结果:

@Test
public void givenRegexWithEmbeddedCaseInsensitiveMatcher
  _whenMatchesOnDifferentCases_thenCorrect() {
    int matches = runTest("(?i)dog", "This is a Dog");
 
    assertTrue(matches > 0);
}

Pattern.COMMENTS

Java API允许在正则表达式中包含使用#的注释。这有助于记录复杂的正则表达式,而其他程序员可能无法立即看到这些正则表达式。

comments标志使matcher忽略正则表达式中的任何空白或注释,只考虑模式。

在默认匹配模式下,以下测试将失败:

@Test
public void givenRegexWithComments_whenMatchFailsWithoutFlag_thenCorrect() {
    int matches = runTest(
      "dog$  #check for word dog at end of text", "This is a dog");
 
    assertFalse(matches > 0);
}

这是因为匹配器将在输入文本中查找整个正则表达式,包括空格和#字符。但当我们使用该标志时,它将忽略额外的空格,并且以#开头的每个文本都将被视为每行要忽略的注释:

@Test
public void givenRegexWithComments_whenMatchesWithFlag_thenCorrect() {
    int matches = runTest(
      "dog$  #check end of text","This is a dog", Pattern.COMMENTS);
 
    assertTrue(matches > 0);
}

还有一个替代的嵌入式标志表达式:

@Test
public void givenRegexWithComments_whenMatchesWithEmbeddedFlag_thenCorrect() {
    int matches = runTest(
      "(?x)dog$  #check end of text", "This is a dog");
 
    assertTrue(matches > 0);
}

到此这篇关于Java正则表达式API边界匹配的文章就介绍到这了,更多相关Java正则表达式内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Java正则表达式API边界匹配

本文链接: https://www.lsjlt.com/news/151024.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Java正则表达式API边界匹配
    目录Boundary MatchersPattern Class MethodsPattern.CANON_EQPattern.CASE_INSENSITIVEPattern.COM...
    99+
    2022-11-13
  • Java正则表达式API边界匹配怎么实现
    本篇内容主要讲解“Java正则表达式API边界匹配怎么实现”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Java正则表达式API边界匹配怎么实现”吧!Boundary MatchersJava ...
    99+
    2023-07-02
  • Java 正则表达式匹配
    1 正则表达式 1.1 什么是正则表达式 正则表达式: 定义一个搜索模式的字符串。 正则表达式可以用于搜索、编辑和操作文本。 正则对文本的分析或修改过程为:首先正则表达式应用的是文本字符串(text/string),它会以定义的模式从左到右...
    99+
    2023-10-27
    正则表达式 java 开发语言
  • Java匹配正则表达式汇总
    目录一.我们先举个例子来看看Java匹配正则表达式二.匹配表达式的特殊情况java匹配字符串表达式在我们数据处理方面是及其重要的,现在就把我这几天数据处理比较常用的向大家介绍一下,常...
    99+
    2023-03-24
    Java匹配正则表达式 java正则匹配
  • 怎么用java正则表达式匹配单词
    使用Java正则表达式匹配单词,可以按照以下步骤进行:1. 创建一个正则表达式模式,用于匹配单词。例如,可以使用 \b\w+\b 来...
    99+
    2023-10-18
    java
  • Python中使用正则表达式及正则表达式匹配规则详解
    目录1 导库2 使用模板3 说明4 示例5 正则表达式匹配规则1 导库 import re 2 使用模板 re_pattern = re.compile(pattern, flags...
    99+
    2023-03-22
    Python正则表达式匹配规则 Python正则表达式
  • java正则表达式匹配规则超详细总结
    目录1 单个字符的匹配规则如下:2 多个字符的匹配规则如下:3 复杂匹配规则主要有:4 提取匹配的字符串子段5 非贪婪匹配6 替换和搜索6.1 分割字符串6.2 搜索字符串6.3 替...
    99+
    2022-11-13
  • 正则表达式空格如何匹配
    正则表达式中,空格可以使用`\s`匹配。`\s`匹配任意空白字符,包括空格、制表符、换行符等。 举个例子,如果想要匹配一个包含空格的...
    99+
    2023-10-08
    正则表达式
  • 在正则表达式中匹配空格
    在正则表达式中,可以使用`\s`来匹配空格字符,包括空格、制表符、换行符等。如果只想匹配空格,可以使用空格字符直接匹配。以下是两个示...
    99+
    2023-09-17
    正则表达式
  • Python匹配中文的正则表达式
    正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里...
    99+
    2022-06-04
    中文 正则表达式 Python
  • 正则表达式如何匹配单词
    这篇文章给大家分享的是有关正则表达式如何匹配单词的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。正则表达式匹配单词的内幕:元字符<<\b>>也是一种对位置进行匹配的“锚”。这种匹配是0长度匹...
    99+
    2023-06-17
  • 正则表达式怎么匹配数字
    这篇文章给大家分享的是有关正则表达式怎么匹配数字的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。高效正则表达式匹配数字实例:^[1-9]\d*$      //匹配正整数&n...
    99+
    2023-06-17
  • Java正则表达式循环匹配字符串方式
    目录正则表达式循环匹配字符串Java匹配正则表达式大全我们先举个例子来看看Java匹配正则表达式匹配表达式的特殊情况正则表达式循环匹配字符串 public static void m...
    99+
    2022-11-13
  • 正则表达式的匹配规则有哪些
    正则表达式的匹配规则有以下几种:1. 字符匹配:使用普通字符来匹配输入的相应字符。2. 通配符匹配:使用特殊字符来匹配任意一个字符。...
    99+
    2023-09-26
    正则表达式
  • Java匹配正则表达式的方法是什么
    这篇文章主要介绍了Java匹配正则表达式的方法是什么的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Java匹配正则表达式的方法是什么文章都会有所收获,下面我们一起来看看吧。一.我们先举个例子来看看Java匹配正...
    99+
    2023-07-05
  • Python中怎么使用正则表达式及正则表达式匹配规则是什么
    1 导库import re2 使用模板re_pattern = re.compile(pattern, flags=0) result = re.findall(re_pattern,string)3 说明参数描述pattern匹配的正则表...
    99+
    2023-05-14
    Python
  • C++实现LeetCode(10.正则表达式匹配)
    [LeetCode] 10. Regular Expression Matching 正则表达式匹配 Given an input string (s) and a pattern ...
    99+
    2022-11-12
  • Notepad++怎么使用正则表达式匹配
    今天小编给大家分享一下Notepad++怎么使用正则表达式匹配的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Notepad+...
    99+
    2023-07-06
  • Java中正则表达式匹配过程实例详解
    目录下面是Java正则表达式的语法字符:正则表达式简单的匹配过程:(1) 基础匹配过程(2)贪婪模式(3)非贪婪模式 (4)零宽度匹配过程总结正则表达式:定义字符串的模式,...
    99+
    2022-11-13
  • Java正则表达式API字符类
    目录一、Predefined字符类二、Quantifiers三、Capturing Groups一、Predefined字符类 Java正则表达式API也接受预定义的字符类。上面的一...
    99+
    2022-11-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作