iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python如何获取指定开头指定结尾所夹中间内容
  • 441
分享到

Python如何获取指定开头指定结尾所夹中间内容

2023-07-05 04:07:26 441人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

本篇内容介绍了“python如何获取指定开头指定结尾所夹中间内容”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!需求获取文章中指定开头、指定结

本篇内容介绍了“python如何获取指定开头指定结尾所夹中间内容”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

需求

获取文章中指定开头、指定结尾中所夹的内容。其中,开头和结尾均有多种,但最多也就十几种,所以代码还是具有可行性的。

例:

X X 市 人 民 检 察 院 指 控 : ‾ \underline{XX市人民检察院指控:} XX市人民检察院指控:被告人XXX与被害人YYY(女,殁年41岁,系XXX妻子)因家庭矛盾多次发生争执。X年Y月Z日早晨,被告人XXX在X市X市场…被告人XXX为偏执性精神障碍,具有限制刑事责任能力。
公 诉 机 关 认 为 ‾ \underline{公诉机关认为} 公诉机关认为,被告人XXX故意非法剥夺他人生命,致一人死亡,其行为应以故意杀人罪追究刑事责任

所需内容为:第一个下划线到第二个下划线中间的内容,即“被告人XXX…责任能力。”。其中,“检察院指控”是指定开头,“公诉机关认为”是指定结尾。

解决方案

原本想着NLP有没有现成的库可以直接调包,后来搜了半天没搜到,然后看到了正则表达式(真香)。

代码

低配方法:

适用于只有一种固定开头和结尾,多种就不行了

import redef GetMiddleStr(content,startStr,endStr):#     patternStr = r'.*%s(.+?)%s.*'%(startStr,endStr) # 此模式不能跨段,‘.'只能匹配除了'\n'外所有单个字符    patternStr = r'[\s\S]*%s(.+?)%s[\s\S]*'%(startStr,endStr)#     patternStr = re.compile(patternStr,re.IGNORECASE) # 忽略大小写 ,这个适用于英文文章    middleStr= re.match(patternStr,content)    if middleStr:        return middleStr.group(1)

中配方法:

适用于多种固定开头和结尾,不过是蛮力法,可以优化判断,减少循环次数

import redef GetMiddleStr2(content,startStr,endStr):#     patternStr = r'.*%s(.+?)%s.*'%(startStr,endStr)    GoalStr = str('')        for sStr in startStr:        for eStr in endStr:            patternStr = r'[\s\S]*%s(.+?)%s[\s\S]*'%(sStr,eStr)            middleStr= re.match(patternStr,content)            if middleStr:                if not goalStr: # 判断 空 时候的值                    goalStr = middleStr.group(1)                else:        # 非空时,将将短的留下来                     goalStr = middleStr.group(1) if len(goalStr)>len(middleStr.group(1)) else goalStr                        return goalStr

运行效果

content='且得到被害人家属谅解。综上,建议法庭对被告人XXX减轻处罚。经审理查明:被告人XXX与被害人YYY因家庭矛盾多次发生争执。X年Y月Z日清晨,被告人XXX在X市X市场......被告人XXX为偏执性精神障碍,具有限制刑事责任能力。公诉机关认为,被告人XXX故意非法剥夺他人生命,致一人死亡,其行为应以故意杀人罪追究刑事责任'
startStr = '经审理查明:'
endStr = '公诉机关认为,'
print(GetMiddleStr(content,startStr,endStr))

Python如何获取指定开头指定结尾所夹中间内容

第二种运行时将startStr和endStr分别赋值为:[‘AAA’,‘BBB’,…],即可
例如:
startStr = [‘审理查明:’,‘审理查明:’,‘检察院指控’]
endStr = [‘经鉴定’,‘经鉴定,’, ‘归案后’]

代码讲解

正则表达式查一下手册即可:
.*:除了’\n’以外所有字符重复多次
[\s\S]:空白字符或者非空白字符,即所有字符(一个集合∪它在全集中的补集,即全集)
其余查一下手册就ok

Python如何获取指定开头指定结尾所夹中间内容”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: Python如何获取指定开头指定结尾所夹中间内容

本文链接: https://www.lsjlt.com/news/349478.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python如何获取指定开头指定结尾所夹中间内容
    本篇内容介绍了“Python如何获取指定开头指定结尾所夹中间内容”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!需求获取文章中指定开头、指定结...
    99+
    2023-07-05
  • python如何获取网页指定内容
    要获取网页中的指定内容,可以使用Python的requests库来发送HTTP请求,并使用BeautifulSoup库来解析HTML页面。以下是一个示例代码,用于获取网页中的标题:```pythonimport requestsfrom...
    99+
    2023-08-11
    python
  • 如何用Python获取网页指定内容
    这篇文章主要介绍“如何用Python获取网页指定内容”,在日常操作中,相信很多人在如何用Python获取网页指定内容问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何用Python获取网页指定内容”的疑惑有所...
    99+
    2023-06-29
  • python如何通过正则匹配指定字符开头与结束提取中间内容
    目录一、提取包含始末字符二、不包含始末字符串三、.*和.+正则提取的区别四、起始有无^的区别五、pandas对具体列的内容通过正则表达式进行数据提取六、遇到的报错参考文章:一、提取包...
    99+
    2023-02-20
    python正则匹配提取中间内容 python正则匹配字符开头 python正则匹配
  • python如何提取xml指定内容
    目录第一种方法:python操作xml文件提取某个单个字段批量提取某个标签值,并将其写入文本第二种:正则提取xml指定内容方法总结第一种方法:python操作xml文件 随手找了一个...
    99+
    2023-01-03
    python提取xml内容 python提取内容 提取xml指定内容
  • php如何获取api接口指定内容
    要获取API接口的指定内容,可以使用PHP中的curl函数。以下是一个示例代码,演示如何使用curl函数从API接口中获取指定内容:...
    99+
    2023-08-25
    php
  • python怎么通过正则匹配指定字符开头与结束提取中间内容
    本文小编为大家详细介绍“python怎么通过正则匹配指定字符开头与结束提取中间内容”,内容详细,步骤清晰,细节处理妥当,希望这篇“python怎么通过正则匹配指定字符开头与结束提取中间内容”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入...
    99+
    2023-07-05
  • python如何提取文本指定内容
    要提取文本中的指定内容,你可以使用正则表达式或字符串方法来实现。下面是使用正则表达式提取指定内容的示例代码:pythonimport...
    99+
    2023-10-18
    python
  • python如何提取字符串指定内容
    要提取字符串中的指定内容,可以使用字符串的切片操作或正则表达式。1. 使用切片操作:可以使用字符串的索引和切片操作来提取指定内容。例...
    99+
    2023-08-20
    python
  • 怎么在python中获取字符串的指定内容
    这篇文章给大家介绍怎么在python中获取字符串的指定内容,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。python的五大特点是什么python的五大特点:1.简单易学,开发程序时,专注的是解决问题,而不是搞明白语言本...
    99+
    2023-06-14
  • python怎么打开指定文件夹添加内容
    要打开指定文件夹并添加内容,可以使用Python的os模块和open函数来实现。以下是一个示例代码: import os fold...
    99+
    2024-03-02
    python
  • 一文教会你用Python获取网页指定内容
    目录前言1.抓取网页源代码2.抓取一个网页源代码中的某标签内容3.抓取多个网页子标签的内容总结前言 Python用做数据处理还是相当不错的,如果你想要做爬虫,Python是很好的选择...
    99+
    2024-04-02
  • python获取指定时间段内特定规律的日期列表
    前言:写小程序时,遇到个需要自定义回归时间的场景,下面是实现的效果图。     于我需求而言,我只需要用到fixed_interval、weekly、per_mo...
    99+
    2024-04-02
  • 使用python如何提取JSON数据指定内容
    目录如何提取JSON数据指定内容假设我们要获取'pic_str'里的数据1、JSON数据为字符串类型2、JSON数据为字典类型如何提取复杂JSON的数据 例...
    99+
    2024-04-02
  • Python如何获取文本特定内容
    要获取文本中的特定内容,可以使用字符串的一些方法。以下是几个实现的例子:1. 使用`find()`方法找到特定内容的起始索引,然后使...
    99+
    2023-08-18
    Python
  • nodejs如何获取指定路径下所有的文件夹名或类型
    目录获取指定路径下所有的文件夹名或类型nodejs文件操作文件操作文件夹操作获取指定路径下所有的文件夹名或类型 let components = [] const files = f...
    99+
    2024-04-02
  • python中如何使用get获取指定键值
    小编给大家分享一下python中如何使用get获取指定键值,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!1、说明在使用字典时,很少直接输出它的内容。一般需要根据指定的键得到相应的结果。Python 中推荐的方法是使用字典对...
    99+
    2023-06-15
  • php如何获取指定时间戳为几号
    这篇文章将为大家详细讲解有关php如何获取指定时间戳为几号,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。在PHP中,可以利用date()函数获取指定时间戳为几号,该函数可把时间戳格式化为可读性更好的日期和...
    99+
    2023-06-29
  • python如何删除文件中的指定内容
    要删除文件中的指定内容,可以按以下步骤操作:1. 打开文件,读取内容并存储在变量中。2. 使用字符串的 `replace()` 方法...
    99+
    2023-10-07
    python
  • Python如何提取PDF指定内容并生成新文件
    小编给大家分享一下Python如何提取PDF指定内容并生成新文件,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!01需求描述数据是一份有286页的上市公司公开年报P...
    99+
    2023-06-15
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作