iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >怎么用Python对Word文件内容进行读取
  • 777
分享到

怎么用Python对Word文件内容进行读取

2023-06-30 12:06:10 777人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

今天小编给大家分享一下怎么用python对Word文件内容进行读取的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。利用 Pyt

今天小编给大家分享一下怎么用pythonWord文件内容进行读取的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。

    利用 Python 批量读取文件

    word利器之python-docx

    python-docx 是用于创建可修改 微软 Word 的一个 python 库,提供全套的 Word 操作,是最常用的 Word 工具

    使用前,先了解几个概念:

    • Document:是一个 Word 文档 对象,不同于 VBA 中 Worksheet 的概念,Document 是独立的,打开不同的 Word 文档,就会有不同的 Document 对象,相互之间没有影响

    • Paragraph:是段落,一个 Word 文档由多个段落组成,当在文档中输入一个回车键,就会成为新的段落,输入 shift + 回车,不会分段

    • Run 表示一个节段,每个段落由多个 节段 组成,一个段落中具有相同样式的连续文本,组成一个节段,所以一个 段落 对象有个 Run 列表。

    例如下图的 word 文档示意图:

    怎么用Python对Word文件内容进行读取

    word 文档结构划分如下:

    怎么用Python对Word文件内容进行读取

    python-docx 安装

    安装:

    pip install python-docx 如果安装速度太慢的话,可以换一个国内的源地址(如下)

    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-docx

    导入:

    import docx
    from docx import …

    python-docx 之 Document

    导入包与模块:

    from docx import Document

    使用方法:

    Document(word文件地址)

    返回值:

    word文件对象

    python-docx 之段落内容读取

    实际上要想读取一个 word 文档,主要就是读取它的段落以及它的表格。无论是段落还是表格,它的内部都是字符串,我们的目的就是读取这些字符串的内容。

    先看一下段落内容的读取方式:

    来源:

    document_obj.paragraphs 通过 document 对象的 paragraphs 函数返回一个段落的列表;如果 word 文件存在多个段落,就会有多个段落对象。

    使用方法:

    通过循环获取每个段落对象,并调用 text

    演示案例脚本如下:

    coding:utf-8import osfrom docx import Documentpath = os.path.join(os.getcwd(), 'test_file/文本.docx')print("\'文本.docx\' 的路径为:", path)     # 调试路径doc = Document(path)for p in doc.paragraphs:    print(p.text)

    运行结果如下:(PS:文本只是演示,本人非培训机构的!)

    怎么用Python对Word文件内容进行读取

    怎么用Python对Word文件内容进行读取

    python-docx 之表格内容读取

    接下来我们看一下如何读取 word 文件中的表格内容:

    来源:

    document_obj.tables 通过 document 对象的 paragraphs 函数返回一个表格的列表;里面是一个一个的表格的对象。

    使用方法:

    同样通过循环,获取行与列的内容

    返回值:

    每个表格字段(字符串)

    演示案例代码如下:

    # coding:utf-8import osfrom docx import Documentpath = os.path.join(os.getcwd(), 'test_file/文本.docx')print("\'文本.docx\' 的路径为:", path)     # 调试路径doc = Document(path)# for p in doc.paragraphs:#     print(p.text)for t in doc.tables:            # for 循环获取表格对象    for row in t.rows:          # 获取每一行        row_str = []        for cell in row.cells:    # 获取每一行单独的小表格,然后将其内容拼接起来;拼接完成之后再第二个for循环中打印出来            row_str.append(cell.text)        print(row_str)        # 也可以通过 "columns" 获取表格中的列的内容,可以自己尝试一下

    运行结果如下:

    怎么用Python对Word文件内容进行读取

    以上就是“怎么用Python对Word文件内容进行读取”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注编程网Python频道。

    --结束END--

    本文标题: 怎么用Python对Word文件内容进行读取

    本文链接: https://www.lsjlt.com/news/328865.html(转载时请注明来源链接)

    有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

    本篇文章演示代码以及资料文档资料下载

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档
    猜你喜欢
    • 怎么用Python对Word文件内容进行读取
      今天小编给大家分享一下怎么用Python对Word文件内容进行读取的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。利用 pyt...
      99+
      2023-06-30
    • Python读取Word文档内容
      Python读取Word文档内容 在Python中,我们可以使用Python-docx模块来读取Word文档内容。这个模块提供了一种方法,即使用Python代码来读取和编辑Word文档。 安装Pyth...
      99+
      2023-09-24
      word python 开发语言
    • python怎么读取文件多行内容
      Python可以使用open()函数来打开文件,并使用readlines()方法读取文件的多行内容。 下面是一个示例: # 打开文件...
      99+
      2024-02-29
      python
    • 怎么用php读取word文档内容
      要使用PHP读取Word文档内容,可以使用PHPWord库。以下是一个简单的示例: 首先,你需要在PHP项目中引入PHPWord...
      99+
      2023-10-25
      php
    • 怎么用python读取文件内容
      使用Python读取文件内容的方法有很多种,以下是几种常用的方法: 使用open()函数打开文件,然后使用read()方法读取文...
      99+
      2023-10-24
      Python
    • python怎么读取文件内容
      Python中可以使用`open()`函数来读取文件内容。`open()`函数需要传入文件的路径和打开方式作为参数。以下是一个示例,...
      99+
      2023-09-05
      python
    • python怎么读取文本文件内容
      要读取文本文件内容,可以使用Python中的open()函数来打开文件,并使用read()方法来读取文件内容。下面是一个简单的示例:...
      99+
      2024-03-05
      python
    • python怎么读取txt文件内容
      这篇文章主要讲解了“python怎么读取txt文件内容”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python怎么读取txt文件内容”吧!python读取txt文件的方法:1、使用read...
      99+
      2023-06-20
    • java怎么逐行读取文件内容
      在Java中,我们可以使用BufferedReader类来逐行读取文件内容。以下是一个示例代码: import java.io.Bu...
      99+
      2024-03-05
      java
    • Python自动化办公之Word文件内容的读取
      目录前言利用 python 批量读取文件word利器之python-docxpython-docx 安装python-docx 之 Documentpython-docx 之段落内容...
      99+
      2024-04-02
    • java 实现读取 word 文件文字内容信息
      【需求】 最近项目中有一个需求,需要实现 java 读取上传的 word 文件的内容 【实现方法】 现有一文档内容如下: 实现代码如下: 引入依赖: org.apache.poi p...
      99+
      2023-09-24
      java word 后端
    • perl怎么读取文件内容
      在Perl中,可以使用open函数来打开一个文件,并使用<操作符来读取文件内容。下面是一个示例代码: # 打开文件 open(...
      99+
      2023-10-20
      perl
    • php怎么读取文件内容
      在PHP中,可以使用`file_get_contents()`函数来读取文件内容。这个函数可以将整个文件内容读取为一个字符串,并返回...
      99+
      2023-09-27
      php
    • makefile怎么读取文件内容
      在Makefile中,你可以使用`$(shell)`函数来读取文件内容。假设你的文件名为`file.txt`,你可以使用以下命令来读...
      99+
      2023-09-12
      makefile
    • golang怎么读取文件内容
      在Golang中,可以使用`io/ioutil`包中的`ReadFile`函数来读取文件内容。以下是一个简单的示例: package...
      99+
      2023-10-26
      golang
    • Python怎么读取文件的一段内容
      要读取文件的一段内容,可以使用以下步骤:1. 打开文件:使用`open()`函数打开文件,并传入文件路径和打开模式(例如:`'r'`...
      99+
      2023-08-08
      Python
    • shell怎么读取文件内容
      在shell脚本中,可以使用多种方法来读取文件的内容,下面是一些常用的方法:1. 使用cat命令:cat命令可以用于将文件的内容输出...
      99+
      2023-09-14
      shell
    • perl怎么读取文件的每一行内容
      在Perl中,可以使用<FILEHANDLE>的方式来读取文件的每一行内容。具体步骤如下: 打开文件并将文件句柄赋值给...
      99+
      2024-04-02
    • Python 读取文件里的内容
      读取文件内容有三个方法:Read() 读取整个文件Readlines()按行读取整个文件Readeline()按行读取一行内容 现需求是:读取整个文件的内容,并打印在控制台上 刚写入的文件不能直接打印,需要在关闭后再次读取,然后打印内容。如...
      99+
      2023-01-31
      文件 内容 Python
    • python如何读取文件内容
      在Python中,可以使用`open()`函数来打开一个文件,并使用`.read()`方法来读取文件的内容。以下是一个示例:```p...
      99+
      2023-08-25
      python
    软考高级职称资格查询
    编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
    • 官方手机版

    • 微信公众号

    • 商务合作