广告
返回顶部
首页 > 资讯 > 后端开发 > Python >用python处理MS Word
  • 713
分享到

用python处理MS Word

pythonMSWord 2023-01-31 08:01:10 713人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

使用python工具读写MS Word文件(docx与doc文件),主要利用了Python-docx包。本文给出一些常用的操作,并完成一个样例,帮助大家快速入手。 pyhton处理docx文件需要使用python-docx 包,

使用python工具读写MS Word文件(docx与doc文件),主要利用了Python-docx包。本文给出一些常用的操作,并完成一个样例,帮助大家快速入手。

pyhton处理docx文件需要使用python-docx 包,可以利用pip工具很方便的安装,pip工具在python安装路径下的Scripts文件夹中

pip install python-docx

当然你也可以选择使用easy_install或者手动方式进行安装

此处我们直接给出一个样例,根据自己的需要摘取有用的内容

#coding=utf-8

from docx import Document
from docx.shared import Pt
from docx.shared import Inches
from docx.oxml.ns import qn
#打开文档
document = Document()
#加入不同等级的标题
document.add_heading(u'MS WORD写入测试',0)
document.add_heading(u'一级标题',1)
document.add_heading(u'二级标题',2)
#添加文本
paragraph = document.add_paragraph(u'我们在做文本测试!')
#设置字号
run = paragraph.add_run(u'设置字号、')
run.font.size = Pt(24)

#设置字体
run = paragraph.add_run('Set Font,')
run.font.name = 'Consolas'

#设置中文字体
run = paragraph.add_run(u'设置中文字体、')
run.font.name=u'宋体'
r = run._element
r.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')

#设置斜体
run = paragraph.add_run(u'斜体、')
run.italic = True

#设置粗体
run = paragraph.add_run(u'粗体').bold = True

#增加引用
document.add_paragraph('Intense quote', style='Intense Quote')

#增加无序列表
document.add_paragraph(
    u'无序列表元素1', style='List Bullet'
)
document.add_paragraph(
    u'无序列表元素2', style='List Bullet'
)
#增加有序列表
document.add_paragraph(
    u'有序列表元素1', style='List Number'
)
document.add_paragraph(
    u'有序列表元素2', style='List Number'
)
#增加图像(此处用到图像image.bmp,请自行添加脚本所在目录中)
document.add_picture('image.bmp', width=Inches(1.25))

#增加表格
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Name'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
#再增加3行表格元素
for i in xrange(3):
    row_cells = table.add_row().cells
    row_cells[0].text = 'test'+str(i)
    row_cells[1].text = str(i)
    row_cells[2].text = 'desc'+str(i)

#增加分页
document.add_page_break()

#保存文件
document.save(u'测试.docx')

该段代码生成的文档样式如下
word内容

注:有一个问题没找到如何解决,即如何为表格设置边框线。如果您知道,还请能够指教。

#coding=utf-8

from docx import Document
#打开文档
document = Document(u'测试.docx')
#读取每段资料
l = [ paragraph.text.encode('gb2312') for paragraph in document.paragraphs];
#输出并观察结果,也可以通过其他手段处理文本即可
for i in l:
    print i
#读取表格材料,并输出结果
tables = [table for table in document.tables];
for table in tables:
    for row in table.rows:
        for cell in row.cells:
            print cell.text.encode('gb2312'),'\t',
        print
    print '\n'

我们仍然使用刚才我们生成的文件,可以看到,输出的结果为
读取文档
注意:此处我们使用gb2312编码方式读取,主要是保证中文的读写正确。一般情况下,使用的utf-8编码方式。另外,python-docx主要处理docx文件,在加载doc文件时,会出现问题,如果有大量doc文件,建议先将doc文件批量转换为docx文件,例如利用工具doc2doc

python-docx
Best way to extract text from a Word doc without using COM/automation?
Extracting text from MS word files in python
Add a w:eastAsia attribute

感谢zanlaoli在文章评论中帮助指出如何设置中文字体的问题。
感谢四路组相联 指出包引入缺失的问题。

--结束END--

本文标题: 用python处理MS Word

本文链接: https://www.lsjlt.com/news/192752.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 用python处理MS Word
    使用python工具读写MS Word文件(docx与doc文件),主要利用了python-docx包。本文给出一些常用的操作,并完成一个样例,帮助大家快速入手。 pyhton处理docx文件需要使用python-docx 包,...
    99+
    2023-01-31
    python MS Word
  • python中使用docx模块处理word文档
    目录一.docx模块二.相关概念三.模块的安装和导入四.读取word文本一.docx模块 Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是...
    99+
    2023-01-05
    python docx模块 python处理word文档 用Python操作Word文档
  • Python pywin32实现word与Excel的处理
    目录pywin32处理Word和Excel的一些事pywin32将Word转pdfpywin32将Excel格式处理并转pdf总结pywin32处理Word和Excel的一些事 我们...
    99+
    2022-11-11
  • 详解python-docx处理Word必备工具
    我的理解 为什么会用到python-docx,因为近段时间下载了大量网文,但格式都是html的,我个人习惯使用word处理文字,于是就想法设法把html文档转换为word,首先要考虑...
    99+
    2022-11-12
  • Python实现Word文档样式批量处理
    这里批量处理word文档的操作主要是通过python-docx非标准库实现的,通过定位到文档对象、再到段落、最后到一行文本从而完成针对文字对象的处理。 使用pip的方式安装pyth...
    99+
    2022-11-11
  • 运用Python巧妙处理Word文档的方法详解
    目录工具生成Word案例读取操作word文档总结工具 python3.7 Pycharm Excel python-docx 生成Word案例 创建一个demo.doc文档,代码如下...
    99+
    2022-11-11
  • 使用python处理一万份word表格简历操作
    前言 有一天朋友A向我抱怨,他的老板要求他把几百份word填好的word表格简历信息整理到excel中,看着他一个个将姓名,年龄……从word表格里复制粘贴到excel里,边粘贴心里...
    99+
    2022-11-11
  • 如何用python处理一万份word表格简历操作
    本篇内容介绍了“如何用python处理一万份word表格简历操作”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!前言有一天朋友A向我抱怨,他的...
    99+
    2023-06-13
  • Python 自动化处理Excel和Word实现自动办公
    今天我来分享一些Python办公自动化的方法,欢迎收藏学习,喜欢点赞支持,欢迎畅聊。 Openpyxl Openpyxl 可以说是 Python 中最通用的工具模块了,它使与 Exc...
    99+
    2022-11-12
  • Python办公自动化Word转Excel文件批量处理
    目录前言首先使用Python将Word文件导入row和cell解析所需内容内层解析循环前言 大家好,今天有一个公务员的小伙伴委托我给他帮个忙,大概是有这样一份Word(由于...
    99+
    2022-11-11
  • 如何实现右键添加打开MS-DOS的批处理
    这篇文章主要介绍如何实现右键添加打开MS-DOS的批处理,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!代码如下:@echo off reg add "HKCR\*\s...
    99+
    2023-06-08
  • word错误报告如何处理
    当接收到一个word错误报告时,下面是一些处理步骤:1. 阅读错误报告:仔细阅读错误报告,并理解报告中提到的错误类型和具体问题。2....
    99+
    2023-10-21
    word
  • Python实现自动化处理Word文档的方法详解
    目录1. 批量生成Word文档2. 将Word文档批量转换成PDF3. 在Word文档中批量标记关键词4. 在Word文档中批量替换关键词使用Python实现Word文档的自动化处理...
    99+
    2022-11-11
  • Word文档怎么轻松处理图片
    这篇文章给大家分享的是有关Word文档怎么轻松处理图片的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。一:图片原始尺寸还原我们在Word文档插入图片时,Word会自动将图片进行缩小,以适应Word排版。插入图片,在...
    99+
    2023-06-04
  • Python办公自动化Word转Excel文件批量处理的方法
    本篇内容主要讲解“Python办公自动化Word转Excel文件批量处理的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python办公自动化Word转Excel文件批量处理的方法”吧!前言...
    99+
    2023-07-02
  • 如何实现右键菜单中添加打开MS-DOS的批处理bat
    小编给大家分享一下如何实现右键菜单中添加打开MS-DOS的批处理bat,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!reg add "...
    99+
    2023-06-09
  • CSS 空白处理属性解读:whitespace 和 word-break
    CSS 空白处理属性解读:whitespace 和 word-break在进行网页开发时,我们经常会遇到需要对文本内容进行空白处理的情况。CSS提供了一些属性来控制文本中的空白符号和单词的换行方式,使得网页内容更加美观和易读。本文将详细解读...
    99+
    2023-10-24
    CSS 空白处理 属性解读
  • C#读取Word文档异常的处理方法
    这篇文章主要讲解了“C#读取Word文档异常的处理方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“C#读取Word文档异常的处理方法”吧!C#读取Word文档是项目中要实现的一个功能,在服...
    99+
    2023-06-17
  • 怎么用Python操作Excel、Word、CSV
    这篇文章主要讲解了“怎么用Python操作Excel、Word、CSV”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用Python操作Excel、Word、CSV”吧!Python 操作...
    99+
    2023-06-16
  • 怎么用Python操作Excel,Word,CSV
    本篇内容介绍了“怎么用Python操作Excel,Word,CSV”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Python 操作 Exce...
    99+
    2023-06-29
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作