iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python 如何提取PPT中所有文字的方法
  • 259
分享到

python 如何提取PPT中所有文字的方法

2023-06-07 23:06:47 259人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍“python 如何提取PPT中所有文字的方法”,在日常操作中,相信很多人在Python 如何提取PPT中所有文字的方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python 如何提取PP

这篇文章主要介绍“python 如何提取PPT中所有文字的方法”,在日常操作中,相信很多人在Python 如何提取PPT中所有文字的方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python 如何提取PPT中所有文字的方法”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

我就废话不多说了,大家还是直接看代码吧~

# 导入pptx包from pptx import Presentationprs = Presentation(path_to_presentation)text_runs = []for slide in prs.slides: for shape in slide.shapes:  if not shape.has_text_frame:   continue  for paragraph in shape.text_frame.paragraphs:   for run in paragraph.runs:    text_runs.append(run.text)

补充:使用 python-pptx-interface 将PPT转换成图片

▌00 简单方法

最简单的方法就是使用PPTX的File中的SaveAs命令,将PPTX文件另存为JPEG格式。

python 如何提取PPT中所有文字的方法

▲ 使用PPT的SaveAs将PPTX存储为JPEG

注意,在最后一步的时候需要选择“所有幻灯片(A)”。

python 如何提取PPT中所有文字的方法

▲ 选择所有幻灯片

最后,PPTX的每张幻灯片都以独立文件方式保存到文件中。X

这部分的内容可以参照: How to Export PowerPoint Slides as JPG or Other Image FORMats 中的介绍。

▌01 使用Python-PPTX

1.简介

python-pptx是用于创建和更新PointPoint(PPTX)文件的Python库。

一种常用的场合就是从数据库内容生成一个客户定制的PointPoint文件,这个过程通过点击WEB应用上的连接完成。许多开发之 通过他们日常管理系统生成工程状态汇报PPT。它也可以用于批量生成PPT或者产品特性说明PPT。

python-ppt License:

The MIT License (MIT) Copyright © 2013 Steve Canny, https://GitHub.com/scanny

Python-PPTX对应的官方网络网址: Python-PPTX Https://python-pptx.readthedocs.io/en/latest/user/intro.html#

2.安装

使用pip进行安装:

pip install python-pptx

对于python要求: Python2.7,3.3,3.4,3.6

依赖库:

Python 2.6, 2.7, 3.3, 3.4, or 3.6lxmlPillowXlsxWriter (to use charting features)

▌02 测试

下面的例子来自于: Get Start 。

1. Hello Word

from pptx     import Presentationprs = Presentation()title_slide_layout = prs.slide_layouts[0]slide = prs.slides.add_slide(title_slide_layout)title = slide.shapes.titlesubtitle = slide.placeholders[1]title.text = 'Hello world!'subtitle.text = 'python-pptx was here.'prs.save(r'd:\temp\test.pptx')printf("\a")

python 如何提取PPT中所有文字的方法

2.Add_TextBox

from pptx import Presentationfrom pptx.util import Inches, Ptprs = Presentation()blank_slide_layout = prs.slide_layouts[6]slide = prs.slides.add_slide(blank_slide_layout)left = top = width = height = Inches(1)txBox = slide.shapes.add_textbox(left, top, width, height)tf = txBox.text_frametf.text = "This is text inside a textbox"p = tf.add_paragraph()p.text = "This is a second paragraph that's bold"p.font.bold = Truep = tf.add_paragraph()p.text = "This is a third paragraph that's big"p.font.size = Pt(40)prs.save(r'd:\temp\test1.pptx')

python 如何提取PPT中所有文字的方法

▌03 输出JPEG

1.安装 python-pptx-interface

pip install python-pptx-interface

2.转换PPTX

注意:转换生成的目录必须使用新的目录。否则就会出现:

Folder d:\temp\pptimage already exists. Set overwrite_folder=True, if you want to overwrite folder content.

from pptx_tools import utilspptfile = r'D:\Temp\如何搭建自己的电子实验室_20210102R10.pptx'png_folder = r'd:\temp\pptimage'utils.save_pptx_as_png(png_folder, pptfile, overwrite_folder=True)

生成后的PPT对应的PNGImage。

python 如何提取PPT中所有文字的方法

▲ 生成后的PPTX对应的PNG图片

※ 结论

将PPTX转换成图片,可以便于后期将文件上载到CSDN,或者用于DOP文件的制作。

到此,关于“python 如何提取PPT中所有文字的方法”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

--结束END--

本文标题: python 如何提取PPT中所有文字的方法

本文链接: https://www.lsjlt.com/news/250393.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作