广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python之excel文件(.xls文件)处理方式
  • 648
分享到

python之excel文件(.xls文件)处理方式

pythonexcel文件excel文件处理.xls文件处理方式 2023-05-19 14:05:21 648人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

目录python excel文件(.xls文件)如何处理xlrdxlwtxlutilsPython处理excel文件问题openpyxl 及 excel 文件结构工作表处理行列处理单

python excel文件(.xls文件)如何处理

xlrd 用于读取文件,xlwt 用于写入文件,xlutils 是两个工具包的桥梁,也就是通过xlrd 读取.xls文件,然后通过xlutils 将文件内容交给xlwt处理并且保存。

xlrd

常用api

#导入
import xlrd
# 打开文件 必须是存在的文件路径
wb = xlrd.open_workbook('路径')
# 获取文件中所有的sheet对象
objects = wb.sheets()
#获取文件中所有的sheet名称
names = wb.sheet_names()
# 按照索引获得sheet对象
ws = wb.sheet_by_index(索引值)
#按照名称获得sheet对象
ws = wb.sheet_by_name(文件名)
#获得当前sheet对象的名称
name = ws.name
#获得当前excel文件的sheet个数
n = wb.nsheets
#获得当前sheet已使用的行和列
nrows = ws.nrows
ncols = ws.ncols
# 获得当前sheet某一行或者某一列的所有元素 元素格式是:数据类型:数据值
# 数据类型:0.空,1.字符串,2.数字,3.日期,4.布尔,5.error
lst = ws.row(索引值)
lst = ws.col(索引值)
# 是ws.row(索引值)和s.col(索引值)得到允许切片版本
lst = ws.row_slice(索引值, start_colx=0, end_colx=None)
lst = ws.col_slice(索引值, start_rowx=0, end_rowx=None)
# 获得当前sheet某一行或者某一列的所有元素的值
lst = ws.row_values(索引值)
lst = ws.col_values(索引值)
# 获得当前sheet某一行或者某一列的所有元素的数据类型
lst = ws.row_types(索引值,start_colx=0, end_colx=None)
lst = ws.col_types(索引值, start_rowx=0, end_rowx=None)
# 返回当前sheet某一行已使用的长度
i = ws.row_len(索引值)
# 获取当前sheet中某个单元格的元素 元素格式是:数据类型:数据值
# 数据类型:0.空,1.字符串,2.数字,3.日期,4.布尔,5.error
n = ws.cell(行索引, 列索引)
# 获取当前sheet中某个单元格的元素的值
n = ws.cell_value(行索引, 列索引)
n = ws.cell(行索引,列索引).value
n = ws.row(行索引)[列索引].value
# 获取当前sheet中某个单元格的元素的数据类型
n = ws.cell_type(行索引, 列索引)
n = ws.cell(行索引,列索引).ctype
n = ws.row(行索引)[列索引].ctype

xlwt

# 导入
import xlwt
# 新建.xls的文件
nwb = xlwt.Workbook('utf-8')
# 添加工作表
nws = nwb.add_sheet('名称', cell_overwrite_ok=True)
# 在对应单元格上写入内容
nws.write(行索引,列索引,写入内容)
# 保存文件 注意.xls的后缀不能少
nwb.save('文件名.xls')

xlutils

# 导入
from xlutils.copy import copy
# 用xlrd导入待处理的文件
wb = xlrd.open_workbook('文件名')
#使用copy函数处理 此时的 nwb 不仅具有 xlwt 的功能, 还具有 xlrd 的功能
#也就是既可读又可写.
nwb = copy(wb)

python处理excel文件问题

最近需要频繁读写 excel 文件,想通过程序对 excel 文件进行自动化处理,发现使用 python 的 openpyxl 库进行 excel 文件读写实在太方便了,结构清晰,操作简单。

本文对 openpyxl 的使用进行总结,主要包含以下内容:

  • openpyxl 的介绍及 excel 文件结构说明
  • 工作表的读写处理
  • 行列的读写处理
  • 单元格的读写处理

openpyxl 及 excel 文件结构

openpyxl 是一个对 xlsx/xlsm/xltx/xltm 格式的 2010 excel 文档进行读写的 python 库。它官网有详细的文档介绍。在进行使用前,需先安装并引入

# 安装
pip install openpyxl
# 引入openpyxl 模块
import openpyxl

在进行 excel 操作之前,先对 excel 的文件结构做一个简单了解,以便于熟悉后续的操作。如下图:

一个 excel 文件,其内容按层次分为工作簿(文件) -> 工作表(sheet) -> 行列 -> 单元格 ,对应上图,整个 excel 文件即是一个工作簿;工作簿下可以有多个工作表(如图中的 Sheet1/test1 等等);工作表中就是对应的表格数据,分为行和列,行是用序号表示,列用大写字母表示(也可用序号);行与列的交点就是每一个存储数据的单元格。

因此,我们对 excel 表格进行读写,基本按这个层次思路来操作:读入文件,找到工作表,遍历行列,定位单元格,对单元格进行读写。因此,会涉及到工作表、行列、单元格的读写操作。

这些操作之前,需要先把文件加载进来,一个 excel 文件就是一个工作簿 (workbook),加载操作如下(示例中的 excel 文件为 text.xlsx):

# 加载excel文件
file_path = "E:/pythontest/test.xlsx"
workbook = openpyxl.load_workbook(file_path)

工作表处理

  • 工作表读取

工作表( sheet )会有多个,可以读取全部的工作表,读取单个时,可以按 sheet 名称读取,也可以按下标(下标从0开始)。

  • 全部工作表对象:workbook.worksheets
  • 全部工作表名称:workbook.sheetnames
  • 按名称(sheet_name)获取工作表:workbook[sheet_name]
  • 按下标(i从0开始)获取工作表:workbook.worksheets[i]
  • 获取正在使用的工作表:workbook.active
  • 获取工作表的属性(如工作表名称、最大行数和列数等):sheet.title、sheet.max_row、sheet.max_column

如下:

# 全部sheet对象
>>> workbook.worksheets
[<Worksheet "Sheet1">, <Worksheet "test1">, <Worksheet "test2">]
# 全部sheet名称
>>> workbook.sheetnames
['Sheet1', 'test1', 'test2']
# 按名称读取sheet
>>> workbook["Sheet1"]
<Worksheet "Sheet1">
# 按下标读取
>>> workbook.worksheets[0]
<Worksheet "Sheet1">
# 获取当前正在使用的sheet
>>> workbook.active
<Worksheet "Sheet1">
# 获取sheet的属性
>>> sheet_active.title
Sheet1
>>> sheet_active.max_row
6
>>> sheet_active.max_column
3
  • 工作表添加

若需要新增工作表,按操作流程,先添加工作表,再保存文件。创建通过create_sheet完成,创建后保存(save)文件,添加才能生效。

  • 创建工作表,若名称相同,则自动进行重命名:workbook.create_sheet(“test3”)
  • 在指定的下标创建工作表:workbook.create_sheet(“test4”,1)
  • 保存文件,若文件路径与打开的文件路径相同,则覆盖;不同,则会复制原文件并保存(相当于另存为):workbook.save(file_path)
  • 工作表修改

要修改工作表名称,直接通过设置工作表的 title 即可,修改后同样需要保存文件。

# 修改工作表名称
>>> sheet1 = workbook['test1']
>>> sheet1.title = 'test11'
# 保存文件
>>> workbook.save(file_path)
  • 工作表删除

删除工作表,需要先获取 sheet 对象,然后删除。删除有两种方式,一是使用 workbook 提供的 remove 方法,也可以直接使用 python 的del进行删除。删除操作后,同样需要保存文件:

# remove删除工作表
sheet = workbook["test-1"]
workbook.remove(sheet)
# del操作删除
del workbook["test2"]
# 保存文件
workbook.save(file_path)

行列处理

获取 sheet 对象后,后续即可进行行列操作,包括行列读取,添加,删除等。

  • 读行列

获取全部行和列,然后可以进行遍历:sheet.rows ,sheet.columns

读取部分行列:读一行sheet[1],读多行sheet[2:3],读一列sheet[‘A’],读多列sheet[‘B:C’]

# 遍历全部行
>>> for row in sheet.rows:
...    print(row)
...
(<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.B1>, <Cell 'Sheet1'.C1>)
(<Cell 'Sheet1'.A2>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.C2>)
....
# 读取部分行列
>>> sheet[1]
(<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.B1>, <Cell 'Sheet1'.C1>)
>>> sheet["A:B"]
((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>, <Cell 'Sheet1'.A6>), (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>, <Cell 'Sheet1'.B6>))
  • 添加行列

添加行列,可以指定位置添加单个行列或多个行列。

  • 直接在工作表中追加行数据:sheet.append(rowdata)
  • 在指定 index(从1开始计算) 位置添加行列:sheet.insert_rows,sheet.insert_cols
# 在第4行插入1行空行
>>> sheet.insert_rows(4)
# 在第2行插入2行空行
>>> sheet.insert_rows(idx=2,amount=2)
# 添加一行数据到表
>>> row_data = ["tom", 15, "tom@test.com"]
>>> sheet.append(row_data)
# 保存修改内容
>>> workbook.save(file_path)
  • 删除行列

删除操作与插入行列操作方式一致,使用delete_rowsdelete_cols方法。

# 删除行
>>> sheet.delete_rows(2,2)
>>> workbook.save(file_path)

单元格处理

我们的数据最终是保存在每一个单元格(Cell)中,因此,最终我们操作数据其实就是单元格中的数据,单元格中,openpyxl 使用是 Cell 对象。前面在遍历行列数据时,可以看到输出<Cell ‘Sheet1’.A1>的内容,这对应的单元格对象。下面对单元格的操作进行说明。

  • 获取单元格数据值及属性值

定位获取单元格有两种方式:

  • 直接指定行列名:sheet[A1]
  • 使用 cell 函数(行列下标从1开始):sheet.cell(row=2,column=1)
# 指定行列坐标获取单元格
>>> sheet["A1"]
<Cell 'Sheet1'.A1>
# cell函数获取单元格
>>> sheet.cell(row=1, column=1)
<Cell 'Sheet1'.A1>

获取单元格对象后,可以获取数据值及其属性,包括它所在的行列数,坐标,值等。

>>> cell = sheet["A2"]
>>> cell.value
'张三'
>>> cell.coordinate
'A2'
>>> cell.column
1
>>> cell.row
2
  • 移动单元格

通过对单元格区域,可以向上、下、左、右进行移动,使用的是move_range(range,rows,cols),其中 rows 和 cols 为整数,正整数表示向下或向右,负整数为向上或向左。

# 单元格合并,使用范围坐标
sheet.merge_cells("A2:B3")
# 单元格合并,指定行列下标(下标从1开始)
sheet.merge_cells(start_row=5, start_column=3, end_row=7, end_column=4)
wb.save(file_path)
# 拆分单元格
sheet.unmerge_cells("A2:B3")
sheet.unmerge_cells(start_row=5, start_column=3, end_row=7, end_column=4)
# 保存文件
wb.save(file_path)
  • 合并拆分单元格

对于跨行和跨列,需要对单元格进行合并,使用的是merge_cells(range_string, start_row, start_column, end_row, end_column)。如果要合并的单元格都有数据,只会保留左上角的数据,其他则丢弃。合并及拆分都可以通过行列坐标(如A1)或者行列下标(如1,2)进行。

# 单元格合并,使用范围坐标
sheet.merge_cells("A2:B3")
# 单元格合并,指定行列下标(下标从1开始)
sheet.merge_cells(start_row=5, start_column=3, end_row=7, end_column=4)
wb.save(file_path)
# 拆分单元格
sheet.unmerge_cells("A2:B3")
sheet.unmerge_cells(start_row=5, start_column=3, end_row=7, end_column=4)
# 保存文件
wb.save(file_path)
  • 写入单元格

对单元格值进行修改和写入,直接对cell.value进行赋值即可。

这里需要注意的是,可以写入 excel 公式,具体公式与 excel 中用到公式一致,另外,若是写入公式,读取时获取到的 value 值也是公式,而非公式值。

# 写入值
cell.value = "张三"
# 写入公式(求平均值)
cell.value = "=AVERAGE(B2:B6)"
  • 设置单元格格式

单元格的格式包括行高,列宽,字体、边框、对齐方式、填充颜色等。这些都在 openpyxl 的 styles 模块中。

  • 行高/列宽:row_dimensions[row_num].height = xx,sheet.column_dimensions[col_name].width = xx
  • 字体( Font 对象):包括字段名称,大小、加粗、斜体、颜色等,Font(name=“微软雅黑”, size=20, bold=True, italic=True, color=“000000”)
  • 边框( Border 对象和 Side 对象):边框每一条边的格式大小/颜色Side(style=“thin”, color=“000000”),通过边构建边框对象:Border(left=side, right=side, top=side, bottom=side)
  • 对齐( Alignment 对象):垂直和水平对齐方向,是否自动换行。Alignment(horizontal=“center”, vertical=“center”, wrap_text=True)
  • 填充颜色,分为普通颜色填充和渐变颜色填充:PatternFill(fill_type=“solid”, fGColor=“FF0000”)和 GradientFill(stop=(“FF0000”, “FD1111”, “000000”))
# 设置行高和列宽
sheet.row_dimensions[1].height = 50
sheet.column_dimensions["A"].width = 20
# 设置单元格字体
cell = sheet["A1"]
current_font = cell.font
font = Font(name="微软雅黑", size=20, bold=True, italic=True, color="000000")
cell.font = font
# 设置边框(细边,黑色)
side_style = Side(style="thin", color="000000")
border = Border(left=side_style, right=side_style, top=side_style, bottom=side_style)
cell.border = border
# 居中对齐,自动换行
cell_alignment = Alignment(horizontal="center", vertical="center", wrap_text=True)
cell.alignment = cell_alignment
# 填充颜色(红色填充,和红色到黑色渐变填充)
p_fill = PatternFill(fill_type="solid", fgColor="FF0000")
g_fill = GradientFill(stop=("FF0000", "FD1111", "000000"))
cell.fill = p_fill
sheet["B1"].fill = g_fill

最后注意的是,这些修改操作最后都需要通过保存操作**(wb.save(file_path))**才能生效。

注意:

通过上面的讲解,了解如何使用 python 的 openpyxl 库对 excel 文档的处理操作,可以发现它的操作逻辑相当是清晰简单的,符合的我们使用 excel 的习惯。

处理流程基本是加载文件、定位需要处理的工作表、行、列及单元格。对它们进行读、写、修改格式等操作。

因此,如果有自动化处理 excel 文件的需求,用 openpyxl 吧,但它限制只能处理 2010 格式的 excel 文档,对于旧格式( xls )的建议都统一换为新的格式再操作,或者也可以使用 xlrd 和 xlwt 模块操作。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。

--结束END--

本文标题: python之excel文件(.xls文件)处理方式

本文链接: https://www.lsjlt.com/news/213288.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python之excel文件(.xls文件)处理方式
    目录python excel文件(.xls文件)如何处理xlrdxlwtxlutilspython处理excel文件问题openpyxl 及 excel 文件结构工作表处理行列处理单...
    99+
    2023-05-19
    python excel文件 excel文件处理 .xls文件处理方式
  • python处理excel文件之xlsxwriter 模块
    目录模块基本使用写入更多样式数据其余样式扩展xlsxwriter 中的 write 方法xlsxwriter 关闭文件其它需要了解的方法xlsxwriter 模块的优缺点优点缺点模块...
    99+
    2022-11-11
  • python处理excel文件
    python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。可从这里下载https://pypi.python.org/pypi。下面分别记录python读和写excel.python...
    99+
    2023-01-31
    文件 python excel
  • python 处理excel文件
    有两种办法1.使用 Xlrd/xlwt 操作 Excelhttp://liluo.org/blog/2011/01/python-using-xlrd-xlwt-operate-excel/ Xlrd/xlwt库的功能有限,比如有的exce...
    99+
    2023-01-31
    文件 python excel
  • python高手之路python处理excel文件(方法汇总)
    用python来自动生成excel数据文件。python处理excel文件主要是第三方模块库xlrd、xlwt、xluntils和pyExcelerator,除此之外,python处理excel还可以用wi...
    99+
    2022-06-04
    之路 高手 文件
  • 用Python处理Excel文件
    四种python处理excel模块PK我主要尝试了四种工具,在此并不会给出他们的排名,因为在不同的应用场景下,做出的选择会不同。 XlsxWriterxlrd&xlwtOpenPyXLMicrosoft Excel API介绍可以创...
    99+
    2023-01-31
    文件 Python Excel
  • python文件处理笔记之文本文件
    目录1. 建立文件1.1 文本文件代码实现1.2 代码编写分析2. 基本的读写文件2.1 用文件对象write(s)方法写内容2.2 用文件对象read()方法读取内容2.3 连续用...
    99+
    2022-11-12
  • Python操作Excel之xlsx文件
    前言 之前处理excel的读写时用的是xlrd/xlwt,但是这两个库有个缺点就是只对xls的格式处理的比较好,对以xlsx结尾的格式就不行了。由于现在大家使用的都是最新版本的office,excel的格式...
    99+
    2022-06-04
    操作 文件 Python
  • 4.python之文件处理
    在python中如果想对硬盘中的一个文件进行操作大概可以分为三步,它的流程如下:使用open函数打开一个文件句柄,并且赋值给一个变量。通过相应的文件句柄对指定的文件进行操作。操作完成后关闭文件,文件关闭后,会将文件内容写入到磁盘中。open...
    99+
    2023-01-31
    文件 python
  • Python处理excel与txt文件详解
    目录一、Python处理excel文件1.两个头文件2.读取excel文件3.写入excel文件二、Python处理txt文件1.打开txt文件2.读取txt文件3.写入txt文件(...
    99+
    2022-11-12
  • python生成excel文件的三种方式
    在我们做平常工作中都会遇到操作excel,那么今天写一篇,如何通过python操作excel。当然python操作excel的库有很多,比如pandas,xlwt/xlrd,openpyxl等,每个库...
    99+
    2023-09-01
    python excel pandas
  • Python使用openpyxl模块处理Excel文件
    首先贴出四种方法适用范围比较: 注释:Excel 2003 即XLS文件有大小限制即65536行256列,所以不支持大文件。而Excel 2007以上即XLSX文件的限制则为1048...
    99+
    2022-11-11
  • Python使用openpyxl处理Excel文件详情
    目录前言1. Excel窗口2. 读取Excel文件3. 写入Excel文件4. 复制Excel文件5. 创建工作表6. 设置单元格字体及颜色7. 数学公式的使用8. 设置单元格宽高...
    99+
    2022-11-11
  • python读取excel格式的文件
    使用 xlrd 能够很方便的读取 excel 文件内容,而且这是个跨平台的库,能够在windows,linux/unix,等平台上面使用。软件可以去这个地址http://www.lexicon.net/sjmachin/xlrd.htm下载...
    99+
    2023-01-31
    格式 文件 python
  • Python 文件处理之open()函数
    目录1.文件处理2.Python 文件写入3.创建新文件4.删除文件实例删除文件夹前言: 文件处理是任何 Web 应用程序的重要组成部分。 Python 有几个用于创建、读取、更新和...
    99+
    2022-11-13
  • python怎么用xlsxwriter模块处理excel文件
    本篇内容介绍了“python怎么用xlsxwriter模块处理excel文件”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!模块安装:pip&...
    99+
    2023-06-30
  • python:关于文件加载及处理方式
    目录关于文件加载及处理1、检查python2、对文件夹下面的文件名称进行列表排列3、过滤不符合要求的文件4、用于将元组转换为列表5、打开文件codeces,open()6、readl...
    99+
    2022-11-11
  • shell文件处理笔记之插入文本到文件的方法
    前言 众所周知,如果在大多数服务器上,不会预先装上 ruby 或者 python 这些语言。这时,你要想操作一些文件,一个合理的选择就是使用 shell。也就是你在 terminal中输入的那些指令。本文给...
    99+
    2022-06-04
    文件 文本 笔记
  • Python如何使用openpyxl模块处理Excel文件
    这篇文章主要介绍“Python如何使用openpyxl模块处理Excel文件”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python如何使用openpyxl模块处理Excel文件”文章能帮助大家解...
    99+
    2023-06-30
  • Python文件处理
    本文给大家介绍Python文件处理相关知识,具体内容如下所示: 1.文件的常见操作 文件是日常编程中常用的操作,通常用于存储数据或应用系统的参数。python提供了os、os.path、shutil等模块...
    99+
    2022-06-04
    文件 Python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作