Python 官方文档:入门教程 => 点击学习
这篇文章主要介绍“python如何使用openpyxl模块处理excel文件”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python如何使用openpyxl模块处理Excel文件”文章能帮助大家解
这篇文章主要介绍“python如何使用openpyxl模块处理excel文件”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python如何使用openpyxl模块处理Excel文件”文章能帮助大家解决问题。
首先贴出四种方法适用范围比较:
注释:Excel 2003 即XLS文件有大小限制即65536行256列,所以不支持大文件。而Excel 2007以上即XLSX文件的限制则为1048576行16384列
最原始的莫过于两位老牌黄金搭档xlrd xlwt了,针对二者的封装有如下模块:
xlutils
xlrd
xlwt
为什么把这三个一起说?
首先,xlutils封装了xlrd xlwt,所以在使用前,会先下载这两个依赖的模块。
其次,这两个模块主要用于处理xls文件,而对xlsx的文件处理很挫,甚至xlwt不支持…
但为何到现在依然在使用这些模块,因为他对xls文档处理的优势….
安装:(如果没安装xlrd、xlwt,会自动安装这2个模块)
pip install xlutils
使用:
import xlrdimport xlwtimport xlutilsimport xlutils.copy as copyrdbook = xlrd.open_workbook('first.xls')wtbook = copy.copy(rdbook)wtsheet = wtbook.get_sheet(0)type(wtsheet)wtsheet.write(0,0,'pcat.cc')wtbook.save('second.xls')
安装:pip install xlrd
使用:只能读.xls、.xlsx文件(xlrd0.8.0+版本支持读取xlsx文件)
import xlrdbook = xlrd.open_workbook("pcat.xls")print("The number of worksheets is {0}".fORMat(book.nsheets))print("Worksheet name(s): {0}".format(book.sheet_names()))sh = book.sheet_by_index(0)print("{0} {1} {2}".format(sh.name, sh.nrows, sh.ncols))print("Cell B3 is {0}".format(sh.cell_value(rowx=2, colx=1)))for rx in range(sh.nrows): print(sh.row(rx))
安装:pip install xlwt
使用:用xlwt创建一个简单的.xls文件
import xlwtfrom datetime import datetimestyle0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on', num_format_str='#,##0.00')style1 = xlwt.easyxf(num_format_str='YYYY-MM-DD HH:MM:SS')wb = xlwt.Workbook()ws = wb.add_sheet('A Test Sheet')ws.write(0, 0, 1234.56, style0)ws.write(1, 0, datetime.now(), style1)ws.write(2, 0, 1)ws.write(2, 1, 1)ws.write(2, 2, xlwt.Formula("A3+B3"))wb.save('example.xls')
pandas作为数据分析利器,在读写excel方面,依赖库xlrd和xlwt。
import pandas as pd #方法一:默认读取第一个表单df=pd.read_excel('lemon.xlsx')#这个会直接默认读取到这个Excel的第一个表单data=df.head()#默认读取前5行的数据print("获取到所有的值:\n{0}".format(data))#格式化输出 #方法二:通过指定表单名的方式来读取df=pd.read_excel('lemon.xlsx',sheet_name='student')#可以通过sheet_name来指定读取的表单data=df.head()#默认读取前5行的数据print("获取到所有的值:\n{0}".format(data))#格式化输出 #方法三:通过表单索引来指定要访问的表单,0表示第一个表单#也可以采用表单名和索引的双重方式来定位表单#也可以同时定位多个表单,方式都罗列如下所示df=pd.read_excel('lemon.xlsx',sheet_name=['python','student'])#可以通过表单名同时指定多个# df=pd.read_excel('lemon.xlsx',sheet_name=0)#可以通过表单索引来指定读取的表单# df=pd.read_excel('lemon.xlsx',sheet_name=['python',1])#可以混合的方式来指定# df=pd.read_excel('lemon.xlsx',sheet_name=[1,2])#可以通过索引 同时指定多个data=df.values#获取所有的数据,注意这里不能用head()方法哦~print("获取到所有的值:\n{0}".format(data))#格式化输出
xlsxwriter拥有丰富的特性,支持图片/表格/图表/筛选/格式/公式等,功能与openpyxl相似,优点是相比 openpyxl 还支持 VBA 文件导入,迷你图等功能,缺点是不能打开/修改已有文件,意味着使用 xlsxwriter 需要从零开始。
注意:XlsxWriter不支持.xls格式。
代码示例:
import xlsxwriter # Create a workbook and add a worksheet.workbook = xlsxwriter.Workbook('Expenses01.xlsx')worksheet = workbook.add_worksheet() # Some data we want to write to the worksheet.expenses = (['Rent', 1000], ['Gas', 100],['Food', 300], ['Gym', 50],) # Start from the first cell. Rows and columns are zero indexed.row = 0col = 0 # Iterate over the data and write it out row by row.for item, cost in (expenses): worksheet.write(row, col, item) worksheet.write(row, col + 1, cost) row += 1 # Write a total using a formula.worksheet.write(row, 0, 'Total')worksheet.write(row, 1, '=SUM(B1:B4)')worksheet.write('A1', 'Hello world')workbook.close()
读写 Excel 2010 xlsx/xlsm files.
最后要说说个人比较常用,也很方便的一个excel处理模块openpyxl….这个模块突出的优势在于,对excel单元格样式的设置方面特别详细。
注意:openpyxl不支持.xls格式。读写文件前记得多备注,有时候可能有bug。
安装:pip install openpyxl
from openpyxl import Workbookfrom openpyxl.utils import get_column_letterwb = Workbook()dest_filename = 'empty_book.xlsx'ws1 = wb.activews1.title = "range names"for row in range(1, 40): ws1.append(range(600))ws2 = wb.create_sheet(title="Pi")ws2['F5'] = 3.14ws2['A1'] = 42 # Data can be assigned directly to cellsws2.append([1, 2, 3])# Rows can also be appended# Python types will automatically be convertedimport datetimews2['A2'] = datetime.datetime.now()ws3 = wb.create_sheet(title="Data")for row in range(10, 20): for col in range(27, 54): _ = ws3.cell(column=col, row=row, value="{0}".format(get_column_letter(col)))print(ws3['AA10'].value)wb.save(filename = dest_filename)
from openpyxl import load_workbookwb = load_workbook(filename = 'empty_book.xlsx')sheet_ranges = wb['Sheet1']print(sheet_ranges['D18'].value)
from openpyxl import Workbookfrom openpyxl.drawing.image import Image wb = Workbook()ws = wb.activews['A1'] = 'You should see three loGos below'img = Image('logo.png') # create an imagews.add_image(img, 'A1') # add to worksheet and anchor next to cellswb.save('logo.xlsx')
样式用于在屏幕上显示时更改数据的外观。它们还用于确定数字的格式。
样式可以应用于以下方面:
字体设置字体大小,颜色,下划线等
填充以设置图案或颜色渐变
边框设置单元格上的边框
单元格排列
保护
以下是默认值:
from openpyxl.styles import PatternFill, Border, Side, Alignment, Protection, Fontfont = Font(name='Calibri',size=11,bold=False, italic=False,vertAlign=None,underline='none',strike=False, color='FF000000')fill = PatternFill(fill_type=None, start_color='FFFFFFFF', end_color='FF000000')border = Border(left=Side(border_style=None,color='FF000000'), right=Side(border_style=None,color='FF000000'), top=Side(border_style=None, color='FF000000'), bottom=Side(border_style=None, color='FF000000'), diagonal=Side(border_style=None, color='FF000000'), diagonal_direction=0, outline=Side(border_style=None,color='FF000000'), vertical=Side(border_style=None,color='FF000000'), horizontal=Side(border_style=None,color='FF000000') )alignment=Alignment(horizontal='general',vertical='bottom', text_rotation=0, wrap_text=False, shrink_to_fit=False, indent=0)number_format = 'General'protection = Protection(locked=True, hidden=False)
关于“Python如何使用openpyxl模块处理Excel文件”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网Python频道,小编每天都会为大家更新不同的知识点。
--结束END--
本文标题: Python如何使用openpyxl模块处理Excel文件
本文链接: https://www.lsjlt.com/news/330787.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
下载Word文档到电脑,方便收藏和打印~
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0