iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >用Python的pandas读取excel文件中的数据
  • 274
分享到

用Python的pandas读取excel文件中的数据

pythonexcel软件测试自动化测试测试工程师 2023-09-01 15:09:59 274人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

一、前言 hello呀!各位铁子们大家好呀,今天呢来和大家聊一聊用python的pandas读取excel文件中的数据。 二、读取Excel文件 使用pandas的read_excel()方法,可通过文件路径直接读取。注意到,在一个exce

一、前言

hello呀!各位铁子们大家好呀,今天呢来和大家聊一聊用pythonpandas读取excel文件中的数据。

二、读取Excel文件

使用pandas的read_excel()方法,可通过文件路径直接读取。注意到,在一个excel文件中有多个sheet,因此,对excel文件的读取实际上是读取指定文件、并同时指定sheet下的数据。可以一次读取一个sheet,也可以一次读取多个sheet,同时读取多个sheet时后续操作可能不够方便,因此建议一次性只读取一个sheet。

当只读取一个sheet时,返回的是DataFrame类型,这是一种表格数据类型,它清晰地展示出了数据的表格型结构。具体写法为:

(1)不指定sheet参数,默认读取第一个sheet,
df=pd.read_excel("data_test.xlsx")
(2)指定sheet名称读取,
df=pd.read_excel("data_test.xlsx",sheet_name="test1")
(3)指定sheet索引号读取,
df=pd.read_excel("data_test.xlsx",sheet_name=0) #sheet索引号从0开始

*同时读取多个sheet,以字典形式返回。(不推荐)
(1)指定多个sheet名称读取, df=pd.read_excel("data_test.xlsx",sheet_name=["test1","test2"])
(2)指定多个sheet索引号读取,
df=pd.read_excel("data_test.xlsx",sheet_name=[0,1])
(3)混合指定sheet名称和sheet索引号读取,
df=pd.read_excel("data_test.xlsx",sheet_name=[0,"test2"])
点我免费领取全套软件测试(自动化测试)视频资料(备注“知乎AAA”)

三、DataFrame对象的结构

对内容的读取分有表头和无表头两种方式,默认情形下是有表头的方式,即将第一行元素自动置为表头标签,其余内容为数据;当在read_excel()方法中加上header=None参数时是不加表头的方式,即从第一行起,全部内容为数据。读取到的Excel数据均构造成并返回DataFrame表格类型(以下以df表示)。

对有表头的方式,读取时将自动地将第一行元素置为表头向量,同时为除表头外的各行内容加入行索引(从0开始)、各列内容加入列索引(从0开始)。如图所示

 

对无表头的方式,读取时将自动地为各行内容加入行索引(从0开始)、为各列内容加入列索引(从0开始),行索引从第一行开始。如图所示

​四、用values方式获取数据

1.基本方法
df.values,获取全部数据,返回类型为ndarray(二维);
df.index.values,获取行索引向量,返回类型为ndarray(一维);
df.columns.values,获取列索引向量(对有表头的方式,是表头标签向量),返回类型为ndarray(一维)。

根据具体需要,通过ndarray的使用规则获取指定数据。数据获取的结构示意图如下所示。

有表头

无表头

 

2.获取指定数据的写法
(1)获取全部数据:
df.values,获取全部数据,返回类型为ndarray(二维)。

(2)获取某个值:
df.values[i , j],第i行第j列的值,返回类型依内容而定。

(3)获取某一行:
df.values[i],第i行数据,返回类型为ndarray(一维)。

(4)获取多行:
df.values[[i1 , i2 , i3]],第i1、i2、i3行数据,返回类型为ndarray(二维)。

(5)获取某一列:
df.values[: , j],第j列数据,返回类型为ndarray(一维)。

(6)获取多列:
df.values[:,[j1,j2,j3]],第j1、j2、j3列数据,返回类型为ndarray(二维)。

(7)获取切片:
df.values[i1:i2 , j1:j2],返回行号[i1,i2)、列号[j1,j2)左闭右开区间内的数据,返回类型为ndarray(二维)。

3.示例
带表头,excel内容为

Python脚本为
`import pandas as pd

df = pd.read_excel("data_test.xlsx")

print("\n(1)全部数据:")
print(df.values)

print("\n(2)第2行第3列的值:")
print(df.values[1,2])

print("\n(3)第3行数据:")
print(df.values[2])

print("\n(4)获取第2、3行数据:")
print(df.values[[1,2]])

print("\n(5)第2列数据:")
print(df.values[:,1])

print("\n(6)第2、3列数据:")
print(df.values[:,[1,2]])

print("\n(7)第2至4行、第3至5列数据:")
print(df.values[1:4,2:5])

执行结果

 

​五、用loc和iloc方式获取数据

1.基本写法
loc和iloc方法是通过索引定位的方式获取数据的,写法为loc[A, B]和iloc[A, B]。其中A表示对行的索引,B表示对列的索引,B可缺省。A、B可为列表或i1:i2(切片)的形式,表示多行或多列。

这两个方法的区别是,loc将参数当作标签处理,iloc将参数当作索引号处理。也就是说,在有表头的方式中,当列索引使用str标签时,只可用loc,当列索引使用索引号时,只可用iloc;在无表头的方式中,索引向量也是标签向量,loc和iloc均可使用;在切片中,loc是闭区间,iloc是半开区间。

获取指定数据的写法:
(1)获取全部数据:
df.loc[: , :].values

df.iloc[: , :].values,返回类型为ndarray(二维)。

(2)获取某个值:
无表头
df.loc[i, j]

df.iloc[i, j],第i行第j列的值,返回类型依内容而定。

有表头
df.loc[i, "序号"],第i行‘序号’列的值。

df.iloc[i, j],第i行第j列的值。

(3)获取某一行:
df.loc[i].values

df.iloc[i].values,第i行数据,返回类型为ndarray(一维)。

(4)获取多行:
df.loc[[i1, i2, i3]].values,

df.iloc[[i1, i2, i3]].values,第i1、i2、i3行数据,返回类型为ndarray(二维)。

(5)获取某一列:
无表头
df.loc[:, j].values

df.iloc[:, j].values,第j列数据,返回类型为ndarray(一维)。

有表头
df.loc[:,"姓名"].values,‘姓名’列数据,返回类型为ndarray(一维)。

df.iloc[:, j].values,第j列数据,返回类型为ndarray(一维)。

(6)获取多列:
无表头
df.loc[:, [j1 , j2]].values

df.iloc[:, [j1 , j2]].values,第j1、j2列数据,返回类型为ndarray(二维)。

有表头
df.loc[:, ["姓名","性别"]].values,‘姓名’、‘性别’列数据,返回类型为ndarray(二维);
df.iloc[:, [j1 , j2]].values,第j1、j2列数据,返回类型为ndarray(二维)。

(7)获取切片:
无表头
df.loc[i1:i2, j1:j2].values,返回行号[i1,i2]、列号[j1,j2]闭区间内的数据,返回类型为ndarray(二维);
df.iloc[i1:i2, j1:j2].values,返回行号[i1,i2)、列号[j1,j2)左闭右开区间内的数据,返回类型为ndarray(二维)。

有表头
df.loc[i1:i2, "序号":"姓名"].values,返回行号[i1,i2]、列号["序号","姓名"]闭区间的数据,返回类型为ndarray(二维);
df.iloc[i1:i2, j1:j2].values,返回行号[i1,i2)、列号[j1,j2)左闭右开区间内的数据,返回类型为ndarray(二维)。

2.示例
带表头,excel内容为

 

Python脚本为
`import pandas as pd

df = pd.read_excel("data_test.xlsx")

print("\n(1)全部数据:")
print(df.iloc[:,:].values)

print("\n(2)第2行第3列的值:")
print(df.iloc[1,2])

print("\n(3)第3行数据:")
print(df.iloc[2].values)

print("\n(4)第2列数据:")
print(df.iloc[:,1].values)

print("\n(5)第6行的姓名:")
print(df.loc[5,"姓名"])

print("\n(6)第2至3行、第3至4列数据:")
print(df.iloc[1:3,2:4].values)`
执行结果

 

最后: 为了回馈铁杆粉丝们,我给大家整理了完整的软件测试视频学习教程,朋友们如果需要可以自行免费领取 【保证100%免费】

在这里插入图片描述

全套资料获取方式:点击下方小卡片自行领取即可

来源地址:https://blog.csdn.net/weixin_57794111/article/details/131455259

--结束END--

本文标题: 用Python的pandas读取excel文件中的数据

本文链接: https://www.lsjlt.com/news/388874.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 用Python的pandas读取excel文件中的数据
    一、前言 hello呀!各位铁子们大家好呀,今天呢来和大家聊一聊用Python的pandas读取excel文件中的数据。 二、读取Excel文件 使用pandas的read_excel()方法,可通过文件路径直接读取。注意到,在一个exce...
    99+
    2023-09-01
    python excel 软件测试 自动化测试 测试工程师
  • 使用python的pandas读取excel文件中的数据详情
    目录一、读取Excel文件二、DataFrame对象的结构三、用values方式获取数据1.基本方法2.获取指定数据的写法3.示例四、用loc和iloc方式获取数据1.基本写法2.示...
    99+
    2022-11-11
  • pandas 读取excel文件的操作代码
    目录一 read_excel() 的基本用法二 read_excel() 的常用的参数:三 示例1. IO:路径2. sheet_name:指定工作表名3. header :指定标题...
    99+
    2022-11-12
  • python中Pandas读取数据文件的优点是什么
    这篇文章给大家分享的是有关python中Pandas读取数据文件的优点是什么的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1、优点Pandas 提供了多种常用文件格式的读写函数,以上各种情况都能一行代码搞定。Pa...
    99+
    2023-06-15
  • Python读取Excel中的数据
     1、用xlrd包读取excel数据 import xlrddef read_excel(): # 打开文件,xlrd.open_workbook(),函数中参数为文件路径,分为相对路径和绝对路径 workBook = xlrd...
    99+
    2023-09-12
    excel python
  • python 读取excel中的数据
      应为工作的原因有所接触python,学习过程中找了点有用的东东,分享一下   使用xlrd包,它可以运行在所有的平台上。 Windows下载链接: http://download.csdn.net/detail/qianminming...
    99+
    2023-01-31
    数据 python excel
  • Python中Pandas怎么读取文件和读取CSV参数
    本篇内容主要讲解“Python中Pandas怎么读取文件和读取CSV参数”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python中Pandas怎么读取文件和读取CSV参数”吧!一、Pandas...
    99+
    2023-07-06
  • python读取excel格式的文件
    使用 xlrd 能够很方便的读取 excel 文件内容,而且这是个跨平台的库,能够在windows,linux/unix,等平台上面使用。软件可以去这个地址http://www.lexicon.net/sjmachin/xlrd.htm下载...
    99+
    2023-01-31
    格式 文件 python
  • python pandas库读取excel/csv中指定行或列数据
    目录引言1.根据index查询2.已知数据在第几行找到想要的数据3.根据条件查询找到指定行数据4.找出指定列5.找出指定的行和指定的列6.在规定范围内找出符合条件的数据总结引言 关键...
    99+
    2022-11-13
  • 【Python】使用pandas将数据写入excel文件中
    文章目录 前言一、pandas是什么?二、使用步骤1.引入库2.将数据写入到Excel中 总结 前言 本文主要简单介绍一下使用python的pandas库来将数据写入到excel文件...
    99+
    2023-09-01
    pandas python excel 经验分享 自动化
  • python使用pandas读写excel文件的方法实例
    目录引言读取excel文件写入文件:总结引言 现在本地创建一个excel表,以及两个sheet,具体数据如下: sheet1:  sheet2: 读取excel文件 p...
    99+
    2022-11-11
  • Python Pandas读取Excel日期数据的异常处理方法
    目录异常描述出现原因解决方案:修改自定义格式pandas直接解析Excel数值为日期总结 异常描述 有时我们的Excel有一个调整过自定义格式的日期字段: 当我们用pan...
    99+
    2022-11-13
  • python使用pandas读取csv文件的方法
    目录pandas读取csv文件的操作1. 读取csv文件在这里记录一下,python使用pandas读取文件的方法用到pandas库的read_csv函数 # -*- coding:...
    99+
    2022-12-23
    python 读取csv文件 pandas读取csv文件
  • pandas读取excel,txt,csv,pkl文件等命令的操作
    pandas读取txt文件 读取txt文件需要确定txt文件是否符合基本的格式,也就是是否存在\t,,,等特殊的分隔符 一般txt文件长成这个样子 txt文件举例 下面的文件为空格间...
    99+
    2022-11-12
  • 如何读取ADO.NET Excel数据文件
    这篇文章主要介绍如何读取ADO.NET Excel数据文件,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!我们用ADO.NET操作数据库,我们就会更Excel打交道,这是避免不了的。现在要介绍是如何动态的读取ADO.N...
    99+
    2023-06-17
  • python pandas 获取Excel文件下所有的sheet名称,表格数据
    方法1: 一定要加sheet_name=None,才能读取出所有的sheet,否则默认读取第一个sheet,且获取到的keys是第一行的值 df = pd.read_excel('自己的Excel文件...
    99+
    2023-09-14
    python pandas excel
  • Python Pandas读取Excel日期数据的异常处理怎么办
    小编给大家分享一下Python Pandas读取Excel日期数据的异常处理怎么办,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!异常描述有时我们的Excel有一个调整过自定义格式的日期字段:当我们用pandas读...
    99+
    2023-06-29
  • 怎么用python pandas库读取excel/csv中指定行或列数据
    本篇内容介绍了“怎么用python pandas库读取excel/csv中指定行或列数据”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所...
    99+
    2023-06-29
  • python读取excel表格的数据
    1.在Windows命令行中安装第三方模块xlrd,先切到python安装目录(Python34),然后切到Scripts,然后输入命令easy_install xlrd按回车进行安装安装完成2.新建一个excel表,然后保存,造数据3.编...
    99+
    2023-01-31
    表格 数据 python
  • 如何使用pandas读取csv文件中的某一列数据
    使用pandas读取csv文件中的某一列数据,可以这样做: 先导入pandas模块:import pandas as pd使用pd.read_csv函数读取csv文件:df = pd.read_csv("文件名.csv")使用df["列...
    99+
    2023-08-31
    pandas python 数据分析 数据挖掘 机器学习
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作