iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python读取.data文件总结
  • 814
分享到

python读取.data文件总结

pythonpandas数据分析 2023-10-25 18:10:20 814人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

python读取.data文件总结 参考资料 https://www.askpython.com/python/examples/read-data-files-in-python .data文件格式

python读取.data文件总结

参考资料

https://www.askpython.com/python/examples/read-data-files-in-python

.data文件格式

.data文件是用来存储数据的一种文件格式。之前通常数据是用逗号隔开或tab健隔开的格式,现在也可能是文本文件格式或二进制文件格式。

识别.data文件里面的数据

1、先测试一下文件是文本文件还是二进制文件

用网上可以下载到的iris.data文件来举例(iris.data文件下载地址:https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data),代码如下:

# 通过Python自带的文件读取文本文件file=open('iris.data','r')data=file.read()print(data)file.close()

运行之后,可以看到结果(此处放部分数据结果):
在这里插入图片描述
根据打印出来的数据结果,可以分析出来,iris.data存的是文本数据,并且是用逗号分隔的,也可以认为是csv文件格式。

如果打印出来的数据结果不是文本类型的话,可以测试一下是不是二进制文件,代码如下:

# 通过python自带的文件读取二进制文件file=open('iris.data','rb')data=file.read()print(data)file.close()

2、用pandas读取.data文件

方法如下:
用read_csv()方法读取文件,这个方法会自动创建一个dataframe,将数据转换进去,代码如下:

# 使用Pandas读取数据import pandas as pddata=pd.read_csv('iris.data',header=None,sep=',')print(data)

注意:在第一步里面查看文件内容的时候,发现iris.data文件里面没有表头,iris.data的表头是在iris.names文件里面进行说明的(附上iris.names文件下载地址:https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.names),所以在read_csv函数调用的时候,需要加上header=None,否则data里面的第一行就会自动变成表头,这样的话150行数据就变成149行。
运行之后,显示结果如下:
在这里插入图片描述

3、其他数据存储类型

除了上述提到的文件格式外,还有JSON格式和pickle。
在读取的时候,需要import json和import pickle后,调用json.dumps()方法和pickle.dump()方法进行读取。

来源地址:https://blog.csdn.net/greenqingqingws/article/details/128906287

--结束END--

本文标题: python读取.data文件总结

本文链接: https://www.lsjlt.com/news/442731.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作