iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python利用Rows快速操作csv文件
  • 202
分享到

Python利用Rows快速操作csv文件

2024-04-02 19:04:59 202人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

目录1.准备2.基本使用3.命令行工具Rows 是一个专门用于操作表格的第三方python模块。 只要通过 Rows 读取 csv 文件,她就能生成可以被计算的 Python 对象。

Rows 是一个专门用于操作表格的第三方python模块。

只要通过 Rows 读取 csv 文件,她就能生成可以被计算的 Python 对象。

相比于 pandas 的 pd.read_csv, 我认为 Rows 的优势在于其易于理解的计算语法和各种方便的导出和转换语法。它能非常方便地提取pdf中的文字、将csv转换为sqlite文件、合并csv等,还能对csv文件执行sql语法,还是比较强大的。

当然,它的影响力肯定没有 Pandas 大,不过了解一下吧,技多不压身。

1.准备

开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问这篇文章:超详细Python安装指南 进行安装。

(可选1) 如果你用Python的目的是数据分析,可以直接安装Anaconda,它内置了Python和pip.

(可选2) 此外,推荐大家用vscode编辑器,它有许多的优点

请选择以下任一种方式输入命令安装依赖:

1. windows 环境 打开 Cmd (开始-运行-CMD)。

2. MacOS 环境 打开 Terminal (command+空格输入Terminal)。

3. 如果你用的是 VSCode编辑器 或 PyCharm,可以直接使用界面下方的Terminal.

pip install rows

2.基本使用

通过下面这个小示例,你就能知道Rows的基本使用方法。

假设我们有这样的一个csv表格数据:

state,city,inhabitants,area
AC,Acrelândia,12538,1807.92
AC,Assis Brasil,6072,4974.18
AC,Brasiléia,21398,3916.5
AC,Bujari,8471,3034.87
AC,Capixaba,8798,1702.58
[...]
RJ,Angra dos Reis,169511,825.09
RJ,Aperibé,10213,94.64
RJ,Araruama,112008,638.02
RJ,Areal,11423,110.92
RJ,Armação dos BúziOS,27560,70.28
[...]

如果我们想要找出 state 为 RJ 并且人口大于 500000 的城市,只需要这么做:

import rows
 
cities = rows.import_from_csv("data/brazilian-cities.csv")
rio_biggest_cities = [
    city for city in cities
    if city.state == "RJ" and city.inhabitants > 500000
]
for city in rio_biggest_cities:
    density = city.inhabitants / city.area
    print(f"{city.city} ({density:5.2f} ppl/km²)")

和 Pandas 很像,但是语法比 Pandas 简单,整个模块也比 Pandas 轻量。

如果你想要自己新建一个"表格", 你可以这么写:

from collections import OrderedDict
from rows import fields, Table
 
 
country_fields = OrderedDict([
    ("name", fields.TextField),
    ("population", fields.IntegerField),
])
 
countries = Table(fields=country_fields)
countries.append({"name": "Argentina", "population": "45101781"})
countries.append({"name": "Brazil", "population": "212392717"})
countries.append({"name": "Colombia", "population": "49849818"})
countries.append({"name": "Ecuador", "population": "17100444"})
countries.append({"name": "Peru", "population": "32933835"})

然后你可以迭代它:

for country in countries:
    print(country)
# Result:
# Row(name='Argentina', population=45101781)
# Row(name='Brazil', population=212392717)
# Row(name='Colombia', population=49849818)
# Row(name='Ecuador', population=17100444)
# Row(name='Peru', population=32933835)
# "Row" is a namedtuple created from `country_fields`
 
# We've added population as a string, the library automatically converted to
# integer so we can also sum:
countries_population = sum(country.population for country in countries)
print(countries_population) # prints 357378595

还可以将此表导出为 CSV 或任何其他支持的格式:

# 公众号:Python实用宝典
import rows
rows.export_to_csv(countries, "some-LA-countries.csv")
 
# html
rows.export_to_html(leGISlators, "some-LA-countries.csv")

从字典导入到rows对象:

import rows
 
data = [
    {"name": "Argentina", "population": "45101781"},
    {"name": "Brazil", "population": "212392717"},
    {"name": "Colombia", "population": "49849818"},
    {"name": "Ecuador", "population": "17100444"},
    {"name": "Peru", "population": "32933835"},
    {"name": "Guyana", }, # Missing "population", will fill with `None`
]
table = rows.import_from_dicts(data)
print(table[-1]) # Can use indexes
# Result:
# Row(name='Guyana', population=None)

3.命令行工具

除了写Python代码外,你还可以直接使用Rows的命令行工具,下面介绍几个可能会经常被用到的工具。

读取pdf文件内的文字并保存为文件:

# 需要提前安装: pip install rows[pdf]
URL="Http://www.imprensaoficial.rr.Gov.br/app/_edicoes/2018/01/doe-20180131.pdf"
rows pdf-to-text $URL result.txt # 保存到文件 显示进度条
rows pdf-to-text --quiet $URL result.txt # 保存到文件 不显示进度条
rows pdf-to-text --pages=1,2,3 $URL # 输出三页到终端
rows pdf-to-text --pages=1-3 $URL # 输出三页到终端(使用 - 范围符)

将csv转化为sqlite:

rows csv2sqlite \
     --dialect=excel \
     --input-encoding=latin1 \
     file1.csv file2.csv \
     result.sqlite

合并多个csv文件:

rows csv-merge \
     file1.csv file2.csv.bz2 file3.csv.xz \
     result.csv.gz

对csv执行sql搜索:

# needs: pip install rows[html]
rows query \
    "SELECT * FROM table1 WHERE inhabitants > 1000000" \
    data/brazilian-cities.csv \
    --output=data/result.html

其他更多功能,请见Rows官方文档:

http://turicas.info/rows

到此这篇关于Python利用Rows快速操作csv文件的文章就介绍到这了,更多相关Python操作csv内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python利用Rows快速操作csv文件

本文链接: https://www.lsjlt.com/news/120282.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python利用Rows快速操作csv文件
    目录1.准备2.基本使用3.命令行工具Rows 是一个专门用于操作表格的第三方Python模块。 只要通过 Rows 读取 csv 文件,她就能生成可以被计算的 Python 对象。...
    99+
    2024-04-02
  • 如何利用Python快速读取CSV文件
    使用 pandas 库可快速读取 csv 文件:首先安装 pandas。使用 read_csv() 函数读取 csv 文件并将其存储在数据框中。使用 head() 函数查看数据框的前几行...
    99+
    2024-04-04
    python csv 数据处理 csv文件
  • Python 操作.csv文件
    import csv csvfile = file('E:\\workspace\\data\\ex1.csv', 'rb') reader = csv.reader(csvfile) for line in reader:     p...
    99+
    2023-01-31
    操作 文件 Python
  • Python利用docx模块实现快速操作word文件
    目录一、基础内容1. 基本概念2. 操作word文档二、单独设置内容样式1. 字体相关样式三、样式演示四、制作表格1. 表格2.行列对象3. 单元格对象一、基础内容 安装第三方库的时...
    99+
    2024-04-02
  • python之文件操作、OS模块、CSV
    1 文件系统和文件 在磁盘上读写文件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘,所以,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件...
    99+
    2023-01-31
    模块 操作 文件
  • Python读写csv文件的操作方法
    这篇文章主要介绍了Python读写csv文件的操作方法,具有一定借鉴价值,需要的朋友可以参考下。下面就和我一起来看看吧。要在 Python 中写入 CSV,请使用 Python 的 csv 模块。例如,让我们将一个字符串列表写入一个新的 C...
    99+
    2023-07-06
  • golang怎么操作csv文件
    本文小编为大家详细介绍“golang怎么操作csv文件”,内容详细,步骤清晰,细节处理妥当,希望这篇“golang怎么操作csv文件”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。练习要求:写一个小程序解析data...
    99+
    2023-06-29
  • python3 csv文件基本操作
    csv(Comma-Separated Values),也叫逗号分割值,如果你安装了excel,默认会用excel打开csv文件。 废话少说直接贴代码: import csv # 打开文件,用with打开可以不用去特意关闭file了,p...
    99+
    2023-01-31
    操作 文件 csv
  • 【MySQL】将 CSV文件快速导入 MySQL 中
    【MySQL】将 CSV文件快速导入 MySQL 中 方法一:使用navicat等软件的导入向导如果出现中文乱码 方法二:命令行导入(LOAD DATA INFILE SQL) 一般来...
    99+
    2023-09-18
    mysql 数据库
  • 利用python如何删除csv文件
    利用python如何删除csv文件?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1. 读取数据用pandas中的read_csv()函数读取出csv文件中的数据:impor...
    99+
    2023-06-14
  • python操作csv格式文件之csv.DictReader()方法
    目录简单使用csv.DictReader()方法使用csv.DictReader()之fieldnames参数使用csv.DictReader()之restkey参数使用csv.Di...
    99+
    2024-04-02
  • 如何利用Python 快速找到最大文件
    现在的电脑差不多都是固态硬盘了,速度很快,但容量不会太大,经常会出现磁盘空间不足的情况,怎么办,删除那些不重要的最大的文件是最有效的办法。 那么如何用找到最大的文件呢?比如...
    99+
    2024-04-02
  • 怎么利用Python快速找到最大文件
    本篇内容介绍了“怎么利用Python快速找到最大文件”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!思路:我们遍历目录,将文件路径和文件大小作...
    99+
    2023-06-25
  • Python怎么读取和写入操作CSV文件
    这篇文章主要介绍“Python怎么读取和写入操作CSV文件”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python怎么读取和写入操作CSV文件”文章能帮助大家解决问题。什么是 CSV 文件?CSV...
    99+
    2023-06-29
  • Java快速导出数据(List)到CSV文件
    👏作者简介:大家好,我是Rockey,不知名企业的不知名Java开发工程师 🔥如果感觉博主的文章还不错的话,请👍三连支持👍一下博主哦 📝联系方式:he183...
    99+
    2023-08-17
    java 开发语言
  • Python中CSV文件的读写库操作方法
    目录文件的基本读写用字典模式处理数据非标准格式的处理dialectSnifferCSV 格式的全称是 Comma Separated Values,意思是逗号分割的数据,是最常见的电...
    99+
    2022-12-08
    CSV文件读写库 CSV文件读写 CSV文件
  • 千万行csv大文件快速导入mysql
    最近尝试csv文件导入,因为之前太菜就用普通图形窗口导入,但是速度很慢,于是做了总结: 目前我这里一共两种方法: 1.窗口 mysql  workbench导入 (适用范围:对数据库不了,要导入的csv文件比较小,不超过1万行适用)【速度慢...
    99+
    2023-09-22
    数据库 sql mysql
  • 如何利用bat文件制作HOSTS快速切换器
    这篇文章将为大家详细讲解有关如何利用bat文件制作HOSTS快速切换器,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。切换 HOSTS 文件的困扰 学校里的 IPV6 免费上,而 IPV6 下是不用翻墙的,...
    99+
    2023-06-08
  • 利用Python实现快速批量转换HEIC文件
    目录1. 前言2. 准备3. 实战4.最后1. 前言 最近打算做一批日历给亲朋好友,但是从 iPhone 上导出的照片格式是 HEIC 格式,而商家的在线制作网站不支持这种图片格式 ...
    99+
    2024-04-02
  • python3.x操作csv文件的实战
    说明python3.x集成了对csv文件的操作,直接引入包即可,但python2.x则需要单独安装。实战1、读取csv文件#引入包 import csv #打开文件 csvfile = open('xiaoqiang.csv',newlin...
    99+
    2023-01-31
    实战 操作 文件
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作