iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >利用python合并csv文件的方式实例
  • 415
分享到

利用python合并csv文件的方式实例

2024-04-02 19:04:59 415人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

目录1.用concat方法合并csv2.glob模块批量合并csv补充:python处理(加载、合并)多个csv文件总结1.用concat方法合并csv 将两个相同的csv文件进行数

1.用concat方法合并csv

将两个相同的csv文件进行数据合并,通过pandas的read_csv和to_csv来完成,即采用concat方法:

#加载第三方库
import pandas as pd
import numpy as np
#读取文件
df1 = pd.read_csv("文件-1.csv")
df2 = pd.read_csv("文件-2.csv")
#合并
df = pd.concat([df1,df2])
df.drop_duplicates()  #数据去重
#保存合并后的文件
df.to_csv('文件.csv',encoding = 'utf-8')

也可以增加一列标签,以区别两个合并后的数据:

#加载第三方库
import pandas as pd
import numpy as np
#读取文件
df1 = pd.read_csv("文件-1.csv")
df1["来自文件"] = "文件-1"
df2 = pd.read_csv("文件-2.csv")
df2["来自文件"] = "文件-2"
#合并
df = pd.concat([df1,df2])
df.drop_duplicates()  #数据去重
#保存合并后的文件
df.to_csv('文件.csv',encoding = 'utf-8')

2.glob模块批量合并csv

在利用合并少量文件时,可以使用上面的concat方法。但是遇到大量的相同文件需要合并,此时应该进行批量合并,这可以减少工作量,提高操作效率。

利用Python批量合并csv,这里介绍使用的方法是引入glob模块。

glob模块是最简单的模块之一,内容少,它可以查找符合特定规则的文件路径名。

通过glob方法遍历所有文件,读取数据并追加保存到文件中。

import numpy as np
import pandas as pd
import glob
import re
 
csv_list = glob.glob('*.csv')
print('共发现%s个CSV文件'% len(csv_list))
print('正在处理............')
for i in csv_list:
    fr = open(i,'r',encoding='utf-8').read()
    with open('文件合集.csv','a',encoding='utf-8') as f:
        f.write(fr)
print('合并完毕!')

以上方法是合并csv文件,要合并excel文件同理。

补充:Python处理(加载、合并)多个csv文件

数据集介绍:本数据集是某化工系统的数据,一共有很多个月的,我这里就拿一个月的数据集,August_data(八月的数据集),一共有31个csv文件。   

方法一  for循环遍历+os.listdir(directory_path)+[ for file in tqdm] + os.path.join(path,file)

import pandas as pd
import numpy as np 
from tqdm import tqdm
import os
 
def get_data(path):
    df_list = []
    for file in tqdm(os.listdir(path)):##进度条
        file_path = os.path.join(path, file)
        df = pd.read_csv(file_path)
        df_list.append(df)
    df = pd.concat(df_list)
    return df
 
cPath = '.\August_data'
# cPath = 'F:/BaiduNetdiskDownload/宁东电厂数据及分析要求/宁东脱销系统优化-上海交大/SCR数据-2020-1/8月数据' #F:/BaiduNetdiskDownload/宁东电厂数据及分析要求/宁东脱销系统优化-上海交大/SCR数据-2020-1/8月数据
# uPath = str(cPath)#uPath = unicode(cPath,'utf-8')
# dirs = os.listdir(TEST_PATH)
# print(dirs)
test_df = get_data(cPath)
print(test_df.head())
# test_df.to_csv(path_or_buf="test.csv",index=False)#保存为CSV文件

方法二   glob方法

#!/usr/bin/env python
# coding=utf-8
 
import glob
import time
import csv
import pandas as pd
from tqdm import tqdm
# a new file 
#open all the CSV file
#遍历文件夹下所有csv文件
TEST_PATH = '.\August_data' 
csv_list = glob.glob(f'{TEST_PATH}\*.csv')
print('共有%s个CSV文件'% len(csv_list))
# print (csv_list)
 
def get_data():
    df_list = []
    for csv_file in csv_list:
        df = pd.read_csv(csv_file)
        df_list.append(df)
    df = pd.concat(df_list)
    print("Loading Oer")
    return df
get_data()

总结

到此这篇关于利用python合并csv文件的文章就介绍到这了,更多相关python合并csv文件内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 利用python合并csv文件的方式实例

本文链接: https://www.lsjlt.com/news/119300.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 利用python合并csv文件的方式实例
    目录1.用concat方法合并csv2.glob模块批量合并csv补充:Python处理(加载、合并)多个csv文件总结1.用concat方法合并csv 将两个相同的csv文件进行数...
    99+
    2024-04-02
  • Python实现本地csv文件合并
    目录一、单文件之间合并二、单个文件夹底下多个文件合并三、多个文件夹底下多个文件合并四、多文件夹[函数递归]总结本篇的文件合并主要是针对.csv的文件合并。 一、单文件之间合并 首先...
    99+
    2024-04-02
  • 利用python如何删除csv文件
    利用python如何删除csv文件?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1. 读取数据用pandas中的read_csv()函数读取出csv文件中的数据:impor...
    99+
    2023-06-14
  • Python修改CSV文件实例详解
    目录前言Python 修改CSV文件前言 由于 CSV 文件仅仅是简单的文本文件,因此更新 CSV 文件中内容的最佳方式是首先读取文件中的数据,并将它们处理为 P...
    99+
    2024-04-02
  • Go来合并两个csv的实现示例
    背景 通常我们处理文件都是用python+pandas,确实很香。但是今天突然有人找我用go写一个合并两个csv文件的,需要将两个csv按id进行合并,大致如下图 思路很简单,先...
    99+
    2024-04-02
  • Python利用Rows快速操作csv文件
    目录1.准备2.基本使用3.命令行工具Rows 是一个专门用于操作表格的第三方Python模块。 只要通过 Rows 读取 csv 文件,她就能生成可以被计算的 Python 对象。...
    99+
    2024-04-02
  • 如何利用Python读取CSV文件并计算某一列的均值和方差
    今天就跟大家聊聊有关如何利用Python读取CSV文件并计算某一列的均值和方差,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。近日需要对excel的csv文件进行处理,求取某银行历年股...
    99+
    2023-06-22
  • 教你用Python读取CSV文件的5种方式
    目录第一招:简单的读取第二招:用nametuple第三招:用tuple类型转换第四招:用DictReader第五招:用字典转换在python里面,读取或写入csv文件时,首先要imp...
    99+
    2024-04-02
  • python 读写csv格式的文件
    python在它的标准库中包含了csv模块。 例子环境 python3.4 win7 32位 1.读取csv文件 csvTest-data.csv内容如下: ItemID,Name,Description,Owner,Bor...
    99+
    2023-01-31
    格式 文件 python
  • 如何利用Python快速读取CSV文件
    使用 pandas 库可快速读取 csv 文件:首先安装 pandas。使用 read_csv() 函数读取 csv 文件并将其存储在数据框中。使用 head() 函数查看数据框的前几行...
    99+
    2024-04-04
    python csv 数据处理 csv文件
  • 使用pandas生成/读取csv文件的方法实例
    前言 csv是我接触的比较早的一种文件,比较好的是这种文件既能够以电子表格的形式查看又能够以文本的形式查看。 先引入pandas库 import pandas as pd 方法一...
    99+
    2024-04-02
  • Python实现读取csv文件并进行排序
    目录前言一、案例描述二、代码讲解三、完整代码从本文开始,本系列将介绍python简单案例并进行代码展示,本文的案例是利用pandas库实现读取csv文件并按照列的从小到大进行排序。 ...
    99+
    2023-02-10
    Python读取csv文件 Python读取csv Python csv
  • python用pd.read_csv()方法来读取csv文件的实现
    csv文件是一种用,和换行符区分数据记录和字段的一种文件结构,可以用excel表格编辑,也可以用记事本编辑,是一种类excel的数据存储文件,也可以看成是一种数据库。pandas提供...
    99+
    2024-04-02
  • python操作csv格式文件之csv.DictReader()方法
    目录简单使用csv.DictReader()方法使用csv.DictReader()之fieldnames参数使用csv.DictReader()之restkey参数使用csv.Di...
    99+
    2024-04-02
  • 用python将word文档合并实例代码
    目录背景:设计思路:脚本环境说明:完整代码:功能执行效果图:总结:背景:         由于工作需要,现在有这么一个需求,要合并大量的word文档,而且要在不同的目录下找到同一个人...
    99+
    2024-04-02
  • Python操作CSV格式文件的方法有哪些
    这篇文章主要介绍“Python操作CSV格式文件的方法有哪些”,在日常操作中,相信很多人在Python操作CSV格式文件的方法有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python操作CSV格式文件...
    99+
    2023-06-20
  • python读写csv文件的实战
    csv介绍csv是什么?大家估计都听过,不过我猜很少能有人比较全面的解释下的,那么小弟就献丑一下。csv我理解的是一个存储数据的文件,里面以逗号作为分割进行存储(当然也可以用制表符进行分割)。csv的规则1 开头是不留空,以行为单位。2 可...
    99+
    2023-01-31
    实战 文件 python
  • Python怎么实现Excel文件的合并
    本文小编为大家详细介绍“Python怎么实现Excel文件的合并”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python怎么实现Excel文件的合并”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。一、单目录下面...
    99+
    2023-06-29
  • python使用pandas读取csv文件的方法
    目录pandas读取csv文件的操作1. 读取csv文件在这里记录一下,python使用pandas读取文件的方法用到pandas库的read_csv函数 # -*- coding:...
    99+
    2022-12-23
    python 读取csv文件 pandas读取csv文件
  • Python实现PDF文字识别提取并写入CSV文件
    目录1.前言2.需求描述3.开始动手动脑3.1安装相关第三方包3.2导入需要用到的第三方库3.3读取pdf文件,并识别内容3.4对识别的数据进行处理,写入csv文件总结1. 前言 扫...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作