首页 > 资讯 > 后端开发 > Python >Python使用read_csv读数据遇到分隔符问题的2种解决方式

291

分享到

Python使用read_csv读数据遇到分隔符问题的2种解决方式

2024-04-02 19:04:59 291人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

目录1.更改read_csv函数中的传参“sep”1.1缺省sep参数1.2不缺省sep参数1.2.1要读入的文档中分隔符为一位字符1.2.2要读入的文档中分

1.更改read_csv函数中的传参“sep”

1.1缺省sep参数

默认分隔符为‘，’

1.2不缺省sep参数

1.2.1要读入的文档中分隔符为一位字符

用单引号括起文本中的分隔符

例：sep = '|'

1.2.2要读入的文档中分隔符为多位字符

多位字符在Python中被识别为正则式

此时可用为sep = ‘\s+’(不论多位分隔符有什么组成，比如几个空格、\r\t）

此时，python将用自己的语法分析器来对多位字符进行识别

2.利用记事本功能进行分隔符替换

因为自己在编程的时候用正则表达式出现了一些问题，故找到了另一种更改文本中分隔符，以便于设定sep参数的方法，现记录如下。

2.1利用txt中的“编辑”—>“替换”操作

当前分隔符为‘,’

替换为‘ | ’，并单击全部替换

替换后，分隔符为‘ | ’

2.2小tips

选择分隔符的时候有可能面临

“这么大空挡是几个空格？”

“这个逗号是中文的还是英文的？”

…

所以建议直接用鼠标拉着两个数据之间的分割区域，复制，然后粘贴填入要替换的框中。（像我这种手残眼花的人就喜欢这种方式。。。）

补充：Python read_csv 报错:‘gbk‘ codec can‘t decode byte 0xb4 in position 8: illegal multibyte sequence

在我们使用pandas.read_csv()读取文件时经常会遇到UnicodeDecodeError 的错误

我遇到的主要有两种:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb4 in position 8: illegal multibyte sequence

或者

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 2: invalid start byte

尝试过改encoding="gbk",encoding="utf-8"或者GB2312、gbk、ISO-8859-1的方法，有时候能够起效果，有时候不行

介绍一种最有效的方法：

1.找到csv文件–>右键–>打开方式–>记事本

2.打开记事本之后，在右下角可以看到文件的默认编码格式为ANSI，选择头部菜单的“文件–>另存为”，

3.选择编码下拉框，选择需要的编码格式UTF-8，重新保存即可

4.使用 read_csv('./test.csv', encoding="utf-8") 即可

下面我遇到过错误可以尝试的解决办法如下（推荐使用上面的，下面的有时候也不行）：

1. csvdata = pd.read_csv(file, keep_default_na=False, encoding="gbk")

报错：

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb4 in position 8: illegal multibyte sequence

解决：将 encoding="gbk" 改为encoding="utf-8" 或者删掉

2. csvdata = pd.read_csv(file, keep_default_na=False)

报错：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 2: invalid start byte

解决：加上 encoding="gbk" 试试看

总结

到此这篇关于Python使用read_csv读数据遇到分隔符问题的2种解决方式的文章就介绍到这了,更多相关Python read_csv读数据分隔符问题内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python使用read_csv读数据遇到分隔符问题的2种解决方式

本文链接: https://www.lsjlt.com/news/119632.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python使用read_csv读数据遇到分隔符问题的2种解决方式

目录1.更改read_csv函数中的传参“sep”1.1缺省sep参数1.2不缺省sep参数1.2.1要读入的文档中分隔符为一位字符1.2.2要读入的文档中分...

99+

2024-04-02
Python 字符串使用多个分隔符分割成列表的2种方法

Python 的字符串默认是有一个 split 来把字符串分割成列表的： >>> test_str = "hello world,nice to meet you"...

99+

2023-05-14

Python 字符串分割 Python 字符串分割成列表
数据库编程中遇到的Python问题及解决方法

数据库编程中遇到的Python问题及解决方法在进行数据库编程时，我们经常会遇到各种各样的问题，如连接数据库、创建表、插入数据、查询数据等等。本文将围绕数据库编程中常见的问题展开讨论，并提供相应的解决方法和代码示例，以帮助读者更好地理解和使用...

99+

2023-10-22

数据库连接：在Python中 SQL查询：在数据库编程中
Vue-Luckysheet的使用方法及遇到问题解决方法

Luckysheet ，一款纯前端类似excel的在线表格，功能强大、配置简单、完全开源。配置文档 · API · 教程：快速上手 | Luckyshe...

99+

2022-11-13

Vue Luckysheet使用 Vue Luckysheet
使用pyinstaller打包python文件遇到的问题和解决方法

pyinstaller 的基本使用方法情况1：当所使用的代码都在一个.py文件中，且该代码中没有调用其他文件和import自己写的函数时例如：打包下面这个检查输入的ip是否符合规范的程序ipch...

99+

2023-10-23

python 开发语言
MongoDB技术开发中遇到的数据备份问题解决方案分析

标题：MongoDB技术开发中遇到的数据备份问题解决方案分析摘要：在MongoDB技术开发中，数据备份是非常重要的。本文将首先介绍MongoDB的数据备份背景及其重要性。然后，我们将分析在开发中可能遇到的数据备份问题，包括备份性能、备份容量...

99+

2023-10-22

MongoDB 数据备份解决方案分析
MongoDB技术开发中遇到的数据更新问题解决方案分析

MongoDB技术开发中遇到的数据更新问题解决方案分析摘要：在MongoDB的应用开发中，数据更新是非常常见的操作。但是，由于MongoDB的灵活性和复杂性，开发人员可能会遇到各种各样的数据更新问题。本文将针对一些常见的数据更新问题进行分析...

99+

2023-10-22

解决方案 MongoDB 数据更新
MongoDB技术开发中遇到的数据迁移问题解决方案分析

MongoDB技术开发中遇到的数据迁移问题解决方案分析摘要：随着数据量的不断增长和业务需求的变化，数据迁移成为了开发中一个必须面对的问题。本文将针对使用MongoDB进行数据迁移时可能遇到的问题进行分析，并给出解决方案，包含具体的代码示例。...

99+

2023-10-22

解决方案 MongoDB 数据迁移
MongoDB技术开发中遇到的数据过期问题解决方案分析

MongoDB技术开发中遇到的数据过期问题解决方案分析摘要：在MongoDB技术开发过程中，对于一些有时效性的数据而言，如何解决数据过期的问题是一个重要的考虑因素。本文将针对MongoDB中的数据过期问题进行分析，并提供具体的解决方案和代码...

99+

2023-10-22

解决方案 MongoDB 数据过期
MongoDB技术开发中遇到的数据分片平衡问题解决方案分析

MongoDB技术开发中遇到的数据分片平衡问题解决方案分析，需要具体代码示例摘要：在使用MongoDB进行大规模数据存储时，数据分片是必不可少的技术手段。然而，在数据量增长的过程中，由于数据分片的不均衡或者其他原因，可能会导致数据分片的不平...

99+

2023-10-22

MongoDB 数据分片平衡问题解决方案
SpringBoot集成WebSocket以及可能遇到的部分问题的解决方式

1.集成 1.1 首先导入pom依赖核心是@ServerEndpoint这个注解。这个注解是Javaee标准里的注解，tomcat7以上已经对其进行了实现，如果是用传统方法使用tomcat发布项目，...

99+

2023-09-07

websocket spring boot java
解决MongoDB技术开发中遇到的数据分析问题的方法研究

解决MongoDB技术开发中遇到的数据分析问题的方法研究，需要具体代码示例摘要：随着大数据的快速发展，数据分析变得越来越重要。MongDB作为一种非关系型数据库，具有高性能和可扩展性的优势，因此在数据分析领域也逐渐受到广泛关注。本文将重点研...

99+

2023-10-22

数据分析 MongoDB 方法研究
利用MongoDB技术开发中遇到的数据分片问题的解决方案探究

利用MongoDB技术开发中遇到的数据分片问题的解决方案探究概述：随着数据存储和处理需求的不断增长，单个MongoDB服务器可能无法满足高性能和高可用性的要求。此时，数据分片（sharding）成为了解决方案之一。本文将针对在使用Mongo...

99+

2023-10-22

解决方案 (solution) MongoDB 分片 (Sharding) 数据分片问题 (Data Sharding)
利用MongoDB技术开发中遇到的数据验证问题的解决方案分析

利用MongoDB技术开发中遇到的数据验证问题的解决方案分析在开发过程中，数据的完整性和准确性是至关重要的。而在利用MongoDB进行开发时，数据验证问题成为一个值得注意的方面。数据验证是指对存储在数据库中的数据进行规则检查，确保数据满足特...

99+

2023-10-22

数据验证 MongoDB 解决方案分析
MongoDB技术开发中遇到的数据库维护问题解决方案分析

MongoDB技术开发中遇到的数据库维护问题解决方案分析引言:随着互联网和大数据的不断发展，MongoDB作为一种NoSQL数据库，因其高性能、高可用性和灵活性而逐渐成为了企业中非常受欢迎的选择。然而，在MongoDB的开发过程中，我们也会...

99+

2023-10-22

MongoDB 问题解决方案数据库维护
MongoDB技术开发中遇到的数据一致性问题解决方案分析

MongoDB技术开发中遇到的数据一致性问题解决方案分析引言：随着大数据时代的到来，数据的规模和复杂性也在不断增加。在开发 MongoDB 的过程中，我们通常会遇到一些数据一致性的问题，如数据错误、数据冲突和数据丢失等。本文将分析一些常见的...

99+

2023-10-22

解决方案 MongoDB 数据一致性
MongoDB技术开发中遇到的分布式事务问题解决方案分析

MongoDB技术开发中遇到的分布式事务问题解决方案分析随着互联网的迅猛发展，分布式系统变得越来越重要。在分布式系统中，数据库的一致性和事务的处理变得尤为关键。MongoDB作为一种流行的NoSQL数据库，也面临着分布式事务的挑战。本文将分...

99+

2023-10-22

解决方案 MongoDB 分布式事务
在python项目中使用2sys.argv时遇到的问题如何解决

这篇文章主要介绍了在python项目中使用2sys.argv时遇到的问题如何解决，此处通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考价值，需要的朋友可以参考下：python可以做什么Python是一种编程语言，内置了许多...

99+

2023-06-06
idea 与 maven 使用过程中遇到的问题及解决方案

目录1. maven项目导入idea报ComponentLookupException异常1.1. 问题描述1.2.解决方案2. IDEA无法加载maven本地仓库的文件2.1.问题...

99+

2024-04-02
Python 解决logging功能使用过程中遇到的一个问题

现象：生产中心进行拷机任务下了300个任务，过了一阵时间后发现任务不再被调度起来，查看后台日志发现日志输出停在某个时间点。分析： 1、首先确认进程存在并没有dead。 2、然后用...

99+

2024-04-02