Python 数据处理，切片，替换，去重

数据处理切片 Python 2023-01-31 07:01:53 628人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

一、把下面这组数据进行处理，进行规则排序。第一版代码：#!/usr/local/python3/bin/python3 #定义了一个函数，用来做数据的分隔符转换，保证数据风格的一致，才能有效排序。 def sanitize(time_str

一、把下面这组数据进行处理，进行规则排序。

第一版代码：

#!/usr/local/python3/bin/python3
#定义了一个函数，用来做数据的分隔符转换，保证数据风格的一致，才能有效排序。
def sanitize(time_string):   
    if '-' in time_string:    
        splitter='-'
    elif ':' in time_string:
        splitter=':'
    else:
        return(time_string)
#将取到的一段数据，通过判断中定义的分割符切开为两组，分别报存到mins，secs变量中。
    (mins,secs) = time_string.split(splitter) 
#在返回结果的时候，完成字符串合并。
    return(mins + '.' + secs)   

#使用with open打开文件，和open不同于with open会自动关闭文件，不需要手动关闭。    
with open('james') as jam:
    data = jam.readline()
#把数据进行首尾去空格，使用，最为分隔符切分。    
james1 = data.strip().split(',')
#这里也可以通过这种方式排序，在最后输出的时候，直接输出james2就可以了。
#james2 = sorted(james1)

with open('julie') as jul:
    data = jul.readline()
julie1 = data.strip().split(',')
#julie2 = sorted(julie1)

with open('mikey') as mik:
    data = mik.readline()
mikey1 = data.strip().split(',')
#mikey2 = sorted(mikey1)

with open('sarah') as sar:
    data = sar.readline()
sarah1 = data.strip().split(',')
#sarah2 = sorted(sarah1)

clean_james=[]
clean_julie=[]
clean_mikey=[]
clean_sarah=[]

#通过迭代每组数据，调用sanitize函数，再把转换好的数据添加到新的列表中，这样列表中的数据风格就是一致的。
for each_t in james1:
    clean_james.append(sanitize(each_t))  
for each_t in julie1:
    clean_julie.append(sanitize(each_t))
for each_t in mikey1:
    clean_mikey.append(sanitize(each_t))
for each_t in sarah1:
    clean_sarah.append(sanitize(each_t))

#输出新列表并排序
print(sorted(clean_james)) 
print(sorted(clean_julie))
print(sorted(clean_mikey))
print(sorted(clean_sarah))

输出结果：

这就完成了规则排序。

二、需要给数据去重复，排序，只输出前三项数据。

第二版代码：

#!/usr/local/Python3/bin/python3
def sanitize(time_string):
    if '-' in time_string:
        splitter='-'
    elif ':' in time_string:
        splitter=':'
    else:
        return(time_string)
    (mins,secs) = time_string.split(splitter)
    return(mins + '.' + secs)

#定义函数来解决去除重复数据项的问题，此函数接受两个列表作为参数带入，当数据不存在新列表中就把数据添加到新列表，如果有存在则不会添加，代替了下面使用每个列表使用for迭代的方式，代码更简洁。    
def pomoto(old_list,new_list):
    for i in old_list:
        if i not in new_list:
            new_list.append(i)

with open('james') as jam:
    data = jam.readline()
james1 = data.strip().split(',')

with open('julie') as jul:
    data = jul.readline()
julie1 = data.strip().split(',')

with open('mikey') as mik:
    data = mik.readline()
mikey1 = data.strip().split(',')

with open('sarah') as sar:
    data = sar.readline()
sarah1 = data.strip().split(',')


unique_james = []
unique_julie = []
unique_sarah = []
unique_mikey = []

#从迭代的方式改为了列表推导的方式
clean_james = sorted([sanitize(each_t) for each_t in james1])
clean_julie = sorted([sanitize(each_t) for each_t in julie1])
clean_mikey = sorted([sanitize(each_t) for each_t in mikey1])
clean_sarah = sorted([sanitize(each_t) for each_t in sarah1])

#调用函数完成去重复
pomoto(clean_james,unique_james)
pomoto(clean_julie,unique_julie)
pomoto(clean_mikey,unique_mikey)
pomoto(clean_sarah,unique_sarah)

#每列表迭代方式的去重复
#for i in clean_james:
#    if i not in unique_james:
#        unique_james.append(i)
#for i in clean_julie:
#    if i not in unique_julie:
#        unique_julie.append(i)
#for i in clean_mikey:
#    if i not in unique_mikey:
#        unique_mikey.append(i)
#for i in clean_sarah:
#    if i not in unique_sarah:
#        unique_sarah.append(i)

#输出去重复后的唯一新列表，只打印前三项数据
print(unique_james[0:3])
print(unique_julie[0:3])
print(unique_mikey[0:3])
print(unique_sarah[0:3])

输出结果：

三、使用集合删除重复项，将重复的with open定义为函数，简洁代码，进行逆序排序，输出前三项。

第三版代码：

#!/usr/local/python3/bin/python3
def sanitize(time_string):
    if '-' in time_string:
        splitter='-'
    elif ':' in time_string:
        splitter=':'
    else:
        return(time_string)
    (mins,secs) = time_string.split(splitter)
    return(mins + '.' + secs)
    
#定义函数打开文件获取数据返回，并加入了错误处理代码。
def get_file_data(filename):
    try:
        with open(filename) as f:
            data = f.readline()
        return(data.strip().split(','))
    except ioError as ioerr:
        print('File error' + str(ioerr))
        return(None)

#调用函数直接得到文件中经过切片后的数据。  
james1 = get_file_data('james')
julie1 = get_file_data('julie')
mikey1 = get_file_data('mikey')
sarah1 = get_file_data('sarah')

print(sorted(set([sanitize(i) for i in james1]),reverse=True)[0:3])
print(sorted(set([sanitize(i) for i in julie1]),reverse=True)[0:3])
print(sorted(set([sanitize(i) for i in mikey1]),reverse=True)[0:3])
print(sorted(set([sanitize(i) for i in sarah1]),reverse=True)[0:3])

输出结果：

定义get_file_data函数代替了，多行的with open，使得代码简洁。

Python 集合数据结构：集合中的数据项是无序的，而且不允许重复的，这和我们数学中的集合很像。

最后print输出代码：

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python 数据处理，切片，替换，去重

本文链接: https://www.lsjlt.com/news/191041.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python 数据处理，切片，替换，去重

一、把下面这组数据进行处理，进行规则排序。第一版代码：#!/usr/local/python3/bin/python3 #定义了一个函数，用来做数据的分隔符转换，保证数据风格的一致，才能有效排序。 def sanitize(time_str...

99+

2023-01-31

数据处理切片 Python
【100天精通Python】Day56：Python 数据分析_Pandas数据清洗和处理（删除填充插值，数据类型转换，去重，连接与合并）

目录数据清洗和处理 1.处理缺失值 1.1 删除缺失值： 1.2 填充缺失值： 1.3 插值： 2 数据类型转换 2.1 数据类型转换 2.2 日期和时间的转换： 2.3 分类数据的转换： 2.4 自定义数据类型的转换： 3 数据去重 ...

99+

2023-09-16

信息可视化 python
python数据处理之Pandas类型转换的实现

目录转换为字符串类型转换为数值类型转为数值类型还可以使用to_numeric()函数分类数据（Category）数据类型小结转换为字符串类型 tips['sex_str'] = ti...

99+

2022-11-10
大数据重定向与 Python：如何提高数据处理效率？

随着大数据时代的到来，数据处理变得越来越重要，然而，随着数据量的增加，数据处理效率也成为了一个问题。在这个问题上，Python 和重定向技术有着非常重要的作用。在本篇文章中，我们将会深入探讨大数据重定向与 Python 的结合，以及如何提高...

99+

2023-10-17

大数据重定向 load
PHP接口中如何处理重定向的数据类型转换？

PHP是一种广泛使用的编程语言，它可以用来开发Web应用程序。在Web应用程序中，接口是非常常见的一种开发方式。接口可以让Web应用程序与其他系统进行交互，以便实现数据的共享和传输。在接口开发中，重定向是一个非常常见的问题，因为它涉及到数据...

99+

2023-10-21

接口重定向数据类型
处理大数据时，Java和Bash的重定向：你需要了解的一切。

在今天的大数据时代，数据量的爆炸式增长已经成为了常态。在处理大数据时，数据的输入和输出是非常重要的一环，而重定向是实现这一过程的关键技术之一。在本文中，我们将会深入探讨Java和Bash中的重定向技术，以及如何在处理大数据时使用它们。一...

99+

2023-10-22

bash 大数据重定向
python数据处理之Pandas类型转换怎么实现

这篇文章主要介绍“python数据处理之Pandas类型转换怎么实现”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“python数据处理之Pandas类型转换怎么实现”文章能帮助大家解决问题。转换为字...

99+

2023-06-30
Python、大数据、重定向，Linux中数据处理的完美三部曲

在当今信息化时代，数据已成为人们生活和工作中不可或缺的一部分。而数据处理的效率和准确性往往决定着业务的成败。因此，数据处理工具的选择和使用显得尤为关键。，成为越来越多数据处理人员的首选。本文将详细介绍这三部曲的使用方法和优势，并通过演示代...

99+

2023-09-16

大数据重定向 linux
Spring大数据：如何使用Python进行重定向和数据处理？

Spring大数据是一个非常流行的开源框架，它提供了一套完整的解决方案来处理大规模数据。在实际应用中，我们通常需要对大量数据进行重定向和数据处理，而Python语言则是处理这些任务的一种优秀的选择。在本文中，我们将介绍如何使用Python...

99+

2023-08-24

重定向 spring 大数据
Go语言中如何处理并发数据库连接的故障切换问题？

Go语言中如何处理并发数据库连接的故障切换问题？在处理并发数据库连接时，我们通常会遇到数据库连接的故障切换问题。当一个数据库连接发生故障时，我们需要考虑如何及时切换到一个可用的数据库连接，以确保系统的正常运行。下面将详细介绍在Go语言中如何...

99+

2023-10-22

数据库连接故障切换 Go并发
100天精通Python（数据分析篇）——第73天：Pandas文本数据处理方法之查找、替换、拼接、正则、虚拟变量

文章目录每篇前言一、Python字符串内置方法 1. 文本查找 2. 文本替换 3. 文本拼接 4. 正则提取二、Pandas实现文本查...

99+

2023-09-04

python 数据分析 pandas 正则表达式字符串替换
python数字图像处理数据类型及颜色空间转换

目录一、图像数据类型及转换1、unit8转float2、float转uint8二、颜色空间及其转换例：rgb转灰度图其它的转换例：rgb转hsv一、图像数据类型及转换在skimag...

99+

2022-11-11
怎么使用python处理数据类型及颜色空间转换

这篇文章主要介绍“怎么使用python处理数据类型及颜色空间转换”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“怎么使用python处理数据类型及颜色空间转换”文章能帮助大家解决问题。一、图像数据类型...

99+

2023-07-02
Python 处理大数据重定向：5个必须知道的技巧

在现代计算机时代，数据量已经变得越来越大。因此，如何处理大数据并且进行有效的分析，已经成为了每个数据科学家的必修课。Python 作为一种流行的编程语言，它的高效性和灵活性赢得了越来越多的关注。Python 处理大数据时，经常需要进行重定...

99+

2023-10-18

大数据重定向 load
Python 学习笔记：path 处理在大数据中有何重要性？

在大数据处理中，文件路径的处理是非常重要的一个环节。Python 作为一门十分流行的编程语言，其对于文件路径的处理也非常得心应手。在本篇文章中，我们将会探讨 Python 中的 path 处理在大数据中的重要性，并且给出一些实例代码。 ...

99+

2023-08-02

学习笔记 path 大数据
队列技术在PHP与MySQL中的消息幂等性和数据去重的处理方法

引言：随着互联网的快速发展，网站和应用程序的并发量不断增加，对于数据存储和处理的效率要求也越来越高。而队列技术成为了解决高并发场景下数据处理问题的重要工具之一。本文将介绍如何利用队列技术在PHP与MySQL中实现消息幂等性和数据去重的处理方...

99+

2023-10-21

MySQL PHP 队列
为什么Python同步容器在大数据处理中如此重要？

Python是一种广泛使用的编程语言，尤其在大数据处理中，Python同步容器扮演着非常重要的角色。在本文中，我们将探讨Python同步容器在大数据处理中的重要性，并通过演示代码来帮助读者更好地理解。一、Python同步容器的定义 Pyt...

99+

2023-10-31

同步容器大数据
如何利用Python文件重定向和load函数简化数据处理流程？

随着数据量不断增加和处理需求的不断提高，数据处理的流程也变得越来越复杂。Python是一门强大的编程语言，它提供了许多用于简化数据处理流程的库和工具。在本文中，我们将介绍如何使用Python中的文件重定向和load函数来简化数据处理流程。 ...

99+

2023-09-20

文件重定向 load
重定向在Linux中的神奇应用：结合Python与大数据实现高效数据处理

在Linux中，重定向是一项非常重要的功能。通过重定向，我们可以将一个命令的输出结果重定向到文件或者另一个命令中，这样就可以实现更加高效的数据处理。本文将介绍如何结合Python与大数据技术，实现高效的数据处理。一、重定向的基本用法在...

99+

2023-09-16

大数据重定向 linux
Python API的重定向和存储功能：如何提高数据处理效率？

Python是一门非常流行的编程语言，它在数据处理和分析领域也有着广泛的应用。在数据处理过程中，有时我们需要对输出的数据进行重定向或存储，以便于后续的数据分析和处理。在本文中，我们将介绍Python API中的重定向和存储功能，并演示如何...

99+

2023-09-13

api 重定向存储