python遍历迭代器自动链式处理数据的代码怎么写

2023-06-26 04:06:50 350人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

python遍历迭代器自动链式处理数据的代码怎么写，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。Python遍历迭代器自动链式处理数据PyTorch.utils.data可兼容

python遍历迭代器自动链式处理数据的代码怎么写，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。

Python遍历迭代器自动链式处理数据

PyTorch.utils.data可兼容迭代数据训练处理，在dataloader中使用提高训练效率：借助迭代器避免内存溢出不足的现象、借助链式处理使得数据读取利用更高效(可类比操作系统的资源调控)

书接上文，使用迭代器链式处理数据，在Process类的__iter__方法中执行挂载的预处理方法，可以嵌套包裹多层处理方法，类似Koajs洋葱模型，在for循环时，自动执行预处理方法返回处理后的数据

分析下述示例中输入数据依次执行顺序：travel -> deep -> shuffle -> sort -> batch，实际由于嵌套循环或设置缓存的存在，数据流式会有变化，具体如后图分析

from torch.utils.data import IterableDataset# ...import randomclass Process(IterableDataset):    def __init__(self, data, f):        self.data = data        # 绑定处理函数        self.f = f       def __iter__(self):        # for循环遍历时，返回一个当前环节处理的迭代器对象        return self.f(iter(self.data)) a = ['a0', 'a1', 'a2', 'a3', 'a4', 'a5', 'a6', 'a7', 'a8', 'a9']b = ['b0', 'b1', 'b2', 'b3', 'b4', 'b5', 'b6', 'b7', 'b8', 'b9']c = ['c0', 'c1', 'c2', 'c3', 'c4', 'c5', 'c6', 'c7', 'c8', 'c9']# data = [[j + str(i) for i in range(10)] for j in ['a','b', 'c'] ]data = [a, b, c]def travel(d):    for i in d:        # print('travel ', i)        yield idef deep(d):    for arr in d:        for item in arr:            yield itemdef shuffle(d, sf_size=5):    buf = []    for i in d:        buf.append(i)        if len(buf) >= sf_size:            random.shuffle(buf)            for j in buf:                # print('shuffle', j)                yield j            buf = []    for k in buf:        yield kdef sort(d):    buf = []    for i in d:        buf.append(i)        if len(buf) >= 3:            for i in buf:                # print('sort', i)                yield i            buf = []    for k in buf:        yield kdef batch(d):    buf = []    for i in d:        buf.append(i)        if len(buf) >= 16:            for i in buf:                # print('batch', i)                yield i            buf = []# 对训练数据进行的多个预处理步骤dataset = Process(data, travel)dataset = Process(dataset , deep)dataset = Process(dataset , shuffle)dataset = Process(dataset , sort)train_dataset = Process(p, batch)# 可在此处断点测试for i in p:    print(i, 'train')# train_data_loader = DataLoader(train_dataset,num_workers=args.num_workers,prefetch_factor=args.prefetch)# train(model , train_data_loader）

由上可以构造数据流式方向：batch(iter(sort(iter(shuffle(iter(deep(iter(travel(iter( d ))))))))))

根据数据流式抽取部分过程画出时序图如下：

python遍历迭代器自动链式处理数据的代码怎么写

附：python 手动遍历迭代器

想遍历一个可迭代对象中的所有元素，但是却不想使用for 循环

为了手动的遍历可迭代对象，使用next() 函数并在代码中捕获StopIteration 异常。比如，下面的例子手动读取一个文件中的所有行

def manual_iter():    with open('/etc/passwd') as f:        try:            while True:                line = next(f)                print(line, end='')        except StopIteration:            pass

通常来讲， StopIteration 用来指示迭代的结尾。然而，如果你手动使用上面演示的next() 函数的话，你还可以通过返回一个指定值来标记结尾，比如None 。下面是示例：

with open('/etc/passwd') as f:    while True:        line = next(f)        if line is None:            break    print(line, end='')

大多数情况下，我们会使用for 循环语句用来遍历一个可迭代对象。但是，偶尔也需要对迭代做更加精确的控制，这时候了解底层迭代机制就显得尤为重要了。下面的交互示例向我们演示了迭代期间所发生的基本细节：

>>> items = [1, 2, 3]>>> # Get the iterator>>> it = iter(items) # Invokes items.__iter__()>>> # Run the iterator>>> next(it) # Invokes it.__next__()1>>> next(it)2>>> next(it)3>>> next(it)Traceback (most recent call last):File "<stdin>", line 1, in <module>StopIteration>>>

看完上述内容，你们掌握python遍历迭代器自动链式处理数据的代码怎么写的方法了吗？如果还想学到更多技能或想了解更多相关内容，欢迎关注编程网Python频道，感谢各位的阅读！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: python遍历迭代器自动链式处理数据的代码怎么写

本文链接: https://www.lsjlt.com/news/306725.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

python遍历迭代器自动链式处理数据的代码怎么写

python遍历迭代器自动链式处理数据的代码怎么写，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。python遍历迭代器自动链式处理数据pytorch.utils.data可兼容...

99+

2023-06-26
python遍历迭代器自动链式处理数据的实例代码

目录python遍历迭代器自动链式处理数据附：python 手动遍历迭代器总结python遍历迭代器自动链式处理数据 pytorch.utils.data可兼容迭代数据训练处理，在d...

99+

2024-04-02
js遍历json数组的代码怎么写

这篇文章主要介绍“js遍历json数组的代码怎么写”，在日常操作中，相信很多人在js遍历json数组的代码怎么写问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”js遍历json数组的代码怎么写”的疑惑有所帮助！...

99+

2023-06-26
Java怎样绕过迭代器遍历时的数据修改异常

这篇文章主要介绍了Java怎样绕过迭代器遍历时的数据修改异常，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。前言既然是绕过迭代器遍历时的数据修改异常，那么有必要先看一下是什么样...

99+

2023-06-06
循环与迭代的秘密代码：解锁 Python 数据处理的捷径

Python、循环、迭代、数据处理循环：重复执行代码块循环是让代码块重复执行多次的有效方法。Python 提供了 for 和 while 循环两种基本循环类型： for 循环：用于遍历集合中的元素，例如列表、元组或字符串。 whi...

99+

2024-02-17

Python 中的循环和迭代是处理数据时必不可少的工具。通过利用循环您可以重复执行代码块而迭代则允许您遍历数据集合中的元素。本文将深入探讨 Python 中循环和迭代的原理并通过演示代码展示其
怎么编写Python代码让数据处理快4倍

这篇文章主要介绍“怎么编写Python代码让数据处理快4倍”，在日常操作中，相信很多人在怎么编写Python代码让数据处理快4倍问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”怎么编写Python代码让数据处理...

99+

2023-06-16
怎么写Python代码提高数据处理脚本速度

这篇文章主要介绍“怎么写Python代码提高数据处理脚本速度”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“怎么写Python代码提高数据处理脚本速度”文章能帮助大家解决问题。普通Python处理数据...

99+

2023-06-29
Vue处理循环数据流程的代码怎么写

这篇文章主要介绍了Vue处理循环数据流程的代码怎么写的相关知识，内容详细易懂，操作简单快捷，具有一定借鉴价值，相信大家阅读完这篇Vue处理循环数据流程的代码怎么写文章都会有所收获，下面我们一起来看看吧。下面就展示使用vue处理循环的一个例子...

99+

2023-07-06
循环与迭代：Python 中高效数据处理的秘密武器

循环循环是重复执行代码块直到满足特定条件的结构。Python 提供了多种循环类型： for 循环：用于遍历序列（例如列表、元组）中的每个元素。 for item in [1, 2, 3, 4, 5]: print(item) ...

99+

2024-02-17

Python 循环迭代数据处理效率
python怎么实现自动生成C++代码的代码生成器

这篇文章主要讲解了“python怎么实现自动生成C++代码的代码生成器”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“python怎么实现自动生成C++代码的代码生成器”吧！遇到的问题工作中遇...

99+

2023-07-02
python使用dabl几行代码实现数据处理分析及ML自动化

目录dabl1、数据预处理2、探索性数据分析3、建模结论数据科学模型开发涉及各种组件，包括数据收集、数据处理、探索性数据分析、建模和部署。在训练机器学习或深度学习模型之前，必须清洗数...

99+

2024-04-02
数据库动态认证封装用户的代码怎么写

本篇内容介绍了“数据库动态认证封装用户的代码怎么写”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！代码实现 ...

99+

2023-02-15

数据库
Json数据异步绑定到界面的Table并且自动刷新原理及代码是怎样的

今天就跟大家聊聊有关Json数据异步绑定到界面的Table并且自动刷新原理及代码是怎样的，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。 ...

99+

2024-04-02