首页 > 资讯 > 后端开发 > Python >PyTorch Dataset与DataLoader使用超详细讲解

205

分享到

PyTorch Dataset与DataLoader使用超详细讲解

2024-04-02 19:04:59 205人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

目录一、Dataset1. 在控制台进行操作①获取图片的基本信息②获取文件的基本信息2. 编写一个继承Dataset 的类加载数据①定义 MyData类②创建类的实例并调用二、Dat

一、Dataset

Dataset 类提供一种方式去获取数据及其标签

主要有两个目的：

获取每一个数据及其标签
获取数据的总量大小

1. 在控制台进行操作

Hymenoptera （膜翅目昆虫）数据集下载地址：

链接: https://pan.baidu.com/s/1XKwXsAtE2yzZW2IsvBDpnw?pwd=8a5t

提取码: 8a5t

这是一个蚂蚁蜜蜂二分类的数据集，通常数据集有以下三种组织形式（上面的数据集属于第一种）：

不同的类别以文件夹的形式存在，文件夹中是该类别的图片
图片与标签分别存储，图片在一个文件夹下，label信息在另一个文件夹下
label直接写在图片名称里

①获取图片的基本信息

在PyCharm 中，点击下方的pythonConsole进入控制台进行操作（通过控制台可以看到变量的详细信息）

首先加载图片，逐行输入下方代码：

from PIL import Image
img_path = "./dataset/hymenoptera_data/train/ants/0013035.jpg"
img = Image.open(img_path)

此时我们就可以在右侧看到相关变量的信息：

点击img变量，可以查看图片的详细信息。通过控制台执行程序能够直观地获取后续操作所需的数据：

最后可以通过img.show()打开图片查看：

②获取文件的基本信息

同样还是在控制台逐行输入以下代码：

dir_path = "dataset/hymenoptera_data/train/ants"
import os
img_path_list = os.listdir(dir_path)
img_path_list[0]

我们就可以获取到文件夹下的文件名称，由于是使用控制台，我们还可以在右侧查看列表的详细信息：

因此在控制台操作是有很大的优点的，我们可以在控制台逐行执行已经编写好的文件中的语句，通过查看右侧变量的值来判断程序写的是否有问题

2. 编写一个继承Dataset 的类加载数据

下面的代码也可以在控制台运行（可以多行复制粘贴）来检验程序是否有误

①定义 MyData类

导入所需头文件：

from torch.utils.data import Dataset
from PIL import Image
import os

定义MyData类：

__init__：初始化函数
__getitem__：返回指定下标的图片和标签
__len__：返回数据集的大小

class MyData(Dataset):
    def __init__(self, root_dir, label_dir):
        self.root_dir = root_dir
        self.label_dir = label_dir
        self.path = os.path.join(self.root_dir, self.label_dir)
        self.img_path = os.listdir(self.path)
    def __getitem__(self, idx):
        img_name = self.img_path[idx]
        img_item_path = os.path.join(self.root_dir, self.label_dir, img_name)
        img = Image.open(img_item_path)
        label = self.label_dir
        return img, label
    def __len__(self):
        return len(self.img_path)

其中os.path.join()可以实现多个路径的合并且不出错

②创建类的实例并调用

创建 MyData 类的实例：

if __name__ == "__main__":
    root_dir = "../dataset/hymenoptera_data/train"
    ants_label_dir = "ants"
    bees_label_dir = "bees"
    ants_dataset = MyData(root_dir, ants_label_dir)
    bees_dataset = MyData(root_dir, bees_label_dir)

调用类中写好的函数：

    img, label = ants_dataset.__getitem__(3)
    print(ants_dataset.__len__(), label)
    img.show()

同时我们也可以通过下面这种方式用已有的数据集来创造数据集：

train_dataset = ants_dataset + bees_dataset

二、DataLoader

DataLoader 类是为后面的网络提供不同的数据形式
DataLoader 会根据batch_size的值对数据进行打包
导入所需的包

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

加载数据：

test_data = torchvision.datasets.CIFAR10("./dataset", train=False, transfORM=torchvision.transforms.ToTensor())
test_loader = DataLoader(dataset=test_data, batch_size=64, shuffle=True, num_workers=0, drop_last=True)

测试：

img, target = test_data[0]
print(img.shape)
print(target)

进行日志记录，开始训练：

writer = SummaryWriter("dataloader")
for epoch in range(2):
    step = 0
    for data in test_loader:
        imgs, targets = data
        print(imgs.shape)
        print(targets)
        writer.add_images("Epoch: {}".format(epoch), imgs, step)
        step = step + 1
writer.close()

到此这篇关于PyTorch Dataset与DataLoader使用超详细讲解的文章就介绍到这了,更多相关PyTorch Dataset与DataLoader内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: PyTorch Dataset与DataLoader使用超详细讲解

本文链接: https://www.lsjlt.com/news/120746.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

PyTorch Dataset与DataLoader使用超详细讲解

目录一、Dataset1. 在控制台进行操作①获取图片的基本信息②获取文件的基本信息2. 编写一个继承Dataset 的类加载数据①定义 MyData类②创建类的实例并调用二、Dat...

99+

2024-04-02
详解Pytorch中Dataset的使用

此案例教我们加载并处理TorchVision的FashionMNIST Dataset。 root 目录是 train/test data 存储的地方 download=True 如...

99+

2022-12-29

Pytorch Dataset使用 Pytorch Dataset
C++ 超详细讲解stack与queue的使用

目录stack介绍和使用模拟实现stack的使用例题最小栈栈的弹出压入序列逆波兰表达式求值queue模拟实现容器适配器deque简介priority_queue优先级队列priori...

99+

2024-04-02
Netty与NIO超详细讲解

目录Linux下的五种I/O模型阻塞IO的流程IO复用信号驱动I/O异步IONIOI0多路复用NIO核心组件使用Java原生API实现NIO操作Redis为什么支持高并发Linux下...

99+

2022-11-13

Netty NIO模型 Netty NIO原理
C++超详细讲解auto与nullptr的使用

目录一. auto关键字1. auto介绍2. 使用规则3. auto不能推导的场景二. 基于范围的for循环(C++11)1. 范围for的语法2. 范围for的使用条件三. 指针...

99+

2024-04-02
Reactjsx转换与createElement使用超详细讲解

目录jsx的转换16.x版本及之前17.x版本及之后React.createElement源码React.Component 源码总结jsx的转换我们从 react 应用的入口开始...

99+

2022-11-13

React jsx转换 React createElement
如何在Pytorch中使用Dataset和DataLoader读取数据

本篇文章给大家分享的是有关如何在Pytorch中使用Dataset和DataLoader读取数据，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。一、前言确保安装scikit-im...

99+

2023-06-15
Pytorch中DataLoader的使用方法详解

目录一：dataset类构建。二：DataLoader使用三：举例前言加载数据datasetdataloader在Pytorch中，torch.utils.data中的Dataset...

99+

2024-04-02
AndroidLayerDrawable超详细讲解

目录1. 前言2. 实例1. 前言 Android LayerDrawble 包含一个Drawable数组，系统将会按照这些Drawable对象的数组顺序来绘制他们，索引最大的 Dr...

99+

2022-11-13

Android LayerDrawable Android LayerDrawable原理
Spring超详细讲解IOC与解耦合

目录前言一.所谓耦合二.Spring三.核心IOC理解1.容器2.控制反转3.依赖注入四.Bean的实例化1.无参构造2.工厂静态方法3.工厂实例方法（常用）五.Bean的依赖注入1...

99+

2022-11-13

Spring IOC Spring 解耦合
MyBatis配置与CRUD超详细讲解

目录CRUD增删改查示例代码Map传参模糊查询MyBatis配置解析核心配置文件mybatis-config.xml环境变量（Environments）属性(Properties)类...

99+

2023-02-21

MyBatis配置解析 MyBatis CRUD
AndroidSwipeRefreshLayout超详细讲解

目录1. 控件说明2. API介绍3. 使用方法3.1 布局文件3.2 界面代码4. 注意事项1. 控件说明 SwipeRefreshLayout是google官方推荐使用的下拉刷新...

99+

2022-11-13

Android SwipeRefreshLayout Android SwipeRefreshLayout控件
SpringCloudNetflixRibbon超详细讲解

目录一、Ribbon简介1、什么是Ribbon2、Ribbon能干什么二、使用Ribbon1、客户端导入依赖2、application.yml配置3、Controller配置4、Co...

99+

2022-11-13

SpringCloud Netflix Ribbon SpringCloud Ribbon
C语言超详细讲解宏与指针的使用

目录1、关于define2、初识指针（1）内存（2）示例（3）指针的使用示例（4）指针变量的大小1、关于define define是一个预处理指令，有两种用法，一种是用define定...

99+

2024-04-02
Java超详细讲解抽象类与接口的使用

目录一、抽象类1、抽象类的语法2、抽象类的特性3、抽象类的作用二、接口1、接口的概念2、接口使用3、接口特性4、实现多个接口5、接口间的继承6、常用的接口（1）Comparable接...

99+

2024-04-02
pytorch中的dataset用法详解

目录1.torch.utils.data 里面的dataset使用方法2.torchvision.datasets的使用方法用法1：使用官方数据集用法2：ImageFolder通用的...

99+

2024-04-02
Python超详细讲解元类的使用

目录类的定义一、什么是元类二、注意区分元类和继承的基类三、type 元类的使用四、自定义元类的使用类的定义对象是通过类创建的，如下面的代码： # object 为顶层基类 clas...

99+

2024-04-02
Java超详细讲解ThreadLocal类的使用

目录Threadlocal有什么用：ThreadLocal使用实例API介绍ThreadLocal的使用Threadlocal 的源码分析原理源码内部类ThreadLocalMapT...

99+

2024-04-02
C++超详细讲解友元的使用

目录一、友元的概念二、友元的用法三、友元的语法四、友元的尴尬五、注意事项六、小结一、友元的概念什么是友元友元是 C++ 中的一种关系友元关系发生在函数与类之间或者类与类之间友元关系...

99+

2024-04-02
C++BoostLockfree超详细讲解使用方法

目录一、说明二、示例和代码Boost.Lockfree 一、说明 Boost.Lockfree 提供线程安全和无锁容器。可以从多个线程访问此库中的容器，而无需同步访问。在 1.56...

99+

2022-11-21

C++ Boost Lockfree C++ Lockfree方案