生成对抗网络（GAN）详解与实例

python 深度学习 pytorch GAN 生成对抗网络 2023-09-25 05:09:13 313人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

GAN介绍理解GAN的直观方法是从博弈论的角度来理解它。GAN由两个参与者组成，即一个生成器和一个判别器，它们都试图击败对方。生成备从分巾中狄取一些随机噪声，并试图从中生成一些类似于输出的分布。生成

GAN介绍

理解GAN的直观方法是从博弈论的角度来理解它。GAN由两个参与者组成，即一个生成器和一个判别器，它们都试图击败对方。生成备从分巾中狄取一些随机噪声，并试图从中生成一些类似于输出的分布。生成器总是试图创建与真实分布没有区别的分布。也就是说，伪造的输出看起来应该是真实的图像。然而，如果没有显式训练或标注，那么生成器将无法判别真实的图像，并且其唯一的来源就是随机浮点数的张量。

之后，GAN将在博弈中引入另一个参与者，即判别器。判别器仅负责通知生成器其生成的输出看起来不像真实图像，以便生成器更改其生成图像的方式以使判别器确信它是真实图像。但是判别器总是可以告诉生成器其生成的图像不是真实的，因为判别器知道图像是从生成器生成的。为了解决这个事情，GAN将真实的图像引入博弈中，并将判别器与生成器隔离。现在，判别器从一组真实图像中获取一个图像，并从生成器中获取一个伪图像，而它必须找出每个图像的来源。

最初，判别器什么都不知道,而是随机预测结果。但是，可以将判别器的任务修改为分类任务。判别器可以将输入图像分类为原始图像或生成图像，这是二元分类。同样，我们训练判别器网络以正确地对图像进行分类，最终，通过反向传播，判别器学会了区分真实图像和生成图像。

在这里插入图片描述

代码实例

数据集简介：
本次实验我们选用花卉数据集做图像的生成，本数据集共六类。
在这里插入图片描述

模型训练
训练判别器：
对于真图片，输出尽可能是1
对于假图片，输出尽可能是0
训练生成器：
对于假图片，输出尽可能是1
1、训练生成器时，无须调整判别器的参数；训练判别器时，无须调整生成器的参数。
2、在训练判别器时，需要对生成器生成的图片用detach操作进行计算图截断，避免反向传播将梯度传到生成器中。因为在训练判别器时我们不需要训练生成器，也就不需要生成器的梯度。
3、在训练判别器时，需要反向传播两次，一次是希望把真图片判为1，一次是希望把假图片判为0。也可以将这两者的数据放到一个batch中，进行一次前向传播和一次反向传播即可。
4、对于假图片，在训练判别器时，我们希望它输出0；而在训练生成器时，我们希望它输出1.因此可以看到一对看似矛盾的代码 error_d_fake = criterion(output, fake_labels)和error_g = criterion(output, true_labels)。判别器希望能够把假图片判别为fake_label，而生成器则希望能把他判别为true_label，判别器和生成器互相对抗提升。

import osimport torchfrom torch.utils.data import Dataset, DataLoaderfrom dataloader import MyDatasetfrom model import Generator, Discriminatorimport torchvisionimport numpy as npimport matplotlib.pyplot as pltif __name__ == '__main__':    LR = 0.0002    EPOCH = 1000  # 50    BATCH_SIZE = 40    N_ideaS = 100    EPS = 1e-10    TRAINED = False    #path = r'./data/image'    train_data = MyDataset(path=path, resize=96, Len=10000, img_type='jpg')    train_loader = DataLoader(dataset=train_data, batch_size=BATCH_SIZE, shuffle=True)    torch.cuda.empty_cache()    if TRAINED:        G = torch.load('G.pkl').cuda()        D = torch.load('D.pkl').cuda()    else:        G = Generator(N_IDEAS).cuda()        D = Discriminator(3).cuda()    optimizerG = torch.optim.Adam(G.parameters(), lr=LR)    optimizerD = torch.optim.Adam(D.parameters(), lr=LR)    for epoch in range(EPOCH):        tmpD, tmpG = 0, 0        for step, x in enumerate(train_loader):            x = x.cuda()            rand_noise = torch.randn((x.shape[0], N_IDEAS, 1, 1)).cuda()            G_imgs = G(rand_noise)            D_fake_probs = D(G_imgs)            D_real_probs = D(x)            p_d_fake = torch.squeeze(D_fake_probs)            p_d_real = torch.squeeze(D_real_probs)            D_loss = -torch.mean(torch.log(p_d_real + EPS) + torch.log(1. - p_d_fake + EPS))            G_loss = -torch.mean(torch.log(p_d_fake + EPS))            # D_loss = -torch.mean(torch.log(D_real_probs) + torch.log(1. - D_fake_probs))            # G_loss = torch.mean(torch.log(1. - D_fake_probs))            optimizerD.zero_grad()            D_loss.backward(retain_graph=True)            optimizerD.step()            optimizerG.zero_grad()            G_loss.backward(retain_graph=True)            optimizerG.step()            tmpD_ = D_loss.cpu().detach().data            tmpG_ = G_loss.cpu().detach().data            tmpD += tmpD_            tmpG += tmpG_        tmpD /= (step + 1)        tmpG /= (step + 1)        print(            'epoch %d avg of loss: D: %.6f, G: %.6f' % (epoch, tmpD, tmpG)        )        # if (epoch+1) % 5 == 0:        select_epoch = [1, 5, 10, 20, 50, 80, 100, 150, 200, 400, 500, 800, 999, 1500, 2000, 3000, 4000, 5000, 6000, 8000, 9999]        if epoch in select_epoch:plt.imshow(np.squeeze(G_imgs[0].cpu().detach().numpy().transpose((1, 2, 0))) * 0.5 + 0.5)            plt.savefig('./result1/_%d.png' % epoch)    torch.save(G, 'G.pkl')    torch.save(D, 'D.pkl')

下面是训练多次的效果
在这里插入图片描述

完整代码如下：

# import osimport torchimport torch.nn as nnimport torchvision as tvfrom torch.autograd import Variableimport tqdmimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签plt.rcParams['axes.unicode_minus'] = False# dir = '... your path/faces/'dir = './data/train_data'# path = []## for fileName in os.listdir(dir):#     path.append(fileName)       # len(path)=51223noiseSize = 100     # 噪声维度n_generator_feature = 64        # 生成器feature map数n_discriminator_feature = 64        # 判别器feature map数batch_size = 50d_every = 1     # 每一个batch训练一次discriminatorg_every = 5     # 每五个batch训练一次generatorclass NetGenerator(nn.Module):    def __init__(self):        super(NetGenerator,self).__init__()        self.main = nn.Sequential(      # 神经网络模块将按照在传入构造器的顺序依次被添加到计算图中执行            nn.ConvTranspose2d(noiseSize, n_generator_feature * 8, kernel_size=4, stride=1, padding=0, bias=False),            nn.BatchNORM2d(n_generator_feature * 8),            nn.ReLU(True),       # (n_generator_feature * 8) × 4 × 4        (1-1)*1+1*(4-1)+0+1 = 4            nn.ConvTranspose2d(n_generator_feature * 8, n_generator_feature * 4, kernel_size=4, stride=2, padding=1, bias=False),            nn.BatchNorm2d(n_generator_feature * 4),            nn.ReLU(True),      # (n_generator_feature * 4) × 8 × 8     (4-1)*2-2*1+1*(4-1)+0+1 = 8            nn.ConvTranspose2d(n_generator_feature * 4, n_generator_feature * 2, kernel_size=4, stride=2, padding=1, bias=False),            nn.BatchNorm2d(n_generator_feature * 2),            nn.ReLU(True),  # (n_generator_feature * 2) × 16 × 16            nn.ConvTranspose2d(n_generator_feature * 2, n_generator_feature, kernel_size=4, stride=2, padding=1, bias=False),            nn.BatchNorm2d(n_generator_feature),            nn.ReLU(True),      # (n_generator_feature) × 32 × 32            nn.ConvTranspose2d(n_generator_feature, 3, kernel_size=5, stride=3, padding=1, bias=False),            nn.Tanh()       # 3 * 96 * 96        )    def forward(self, input):        return self.main(input)class NetDiscriminator(nn.Module):    def __init__(self):        super(NetDiscriminator,self).__init__()        self.main = nn.Sequential(            nn.Conv2d(3, n_discriminator_feature, kernel_size=5, stride=3, padding=1, bias=False),            nn.LeakyReLU(0.2, inplace=True),        # n_discriminator_feature * 32 * 32            nn.Conv2d(n_discriminator_feature, n_discriminator_feature * 2, kernel_size=4, stride=2, padding=1, bias=False),            nn.BatchNorm2d(n_discriminator_feature * 2),            nn.LeakyReLU(0.2, inplace=True),         # (n_discriminator_feature*2) * 16 * 16            nn.Conv2d(n_discriminator_feature * 2, n_discriminator_feature * 4, kernel_size=4, stride=2, padding=1, bias=False),            nn.BatchNorm2d(n_discriminator_feature * 4),            nn.LeakyReLU(0.2, inplace=True),  # (n_discriminator_feature*4) * 8 * 8            nn.Conv2d(n_discriminator_feature * 4, n_discriminator_feature * 8, kernel_size=4, stride=2, padding=1, bias=False),            nn.BatchNorm2d(n_discriminator_feature * 8),            nn.LeakyReLU(0.2, inplace=True),  # (n_discriminator_feature*8) * 4 * 4            nn.Conv2d(n_discriminator_feature * 8, 1, kernel_size=4, stride=1, padding=0, bias=False),            nn.Sigmoid()        # 输出一个概率        )    def forward(self, input):        return self.main(input).view(-1)def train():    for i, (image,_) in tqdm.tqdm(enumerate(dataloader)):       # type((image,_)) = , len((image,_)) = 2 * 256 * 3 * 96 * 96        real_image = Variable(image)        real_image = real_image.cuda()        if (i + 1) % d_every == 0:            optimizer_d.zero_grad()            output = Discriminator(real_image)      # 尽可能把真图片判为True            error_d_real = criterion(output, true_labels)            error_d_real.backward()            noises.data.copy_(torch.randn(batch_size, noiseSize, 1, 1))            fake_img = Generator(noises).detach()       # 根据噪声生成假图            fake_output = Discriminator(fake_img)       # 尽可能把假图片判为False            error_d_fake = criterion(fake_output, fake_labels)            error_d_fake.backward()            optimizer_d.step()        if (i + 1) % g_every == 0:            optimizer_g.zero_grad()            noises.data.copy_(torch.randn(batch_size, noiseSize, 1, 1))            fake_img = Generator(noises)        # 这里没有detach            fake_output = Discriminator(fake_img)       # 尽可能让Discriminator把假图片判为True            error_g = criterion(fake_output, true_labels)            error_g.backward()            optimizer_g.step()def show(num):    fix_fake_imags = Generator(fix_noises)    fix_fake_imags = fix_fake_imags.data.cpu()[:64] * 0.5 + 0.5    # x = torch.rand(64, 3, 96, 96)    fig = plt.figure(1)    i = 1    for image in fix_fake_imags:        ax = fig.add_subplot(8, 8, eval('%d' % i))        # plt.xticks([]), plt.yticks([])  # 去除坐标轴        plt.axis('off')        plt.imshow(image.permute(1, 2, 0))        i += 1    plt.subplots_adjust(left=None,  # the left side of the subplots of the figure                        right=None,  # the right side of the subplots of the figure                        bottom=None,  # the bottom of the subplots of the figure                        top=None,  # the top of the subplots of the figure                        wspace=0.05,  # the amount of width reserved for blank space between subplots                        hspace=0.05)  # the amount of height reserved for white space between subplots)    plt.suptitle('第%d迭代结果' % num, y=0.91, fontsize=15)    plt.savefig("images/%dcgan.png" % num)if __name__ == '__main__':    transform = tv.transforms.Compose([        tv.transforms.Resize(96),     # 图片尺寸, transforms.Scale transform is deprecated        tv.transforms.CenterCrop(96),        tv.transforms.ToTensor(),        tv.transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))       # 变成[-1,1]的数    ])    dataset = tv.datasets.ImageFolder(dir, transform=transform)    dataloader = torch.utils.data.DataLoader(dataset, batch_size=batch_size, shuffle=True, num_workers=4, drop_last=True)   # module 'torch.utils.data' has no attribute 'DataLoder'    print('数据加载完毕！')    Generator = NetGenerator()    Discriminator = NetDiscriminator()    optimizer_g = torch.optim.Adam(Generator.parameters(), lr=2e-4, betas=(0.5, 0.999))    optimizer_d = torch.optim.Adam(Discriminator.parameters(), lr=2e-4, betas=(0.5, 0.999))    criterion = torch.nn.BCELoss()    true_labels = Variable(torch.ones(batch_size))     # batch_size    fake_labels = Variable(torch.zeros(batch_size))    fix_noises = Variable(torch.randn(batch_size, noiseSize, 1, 1))    noises = Variable(torch.randn(batch_size, noiseSize, 1, 1))     # 均值为0，方差为1的正态分布    if torch.cuda.is_available() == True:        print('Cuda is available!')        Generator.cuda()        Discriminator.cuda()        criterion.cuda()        true_labels, fake_labels = true_labels.cuda(), fake_labels.cuda()        fix_noises, noises = fix_noises.cuda(), noises.cuda()    plot_epoch = [1,5,10,50,100,200,500,800,1000,1500,2000,2500,3000]    for i in range(3000):        # 最大迭代次数        train()        print('迭代次数：{}'.format(i))        if i in plot_epoch:            show(i)

来源地址：https://blog.csdn.net/weixin_45807161/article/details/123776427

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 生成对抗网络（GAN）详解与实例

本文链接: https://www.lsjlt.com/news/417170.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

生成对抗网络（GAN）详解与实例

GAN介绍理解GAN的直观方法是从博弈论的角度来理解它。GAN由两个参与者组成，即一个生成器和一个判别器，它们都试图击败对方。生成备从分巾中狄取一些随机噪声，并试图从中生成一些类似于输出的分布。生成...

99+

2023-09-25

python 深度学习 pytorch GAN 生成对抗网络
GAN（生成式对抗网络）简介

本文利用通俗易懂的语言对生成对抗网络（GAN）进行介绍，包括技术背景、原理、应用场景、未来发展趋势等。一、技术背景生成对抗网络（Generative Adversarial Networks，GAN）是一种生成模型，由Goodfello...

99+

2023-10-25

生成对抗网络深度学习人工智能机器学习神经网络
如何使用TensorFlow创建生成式对抗网络GAN

本篇内容介绍了“如何使用TensorFlow创建生成式对抗网络GAN”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！导入必要的库和模块以下是使...

99+

2023-07-05
PaddlePaddle中的生成对抗网络有哪些应用

PaddlePaddle中的生成对抗网络（GAN）可以应用于以下领域：图像生成：通过训练生成对抗网络，可以生成逼真的图像，例如...

99+

2024-04-02
Torch中的生成对抗网络模块有哪些

在Torch中，生成对抗网络（GAN）模块有以下几个常用的库： nn.Sequential：用于构建生成器和判别器网络的序列模块。...

99+

2024-03-08

Torch
Torch中的生成对抗网络有哪些应用

生成对抗网络（GANs）在Torch中有许多应用，包括但不限于：图像生成：使用GANs可以生成逼真的图像，如人脸、动物等。通过...

99+

2024-04-02
PyTorch 深度学习实战 | 基于生成式对抗网络生成动漫人物

生成式对抗网络（Generative Adversarial Network, GAN）是近些年计算机视觉领域非常常见的一类方法，其强大的从已有数据集中生成新数据的能力令人惊叹，甚至连人眼都无法进行分辨。本文将会介绍基...

99+

2023-10-25

深度学习 pytorch 人工智能原力计划 Powered by 金山文档
Java dom4j生成与解析XML案例详解

一）dom4j介绍使用方式：在pom.xml中导入dom4j对应的jar <dependency> <groupId>dom4j</gro...

99+

2024-04-02
深入理解Java对象实例生成的例子!(转)

深入理解Java对象实例生成的例子!(转)[@more@]代码如下:class A { public int Avar; public A() { System.out.println("AAA"); doSomething(); } pu...

99+

2023-06-03
java仿Servlet生成验证码实例详解

java仿Servlet生成验证码实例详解实现原理：使用BufferedImage对象的Graphics来进行绘制，然后输出成一张图片进行保存实现代码及详解:public class validateCode{ private stati...

99+

2023-05-31

java servlet 验证码
Python元类与迭代器生成器案例详解

1.__getattr__和__getattribute__魔法函数 __getattr__是当类调用一个不存在的属性时才会调用getattr魔法函数，他传入的值item就是你这个调...

99+

2024-04-02
JavaScript实现动态生成表格案例详解

目录前言实现思路实现代码实现效果前言在这里实现一个动态添加表格的案例，当点击添加按钮时，可以弹出一个表单，然后将输入的内容添加到表格中，也可以将表格中的整行内容清除。实现思路 ...

99+

2024-04-02
php curl发起get与post网络请求案例详解

curl介绍 curl是一个开源的网络链接库，支持http, https, ftp, gopher, telnet, dict, file, and ldap 协议。之前均益介绍了p...

99+

2024-04-02
基于go实例网络存储协议详解

目录主要内容一.网络存储是什么二.iSCSI是什么iscsid三.RDMA是什么四.NVME-oF是什么主要内容一.网络存储是什么二.iSCSI是什么三.RDMA是什么四....

99+

2023-03-06

go网络存储协议 go 存储协议
Java 生成随机字符串数组的实例详解

Java 生成随机字符串数组的实例详解利用Collections.sort()方法对泛型为String的List 进行排序。具体要求：创建完List<String>之后，往其中添加十条随机字符串2.每条字符串的长度为10以内的随...

99+

2023-05-31

java 随机字符串
itext生成PDF设置页眉页脚的实例详解

itext生成PDF设置页眉页脚的实例详解实例代码： package com.labci.itext.test; import java.awt.Color; import java.io.FileNotFoundException; im...

99+

2023-05-31

itext pdf te
TensorFlow卷积神经网络AlexNet实现示例详解

2012年，Hinton的学生Alex Krizhevsky提出了深度卷积神经网络模型AlexNet，它可以算是LeNet的一种更深更宽的版本。AlexNet以显著的优势赢得了竞争激...

99+

2024-04-02
python中列表推导式与生成器表达式对比详解

目录概述列表推导式生成器表达式使用场景选择参考总结概述 Python中的列表推倒式(List Comprehension) 和生成器表达式（Generator Expression...

99+

2023-01-07

python 列表推导式 python 生成器表达式
uni-app网络请求、数据缓存实例详解

目录一、网络请求1.配置请求1.1 发送get请求1.2 发送POST请求二、数据缓存1.uni.setStorage(OBJECT)2.uni.setStorageSyn...

99+

2022-11-16

uni-app网络请求数据缓存 uni-app网络请求
Vue3中进行二维码的生成与解码实现详解

目录使用到的库生成二维码的流程二维码的解码过程实现思路使用到的库最近在项目中需要使用到二维码的生成解码来进行一些认证操作，在此记录一下我的学习过程。 npm i qrcode.v...

99+

2023-03-02

Vue3二维码生成解码 Vue3 二维码