CGAN--条件生成对抗神经网络（文末留言免费赠书）

CGAN概述

原始的GAN在生成高维度数据时，只能随机生成，无法生成我们给定条件的数据。这极大的限制了GAN的应用范围，因为，对于我们来说，仅仅生成足够真实的数据（如图片）没有太大的意义，因为只要架起高清照相机，我们就能够得到足够多的、真实的图片，所以，只有能够生成我们指定条件的数据，才有意义。

有条件约束的GAN，将数字类别作为约束条件与随机噪声一起输入到生成模型，使生成模型能够生成指定的手写数字。对应的，CGAN的辨别模型的输入也包含两个部分，图片和标签。

一、CGAN模型架构

CGAN的模型架构，如图1所示。

图1 CGAN模型架构

从图1中可以看出，样本数据中的图片（x）和类别标签（y）对，一起输入到辨别模型，除此之外，输入到辨别模型的还有生成模型生成的图片（G（z|y））与类别标签（y），辨别模型的目标是将他们区分开。生成模型的输入是类别标签（y）和随机噪声（z），输出的是生成的手写数字图片。需要注意的是，这里的类别标签（y）来源于样本数据，而不是随机生成的标签，只有这样生成模型才能学习到如何生成指定类别的手写数字。

二、生成模型架构

CGAN的生成模型，如图2所示。输入的类别标签（y）和随机噪声（z），分别与包含200个和1000个神经元的全连接层连接（类别标签先被转换成one-hot张量），该全连接层之后紧接着一个批量正则化层，激活函数采用的是ReLU。

图2 CGAN原始的生成模型架构

然后，将上述两个全连接层串联起来，与一个包含512个神经元的全连接层连接起来，紧接着是带泄露的ReLU激活函数、批量正则化函数。需要说明的是，在原始的CGAN论文中，该层似乎是1200个神经元，但是，在实际模型训练过程中，笔者发现512个神经元模型更容易训练。

最后，连接到包含784个神经元的全连接层，采用sigmoid激活函数，紧接着是批量正则化层。由于sigmoid输出的取值范围是[0, 1]，所以，在模型训练阶段，我们读取样本数据时，需要将样本数据的取值范围从[0,255]映射到[0, 1]，这样真实的样本数据和生成的数据取值范围才有可能一致。对应的，在展示生成的图片是，需要将生成的数据取值范围映射到[-1, 1]，才能正确的显示图片，否则，生成的图片会变灰、变白，看起来很模糊。

三、辨别模型架构

CGAN的辨别模型，见图3。样本数据的图片（x）首先与一个k=5、输出神经元个数为240的Maxout网络层连接。Maxout网络层是全连接层的变种，原理和实现代码见“7.1.4 Maxout网络层”。类别标签分别（y）与一个k=5、输出神经元个数为50的Maxout网络层连接。

其次，将上述两个Maxout网络层的输出结果串联起来，再与一个k=4、输出神经元个数为240的Maxout网络层连接。

最后，将上述Maxout网络层的输出结果连接到一个只包含1个神经元的全连接层，该全连接层采用sigmoid作为激活函数。

图3 CGAN原始的辨别模型架构

四、 Maxout网络层原理

Maxout网络层是原始全连接层的变种。原始的全连接层的计算过程，见图4。此图展示了输入，输出的计算过程。其中，是激活函数，是权重，是偏置项。

图4 原始全连接层示意图

我们仍然以输入，输出为例，展示Maxout网络层的计算过程，参见图5。从图5中可以看出，与原始的全连接层神经网络相比，Maxout网络层中多了一个包含k个神经元的隐藏层，输入的分别与这k个神经元连接，对应的使用k组（）权重参数，输出k个y，然后，这k个y输入给求最大值（max）函数，将求出的最大值作为Maxout的最终输出。

图5 Maxout网络层的计算过程示意图

五、 Maxout网络层实现

Maxout没有内置在TensorFlow 2.0的版本中，所以，我们来实现一个简单的、自定义Maxout网络层，命名为MaxoutDense。

实现自定义的Maxout网络层，需要实现一个继承tf.keras.layers.Layer的MaxoutDense类，实现它的初始化函数、buid函数、以及call函数。其中，初始化函数，用于接收MaxoutDense的超参，比如k和output_dims。build函数用于对权重参数进行初始化，它是由父类在调用call函数之前自动调用。由于初始化参数时，需要根据输入张量的形状来计算参数的形状，因此，build的输入参数是input_shape，代表输入张量的形状。最后是call函数，输入参数是输入张量，call函数用于执行最终的计算。

Maxout网络层的实现代码如下，我们将下面的代码保存到maxout.py文件中备用。

#!/usr/bin/env python3# -*- coding: UTF-8 -*-

from __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_function

import tensorflow as tf # TensorFlow 2.0

class MaxoutDense(tf.keras.layers.Layer): def __init__(self, k, output_dims, kernel_initializer=None): ''' 参数： k : k个神经元一组 output_dims: 输出的神经元个数 kernel_initializer: 参数初始化器，GAN模型训练困难，参数初始化必须小心。 在这里我们采用均值为0.0、方差为0.02的正态分布随机数来填充 ''' super(MaxoutDense, self).__init__() self.k = k self.output_dims = output_dims if kernel_initializer is None: kernel_initializer = tf.random_normal_initializer( mean=0.0, stddev=0.02) self.kernel_initializer = kernel_initializer

def build(self, input_shape): ''' 在调用call之前，根据输入张量的形状，初始化变量。 在调用call函数之前，由父类自动调用。 ''' d = input_shape[-1]

self.W = tf.Variable(self.kernel_initializer( shape=[d, self.output_dims, self.k])) self.b = tf.Variable(self.kernel_initializer( shape=[self.output_dims, self.k]))

def call(self, input): ''' 执行Maxout计算。 ''' z = tf.tensordot(input, self.W, axes=1) self.b # 对k组输出结果，求最大值 z = tf.reduce_max(z, axis=2)

return z

Maxout网络层的调用示例代码如下：

# 将图像连接到k=5、输出神经元个数为240的Maxout层image_h0 = MaxoutDense(k=5, output_dims=240)(image)
# 将k=5、输出神经元个数为240的Maxout层增加到模型中model = Sequential( )model.add(MaxoutDense(k=5, output_dims=50))

本文选自----《GAN生成对抗神经网络原理与实践》一书中，经授权此公号。

文末赠书

编辑推荐

全景：囊括GAN起源、发展和演变的全貌；
插图：100余幅插图，图说GAN的原理；
实战：10余种有代表性的GAN案例代码。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。