Ch.21

GAN 基础：生成与判别的对抗

像造假者和鉴定师互相提升技艺。

真实照片 与 噪声造出的假图 进入 判别器 ，分为 真 / 假 。先分清 制造方(G) 与 分辨方(D) 。

训练流程

x

G

G

GAN：生成器与判别器

G

1. 生成式 AI 的真正起点 分类器答“这是狗”，GAN 则 画出世上不存在的狗 —图像、语音等生成革命的重要骨架。 2. 清晰锐利的细节 相比输出平均值的模糊模型，GAN 需通过苛刻判别器，发丝与肤质可 极其锐利 。 3. 数据增强 用少量暴雪夜路照片合成大量训练图，或扩充罕见医疗/缺陷样本，供其他模型使用。

[-1,1]

z

G

GAN：生成器与判别器

1. GAN 核心结构：生成器与判别器的激烈对抗

GAN 是两个网络为胜过对方而不断成长的独特结构。生成器（ $G$ ） 努力把假数据做得像真的，判别器（ $D$ ） 则敏锐地分辨真伪。

* 比喻： 赝品画师（生成器）与鉴定师（判别器）互相逼出更高水平。

2. 极小极大（Minimax）博弈

核心目标函数为：

\min_G \max_D V(D, G) = \mathbb{E}_{x}[\log D(x)] + \mathbb{E}_{z}[\log(1 - D(G(z)))]

* 判别器（ $D$ ）最大化： 真样本

x

上

D(x)\to 1

，假样本

G(z)

上

D(G(z))\to 0

。

* 生成器（ $G$ ）最小化： 让

D(G(z))\to 1

，使后一项变小。

3. 潜在噪声 $z$

喂给生成器的随机向量称为 潜在噪声（ $z$ ）。

* 比喻： 像交给雕塑家的一团黏土，

z

的细微变化会改变成品的表情与色彩。

4. 模式崩溃（Mode Collapse）

生成器不再多样，而是 无限复制曾骗过判别器的那一种样本。

* 比喻： 餐馆因泡菜汤得满分，就把全年菜单都改成泡菜汤。

5. 条件 GAN（cGAN）

把 条件（ $y$ ）—类别或文本—与

z

一起输入，例如“画一只猫”“把素描上色”。