Ch.21

GAN基礎：生成と識別の対決

偽札の作り手と鑑定士が互いに腕を上げるイメージです。

本物の写真 と ノイズで作った偽物 が 識別器 に入り、 本物 / 偽物 に分かれます。まず 作る側(G) と 見分ける側(D) だけ区別してみてください。

学習の流れ

x

G

G

GAN: 生成器と識別器

G

1. 生成型 AI の出発点 分類が「犬です」と答えるなら、GAN は 存在しない犬の絵を描く 側です。画像・音声など現代の生成革命の骨格です。 2. 鮮明でリアルなディテール 平均に寄るモデルと違い、厳しい識別器を通るため シャープ な質感を出しやすいです。 3. データ拡張 少数の雪の夜道写真から大量の合成データを作るなど、希少データを増やす技術として重要です。

[-1,1]

z

G

GAN: 生成器と識別器

1. GAN の核心構造: 生成器と識別器の激しい対決

GAN は二つのネットワークが互いに勝とうとしながら成長する独特の構造です。生成器（ $G$ ） は偽物を本物らしく作り、識別器（ $D$ ） は真偽を鋭く判定します。

* 比喩: 贋作画家（生成器）と鑑定士（識別器）が互いの腕を磨き合う関係です。

2. ミニマックス（Minimax）ゲーム

核心の目的関数は次のとおりです。

\min_G \max_D V(D, G) = \mathbb{E}_{x}[\log D(x)] + \mathbb{E}_{z}[\log(1 - D(G(z)))]

* 識別器（ $D$ ）は最大化: 本物

x

では

D(x)\to 1

、偽物

G(z)

では

D(G(z))\to 0

。

* 生成器（ $G$ ）は最小化:

D(G(z))\to 1

になるよう偽物を作り、後項を小さくします。

3. 潜在ノイズ $z$

生成器への指示として渡す乱数ベクトルを 潜在ノイズ（ $z$ ） と呼びます。

* 比喩: 粘土の塊の形が少し変わるだけで、仕上がりの表情や色が変わるイメージです。

4. モード崩壊（Mode Collapse）

生成器が多様性を失い、一度識別器を騙した一種類のサンプルだけを無限に複製する現象です。

* 比喩: キムチチゲだけで満点を取った店が、一年間メニューをそれだけにするようなものです。

5. 条件付き GAN（cGAN）

条件（ $y$ ）—クラスやテキスト—を

z

と一緒に入れ、「猫を描いて」「スケッチを彩色して」など生成を制御します。