Chapter 07

連鎖律：重ねた関数を解く、逆伝播の核心

関数を重ねて書いたものを微分するときは 外の微分 \times 内の微分 をかければよいです。逆伝播の核心です。

チャプター別数学図

チャプターを選ぶと、下の図がそのチャプターの内容に切り替わります。基礎数学の流れを一覧で確認できます。

重なった関数は $x$ → 内側 → 外側 → $y$ と連鎖しています。外の微分 × 内の微分をかけると全体の微分になります。

例で見る計算の順番（一度に一つずつ強調）

1.例：上のグラフのように

u = g(x) = 2x+1

、

y = f(u) = u^2

のとき

y = (2x+1)^2

を

x

で微分する。

2.① 内の微分（左グラフ）：

u = g(x) = 2x+1

を

x

で微分 →

2

3.② 外の微分（右グラフ）：

y = f(u) = u^2

を

u

で微分 →

2u = 2(2x+1)

4.③ かける：

2 \times 2(2x+1) = 4(2x+1)

→ 答え

点が連鎖に沿って動くように、変化率がかけ算されて伝わります。逆伝播もこのかけ算の繰り返しです。

連鎖律とは

連鎖律（Chain Rule）は、関数の中に別の関数が入った合成関数を微分する規則です。玉ねぎの皮をむくように、「外側の関数を微分（ $f^{\prime}$ ）× 内側の関数を微分（ $g'$ ）してかける」という原理です。式では

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

と表し、噛み合った歯車の回転比を求めるのと同じです。

直感的な例：「自分」(

x

) が「友達」(

u

) を押し、友達が「台車」(

y

) を押すとします。自分が友達を2倍の力で押し、友達が台車を3倍の力で押すなら、台車は自分の力の

2 \times 3 = 6

倍で動きます。このように段階ごとの変化率（傾き）をかけ算でつなぐのが連鎖律です。

核心公式：

\{f(g(x))\}' = f^{\prime}(g(x)) \times g'(x)

。覚え方は「外の微分 × 内の微分」です。

段階 $1$
やること $内側・外側を区別$
例： $y=(2x+1)^2$ $u=2x+1$

段階 $2$
やること $外の微分$
例： $y=(2x+1)^2$ $u^2$

段階 $3$
やること $内の微分$
例： $y=(2x+1)^2$ $2x+1$

段階 $4$
やること $かける$
例： $y=(2x+1)^2$ $2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)$

段階	やること	例： $y=(2x+1)^2$
1	内側・外側を区別	内側 $u=2x+1$ 、外側 $y=u^2$
2	外の微分	$u^2$ を微分すると $2u$ （このとき $u$ はそのまま）
3	内の微分	内側 $2x+1$ を微分すると $2$
4	かける	$2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)$

代表式：

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

または

(f \circ g)'(x) = f^{\prime}(g(x)) \cdot g'(x)

。上のビジュアルのように

x

→ 内側 → 外側 →

y

の順でつながるので、各区間の微分をかけます。内側がまた重なっているときは、その部分でも同じように外の微分×内の微分を繰り返してかけます。

なぜ足し算ではなくかけ算か？比率（Rate）だからです。時速100kmで走る車（

v

）と、1ドル1300円の為替（

r

）を足しても意味がありません。変化の増幅や減衰を求めるにはかけ算が必要です。

数で確認：

y=(2x+1)^2

で

x=1

のときの変化率は、公式どおり

4(2(1)+1)=12

。実際

x

が 1 から 1.01 に 0.01 だけ変わると、

y

は 9 から約 9.1204 に約 0.12 変わります。0.01 の 12 倍が 0.12 なので、変化率 12 で正しいです。

ディープラーニングモデルは、数十・数百の関数が重なった巨大な合成関数（

y = f_n(...f_2(f_1(x))...)

）です。知りたいのは「最初の入力や中間の重み（

w

）を変えたとき、最終的な誤差（

L

）がどう変わるか」です。これを求めるには連鎖律が不可欠です。

誤差逆伝播（Backpropagation）の正体がまさに連鎖律です。出力層で生じた誤差を入力層方向へ逆に伝えるとき、各層の微分値（傾き）をかけ算で伝えていきます。この過程がなければ深いニューラルネットの学習は不可能です。

つまりAIが学習するとは「微分値を連鎖律でかけ算して伝える過程」です。層が深いほどこのかけ算が繰り返されますが、1より小さい数（例：0.5）を何度もかけると0に近づきます。こうして勾配が消える現象を勾配消失（Vanishing Gradient）といい、深いネットワークの学習が難しかった理由の一つでした。ReLUやスキップ接続などの技術がこの問題を緩和します。

複雑な因果関係を分析するときに使います。AがBに影響し、BがCに影響するとき、AがCに及ぼす影響は各段階の影響力をかけ算して求めます。

状況 $コスト \to 生産量 \to 時間$
求めるもの $時間がコストに及ぼす影響$
連鎖律（全体の変化率） $\times$

状況 $体積 \to 半径 \to 時間$
求めるもの $風船に空気を入れるときの体積の変化率$
連鎖律（全体の変化率） $\times$

状況 $誤差 \to 出力 \to 重み$
求めるもの $AI学習：重みの更新量$
連鎖律（全体の変化率） $\times$

状況	求めるもの	連鎖律（全体の変化率）
コスト → 生産量 → 時間	時間がコストに及ぼす影響	(コスト/生産量) $\times$ (生産量/時間)
体積 → 半径 → 時間	風船に空気を入れるときの体積の変化率	(体積/半径) $\times$ (半径/時間)
誤差 → 出力 → 重み	AI学習：重みの更新量	(誤差/出力) $\times$ (出力/重み)

自動微分（Automatic Differentiation）：PyTorchやTensorFlowなどのAIフレームワークでは、`loss.backward()`と一行書くだけで微分してくれます。内部では計算グラフを構築し、各ノードで連鎖律を適用して勾配を計算・乗算する処理が一瞬で行われます。

重なった関数を微分するときは内側を一つの塊と見て、外を微分したものと内を微分したものをかけるだけ。内側がまた重なっていればそこでも同じように繰り返します。コツ：まず「内側＝何」とおき、外の関数だけ微分してから、内側を

x

で微分したものをかければよいです。

いちばん簡単な例：

y=(3x)^2

。内側

u=3x

→ 微分して

3

。外側

u^2

→ 微分して

2u=2\cdot 3x

。かけると

3 \times 2\cdot 3x = 18x

。

x=2

のときの傾きは

36

です。

やさしいものからいろいろな例を表にまとめました。各行で「内の微分」と「外の微分」をかけると答えになります。

問題 $y=(3x)^2$
解法 $u=3x$

問題 $y=\sqrt{x+1}$
解法 $u=x+1$

問題 $y=(2x+1)^5$
解法 $2$

問題 $y=e^{x^2}$
解法 $2x$

問題 $y=\sin(2x)$
解法 $u=2x$

問題 $y=e^{3x}$
解法 $3$

問題 $y=\ln(\sin x)$
解法 $\cos x$

問題	解法
やさしい例 $y=(3x)^2$	内 $u=3x$ → 内の微分 $3$ 、外 $u^2$ → 外の微分 $2u$ ；積 $2\cdot 3x\cdot 3=18x$
やさしい例 $y=\sqrt{x+1}$	内 $u=x+1$ → 内の微分 $1$ 、外 $\sqrt{u}$ → 外の微分 $1/(2\sqrt{u})$ ；積 $1/(2\sqrt{x+1})$
例 $y=(2x+1)^5$	内の微分 $2$ 、外の微分 $5(2x+1)^4$ → 積 $10(2x+1)^4$
例 $y=e^{x^2}$	内の微分 $2x$ 、外の微分 $e^{x^2}$ → 積 $2x\,e^{x^2}$
例 $y=\sin(2x)$	内 $u=2x$ → 内の微分 $2$ 、外 $\sin u$ → 外の微分 $\cos u$ ；積 $2\cos(2x)$
例 $y=e^{3x}$	内の微分 $3$ 、外の微分 $e^{3x}$ → 積 $3e^{3x}$
例 $y=\ln(\sin x)$	内の微分 $\cos x$ 、外の微分 $1/\sin x$ → 積 $\cos x/\sin x=\cot x$

問題タイプ別の解法

タイプ $べき乗$
式の形 $(g(x))^n$
$f^{\prime}(x)$ の求め方 $n u^{n-1}$

タイプ $指数$
式の形 $e^{g(x)}$
$f^{\prime}(x)$ の求め方 $e^u$

タイプ $三角$
式の形 $\sin(g(x))$
$f^{\prime}(x)$ の求め方 $外の微分(cos または -sin) \times 内の微分。$

タイプ $ルート$
式の形 $\sqrt{g(x)}$
$f^{\prime}(x)$ の求め方 $1/(2\sqrt{u})$

タイプ $対数$
式の形 $\ln(g(x))$
$f^{\prime}(x)$ の求め方 $1/u$

タイプ $二次式の中$
式の形 $(ax^2+bx+c)^n$
$f^{\prime}(x)$ の求め方 $2ax+b$

タイプ	式の形	$f^{\prime}(x)$ の求め方
べき乗	$(g(x))^n$	外の微分 $n u^{n-1}$ × 内の微分 $g'(x)$ 。
指数	$e^{g(x)}$	外の微分 $e^u$ × 内の微分 → $e^{g(x)} \cdot g'(x)$ 。
三角	$\sin(g(x))$ 、 $\cos(g(x))$	外の微分(cos または −sin) × 内の微分。
ルート	$\sqrt{g(x)}$	外の微分 $1/(2\sqrt{u})$ × 内の微分。
対数	$\ln(g(x))$	外の微分 $1/u$ × 内の微分 → $g'(x)/g(x)$ 。
二次式の中	$(ax^2+bx+c)^n$ など	内の微分は $2ax+b$ 。外の微分と掛ける。

例（べき乗）

y=(3x)^2

のとき

x=2

での導関数の値を求めなさい。

解答

y'=2\cdot 3x \cdot 3=18x

。

x=2

を代入 →

36

。→ 答 36

例（指数）

y=e^{3x}

のとき

x=0

での導関数の値を求めなさい。

解答

y'=3e^{3x}

。

x=0

を代入 →

3e^0=3

。→ 答 3

例（三角）

y=\sin(2x)

のとき

x=0

での導関数の値を求めなさい。

解答

y'=2\cos(2x)

。

x=0

を代入 →

2\cos 0=2

。→ 答 2

例（対数）

y=\ln(\sin x)

のとき

x=\pi/2

での導関数の値を求めなさい。

解答

y'=\frac{\cos x}{\sin x}=\cot x

。

x=\pi/2

で

\cos(\pi/2)=0

なので

y'=0

。→ 答 0

連鎖律とは

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

と表し、噛み合った歯車の回転比を求めるのと同じです。

直感的な例：「自分」(

x

) が「友達」(

u

) を押し、友達が「台車」(

y

) を押すとします。自分が友達を2倍の力で押し、友達が台車を3倍の力で押すなら、台車は自分の力の

2 \times 3 = 6

倍で動きます。このように段階ごとの変化率（傾き）をかけ算でつなぐのが連鎖律です。

核心公式：

\{f(g(x))\}' = f^{\prime}(g(x)) \times g'(x)

。覚え方は「外の微分 × 内の微分」です。

段階 $1$
やること $内側・外側を区別$
例： $y=(2x+1)^2$ $u=2x+1$

段階 $2$
やること $外の微分$
例： $y=(2x+1)^2$ $u^2$

段階 $3$
やること $内の微分$
例： $y=(2x+1)^2$ $2x+1$

段階 $4$
やること $かける$
例： $y=(2x+1)^2$ $2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)$

段階	やること	例： $y=(2x+1)^2$
1	内側・外側を区別	内側 $u=2x+1$ 、外側 $y=u^2$
2	外の微分	$u^2$ を微分すると $2u$ （このとき $u$ はそのまま）
3	内の微分	内側 $2x+1$ を微分すると $2$
4	かける	$2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)$

代表式：

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

または

(f \circ g)'(x) = f^{\prime}(g(x)) \cdot g'(x)

。上のビジュアルのように

x

→ 内側 → 外側 →

y

なぜ足し算ではなくかけ算か？比率（Rate）だからです。時速100kmで走る車（

v

）と、1ドル1300円の為替（

r

）を足しても意味がありません。変化の増幅や減衰を求めるにはかけ算が必要です。

数で確認：

y=(2x+1)^2

で

x=1

のときの変化率は、公式どおり

4(2(1)+1)=12

。実際

x

が 1 から 1.01 に 0.01 だけ変わると、

y

は 9 から約 9.1204 に約 0.12 変わります。0.01 の 12 倍が 0.12 なので、変化率 12 で正しいです。

ディープラーニングモデルは、数十・数百の関数が重なった巨大な合成関数（

y = f_n(...f_2(f_1(x))...)

）です。知りたいのは「最初の入力や中間の重み（

w

）を変えたとき、最終的な誤差（

L

）がどう変わるか」です。これを求めるには連鎖律が不可欠です。

複雑な因果関係を分析するときに使います。AがBに影響し、BがCに影響するとき、AがCに及ぼす影響は各段階の影響力をかけ算して求めます。

状況 $コスト \to 生産量 \to 時間$
求めるもの $時間がコストに及ぼす影響$
連鎖律（全体の変化率） $\times$

状況 $体積 \to 半径 \to 時間$
求めるもの $風船に空気を入れるときの体積の変化率$
連鎖律（全体の変化率） $\times$

状況 $誤差 \to 出力 \to 重み$
求めるもの $AI学習：重みの更新量$
連鎖律（全体の変化率） $\times$

状況	求めるもの	連鎖律（全体の変化率）
コスト → 生産量 → 時間	時間がコストに及ぼす影響	(コスト/生産量) $\times$ (生産量/時間)
体積 → 半径 → 時間	風船に空気を入れるときの体積の変化率	(体積/半径) $\times$ (半径/時間)
誤差 → 出力 → 重み	AI学習：重みの更新量	(誤差/出力) $\times$ (出力/重み)

x

で微分したものをかければよいです。

いちばん簡単な例：

y=(3x)^2

。内側

u=3x

→ 微分して

3

。外側

u^2

→ 微分して

2u=2\cdot 3x

。かけると

3 \times 2\cdot 3x = 18x

。

x=2

のときの傾きは

36

です。

やさしいものからいろいろな例を表にまとめました。各行で「内の微分」と「外の微分」をかけると答えになります。

問題 $y=(3x)^2$
解法 $u=3x$

問題 $y=\sqrt{x+1}$
解法 $u=x+1$

問題 $y=(2x+1)^5$
解法 $2$

問題 $y=e^{x^2}$
解法 $2x$

問題 $y=\sin(2x)$
解法 $u=2x$

問題 $y=e^{3x}$
解法 $3$

問題 $y=\ln(\sin x)$
解法 $\cos x$

問題	解法
やさしい例 $y=(3x)^2$	内 $u=3x$ → 内の微分 $3$ 、外 $u^2$ → 外の微分 $2u$ ；積 $2\cdot 3x\cdot 3=18x$
やさしい例 $y=\sqrt{x+1}$	内 $u=x+1$ → 内の微分 $1$ 、外 $\sqrt{u}$ → 外の微分 $1/(2\sqrt{u})$ ；積 $1/(2\sqrt{x+1})$
例 $y=(2x+1)^5$	内の微分 $2$ 、外の微分 $5(2x+1)^4$ → 積 $10(2x+1)^4$
例 $y=e^{x^2}$	内の微分 $2x$ 、外の微分 $e^{x^2}$ → 積 $2x\,e^{x^2}$
例 $y=\sin(2x)$	内 $u=2x$ → 内の微分 $2$ 、外 $\sin u$ → 外の微分 $\cos u$ ；積 $2\cos(2x)$
例 $y=e^{3x}$	内の微分 $3$ 、外の微分 $e^{3x}$ → 積 $3e^{3x}$
例 $y=\ln(\sin x)$	内の微分 $\cos x$ 、外の微分 $1/\sin x$ → 積 $\cos x/\sin x=\cot x$

問題タイプ別の解法

タイプ $べき乗$
式の形 $(g(x))^n$
$f^{\prime}(x)$ の求め方 $n u^{n-1}$

タイプ $指数$
式の形 $e^{g(x)}$
$f^{\prime}(x)$ の求め方 $e^u$

タイプ $三角$
式の形 $\sin(g(x))$
$f^{\prime}(x)$ の求め方 $外の微分(cos または -sin) \times 内の微分。$

タイプ $ルート$
式の形 $\sqrt{g(x)}$
$f^{\prime}(x)$ の求め方 $1/(2\sqrt{u})$

タイプ $対数$
式の形 $\ln(g(x))$
$f^{\prime}(x)$ の求め方 $1/u$

タイプ $二次式の中$
式の形 $(ax^2+bx+c)^n$
$f^{\prime}(x)$ の求め方 $2ax+b$

タイプ	式の形	$f^{\prime}(x)$ の求め方
べき乗	$(g(x))^n$	外の微分 $n u^{n-1}$ × 内の微分 $g'(x)$ 。
指数	$e^{g(x)}$	外の微分 $e^u$ × 内の微分 → $e^{g(x)} \cdot g'(x)$ 。
三角	$\sin(g(x))$ 、 $\cos(g(x))$	外の微分(cos または −sin) × 内の微分。
ルート	$\sqrt{g(x)}$	外の微分 $1/(2\sqrt{u})$ × 内の微分。
対数	$\ln(g(x))$	外の微分 $1/u$ × 内の微分 → $g'(x)/g(x)$ 。
二次式の中	$(ax^2+bx+c)^n$ など	内の微分は $2ax+b$ 。外の微分と掛ける。

例（べき乗）

y=(3x)^2

のとき

x=2

での導関数の値を求めなさい。

解答

y'=2\cdot 3x \cdot 3=18x

。

x=2

を代入 →

36

。→ 答 36

例（指数）

y=e^{3x}

のとき

x=0

での導関数の値を求めなさい。

解答

y'=3e^{3x}

。

x=0

を代入 →

3e^0=3

。→ 答 3

例（三角）

y=\sin(2x)

のとき

x=0

での導関数の値を求めなさい。

解答

y'=2\cos(2x)

。

x=0

を代入 →

2\cos 0=2

。→ 答 2

例（対数）

y=\ln(\sin x)

のとき

x=\pi/2

での導関数の値を求めなさい。

解答

y'=\frac{\cos x}{\sin x}=\cot x

。

x=\pi/2

で

\cos(\pi/2)=0

なので

y'=0

。→ 答 0

連鎖律：重ねた関数を解く、逆伝播の核心

チャプター別 数学図

連鎖律とは

連鎖律：重ねた関数を解く、逆伝播の核心

チャプター別 数学図

連鎖律とは

チャプター別数学図

チャプター別数学図