Chapter 07

연쇄 법칙: 겹친 함수를 풀다, 역전파의 핵심

함수를 겹쳐 쓴 걸 미분할 때는 밖의 미분 \times 안의 미분 으로 곱하면 됩니다. 역전파의 핵심이에요.

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.

겹친 함수는 $x$ → 안쪽 → 밖쪽 → $y$ 처럼 연쇄로 이어져 있어요. 밖의 미분 × 안의 미분을 곱하면 전체 미분이에요.

예시로 보는 계산 순서 (한 번에 하나씩 강조)

1.예: 위 그래프처럼

u = g(x) = 2x+1

y = f(u) = u^2

일 때

y = (2x+1)^2

를

x

로 미분하자.

2.① 안의 미분 (왼쪽 그래프):

u = g(x) = 2x+1

을

x

로 미분 →

2

3.② 밖의 미분 (오른쪽 그래프):

y = f(u) = u^2

를

u

로 미분 →

2u = 2(2x+1)

4.③ 곱하기:

2 \times 2(2x+1) = 4(2x+1)

→ 답

점이 연쇄를 따라 움직이듯, 변화율이 곱해지면서 전달돼요. 역전파도 이 곱하기가 반복되는 구조예요.

연쇄 법칙이란

연쇄 법칙(Chain Rule)은 함수 안에 또 다른 함수가 들어있는 합성함수를 미분하는 규칙입니다. 마치 양파 껍질을 까듯, '바깥쪽 함수를 미분하고( $f^{\prime}$ ) $\times$ 안쪽 함수를 미분( $g'$ )해서 곱한다'는 원리입니다. 수식으로는

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

로 표현하며, 서로 맞물린 톱니바퀴의 회전 비율을 구하는 것과 같습니다.

직관적 예시: '나'(

x

)가 '친구'(

u

)를 밀고, '친구'가 '수레'(

y

)를 밉니다. 내가 친구를 2배 힘으로 밀고, 친구가 수레를 3배 힘으로 민다면, 결과적으로 수레는 내 힘의

2 \times 3 = 6

배로 움직입니다. 이처럼 단계별 변화율(기울기)을 곱셈으로 연결하는 것이 연쇄 법칙입니다.

핵심 공식:

\{f(g(x))\}' = f^{\prime}(g(x)) \times g'(x)

. 기억하세요, '겉미분 곱하기 속미분'입니다.

단계 $1$
할 일 $안/밖 구분$
예: $y=(2x+1)^2$ $u=2x+1$

단계 $2$
할 일 $겉미분$
예: $y=(2x+1)^2$ $u^2$

단계 $3$
할 일 $속미분$
예: $y=(2x+1)^2$ $2x+1$

단계 $4$
할 일 $곱하기$
예: $y=(2x+1)^2$ $2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)$

단계	할 일	예: $y=(2x+1)^2$
1	안/밖 구분	안쪽 $u=2x+1$ , 바깥쪽 $y=u^2$
2	겉미분	$u^2$ 을 미분하면 $2u$ (이때 $u$ 는 그대로 둠)
3	속미분	안쪽 $2x+1$ 을 미분하면 $2$
4	곱하기	$2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)$

대표 수식:

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

y

가

u

에 의해 변하고,

u

가

x

에 의해 변할 때,

x

가 변할 때

y

의 총 변화량은 두 변화율의 곱입니다.

왜 더하지 않고 곱할까요? 비율(Rate)이기 때문입니다. 시속 100km로 달리는 차(

v

)가 있고, 환율이 1달러당 1300원(

r

)이라면, 이 둘을 더하는 건 의미가 없죠. 변화의 증폭이나 감쇄를 계산하려면 반드시 곱해야 합니다.

숫자로 확인하기:

y=(2x+1)^2

에서

x=1

일 때 변화율을 구해봅시다. 공식대로면

4(2(1)+1) = 12

입니다. 실제로

x

가 1에서 1.01로

0.01

만큼 아주 조금 변하면,

y

는 9에서

9.1204

로 약

0.12

만큼 변합니다.

0.01

의 12배인

0.12

가 변했으니, 변화율이 12가 맞습니다.

딥러닝(Deep Learning) 모델은 수십, 수백 개의 함수가 겹겹이 쌓인 거대한 합성함수(

y = f_n(...f_2(f_1(x))...)

)입니다. 우리가 원하는 건 '맨 처음 입력이나 중간의 가중치(

w

)를 바꿀 때, 맨 마지막 오차(

L

)가 어떻게 변하는가'입니다. 이를 구하려면 연쇄 법칙을 필수로 써야 합니다.

역전파(Backpropagation) 알고리즘의 정체가 바로 연쇄 법칙입니다. 출력층에서 발생한 오차를 입력층 방향으로 거꾸로 전파할 때, 각 층의 미분값(기울기)을 계속해서 곱해 나갑니다. 이 과정이 없다면 깊은 신경망의 학습 자체가 불가능합니다.

결국 AI가 학습한다는 것은 '미분값을 연쇄 법칙으로 곱해서 전달하는 과정'입니다. 층이 깊을수록 이 곱이 반복되는데, 1보다 작은 수(예: 0.5)를 여러 번 곱하면 0에 가까워집니다. 이렇게 기울기가 사라지는 현상을 그라디언트 소실(Vanishing Gradient)라고 하며, 깊은 신경망 학습이 어려웠던 이유 중 하나였어요. ReLU나 스킵 연결 같은 기술이 이 문제를 완화합니다.

복잡한 인과관계를 분석할 때 쓰입니다. A가 B에 영향을 주고, B가 C에 영향을 주는 상황에서 A가 C에 미치는 영향을 계산하려면 각 단계의 영향력을 곱해야 합니다.

상황 $비용 \to 생산량 \to 시간$
구하는 것 $시간이 비용에 미치는 영향$
연쇄 법칙 (총 변화율) $\times$

상황 $부피 \to 반지름 \to 시간$
구하는 것 $풍선에 바람 넣을 때 부피 변화 속도$
연쇄 법칙 (총 변화율) $\times$

상황 $오차 \to 출력 \to 가중치$
구하는 것 $AI 학습: 가중치 업데이트 양$
연쇄 법칙 (총 변화율) $\times$

상황	구하는 것	연쇄 법칙 (총 변화율)
비용 → 생산량 → 시간	시간이 비용에 미치는 영향	(비용/생산량) $\times$ (생산량/시간)
부피 → 반지름 → 시간	풍선에 바람 넣을 때 부피 변화 속도	(부피/반지름) $\times$ (반지름/시간)
오차 → 출력 → 가중치	AI 학습: 가중치 업데이트 양	(오차/출력) $\times$ (출력/가중치)

자동 미분(Automatic Differentiation): PyTorch나 TensorFlow 같은 AI 프레임워크는 우리가 `loss.backward()`라고 한 줄만 치면 알아서 미분을 해줍니다. 이때 컴퓨터 내부에서는 연산 그래프(Computation Graph)를 그리고, 각 노드마다 연쇄 법칙을 적용하여 기울기를 계산하고 곱해주는 작업이 순식간에 일어납니다.

겹친 함수를 미분할 때는 안쪽을 한 덩어리로 보고 밖을 미분한 것과 안을 미분한 것을 곱하면 돼요. 안쪽이 또 겹쳐 있으면 그 부분에도 같은 방식으로 반복해요. 팁: 먼저 ‘안쪽 = 무엇’으로 두고, 밖 함수만 미분한 뒤, 안쪽을

x

로 미분한 것을 곱하면 돼요.

가장 쉬운 예:

y=(3x)^2

. 안쪽

u=3x

→ 미분하면

3

. 밖쪽

u^2

→ 미분하면

2u=2\cdot 3x

. 곱하면

3 \times 2\cdot 3x = 18x

x=2

일 때 기울기는

36

이에요.

쉬운 것부터 다양한 예시를 표로 정리했어요. 각 줄에서 ‘안의 미분’과 ‘밖의 미분’을 곱하면 답이에요.

문제 $y=(3x)^2$
풀이 $u=3x$

문제 $y=\sqrt{x+1}$
풀이 $u=x+1$

문제 $y=(2x+1)^5$
풀이 $2$

문제 $y=e^{x^2}$
풀이 $2x$

문제 $y=\sin(2x)$
풀이 $u=2x$

문제 $y=e^{3x}$
풀이 $3$

문제 $y=\ln(\sin x)$
풀이 $\cos x$

문제	풀이
쉬운 예 $y=(3x)^2$	안 $u=3x$ → 안 미분 $3$ , 밖 $u^2$ → 밖 미분 $2u$ ; 곱하면 $2\cdot 3x\cdot 3=18x$
쉬운 예 $y=\sqrt{x+1}$	안 $u=x+1$ → 안 미분 $1$ , 밖 $\sqrt{u}$ → 밖 미분 $1/(2\sqrt{u})$ ; 곱하면 $1/(2\sqrt{x+1})$
예 $y=(2x+1)^5$	안 미분 $2$ , 밖 미분 $5(2x+1)^4$ → 곱하면 $10(2x+1)^4$
예 $y=e^{x^2}$	안 미분 $2x$ , 밖 미분 $e^{x^2}$ → 곱하면 $2x\,e^{x^2}$
예 $y=\sin(2x)$	안 $u=2x$ → 안 미분 $2$ , 밖 $\sin u$ → 밖 미분 $\cos u$ ; 곱하면 $2\cos(2x)$
예 $y=e^{3x}$	안 미분 $3$ , 밖 미분 $e^{3x}$ → 곱하면 $3e^{3x}$
예 $y=\ln(\sin x)$	안 미분 $\cos x$ , 밖 미분 $1/\sin x$ → 곱하면 $\cos x/\sin x=\cot x$

문제 유형별 풀이

유형 $거듭제곱$
식 형태 $(g(x))^n$
$f^{\prime}(x)$ 구하는 법 $n u^{n-1}$

유형 $지수$
식 형태 $e^{g(x)}$
$f^{\prime}(x)$ 구하는 법 $e^u$

유형 $삼각$
식 형태 $\sin(g(x))$
$f^{\prime}(x)$ 구하는 법 $밖 미분(cos 또는 -sin) \times 안 미분.$

유형 $루트$
식 형태 $\sqrt{g(x)}$
$f^{\prime}(x)$ 구하는 법 $1/(2\sqrt{u})$

유형 $로그$
식 형태 $\ln(g(x))$
$f^{\prime}(x)$ 구하는 법 $1/u$

유형 $이차식 안$
식 형태 $(ax^2+bx+c)^n$
$f^{\prime}(x)$ 구하는 법 $2ax+b$

유형	식 형태	$f^{\prime}(x)$ 구하는 법
거듭제곱	$(g(x))^n$	밖 미분 $n u^{n-1}$ × 안 미분 $g'(x)$ .
지수	$e^{g(x)}$	밖 미분 $e^u$ × 안 미분 $g'(x)$ → $e^{g(x)} \cdot g'(x)$ .
삼각	$\sin(g(x))$ , $\cos(g(x))$	밖 미분(cos 또는 −sin) × 안 미분.
루트	$\sqrt{g(x)}$	밖 미분 $1/(2\sqrt{u})$ × 안 미분.
로그	$\ln(g(x))$	밖 미분 $1/u$ × 안 미분 → $g'(x)/g(x)$ .
이차식 안	$(ax^2+bx+c)^n$ 등	안 미분은 $2ax+b$ , 밖 미분 후 곱.

예시 (거듭제곱)

y=(3x)^2

일 때

x=2

에서의 도함수 값을 구하세요.

풀이

y'=2\cdot 3x \cdot 3 = 18x

x=2

대입 →

36

. → 정답 36

예시 (지수)

y=e^{3x}

일 때

x=0

에서의 도함수 값을 구하세요.

풀이

y'=3e^{3x}

x=0

대입 →

3e^0=3

. → 정답 3

예시 (삼각)

y=\sin(2x)

일 때

x=0

에서의 도함수 값을 구하세요.

풀이

y'=2\cos(2x)

x=0

대입 →

2\cos 0=2

. → 정답 2

예시 (로그)

y=\ln(\sin x)

일 때

x=\pi/2

에서의 도함수 값을 구하세요.

풀이

y'=\frac{\cos x}{\sin x}=\cot x

x=\pi/2

에서

\cos(\pi/2)=0

이므로

y'=0

. → 정답 0

연쇄 법칙이란

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

로 표현하며, 서로 맞물린 톱니바퀴의 회전 비율을 구하는 것과 같습니다.

직관적 예시: '나'(

x

)가 '친구'(

u

)를 밀고, '친구'가 '수레'(

y

)를 밉니다. 내가 친구를 2배 힘으로 밀고, 친구가 수레를 3배 힘으로 민다면, 결과적으로 수레는 내 힘의

2 \times 3 = 6

배로 움직입니다. 이처럼 단계별 변화율(기울기)을 곱셈으로 연결하는 것이 연쇄 법칙입니다.

핵심 공식:

\{f(g(x))\}' = f^{\prime}(g(x)) \times g'(x)

. 기억하세요, '겉미분 곱하기 속미분'입니다.

단계 $1$
할 일 $안/밖 구분$
예: $y=(2x+1)^2$ $u=2x+1$

단계 $2$
할 일 $겉미분$
예: $y=(2x+1)^2$ $u^2$

단계 $3$
할 일 $속미분$
예: $y=(2x+1)^2$ $2x+1$

단계 $4$
할 일 $곱하기$
예: $y=(2x+1)^2$ $2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)$

단계	할 일	예: $y=(2x+1)^2$
1	안/밖 구분	안쪽 $u=2x+1$ , 바깥쪽 $y=u^2$
2	겉미분	$u^2$ 을 미분하면 $2u$ (이때 $u$ 는 그대로 둠)
3	속미분	안쪽 $2x+1$ 을 미분하면 $2$
4	곱하기	$2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)$

대표 수식:

\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}

y

가

u

에 의해 변하고,

u

가

x

에 의해 변할 때,

x

가 변할 때

y

의 총 변화량은 두 변화율의 곱입니다.

왜 더하지 않고 곱할까요? 비율(Rate)이기 때문입니다. 시속 100km로 달리는 차(

v

)가 있고, 환율이 1달러당 1300원(

r

)이라면, 이 둘을 더하는 건 의미가 없죠. 변화의 증폭이나 감쇄를 계산하려면 반드시 곱해야 합니다.

숫자로 확인하기:

y=(2x+1)^2

에서

x=1

일 때 변화율을 구해봅시다. 공식대로면

4(2(1)+1) = 12

입니다. 실제로

x

가 1에서 1.01로

0.01

만큼 아주 조금 변하면,

y

는 9에서

9.1204

로 약

0.12

만큼 변합니다.

0.01

의 12배인

0.12

가 변했으니, 변화율이 12가 맞습니다.

딥러닝(Deep Learning) 모델은 수십, 수백 개의 함수가 겹겹이 쌓인 거대한 합성함수(

y = f_n(...f_2(f_1(x))...)

)입니다. 우리가 원하는 건 '맨 처음 입력이나 중간의 가중치(

w

)를 바꿀 때, 맨 마지막 오차(

L

)가 어떻게 변하는가'입니다. 이를 구하려면 연쇄 법칙을 필수로 써야 합니다.

상황 $비용 \to 생산량 \to 시간$
구하는 것 $시간이 비용에 미치는 영향$
연쇄 법칙 (총 변화율) $\times$

상황 $부피 \to 반지름 \to 시간$
구하는 것 $풍선에 바람 넣을 때 부피 변화 속도$
연쇄 법칙 (총 변화율) $\times$

상황 $오차 \to 출력 \to 가중치$
구하는 것 $AI 학습: 가중치 업데이트 양$
연쇄 법칙 (총 변화율) $\times$

상황	구하는 것	연쇄 법칙 (총 변화율)
비용 → 생산량 → 시간	시간이 비용에 미치는 영향	(비용/생산량) $\times$ (생산량/시간)
부피 → 반지름 → 시간	풍선에 바람 넣을 때 부피 변화 속도	(부피/반지름) $\times$ (반지름/시간)
오차 → 출력 → 가중치	AI 학습: 가중치 업데이트 양	(오차/출력) $\times$ (출력/가중치)

x

로 미분한 것을 곱하면 돼요.

가장 쉬운 예:

y=(3x)^2

. 안쪽

u=3x

→ 미분하면

3

. 밖쪽

u^2

→ 미분하면

2u=2\cdot 3x

. 곱하면

3 \times 2\cdot 3x = 18x

x=2

일 때 기울기는

36

이에요.

쉬운 것부터 다양한 예시를 표로 정리했어요. 각 줄에서 ‘안의 미분’과 ‘밖의 미분’을 곱하면 답이에요.

문제 $y=(3x)^2$
풀이 $u=3x$

문제 $y=\sqrt{x+1}$
풀이 $u=x+1$

문제 $y=(2x+1)^5$
풀이 $2$

문제 $y=e^{x^2}$
풀이 $2x$

문제 $y=\sin(2x)$
풀이 $u=2x$

문제 $y=e^{3x}$
풀이 $3$

문제 $y=\ln(\sin x)$
풀이 $\cos x$

문제	풀이
쉬운 예 $y=(3x)^2$	안 $u=3x$ → 안 미분 $3$ , 밖 $u^2$ → 밖 미분 $2u$ ; 곱하면 $2\cdot 3x\cdot 3=18x$
쉬운 예 $y=\sqrt{x+1}$	안 $u=x+1$ → 안 미분 $1$ , 밖 $\sqrt{u}$ → 밖 미분 $1/(2\sqrt{u})$ ; 곱하면 $1/(2\sqrt{x+1})$
예 $y=(2x+1)^5$	안 미분 $2$ , 밖 미분 $5(2x+1)^4$ → 곱하면 $10(2x+1)^4$
예 $y=e^{x^2}$	안 미분 $2x$ , 밖 미분 $e^{x^2}$ → 곱하면 $2x\,e^{x^2}$
예 $y=\sin(2x)$	안 $u=2x$ → 안 미분 $2$ , 밖 $\sin u$ → 밖 미분 $\cos u$ ; 곱하면 $2\cos(2x)$
예 $y=e^{3x}$	안 미분 $3$ , 밖 미분 $e^{3x}$ → 곱하면 $3e^{3x}$
예 $y=\ln(\sin x)$	안 미분 $\cos x$ , 밖 미분 $1/\sin x$ → 곱하면 $\cos x/\sin x=\cot x$

문제 유형별 풀이

유형 $거듭제곱$
식 형태 $(g(x))^n$
$f^{\prime}(x)$ 구하는 법 $n u^{n-1}$

유형 $지수$
식 형태 $e^{g(x)}$
$f^{\prime}(x)$ 구하는 법 $e^u$

유형 $삼각$
식 형태 $\sin(g(x))$
$f^{\prime}(x)$ 구하는 법 $밖 미분(cos 또는 -sin) \times 안 미분.$

유형 $루트$
식 형태 $\sqrt{g(x)}$
$f^{\prime}(x)$ 구하는 법 $1/(2\sqrt{u})$

유형 $로그$
식 형태 $\ln(g(x))$
$f^{\prime}(x)$ 구하는 법 $1/u$

유형 $이차식 안$
식 형태 $(ax^2+bx+c)^n$
$f^{\prime}(x)$ 구하는 법 $2ax+b$

유형	식 형태	$f^{\prime}(x)$ 구하는 법
거듭제곱	$(g(x))^n$	밖 미분 $n u^{n-1}$ × 안 미분 $g'(x)$ .
지수	$e^{g(x)}$	밖 미분 $e^u$ × 안 미분 $g'(x)$ → $e^{g(x)} \cdot g'(x)$ .
삼각	$\sin(g(x))$ , $\cos(g(x))$	밖 미분(cos 또는 −sin) × 안 미분.
루트	$\sqrt{g(x)}$	밖 미분 $1/(2\sqrt{u})$ × 안 미분.
로그	$\ln(g(x))$	밖 미분 $1/u$ × 안 미분 → $g'(x)/g(x)$ .
이차식 안	$(ax^2+bx+c)^n$ 등	안 미분은 $2ax+b$ , 밖 미분 후 곱.

예시 (거듭제곱)

y=(3x)^2

일 때

x=2

에서의 도함수 값을 구하세요.

풀이

y'=2\cdot 3x \cdot 3 = 18x

x=2

대입 →

36

. → 정답 36

예시 (지수)

y=e^{3x}

일 때

x=0

에서의 도함수 값을 구하세요.

풀이

y'=3e^{3x}

x=0

대입 →

3e^0=3

. → 정답 3

예시 (삼각)

y=\sin(2x)

일 때

x=0

에서의 도함수 값을 구하세요.

풀이

y'=2\cos(2x)

x=0

대입 →

2\cos 0=2

. → 정답 2

예시 (로그)

y=\ln(\sin x)

일 때

x=\pi/2

에서의 도함수 값을 구하세요.

풀이

y'=\frac{\cos x}{\sin x}=\cot x

x=\pi/2

에서

\cos(\pi/2)=0

이므로

y'=0

. → 정답 0