모두의 AI
머신러닝AI논문
Loading...

배우기

🏅내 업적

Chapter 07

연쇄 법칙: 겹친 함수를 풀다, 역전파의 핵심

함수를 겹쳐 쓴 걸 미분할 때는 밖의 미분 × 안의 미분으로 곱하면 됩니다. 역전파의 핵심이에요.

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.

겹친 함수는 xxx → 안쪽 → 밖쪽 → yyy처럼 연쇄로 이어져 있어요. 밖의 미분 × 안의 미분을 곱하면 전체 미분이에요.

012036xu(1, 3)u = g(x) = 2x+1g'(x)=2u0350925uy(3, 9)y = f(u) = u²f'(u)=2u안의 미분밖의 미분

예시로 보는 계산 순서 (한 번에 하나씩 강조)

1.예: 위 그래프처럼 u=g(x)=2x+1u = g(x) = 2x+1u=g(x)=2x+1, y=f(u)=u2y = f(u) = u^2y=f(u)=u2일 때 y=(2x+1)2y = (2x+1)^2y=(2x+1)2를 xxx로 미분하자.
2.① 안의 미분 (왼쪽 그래프): u=g(x)=2x+1u = g(x) = 2x+1u=g(x)=2x+1을 xxx로 미분 → 222
3.② 밖의 미분 (오른쪽 그래프): y=f(u)=u2y = f(u) = u^2y=f(u)=u2를 uuu로 미분 → 2u=2(2x+1)2u = 2(2x+1)2u=2(2x+1)
4.③ 곱하기: 2×2(2x+1)=4(2x+1)2 \times 2(2x+1) = 4(2x+1)2×2(2x+1)=4(2x+1) → 답

점이 연쇄를 따라 움직이듯, 변화율이 곱해지면서 전달돼요. 역전파도 이 곱하기가 반복되는 구조예요.

연쇄 법칙이란

연쇄 법칙(Chain Rule)은 함수 안에 또 다른 함수가 들어있는 합성함수를 미분하는 규칙입니다. 마치 양파 껍질을 까듯, '바깥쪽 함수를 미분하고(f′f^{\prime}f′) ×\times× 안쪽 함수를 미분(g′g'g′)해서 곱한다'는 원리입니다. 수식으로는 dydx=dydu⋅dudx\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}dxdy​=dudy​⋅dxdu​로 표현하며, 서로 맞물린 톱니바퀴의 회전 비율을 구하는 것과 같습니다.
직관적 예시: '나'(xxx)가 '친구'(uuu)를 밀고, '친구'가 '수레'(yyy)를 밉니다. 내가 친구를 2배 힘으로 밀고, 친구가 수레를 3배 힘으로 민다면, 결과적으로 수레는 내 힘의 2×3=62 \times 3 = 62×3=6배로 움직입니다. 이처럼 단계별 변화율(기울기)을 곱셈으로 연결하는 것이 연쇄 법칙입니다.
핵심 공식: {f(g(x))}′=f′(g(x))×g′(x)\{f(g(x))\}' = f^{\prime}(g(x)) \times g'(x){f(g(x))}′=f′(g(x))×g′(x). 기억하세요, '겉미분 곱하기 속미분'입니다.
  • 단계1
  • 할 일안/밖 구분
  • 예: y=(2x+1)2y=(2x+1)^2y=(2x+1)2안쪽 u=2x+1u=2x+1u=2x+1, 바깥쪽 y=u2y=u^2y=u2
  • 단계2
  • 할 일겉미분
  • 예: y=(2x+1)2y=(2x+1)^2y=(2x+1)2u2u^2u2을 미분하면 2u2u2u (이때 uuu는 그대로 둠)
  • 단계3
  • 할 일속미분
  • 예: y=(2x+1)2y=(2x+1)^2y=(2x+1)2안쪽 2x+12x+12x+1을 미분하면 222
  • 단계4
  • 할 일곱하기
  • 예: y=(2x+1)2y=(2x+1)^2y=(2x+1)22u×2=2(2x+1)×2=4(2x+1)2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)2u×2=2(2x+1)×2=4(2x+1)
단계할 일예: y=(2x+1)2y=(2x+1)^2y=(2x+1)2
1안/밖 구분안쪽 u=2x+1u=2x+1u=2x+1, 바깥쪽 y=u2y=u^2y=u2
2겉미분u2u^2u2을 미분하면 2u2u2u (이때 uuu는 그대로 둠)
3속미분안쪽 2x+12x+12x+1을 미분하면 222
4곱하기2u×2=2(2x+1)×2=4(2x+1)2u \times 2 = 2(2x+1) \times 2 = 4(2x+1)2u×2=2(2x+1)×2=4(2x+1)
대표 수식: dydx=dydu⋅dudx\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}dxdy​=dudy​⋅dxdu​. yyy가 uuu에 의해 변하고, uuu가 xxx에 의해 변할 때, xxx가 변할 때 yyy의 총 변화량은 두 변화율의 곱입니다.
왜 더하지 않고 곱할까요? 비율(Rate)이기 때문입니다. 시속 100km로 달리는 차(vvv)가 있고, 환율이 1달러당 1300원(rrr)이라면, 이 둘을 더하는 건 의미가 없죠. 변화의 증폭이나 감쇄를 계산하려면 반드시 곱해야 합니다.
숫자로 확인하기: y=(2x+1)2y=(2x+1)^2y=(2x+1)2에서 x=1x=1x=1일 때 변화율을 구해봅시다. 공식대로면 4(2(1)+1)=124(2 (1) +1) = 124(2(1)+1)=12입니다. 실제로 xxx가 1에서 1.01로 0.010.010.01만큼 아주 조금 변하면, yyy는 9에서 9.12049.12049.1204로 약 0.120.120.12만큼 변합니다. 0.010.010.01의 12배인 0.120.120.12가 변했으니, 변화율이 12가 맞습니다.
딥러닝(Deep Learning) 모델은 수십, 수백 개의 함수가 겹겹이 쌓인 거대한 합성함수(y=fn(...f2(f1(x))...)y = f_n(...f_2(f_1(x))...)y=fn​(...f2​(f1​(x))...))입니다. 우리가 원하는 건 '맨 처음 입력이나 중간의 가중치(www)를 바꿀 때, 맨 마지막 오차(LLL)가 어떻게 변하는가'입니다. 이를 구하려면 연쇄 법칙을 필수로 써야 합니다.
역전파(Backpropagation) 알고리즘의 정체가 바로 연쇄 법칙입니다. 출력층에서 발생한 오차를 입력층 방향으로 거꾸로 전파할 때, 각 층의 미분값(기울기)을 계속해서 곱해 나갑니다. 이 과정이 없다면 깊은 신경망의 학습 자체가 불가능합니다.
결국 AI가 학습한다는 것은 '미분값을 연쇄 법칙으로 곱해서 전달하는 과정'입니다. 층이 깊을수록 이 곱이 반복되는데, 1보다 작은 수(예: 0.5)를 여러 번 곱하면 0에 가까워집니다. 이렇게 기울기가 사라지는 현상을 그라디언트 소실(Vanishing Gradient)라고 하며, 깊은 신경망 학습이 어려웠던 이유 중 하나였어요. ReLU나 스킵 연결 같은 기술이 이 문제를 완화합니다.
복잡한 인과관계를 분석할 때 쓰입니다. A가 B에 영향을 주고, B가 C에 영향을 주는 상황에서 A가 C에 미치는 영향을 계산하려면 각 단계의 영향력을 곱해야 합니다.
  • 상황비용 → 생산량 → 시간
  • 구하는 것시간이 비용에 미치는 영향
  • 연쇄 법칙 (총 변화율)(비용/생산량) ×\times× (생산량/시간)
  • 상황부피 → 반지름 → 시간
  • 구하는 것풍선에 바람 넣을 때 부피 변화 속도
  • 연쇄 법칙 (총 변화율)(부피/반지름) ×\times× (반지름/시간)
  • 상황오차 → 출력 → 가중치
  • 구하는 것AI 학습: 가중치 업데이트 양
  • 연쇄 법칙 (총 변화율)(오차/출력) ×\times× (출력/가중치)
상황구하는 것연쇄 법칙 (총 변화율)
비용 → 생산량 → 시간시간이 비용에 미치는 영향(비용/생산량) ×\times× (생산량/시간)
부피 → 반지름 → 시간풍선에 바람 넣을 때 부피 변화 속도(부피/반지름) ×\times× (반지름/시간)
오차 → 출력 → 가중치AI 학습: 가중치 업데이트 양(오차/출력) ×\times× (출력/가중치)
자동 미분(Automatic Differentiation): PyTorch나 TensorFlow 같은 AI 프레임워크는 우리가 `loss.backward()`라고 한 줄만 치면 알아서 미분을 해줍니다. 이때 컴퓨터 내부에서는 연산 그래프(Computation Graph)를 그리고, 각 노드마다 연쇄 법칙을 적용하여 기울기를 계산하고 곱해주는 작업이 순식간에 일어납니다.
겹친 함수를 미분할 때는 안쪽을 한 덩어리로 보고 밖을 미분한 것과 안을 미분한 것을 곱하면 돼요. 안쪽이 또 겹쳐 있으면 그 부분에도 같은 방식으로 반복해요. 팁: 먼저 ‘안쪽 = 무엇’으로 두고, 밖 함수만 미분한 뒤, 안쪽을 xxx로 미분한 것을 곱하면 돼요.
가장 쉬운 예: y=(3x)2y=(3x)^2y=(3x)2. 안쪽 u=3xu=3xu=3x → 미분하면 333. 밖쪽 u2u^2u2 → 미분하면 2u=2⋅3x2u=2\cdot 3x2u=2⋅3x. 곱하면 3×2⋅3x=18x3 \times 2\cdot 3x = 18x3×2⋅3x=18x. x=2x=2x=2일 때 기울기는 363636이에요.
쉬운 것부터 다양한 예시를 표로 정리했어요. 각 줄에서 ‘안의 미분’과 ‘밖의 미분’을 곱하면 답이에요.
  • 문제쉬운 예 y=(3x)2y=(3x)^2y=(3x)2
  • 풀이안 u=3xu=3xu=3x → 안 미분 333, 밖 u2u^2u2 → 밖 미분 2u2u2u; 곱하면 2⋅3x⋅3=18x2\cdot 3x\cdot 3=18x2⋅3x⋅3=18x
  • 문제쉬운 예 y=x+1y=\sqrt{x+1}y=x+1​
  • 풀이안 u=x+1u=x+1u=x+1 → 안 미분 111, 밖 u\sqrt{u}u​ → 밖 미분 1/(2u)1/(2\sqrt{u})1/(2u​); 곱하면 1/(2x+1)1/(2\sqrt{x+1})1/(2x+1​)
  • 문제예 y=(2x+1)5y=(2x+1)^5y=(2x+1)5
  • 풀이안 미분 222, 밖 미분 5(2x+1)45(2x+1)^45(2x+1)4 → 곱하면 10(2x+1)410(2x+1)^410(2x+1)4
  • 문제예 y=ex2y=e^{x^2}y=ex2
  • 풀이안 미분 2x2x2x, 밖 미분 ex2e^{x^2}ex2 → 곱하면 2x ex22x\,e^{x^2}2xex2
  • 문제예 y=sin⁡(2x)y=\sin(2x)y=sin(2x)
  • 풀이안 u=2xu=2xu=2x → 안 미분 222, 밖 sin⁡u\sin usinu → 밖 미분 cos⁡u\cos ucosu; 곱하면 2cos⁡(2x)2\cos(2x)2cos(2x)
  • 문제예 y=e3xy=e^{3x}y=e3x
  • 풀이안 미분 333, 밖 미분 e3xe^{3x}e3x → 곱하면 3e3x3e^{3x}3e3x
  • 문제예 y=ln⁡(sin⁡x)y=\ln(\sin x)y=ln(sinx)
  • 풀이안 미분 cos⁡x\cos xcosx, 밖 미분 1/sin⁡x1/\sin x1/sinx → 곱하면 cos⁡x/sin⁡x=cot⁡x\cos x/\sin x=\cot xcosx/sinx=cotx
문제풀이
쉬운 예 y=(3x)2y=(3x)^2y=(3x)2안 u=3xu=3xu=3x → 안 미분 333, 밖 u2u^2u2 → 밖 미분 2u2u2u; 곱하면 2⋅3x⋅3=18x2\cdot 3x\cdot 3=18x2⋅3x⋅3=18x
쉬운 예 y=x+1y=\sqrt{x+1}y=x+1​안 u=x+1u=x+1u=x+1 → 안 미분 111, 밖 u\sqrt{u}u​ → 밖 미분 1/(2u)1/(2\sqrt{u})1/(2u​); 곱하면 1/(2x+1)1/(2\sqrt{x+1})1/(2x+1​)
예 y=(2x+1)5y=(2x+1)^5y=(2x+1)5안 미분 222, 밖 미분 5(2x+1)45(2x+1)^45(2x+1)4 → 곱하면 10(2x+1)410(2x+1)^410(2x+1)4
예 y=ex2y=e^{x^2}y=ex2안 미분 2x2x2x, 밖 미분 ex2e^{x^2}ex2 → 곱하면 2x ex22x\,e^{x^2}2xex2
예 y=sin⁡(2x)y=\sin(2x)y=sin(2x)안 u=2xu=2xu=2x → 안 미분 222, 밖 sin⁡u\sin usinu → 밖 미분 cos⁡u\cos ucosu; 곱하면 2cos⁡(2x)2\cos(2x)2cos(2x)
예 y=e3xy=e^{3x}y=e3x안 미분 333, 밖 미분 e3xe^{3x}e3x → 곱하면 3e3x3e^{3x}3e3x
예 y=ln⁡(sin⁡x)y=\ln(\sin x)y=ln(sinx)안 미분 cos⁡x\cos xcosx, 밖 미분 1/sin⁡x1/\sin x1/sinx → 곱하면 cos⁡x/sin⁡x=cot⁡x\cos x/\sin x=\cot xcosx/sinx=cotx
문제 유형별 풀이
  • 유형거듭제곱
  • 식 형태(g(x))n(g(x))^n(g(x))n
  • f′(x)f^{\prime}(x)f′(x) 구하는 법밖 미분 nun−1n u^{n-1}nun−1 × 안 미분 g′(x)g'(x)g′(x).
  • 유형지수
  • 식 형태eg(x)e^{g(x)}eg(x)
  • f′(x)f^{\prime}(x)f′(x) 구하는 법밖 미분 eue^ueu × 안 미분 g′(x)g'(x)g′(x) → eg(x)⋅g′(x)e^{g(x)} \cdot g'(x)eg(x)⋅g′(x).
  • 유형삼각
  • 식 형태sin⁡(g(x))\sin(g(x))sin(g(x)), cos⁡(g(x))\cos(g(x))cos(g(x))
  • f′(x)f^{\prime}(x)f′(x) 구하는 법밖 미분(cos 또는 −sin) × 안 미분.
  • 유형루트
  • 식 형태g(x)\sqrt{g(x)}g(x)​
  • f′(x)f^{\prime}(x)f′(x) 구하는 법밖 미분 1/(2u)1/(2\sqrt{u})1/(2u​) × 안 미분.
  • 유형로그
  • 식 형태ln⁡(g(x))\ln(g(x))ln(g(x))
  • f′(x)f^{\prime}(x)f′(x) 구하는 법밖 미분 1/u1/u1/u × 안 미분 → g′(x)/g(x)g'(x)/g(x)g′(x)/g(x).
  • 유형이차식 안
  • 식 형태(ax2+bx+c)n(ax^2+bx+c)^n(ax2+bx+c)n 등
  • f′(x)f^{\prime}(x)f′(x) 구하는 법안 미분은 2ax+b2ax+b2ax+b, 밖 미분 후 곱.
유형식 형태f′(x)f^{\prime}(x)f′(x) 구하는 법
거듭제곱(g(x))n(g(x))^n(g(x))n밖 미분 nun−1n u^{n-1}nun−1 × 안 미분 g′(x)g'(x)g′(x).
지수eg(x)e^{g(x)}eg(x)밖 미분 eue^ueu × 안 미분 g′(x)g'(x)g′(x) → eg(x)⋅g′(x)e^{g(x)} \cdot g'(x)eg(x)⋅g′(x).
삼각sin⁡(g(x))\sin(g(x))sin(g(x)), cos⁡(g(x))\cos(g(x))cos(g(x))밖 미분(cos 또는 −sin) × 안 미분.
루트g(x)\sqrt{g(x)}g(x)​밖 미분 1/(2u)1/(2\sqrt{u})1/(2u​) × 안 미분.
로그ln⁡(g(x))\ln(g(x))ln(g(x))밖 미분 1/u1/u1/u × 안 미분 → g′(x)/g(x)g'(x)/g(x)g′(x)/g(x).
이차식 안(ax2+bx+c)n(ax^2+bx+c)^n(ax2+bx+c)n 등안 미분은 2ax+b2ax+b2ax+b, 밖 미분 후 곱.

예시 (거듭제곱)
y=(3x)2y=(3x)^2y=(3x)2일 때 x=2x=2x=2에서의 도함수 값을 구하세요.
풀이
y′=2⋅3x⋅3=18xy'=2\cdot 3x \cdot 3 = 18xy′=2⋅3x⋅3=18x. x=2x=2x=2 대입 → 363636. → 정답 36

예시 (지수)
y=e3xy=e^{3x}y=e3x일 때 x=0x=0x=0에서의 도함수 값을 구하세요.
풀이
y′=3e3xy'=3e^{3x}y′=3e3x. x=0x=0x=0 대입 → 3e0=33e^0=33e0=3. → 정답 3

예시 (삼각)
y=sin⁡(2x)y=\sin(2x)y=sin(2x)일 때 x=0x=0x=0에서의 도함수 값을 구하세요.
풀이
y′=2cos⁡(2x)y'=2\cos(2x)y′=2cos(2x). x=0x=0x=0 대입 → 2cos⁡0=22\cos 0=22cos0=2. → 정답 2

예시 (로그)
y=ln⁡(sin⁡x)y=\ln(\sin x)y=ln(sinx)일 때 x=π/2x=\pi/2x=π/2에서의 도함수 값을 구하세요.
풀이
y′=cos⁡xsin⁡x=cot⁡xy'=\frac{\cos x}{\sin x}=\cot xy′=sinxcosx​=cotx. x=π/2x=\pi/2x=π/2에서 cos⁡(π/2)=0\cos(\pi/2)=0cos(π/2)=0이므로 y′=0y'=0y′=0. → 정답 0