모두의 AI
머신러닝AI논문
Loading...

배우기

🏅내 업적

Chapter 06

미분과 도함수: 순간의 기울기, 학습의 나침반

미분은 한 점에서의 순간 변화율(기울기)을 나타내요. 도함수는 그걸 함수로 만든 것이고, 딥러닝의 경사 하강법·역전파의 기초가 됩니다.

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.

왼쪽: 접선 — 곡선 위 한 점에서 한 점만 맞닿는 직선이에요. 이 직선의 기울기가 바로 그 점에서의 미분이에요. 오른쪽: 두 점 잇는 선 — 곡선 위 두 점을 잇는 선이에요. 두 점을 가깝게 하면 이 선이 접선에 가까워지고, 그 극한이 미분이에요.

1232468(2, 4)y=x²

곡선 y=x2y=x^2y=x2 위에 한 점 (2, 4)를 잡아요. 이 점에서 ‘기울기’를 재려고 해요.

미분은 접선의 기울기예요. ‘두 점 잇는 선의 기울기’를 두 점을 겹치게 했을 때의 극한이 접선 기울기예요.

미분과 도함수란 무엇인가

미분(Derivative)은 곡선 위의 특정 지점에서 그래프가 얼마나 가파르게 변하고 있는지를 나타내는 '순간 변화율'입니다. 기하학적으로는 그 점에서의 접선의 기울기와 같습니다. 자동차의 속도계가 매 순간 변하는 속도를 보여주듯, 미분은 입력값 xxx가 아주 미세하게 변할 때 결과값 yyy가 얼마나 민감하게 반응하는지를 숫자로 알려줍니다.
수학적으로 이 기울기는 '아주 가까운 두 점 사이의 평균 기울기'를 구한 뒤, 두 점 사이의 간격을 0으로 보내는 극한(Limit)을 취해 구합니다. 공식으로 쓰면 f′(a)=lim⁡h→0f(a+h)−f(a)hf^{\prime}(a) = \lim_{h \to 0} \frac{f(a+h)-f(a)}{h}f′(a)=limh→0​hf(a+h)−f(a)​입니다. (분모의 hhh는 두 점 사이 거리, 분자는 그만큼 변했을 때 fff의 변화량이에요.) 이 과정을 거쳐 나온 값을 미분계수라고 하며, f′(a)f^{\prime}(a)f′(a)라고 표기합니다. 이 값이 크면 경사가 가파른 것이고, 0이면 평평한 상태를 의미합니다.
도함수는 함수 f(x)f(x)f(x)의 모든 점에 대해 그 점에서의 미분계수(기울기)를 대응시킨 새로운 함수입니다. 즉, 일일이 기울기를 계산할 필요 없이 도함수 식에 xxx만 넣으면 그 자리의 경사를 바로 알 수 있게 해주는 '기울기 생성기'입니다. 이 도함수를 찾아내는 과정을 '미분한다'고 합니다.
  • 구분아래
  • 설명자주 쓰는 미분 공식이에요.
  • 구분′'′
  • 설명미분(도함수)을 뜻해요.
구분설명
아래자주 쓰는 미분 공식이에요.
′'′미분(도함수)을 뜻해요.
  • 공식상수
  • 설명미분하면 0 (변화가 없으므로)
  • 공식거듭제곱 xnx^nxn
  • 설명nxn−1n x^{n-1}nxn−1 (지수를 앞으로 곱하고 하나 줄임)
  • 공식자연지수 exe^xex
  • 설명exe^xex (미분해도 자기 자신 그대로인 특별한 수)
  • 공식자연로그 ln⁡x\ln xlnx
  • 설명1/x1/x1/x
  • 공식sin
  • 설명cos⁡x\cos xcosx
  • 공식cos
  • 설명−sin⁡x-\sin x−sinx
  • 공식곱의 미분
  • 설명(앞 미분 ×\times× 뒤) + (앞 ×\times× 뒤 미분)
  • 공식몫의 미분
  • 설명(분자 미분 ×\times× 분모 − 분자 ×\times× 분모 미분) / 분모 제곱
공식설명
상수미분하면 0 (변화가 없으므로)
거듭제곱 xnx^nxnnxn−1n x^{n-1}nxn−1 (지수를 앞으로 곱하고 하나 줄임)
자연지수 exe^xexexe^xex (미분해도 자기 자신 그대로인 특별한 수)
자연로그 ln⁡x\ln xlnx1/x1/x1/x
sincos⁡x\cos xcosx
cos−sin⁡x-\sin x−sinx
곱의 미분(앞 미분 ×\times× 뒤) + (앞 ×\times× 뒤 미분)
몫의 미분(분자 미분 ×\times× 분모 − 분자 ×\times× 분모 미분) / 분모 제곱
  • 공식상수
  • 숫자 예시(5)′=0(5)'=0(5)′=0
  • 풀이 과정상수는 변하지 않으므로 기울기 0
  • 공식xnx^nxn
  • 숫자 예시(x3)′=3x2(x^3)'=3x^2(x3)′=3x2
  • 풀이 과정3을 앞으로 내리고 지수에서 1을 뺌
  • 공식exe^xex
  • 숫자 예시x=0x=0x=0에서 e0=1e^0=1e0=1
  • 풀이 과정미분해도 그대로이므로 exe^xex에 대입
  • 공식ln⁡x\ln xlnx
  • 숫자 예시x=5x=5x=5에서 1/51/51/5
  • 풀이 과정미분하면 분수 형태인 1/x1/x1/x로 변함
  • 공식합
  • 숫자 예시(x2+x)′=2x+1(x^2+x)'=2x+1(x2+x)′=2x+1
  • 풀이 과정각 항을 따로 미분하여 더함
  • 공식곱
  • 숫자 예시(xex)′=ex+xex(x e^x)' = e^x + x e^x(xex)′=ex+xex
  • 풀이 과정앞 미분(111) ×\times× 뒤 + 앞 ×\times× 뒤 미분(exe^xex)
공식숫자 예시풀이 과정
상수(5)′=0(5)'=0(5)′=0상수는 변하지 않으므로 기울기 0
xnx^nxn(x3)′=3x2(x^3)'=3x^2(x3)′=3x23을 앞으로 내리고 지수에서 1을 뺌
exe^xexx=0x=0x=0에서 e0=1e^0=1e0=1미분해도 그대로이므로 exe^xex에 대입
ln⁡x\ln xlnxx=5x=5x=5에서 1/51/51/5미분하면 분수 형태인 1/x1/x1/x로 변함
합(x2+x)′=2x+1(x^2+x)'=2x+1(x2+x)′=2x+1각 항을 따로 미분하여 더함
곱(xex)′=ex+xex(x e^x)' = e^x + x e^x(xex)′=ex+xex앞 미분(111) ×\times× 뒤 + 앞 ×\times× 뒤 미분(exe^xex)
일상의 언어로 미분은 '최적의 지점'을 찾는 나침반입니다. 산 정상에서 가장 낮은 계곡으로 내려가고 싶을 때, 우리는 발끝에 느껴지는 지면의 기울기를 따라 아래로 움직입니다. 미분은 이 '경사'를 정확한 수치로 계산해줍니다. 특히 경사가 0이 되는 지점은 산꼭대기(최대)나 골짜기 바닥(최소)일 가능성이 크기 때문에, 무언가의 최솟값이나 최댓값을 찾을 때 미분은 필수적인 도구가 됩니다.
딥러닝 모델은 정답과 예측값 사이의 오차(손실)를 최소화해야 합니다. 이때 모델 내부의 수많은 가중치(www)를 어떻게 바꿔야 오차가 줄어들지 결정하는 것이 바로 기울기(그라디언트)입니다. 미분을 통해 '특정 가중치를 아주 조금 키웠을 때 오차가 늘어나는지 줄어드는지'를 알 수 있고, 이를 통해 오차가 가장 빨리 줄어드는 방향으로 가중치를 업데이트할 수 있습니다.
역전파(Backpropagation)는 이 미분 원리를 거꾸로 적용한 효율적인 학습 방법입니다. 정답에서부터 거꾸로 한 단계씩 거슬러 올라가며 '각 단계가 최종 오차에 얼마나 기여했는지'를 미분으로 계산합니다. 이때 여러 함수가 겹쳐진 구조를 미분하기 위해 합성함수의 미분(연쇄 법칙)이 사용되며, 이는 이번 챕터에서 배우는 기본 도함수 공식들을 토대로 작동합니다.
보통 미분은 한 변수를 살짝 건드렸을 때 전체 결과가 얼마나 출렁이는지를 측정하는 '민감도 분석'에 쓰입니다. 경제학에서는 가격을 조금 올렸을 때 수요가 얼마나 민감하게 변하는지를, 물리학에서는 시간이 흐름에 따라 위치가 얼마나 빠르게 변하는지(속도)를 잴 때 사용합니다. 즉, '원인'의 미세한 변화가 '결과'에 미치는 영향력을 수치화하는 모든 곳에 미분이 있습니다.
AI 학습 시스템에서는 모든 파라미터 업데이트가 미분값에 의존합니다. 우리가 PyTorch나 TensorFlow 같은 라이브러리를 쓸 때 내부적으로는 손실 함수를 각 가중치로 미분하는 과정이 순식간에 일어납니다. 이 미분값이 가리키는 방향의 반대로 가중치를 이동시키는 것이 바로 경사 하강법입니다. 이번 장에서 익히는 공식들은 AI가 복잡한 수식을 계산하며 스스로 똑똑해지는 과정을 이해하는 첫 번째 열쇠입니다.
도함수를 구할 때는 어떤 공식이 쓰이는지(거듭제곱, 지수, 로그, 삼각, 곱·몫·연쇄)를 보고, 공식대로 쓴 다음 정리하면 돼요.
예시 문제와 풀이를 표로 정리했어요.
  • 문제예시 1. f(x)=x3−2xf(x)=x^3-2xf(x)=x3−2x 도함수
  • 풀이거듭제곱·합: f′(x)=3x2−2f^{\prime}(x)=3x^2-2f′(x)=3x2−2
  • 문제예시 2. g(x)=exln⁡xg(x)=e^x \ln xg(x)=exlnx 도함수
  • 풀이곱의 미분: exln⁡x+ex⋅1xe^x \ln x + e^x \cdot \frac{1}{x}exlnx+ex⋅x1​
  • 문제예시 3. h(x)=sin⁡xxh(x)=\frac{\sin x}{x}h(x)=xsinx​ 도함수
  • 풀이몫의 미분: cos⁡x⋅x−sin⁡xx2\frac{\cos x \cdot x - \sin x}{x^2}x2cosx⋅x−sinx​
문제풀이
예시 1. f(x)=x3−2xf(x)=x^3-2xf(x)=x3−2x 도함수거듭제곱·합: f′(x)=3x2−2f^{\prime}(x)=3x^2-2f′(x)=3x2−2
예시 2. g(x)=exln⁡xg(x)=e^x \ln xg(x)=exlnx 도함수곱의 미분: exln⁡x+ex⋅1xe^x \ln x + e^x \cdot \frac{1}{x}exlnx+ex⋅x1​
예시 3. h(x)=sin⁡xxh(x)=\frac{\sin x}{x}h(x)=xsinx​ 도함수몫의 미분: cos⁡x⋅x−sin⁡xx2\frac{\cos x \cdot x - \sin x}{x^2}x2cosx⋅x−sinx​
문제 유형별 풀이
  • 유형거듭제곱
  • 식·공식f(x)=xnf(x)=x^nf(x)=xn
  • x=ax=ax=a에서 f′(a)f^{\prime}(a)f′(a) 구하는 법f′(a)=n⋅an−1f^{\prime}(a) = n \cdot a^{n-1}f′(a)=n⋅an−1. 지수를 앞으로 내리고 지수에서 1 뺀 값에 aaa 대입.
  • 유형일차식
  • 식·공식f(x)=mx+bf(x)=mx+bf(x)=mx+b
  • x=ax=ax=a에서 f′(a)f^{\prime}(a)f′(a) 구하는 법f′(a)=mf^{\prime}(a) = mf′(a)=m. 기울기가 곧 도함수이므로 aaa와 무관하게 mmm이 답.
  • 유형이차식
  • 식·공식f(x)=a2x2+a1x+a0f(x)=a_2 x^2 + a_1 x + a_0f(x)=a2​x2+a1​x+a0​
  • x=ax=ax=a에서 f′(a)f^{\prime}(a)f′(a) 구하는 법f′(a)=2a2⋅a+a1f^{\prime}(a) = 2 a_2 \cdot a + a_1f′(a)=2a2​⋅a+a1​. x2x^2x2 계수의 2배×aaa + 일차항 계수.
  • 유형상수배·거듭제곱
  • 식·공식f(x)=c⋅xnf(x)=c \cdot x^nf(x)=c⋅xn
  • x=ax=ax=a에서 f′(a)f^{\prime}(a)f′(a) 구하는 법f′(a)=c⋅n⋅an−1f^{\prime}(a) = c \cdot n \cdot a^{n-1}f′(a)=c⋅n⋅an−1. 상수 ccc는 그대로 두고, xnx^nxn을 미분한 것에 곱함.
유형식·공식x=ax=ax=a에서 f′(a)f^{\prime}(a)f′(a) 구하는 법
거듭제곱f(x)=xnf(x)=x^nf(x)=xnf′(a)=n⋅an−1f^{\prime}(a) = n \cdot a^{n-1}f′(a)=n⋅an−1. 지수를 앞으로 내리고 지수에서 1 뺀 값에 aaa 대입.
일차식f(x)=mx+bf(x)=mx+bf(x)=mx+bf′(a)=mf^{\prime}(a) = mf′(a)=m. 기울기가 곧 도함수이므로 aaa와 무관하게 mmm이 답.
이차식f(x)=a2x2+a1x+a0f(x)=a_2 x^2 + a_1 x + a_0f(x)=a2​x2+a1​x+a0​f′(a)=2a2⋅a+a1f^{\prime}(a) = 2 a_2 \cdot a + a_1f′(a)=2a2​⋅a+a1​. x2x^2x2 계수의 2배×aaa + 일차항 계수.
상수배·거듭제곱f(x)=c⋅xnf(x)=c \cdot x^nf(x)=c⋅xnf′(a)=c⋅n⋅an−1f^{\prime}(a) = c \cdot n \cdot a^{n-1}f′(a)=c⋅n⋅an−1. 상수 ccc는 그대로 두고, xnx^nxn을 미분한 것에 곱함.

예시 (거듭제곱)
f(x)=x3f(x)=x^3f(x)=x3일 때 x=2x=2x=2에서의 미분계수 f′(2)f^{\prime} (2)f′(2)를 구하세요.
풀이
f′(x)=3x2f^{\prime}(x)=3x^2f′(x)=3x2이므로 f′(2)=3×22=12f^{\prime} (2) =3 \times 2^2 = 12f′(2)=3×22=12. → 정답 12

예시 (일차식)
f(x)=3x+1f(x)=3x+1f(x)=3x+1일 때 x=5x=5x=5에서의 미분계수 f′(5)f^{\prime} (5)f′(5)를 구하세요.
풀이
일차식의 도함수는 기울기와 같으므로 f′(x)=3f^{\prime}(x)=3f′(x)=3. aaa와 무관하게 f′(5)=3f^{\prime} (5) =3f′(5)=3. → 정답 3

예시 (이차식)
f(x)=x2+2x+1f(x)=x^2+2x+1f(x)=x2+2x+1일 때 x=3x=3x=3에서의 미분계수 f′(3)f^{\prime} (3)f′(3)를 구하세요.
풀이
f′(x)=2x+2f^{\prime}(x)=2x+2f′(x)=2x+2이므로 f′(3)=2×3+2=8f^{\prime} (3) =2 \times 3 + 2 = 8f′(3)=2×3+2=8. → 정답 8

예시 (상수배·거듭제곱)
f(x)=2x4f(x)=2x^4f(x)=2x4일 때 x=1x=1x=1에서의 미분계수 f′(1)f^{\prime} (1)f′(1)를 구하세요.
풀이
f′(x)=2×4×x3=8x3f^{\prime}(x)=2 \times 4 \times x^3 = 8x^3f′(x)=2×4×x3=8x3이므로 f′(1)=8×1=8f^{\prime} (1) =8 \times 1 = 8f′(1)=8×1=8. → 정답 8