Chapter 06

미분과 도함수

미분은 한 점에서의 순간 변화율(기울기)을 나타내요. 도함수는 그걸 함수로 만든 것이고, 딥러닝의 경사 하강법·역전파의 기초가 됩니다.

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.

왼쪽: 접선 — 곡선 위 한 점에서 한 점만 맞닿는 직선이에요. 이 직선의 기울기가 바로 그 점에서의 미분이에요. 오른쪽: 두 점 잇는 선 — 곡선 위 두 점을 잇는 선이에요. 두 점을 가깝게 하면 이 선이 접선에 가까워지고, 그 극한이 미분이에요.

곡선 y=x2y=x^2 위에 한 점 (2, 4)를 잡아요. 이 점에서 ‘기울기’를 재려고 해요.

미분은 접선의 기울기예요. ‘두 점 잇는 선의 기울기’를 두 점을 겹치게 했을 때의 극한이 접선 기울기예요.

미분과 도함수란 무엇인가

한마디로: 미분은 한 점에서 곡선이 얼마나 가파른지(기울기)를 재는 거예요. 그래프 위 한 점에서 그 점에 접선을 그었을 때, 그 접선의 기울기가 바로 그 점에서의 미분이에요. 가로가 조금 움직일 때 세로가 얼마나 빠르게 변하는지를 숫자로 나타낸 값이에요.
수식으로: 그 기울기는 ‘아주 가까운 두 점 사이의 평균 기울기’의 극한으로 구해요. 이 극한이 있을 때 미분 가능이라고 하고, 그 값을 미분계수라 부르며 f(a)f'(a)처럼 써요. 위 비주얼에서 접선의 기울기가 바로 이 미분계수예요.
도함수는 ‘각 점에서의 미분계수’를 모아서 만든 함수예요. 점마다 접선의 기울기가 하나씩 있으니, 그걸 정리한 게 도함수예요. 도함수를 구하는 걸 미분한다고 해요.
구분설명
아래자주 쓰는 미분 공식이에요.
'미분(도함수)을 뜻해요.
공식설명
상수미분하면 0
거듭제곱 xnx^n앞에 nn 곱하고 지수는 n1n-1
자연지수 exe^x미분해도 그대로 exe^x
일반 지수 axa^xaxlnaa^x \ln a
자연로그 lnx\ln x1/x1/x
일반 로그1/(xlna)1/(x \ln a)
sin미분하면 cos
cos미분하면 sin-\sin
tan미분하면 1/cos21/\cos^2
합·차각각 미분한 뒤 더하거나 빼면 됨
상수배상수는 그대로 두고 안에 것만 미분
곱의 미분(첫째 미분)×둘째 + 첫째×(둘째 미분)
몫의 미분(위 미분×아래 − 위×아래 미분) / 아래 제곱
직관 (곱)'첫 번째 미분 × 두 번째' + '첫 번째 × 두 번째 미분'. 극한을 나누어 보면 두 변화가 더해져서 이렇게 두 항으로 나뉘어요.
직관 (몫)몫을 '위 × (1/아래)'로 보면 곱의 미분을 써요. (1/아래)를 미분한 걸 넣고 정리하면 위 공식이 나와요.
공식숫자 예시풀이 과정
상수(5)'=0, (-3)'=0상수는 미분하면 0
xnx^n(x3)=3x2(x^3)'=3x^2, x=2x=2에서 12지수 앞에 곱하고 지수는 n1n-1
exe^xx=0x=0에서 1, x=1x=1에서 ee미분해도 그대로
axa^x(2x)=2xln2(2^x)'=2^x \ln 2axa^xlna\ln a 곱함
lnx\ln xx=5x=5에서 1/51/5미분하면 1/x1/x
sinx=0x=0에서 1sin → cos
cosx=0x=0에서 0cos → sin-\sin
(x2+x3)=2x+3x2(x^2+x^3)'=2x+3x^2항별 미분 후 더함
상수배(5x2)=10x(5x^2)'=10x상수 그대로, x2x^2만 미분
(xex)=ex(1+x)(x\cdot e^x)'=e^x(1+x)(첫째 미분)×둘째 + 첫째×(둘째 미분)
x/(x2+1)x/(x^2+1)x=1x=1에서 0(위 미분×아래−위×아래 미분)/아래 제곱 대입
일상에서 '기울기'는 '어느 쪽으로 얼마나 빨리 변하는지'를 알려 줘요. 예를 들어 언덕을 내려갈 때, 가장 가파르게 내려가는 방향이 바로 '기울기가 가장 큰 방향'이에요. 반대로 골짜기 밑바닥(최솟값)이나 산꼭대기(최댓값)에서는 올라가도 내려가도 아니니까, 그 자리에서는 기울기가 0이에요. 그래서 '가장 낮은 곳'이나 '가장 높은 곳'을 찾을 때는 '기울기가 0인 곳'을 찾는 것과 같아요. 이렇게 쓰이는 '기울기'를 수식으로 정확히 나타낸 것이 미분이에요. 미분을 알면 '어디가 가장 낮은지·높은지'뿐 아니라 '어느 방향으로 가야 빨리 내려가는지'까지 계산할 수 있어요.
딥러닝에서는 먼저 '예측이 정답에 가까울수록 좋다'는 점수(손실)를 하나 정해요. 이 점수가 낮을수록 모델이 잘 맞춘 거예요. 그다음 이 점수를 줄이려고 모델 안에 있는 수많은 숫자(가중치)를 조금씩 바꿔요. 그런데 숫자가 너무 많아서 하나하나 '키워볼까, 줄여볼까' 다 해보기는 불가능해요. 그래서 기울기(그래디언트)를 써요. 기울기는 '각 숫자를 조금 키우면 점수가 줄어드는지 늘어나는지, 조금 줄이면 어떻게 되는지'를 한 번에 알려 주는 값이에요. 즉 도함수랑 같은 생각이에요. 이걸 보고 '점수를 줄이려면 이 숫자는 키우고, 저 숫자는 줄이자'라고 정해요. 미분을 알면 'AI가 왜 이렇게 숫자를 바꾼다'고 설명할 수 있어요.
역전파는 '답(출력) 쪽에서 입력 쪽으로 거꾸로' 한 단계씩 가면서, 각 숫자(가중치)에 대해 '손실이 얼마나 변하는지(미분)'를 하나씩 계산하는 방법이에요. 모델은 여러 단계가 겹쳐 있어서(입력 → 첫 번째 층 → … → 출력), 한 가중치를 바꾸면 그 다음 단계들이 차례로 바뀌고, 마지막에 손실이 바뀌어요. 이 '연쇄적으로 변하는' 관계를 따라 미분하려면 합성함수의 미분(연쇄 법칙)이 필요해요. 이번 챕터에서 배우는 도함수와 공식이 그대로 쓰이니까, 여기서 잘 익혀 두면 나중에 편해요.
보통 미분은 '이 값을 조금 바꿨을 때, 결과가 얼마나 바뀌고 어느 쪽(늘어나는지 줄어드는지)으로 바뀌는지'를 재는 도구예요. 그래서 '이 숫자를 키우는 게 좋을지, 줄이는 게 좋을지'를 정할 때 쓰여요. 예를 들어 온도가 올라가면 매출이 늘어나는지 줄어드는지, 가격을 올리면 수요가 얼마나 줄어드는지, 광고비를 더 쓰면 매출이 얼마나 더 오르는지—이런 '한 가지를 조금 바꿨을 때 다른 것이 얼마나, 어느 쪽으로 변하는지'를 다 미분으로 잴 수 있어요.
AI 학습에서는 '각 가중치를 얼마나, 어느 방향으로 바꿀지'를 손실을 그 가중치로 미분한 값으로 정해요. 손실(점수)을 줄이고 싶은데, 가중치가 수천·수만 개라서 일일이 실험할 수 없으니까, '이 가중치를 조금 키우면 손실이 줄어드는지 늘어나는지'를 미분으로 구하는 거예요. 그래서 이번 챕터의 미분 공식(합·곱·몫·연쇄 법칙)을 알면 역전파 식을 읽을 수 있고, 나중에 편미분·그라디언트(Ch08)로 넓혀 갈 수 있어요.
도함수를 구할 때는 어떤 공식이 쓰이는지(거듭제곱, 지수, 로그, 삼각, 곱·몫·연쇄)를 보고, 공식대로 쓴 다음 정리하면 돼요.
예시 문제풀이를 표로 정리했어요.
문제풀이
예시 1. f(x)=x32xf(x)=x^3-2x 도함수거듭제곱·합: f(x)=3x22f'(x)=3x^2-2
예시 2. g(x)=exlnxg(x)=e^x \ln x 도함수곱의 미분: exlnx+ex1xe^x \ln x + e^x \cdot \frac{1}{x}
예시 3. h(x)=sinxxh(x)=\frac{\sin x}{x} 도함수몫의 미분: cosxxsinxx2\frac{\cos x \cdot x - \sin x}{x^2}