Ch.03

선형 회귀 (Linear Regression): 데이터의 흐름을 꿰뚫는 선

복잡하게 흩어진 데이터들 사이에서'가장 잘 어울리는 하나의 직선' 을 긋는 과정입니다. 이 직선 하나만 잘 찾으면, 새로운 데이터가 들어왔을 때 그 결과값을 바로 예측할 수 있습니다. 머신러닝이 어떻게 수학(함수, 미분)을 이용해 '학습'하는지 보여주는 가장 기초적이면서도 강력한 모델입니다.

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 머신러닝 흐름을 한눈에 보세요.

① 학습 데이터 — (x, y) 산점도

y \approx 0.7x + 1.1

선형 회귀: 데이터의 흐름을 꿰뚫는 선

x

\hat{y}

y=wx+b

머신러닝 학습의 정석 — '오차를 줄이는 방향으로 조금씩 수정한다'는 머신러닝의 핵심 원리를 배웁니다. 산 정상에서 가장 낮은 골짜기로 내려가는 것처럼, 미분(기울기)을 이용해 오차를 줄여나가는 경사 하강법(Gradient Descent) 의 기초가 됩니다.

x

딥러닝의 씨앗 — 현재 가장 강력한 AI인 딥러닝(신경망)도 사실 이 선형 회귀를 수없이 겹쳐 놓은 구조입니다. 선형 회귀를 이해하면 최신 AI 모델의 작동 원리도 절반은 이해한 셈입니다.

숫자 예측의 달인 — 결과값이 '합격/불합격' 같은 범주가 아니라, 연속된 숫자 일 때 사용합니다. (예: 내일의 기온 예측, 택시 이동 거리에 따른 요금 예측, 공부 시간에 따른 시험 점수 예측)

x_1, x_2, ...

데이터 크기에 따른 전략 — 데이터가 적을 땐 수학 공식(정규방정식)으로 한방에 답을 찾지만, 데이터가 방대할 땐 경사 하강법 을 통해 조금씩 정답에 가까워지는 방식을 사용합니다.

y=wx+b

y=wx+b