Chapter 11

평균과 분산

평균(기댓값)은 확률분포의 중심을, 분산은 퍼짐을 나타냅니다. AI에서 예측\cdot손실\cdot정규화에 쓰입니다.

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.

평균과 분산

평균과 분산이란

평균(기댓값)은 분포의 무게중심이에요. 분산은 평균에서 값이 얼마나 퍼져 있는지를 숫자로 둔 거예요. 표준편차는 분산의 제곱근이라, ‘평균에서 보통 얼마나 떨어져 있는지’를 같은 단위로 보여 줘요.

평균 — 주사위는 (1+2+…+6)/6=3.5, 시험 점수는 반 평균, 수요 예측은 ‘예상값’처럼 중심을 나타내요. 위 그림의 빨간 세로선이 평균

\mu

예요.

분산 — (값−평균)²을 확률로 평균 낸 거예요. 분산이 크면 퍼짐이 크고, 작으면 평균 근처에 모여 있어요. 표준편차 $\sigma=\sqrt{\text{분산}}$ 은 분산을 제곱근해서 원래 단위(점수, kg 등)로 되돌린 거라 해석하기 쉬워요. 시험에서 ‘평균 70점, 표준편차 10점’이면 대략 60~80점 구간에 많이 분포해요.

평균만 보면 ‘어디쯤’만 알 수 있고, 분산·표준편차를 보면 불확실성·퍼짐까지 알 수 있어요. AI에서는 예측(평균)과 함께 신뢰구간·손실·정규화에 쓰여요.

AI에서 자주 쓰는 개념 — 아래 표는 최빈값·평균·최소·최대·중앙값의 의미와 AI에서의 쓰임을 정리한 거예요.

개념	의미	AI 활용
최빈값	확률이 가장 큰 값. 여러 번 시행했을 때 가장 자주 나오는 결과를 말해요.	분류 모델에서 ‘가장 가능성 높은 클래스’를 고를 때 써요. 소프트맥스 출력의 argmax가 최빈값에 해당해요.
평균(기댓값)	분포의 무게중심. 값×확률을 모두 더한 것으로, ‘기대되는 값’을 나타내요.	회귀의 예측값, MSE 같은 손실 계산, 강화학습의 보상 기댓값 등에 쓰여요.
최소·최대	변량이 움직일 수 있는 구간 [min, max]. 최솟값·최댓값으로 범위를 정해요.	손실을 줄이는 최소화(경사 하강), 값의 클리핑, 정규화 구간 설정 등에 쓰여요.
중앙값	값을 크기 순으로 놓았을 때 정가운데 오는 값. 평균과 달리 극단값(이상치)에 덜 흔들려요.	이상치가 많은 데이터를 요약하거나, 강건한 통계 지표가 필요할 때 쓰여요.

예측할 때 모델이 한 숫자를 내놓으면, 그건 보통 평균(기댓값)이에요. 예를 들어 ‘내일 매출은 약 1천만 원’이라고 하면 1천만 원이 기댓값이에요. 표준편차가 크면 ‘예측이 들쭉날쭉하다’고 해석할 수 있어요.

불확실성 — 분산·표준편차가 크면 값이 평균 주변에 넓게 퍼져 있어서 ‘얼마나 믿을 만한지’를 알 수 있어요. 의료·금융·자율주행처럼 신뢰구간(예: 평균 ± 2σ)이 중요할 때 꼭 쓰여요.

손실 함수 — 회귀에서 많이 쓰는 MSE(평균 제곱 오차)는 ‘오차의 제곱’의 평균이에요. 즉 분산과 같은 식 구조라서, 학습 목표가 ‘오차 분산을 줄이는 것’이라고 해석할 수 있어요.

정규화·드롭아웃 — 가중치 분산을 줄이거나 노이즈를 넣어 분산을 조절해요. 분산이 너무 크면 예측이 불안정해지므로, 정규화로 과적합을 막고 일반화를 도와요.

AI 전반 — 베이지안 네트워크·불확실성 추정 모델은 평균과 분산(또는 표준편차)을 함께 예측해요. 생성 모델(VAE, 확산)에서도 잠재공간의 평균·분산이 핵심이에요.

일상 — 시험 성적은 ‘평균 70점, 표준편차 10점’처럼 중심과 퍼짐을 함께 봐요. 키·체중 분포, 수요 예측(예상값과 오차 범위), 품질 관리(규격 ± σ)도 같은 맥락이에요.

회귀 — 예측값은 보통 조건부 기댓값이에요. ‘입력이 이럴 때 출력의 평균’을 학습하는 거예요. 손실은 MSE(오차 제곱의 평균)로 두고, 이 평균을 최소화해요.

분류 — 각 클래스의 확률을 출력한 뒤, 그중 가장 큰 값(최빈값)을 예측 클래스로 써요. 소프트맥스 출력에서 argmax가 바로 그 역할이에요.

강화학습 — 정책이 좋은지 평가할 때 보상의 기댓값을 써요. ‘이 행동을 했을 때 앞으로 받을 보상의 평균’을 최대화하는 방향으로 학습해요.

불확실성 추정 — 베이지안 신경망, 앙상블, 드롭아웃 추론 등은 예측 분산을 함께 구해요. ‘이 예측이 얼마나 확실한지’를 분산·표준편차로 나타내요.

수학 흐름 — Ch10에서 기댓값·분산을 정의했고, Ch11에서 직접 계산해 보는 단계예요. Ch12 정규분포는 평균

\mu

와 표준편차

\sigma

두 개로 모양이 정해져요.

이산확률: 평균 =

\text{값}\times\text{확률의 합}

, 분산 =

E[X^2]-(E[X])^2

. 분모 6이면

6\times\text{평균}

36\times\text{분산}

이 정수예요.

평균 —

\text{값}\times\text{확률}

을 다 더하면 돼요. 분모 6이면

6\times\text{평균}

이 정수로 나와요.

분산 —

E[X^2]

에서

(\text{평균})^2

을 빼요.

36\times\text{분산}

이 정수로 나오게 하면 계산이 편해요.

아래 문제:

6\times\text{평균}

36\times\text{분산}

, 평균(정수), 최빈값, 누적확률 분자 등을 구해요.

예시. 값 1,2,3에 확률

\frac{1}{6}

\frac{2}{6}

\frac{3}{6}

→

6\times\text{평균} = 1\times1+2\times2+3\times3 = 14

예시. 같은 분포에서

36\times\text{분산} = 6\sum_i (n_i x_i^2) - (\sum_i n_i x_i)^2