Chapter 12

균등 분포와 정규 분포

균등 분포는 구간 안에서 확률이 고르게 퍼진 경우를, 정규 분포는 평균 주변에 종 모양으로 퍼진 경우를 나타냅니다. 딥러닝\cdot머신러닝에서는 초기화, 노이즈, 사전분포를 다룰 때 이 두 분포가 자주 쓰여요.

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.

균등 분포와 정규 분포

균등 분포는 구간 안에서 확률이 고르게 퍼진 경우를, 정규 분포는 평균 주변에 종 모양으로 퍼진 경우를 나타냅니다. 딥러닝·머신러닝에서는 초기화, 노이즈, 사전분포를 다룰 때 이 두 분포가 자주 쓰여요.

균등 분포와 정규 분포란

연속 확률분포 중에서 가장 많이 쓰이는 것이 균등 분포와 정규 분포예요. Ch10에서 확률변수와 분포를, Ch11에서 평균과 분산을 배웠다면, 이제 그 평균·분산으로 모양이 완전히 정해지는 두 가지 구체적인 분포를 배우는 단계예요.

균등 분포는 어떤 구간

[a,b]

안에서 확률이 같은 높이로 퍼져 있는 분포예요. 수학적으로는 밀도가

f(x) = 1/(b-a)

(

a \le x \le b

)로, 구간 밖에서는 0이에요. 주사위 한 면이 나올 확률처럼, ‘어느 값이든 나올 가능성이 고르다’고 할 때 이 분포를 쓰면 돼요.

균등 분포의 평균은 구간의 정가운데인

(a+b)/2

예요. 분산은

(b-a)^2/12

로, 구간이 넓을수록 분산이 커져요. 즉 구간의 길이가 클수록 값이 더 넓게 퍼져 있다고 보면 됩니다.

정규 분포는 평균 $\mu$ 와 표준편차 $\sigma$ 두 개의 숫자로 모양이 완전히 정해지는 분포예요. 밀도 식은

f(x) = \frac{1}{\sigma\sqrt{2\pi}}\,e^{-(x-\mu)^2/(2\sigma^2)}

인데, 측정 오차나 키·점수처럼 평균 근처에 값이 많이 모여 있고 양쪽으로 갈수록 적어지는 경우에 잘 맞아요.

정규분포를 그래프로 그리면 종 모양의 곡선이 나와요. 평균

\mu

에서 가장 높고,

\mu

를 중심으로 좌우 대칭이에요. 평균에서 표준편차 하나 범위, 즉

\mu \pm \sigma

구간에는 전체의 약 68%가 들어가고,

\mu \pm 2\sigma

구간에는 약 95%가 들어간다고 외워 두면 해석할 때 편해요.

왜 균등과 정규를 따로 배우나요? 균등 분포는 ‘아무 정보가 없을 때’ 초기값이나 사전분포를 정할 때 자주 쓰여요. 정규 분포는 오차나 노이즈를 모델링할 때 쓰이고, 중심극한정리 때문에 독립적인 값들을 많이 더한 결과가 정규에 가까워지는 경우가 많아서, 통계와 딥러닝·머신러닝 모두에서 기본이 됩니다.

사전분포를 둘 때 베이지안 방법에서는 ‘아무 정보가 없다’고 가정할 때 균등 분포를 쓰고, 평균이나 분산에 대한 어느 정도 믿음이 있을 때는 정규 분포를 사전으로 두는 경우가 많아요.

노이즈나 오차를 수학적으로 나타낼 때 정규분포를 쓰는 경우가 많아요. 회귀에서 오차를 정규로 가정하고, VAE나 확산 모델에서도 노이즈를 정규(가우시안)로 둬요. 수식이 단순하고, 중심극한정리와도 잘 맞아서 선택되는 거예요.

중심극한정리에 따르면, 서로 독립인 시행을 많이 했을 때 그 표본평균의 분포가 정규분포에 가까워져요. 그래서 신뢰구간을 잡거나 가설검정을 할 때 정규분포가 기본 도구로 쓰입니다.

딥러닝·머신러닝에서는 가중치 초기화를 균등 또는 정규 분포에서 값을 뽑아서 하고, 드롭아웃이나 노이즈 추가 시에는 정규 분포를 쓰며, VAE의 잠재공간이나 확산 모델의 노이즈도 가우시안(정규)으로 두는 경우가 많아요.

초기화할 때 가중치를 균등 분포나 정규 분포에서 무작위로 뽑아서 넣어요. 값이 너무 크거나 한쪽으로 치우치면 학습이 불안정해지기 때문에, 보통은 분산을 작게 잡은 정규 분포를 많이 써요.

노이즈를 넣을 때도 정규 분포가 쓰여요. VAE에서는 잠재 벡터를 정규 분포에서 샘플링하고, 확산 모델에서는 가우시안 노이즈를 단계적으로 더했다가 다시 빼는 방식으로 학습해요.

회귀에서는 오차를 정규분포로 가정하는 경우가 많아요. 그렇게 하면 최소제곱(OLS) 추정이 최대가능도 추정과 같아지고, 예측 구간도 평균

\mu

에 표준편차의 배수를 더해

\mu \pm k\sigma

형태로 잡을 수 있어요.

베이지안 방법에서는 사전분포로 균등이나 정규를 자주 쓰고, 데이터를 관측한 뒤 사후분포를 구해요. 신경망의 가중치에도 정규 분포를 사전으로 두는 모델이 있어요.

수학 흐름으로 보면, Ch10에서 확률변수와 분포를, Ch11에서 평균과 분산을 배우고, Ch12에서는 그걸 적용할 구체적인 두 분포(균등·정규)를 배우는 거예요. 이 둘을 알면 논문에서 ‘초기화’, ‘노이즈’, ‘사전분포’ 같은 말이 나왔을 때 어떤 분포를 말하는지 자연스럽게 떠올릴 수 있어요.

균등 분포는 구간

[a,b]

에서 밀도가

1/(b-a)

, 평균이

(a+b)/2

, 분산이

(b-a)^2/12

예요. 정규 분포는 평균

\mu

와 분산

\sigma^2

(또는 표준편차

\sigma

)로 정해지고, 특정 구간에 들어갈 확률은 표준정규표나 계산기로 구하면 돼요.

예시(균등). 구간

[0,6]

위에서 균등 분포를 생각하면, 평균은 가운데인

3

이고, 분산은

(6-0)^2/12 = 36/12 = 3

, 표준편차는

\sqrt{3}

이에요.

예시(정규). 평균이

70

, 표준편차가

10

인 정규분포라면,

\mu \pm \sigma

구간인 60~80 사이에 약 68%가 들어가고,

\mu \pm 2\sigma

구간인 50~90 사이에는 약 95%가 들어가요.