Chapter 10

확률 변수와 확률 분포

확률변수는 시행 결과를 숫자로 나타낸 것이고, 확률 분포는 각 값이 나올 가능성을 정리한 것이에요. 딥러닝에서 예측\cdot불확실성을 다룰 때 쓰입니다.

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.

포아송: 한쪽 치우침(이벤트 횟수) · 이항: 가운데 높은 대칭(성공 횟수)

정규분포

포아송분포

이항분포

그림 2: 이산 vs 연속 확률변수

확률 변수와 확률 분포란 무엇인가

확률변수는 시행(실험)의 결과를 숫자로 바꾼 것이에요. 확률 분포는 그 숫자마다 얼마나 나오는지(확률)를 정리한 거예요. 위 그림은 AI에서 자주 쓰는 세 가지 분포—정규·포아송·이항—를 보여 줍니다.

① 이산확률변수 — 유한하거나 셀 수 있는 값만 가져요. 표, 함수, 막대 그래프로 나타낼 수 있어요. 각 값

k

에 대한 확률

P(X=k)

를 확률질량함수(PMF)라고 하며, 필수 조건은

\sum_k P(X=k)=1

이에요.

이산확률변수 예시 — 어느 날 동물원 입장객 수, 동전 2개를 던졌을 때 앞면의 개수, 스트라이크가 나올 때까지 굴린 볼링공 횟수처럼 셀 수 있는 결과예요. 위 그림의 포아송분포·이항분포가 이산확률변수의 막대 그래프예요.

② 연속확률변수 — 실수 구간 안에서 무한히 많은 값을 가져요. 특정 한 값의 확률은 0으로 두고, 구간 안에 있을 확률을 확률밀도함수(PDF)로 나타내요. 표로는 쓰기 어렵고, 함수와 곡선 그래프로 표현해요.

연속확률변수 예시 — 한 해 강수량, 전구 수명, 버스가 올 때까지 기다리는 시간처럼 연속적인 값이에요. 위 그림의 정규분포(종형 곡선)가 연속확률변수의 대표 예요.

확률 분포는 ‘어떤 값이 얼마나 나오는지’의 규칙이에요. 위 그림처럼 정규(연속)·포아송(이산)·이항(이산) 세 가지를 알아 두면 AI에서 쓰는 대부분의 상황을 다룰 수 있어요.

확률질량함수(PMF)는 이산확률변수에서 각 값

k

에 대한 확률

P(X=k)

를 말해요. 막대 그래프의 막대 높이가 그 확률이고, 모든 막대 높이의 합은 1이에요. 아래 그림은 대표적인 분포 세 가지예요.

그림과 연결 — 그림 1(위)에서 왼쪽 정규분포는 연속(곡선), 가운데 포아송과 오른쪽 이항은 이산(막대)이에요. 그림 2는 이산(막대)과 연속(곡선)을 나란히 비교한 것이에요. 인공지능에서는 정규로 노이즈·예측 오차, 포아송으로 이벤트 횟수, 이항으로 성공 횟수·이진 분류 확률을 모델링해요.

확률분포 조건 (이산) — PMF는 각 값

k

의 확률

P(X=k)

예요. 필수:

\sum_k P(X=k)=1

. (예: 주사위는

P(1)+\cdots+P(6)=1

풀어쓰면: 이산확률에서는 ‘각 경우의 확률을 다 더하면 1’이어야 해요. 주사위처럼 1부터 6까지 나올 확률을 더하면 1이 되는 것과 같아요.

확률분포 조건 (연속) — PDF

f(x)

는 구간 확률을 주어요.

P(a\le X\le b)=\int_a^b f(x)\,dx

, 전체 넓이는

\int_{-\infty}^{\infty} f(x)\,dx=1

이에요.

풀어쓰면: 연속확률에서는 곡선 아래 넓이가 확률이에요. 어떤 구간 [a,b]에 들어갈 확률은 그 구간에서 곡선 아래 넓이로 구하고, 전체 구간(−∞~∞)의 넓이는 1이에요.

기댓값(평균) — 이산:

E[X]=\sum_k x_k\, P(X=k)

, 연속은 적분으로 구해요. ‘값을 확률로 잰 평균’이에요.

풀어쓰면: 기댓값은 ‘각 값에 그 확률을 곱해서 모두 더한 값’이에요. 주사위라면 (1×1/6)+(2×1/6)+…+(6×1/6)=3.5처럼, 값을 확률로 든든히 해서 평균을 내는 거예요.

분산 —

\mathrm{Var}(X)=E[(X-E[X])^2]

. 표준편차는

\sigma=\sqrt{\mathrm{Var}(X)}

예요. Ch11에서 자세히 다뤄요.

풀어쓰면: 분산은 ‘평균에서 얼마나 퍼져 있는지’를 숫자로 둔 거예요. (각 값 − 평균)을 제곱해서 확률로 평균을 내면 분산이 되고, 그 제곱근이 표준편차예요.

정규분포(연속) — 밀도

f(x)=\frac{1}{\sigma\sqrt{2\pi}}\,e^{-(x-\mu)^2/(2\sigma^2)}

\mu

=평균,

\sigma

=표준편차로 종형 곡선이 정해져요.

풀어쓰면: 평균 μ를 중심으로 좌우 대칭인 종 모양 곡선이에요. σ(표준편차)가 크면 넓게 퍼지고, 작으면 뾰족해요. 키·측정 오차·노이즈처럼 자연스럽게 퍼진 값들이 이 분포를 많이 따릅니다.

포아송분포(이산) —

P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}

(

k=0,1,2,\ldots

\lambda

는 평균 발생 횟수예요.

풀어쓰면: ‘일정 시간이나 구간 안에 사건이 몇 번 일어나는지’를 셀 때 쓰는 분포예요. λ는 평균 발생 횟수고, k=0,1,2,… 각각에 대한 확률을 위 식으로 구해요. 한쪽으로 치우친 막대 그래프가 나와요.

이항분포(이산) —

P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}

n

=시행 횟수,

p

=한 번의 성공 확률이에요.

풀어쓰면: 같은 시행을 n번 반복할 때 ‘성공’이 k번 나올 확률을 주는 분포예요. p는 한 번 시행에서 성공할 확률이에요. 동전을 n번 던져 앞면이 k번 나오는 경우처럼, 가운데가 높은 대칭에 가까운 막대 그래프가 자주 나와요.

예측할 때 모델 출력을 ‘가능한 값과 그 확률’로 두면 확률변수·분포가 됩니다. 위 그림의 세 분포처럼, AI는 정규·포아송·이항 등을 써서 불확실한 결과를 확률로 표현해요.

인공지능과 위 그림 — (정규) 회귀·노이즈·잠재공간에, (포아송) 조회수·클릭 수·이벤트 횟수에, (이항) 이진 분류·성공 확률·A/B 테스트에 쓰여요. 분류의 소프트맥스, 생성 모델의 샘플링, 손실(교차엔트로피)도 모두 확률분포와 연결돼요.

일상 — 동물원 입장객(이산), 강수량·전구 수명·버스 대기 시간(연속)처럼 셀 수 있는 값과 연속적인 값을 구분하면 위 그림의 막대(이산)와 곡선(연속)과 자연스럽게 연결돼요.

AI 활용 — 위 그림의 정규분포는 오차 분포·가우시안 노이즈로, 포아송은 count 데이터·언어 모델의 단어 빈도로, 이항은 클래스 확률·성공/실패 모델링에 쓰입니다. Ch11·Ch12에서 평균·분산·정규분포를 더 배워요.

이산확률변수에서는 ① 가능한 값과 각 확률 확인 → ② 확률의 합이 1인지 확인 → ③ 기댓값은 (값)×(확률)을 모두 더한 것을 생각하면 돼요.

확률의 합 —

P(X=1)+P(X=2)+P(X=3)=1

. 분모를 6으로 두면

a/6+b/6+c/6=1

일 때

a+b+c=6

이에요. 두 개를 알면 나머지 하나를 구할 수 있어요.

기댓값 —

E[X]=x_1 p_1+x_2 p_2+x_3 p_3

. 분모가 6이면

6\cdot E[X]

가 정수라서, 문제에서 ‘6×기댓값’을 구하라고 할 수 있어요.

예시 — 확률의 합이 1이 되도록 빈 칸을 채우거나, 6×기댓값을 구하는 문제예요.

예시 1. 세 확률이 a/6, b/6, c/6이고 합이 1일 때 a+b+c=6이에요. a=1, b=2이면 c=3이에요.

예시 2. 값 1, 2, 3에 확률 1/6, 2/6, 3/6이면 기댓값에 6을 곱한 값은 1×1+2×2+3×3=14예요.