Chapter 10

확률 변수와 확률 분포

확률변수는 시행 결과를 숫자로 나타낸 것이고, 확률 분포는 각 값이 나올 가능성을 정리한 것이에요. 딥러닝에서 예측·불확실성을 다룰 때 쓰입니다.

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.

포아송: 한쪽 치우침(이벤트 횟수) · 이항: 가운데 높은 대칭(성공 횟수)

정규분포
포아송분포
이항분포
그림 2: 이산 vs 연속 확률변수

확률 변수와 확률 분포란 무엇인가

확률변수는 시행(실험)의 결과를 숫자로 바꾼 것이에요. 확률 분포는 그 숫자마다 얼마나 나오는지(확률)를 정리한 거예요. 위 그림은 AI에서 자주 쓰는 세 가지 분포—정규·포아송·이항—를 보여 줍니다.
① 이산확률변수 — 유한하거나 셀 수 있는 값만 가져요. 표, 함수, 막대 그래프로 나타낼 수 있어요. 각 값 kk에 대한 확률 P(X=k)P(X=k)확률질량함수(PMF)라고 하며, 필수 조건은 kP(X=k)=1\sum_k P(X=k)=1이에요.
이산확률변수 예시 — 어느 날 동물원 입장객 수, 동전 2개를 던졌을 때 앞면의 개수, 스트라이크가 나올 때까지 굴린 볼링공 횟수처럼 셀 수 있는 결과예요. 위 그림의 포아송분포·이항분포가 이산확률변수의 막대 그래프예요.
② 연속확률변수 — 실수 구간 안에서 무한히 많은 값을 가져요. 특정 한 값의 확률은 0으로 두고, 구간 안에 있을 확률을 확률밀도함수(PDF)로 나타내요. 표로는 쓰기 어렵고, 함수와 곡선 그래프로 표현해요.
연속확률변수 예시 — 한 해 강수량, 전구 수명, 버스가 올 때까지 기다리는 시간처럼 연속적인 값이에요. 위 그림의 정규분포(종형 곡선)가 연속확률변수의 대표 예요.
확률 분포는 ‘어떤 값이 얼마나 나오는지’의 규칙이에요. 위 그림처럼 정규(연속)·포아송(이산)·이항(이산) 세 가지를 알아 두면 AI에서 쓰는 대부분의 상황을 다룰 수 있어요.
확률질량함수(PMF)는 이산확률변수에서 각 값 kk에 대한 확률 P(X=k)P(X=k)를 말해요. 막대 그래프의 막대 높이가 그 확률이고, 모든 막대 높이의 합은 1이에요. 아래 그림은 대표적인 분포 세 가지예요.
그림과 연결그림 1(위)에서 왼쪽 정규분포는 연속(곡선), 가운데 포아송과 오른쪽 이항은 이산(막대)이에요. 그림 2는 이산(막대)과 연속(곡선)을 나란히 비교한 것이에요. 인공지능에서는 정규로 노이즈·예측 오차, 포아송으로 이벤트 횟수, 이항으로 성공 횟수·이진 분류 확률을 모델링해요.
확률분포 조건 (이산) — PMF는 각 값 kk의 확률 P(X=k)P(X=k)예요. 필수: kP(X=k)=1\sum_k P(X=k)=1. (예: 주사위는 P(1)++P(6)=1P(1)+\cdots+P(6)=1.)
풀어쓰면: 이산확률에서는 ‘각 경우의 확률을 다 더하면 1’이어야 해요. 주사위처럼 1부터 6까지 나올 확률을 더하면 1이 되는 것과 같아요.
확률분포 조건 (연속) — PDF f(x)f(x)는 구간 확률을 주어요. P(aXb)=abf(x)dxP(a\le X\le b)=\int_a^b f(x)\,dx, 전체 넓이는 f(x)dx=1\int_{-\infty}^{\infty} f(x)\,dx=1이에요.
풀어쓰면: 연속확률에서는 곡선 아래 넓이가 확률이에요. 어떤 구간 [a,b]에 들어갈 확률은 그 구간에서 곡선 아래 넓이로 구하고, 전체 구간(−∞~∞)의 넓이는 1이에요.
기댓값(평균) — 이산: E[X]=kxkP(X=k)E[X]=\sum_k x_k\, P(X=k), 연속은 적분으로 구해요. ‘값을 확률로 잰 평균’이에요.
풀어쓰면: 기댓값은 ‘각 값에 그 확률을 곱해서 모두 더한 값’이에요. 주사위라면 (1×1/6)+(2×1/6)+…+(6×1/6)=3.5처럼, 값을 확률로 든든히 해서 평균을 내는 거예요.
분산Var(X)=E[(XE[X])2]\mathrm{Var}(X)=E[(X-E[X])^2]. 표준편차는 σ=Var(X)\sigma=\sqrt{\mathrm{Var}(X)}예요. Ch11에서 자세히 다뤄요.
풀어쓰면: 분산은 ‘평균에서 얼마나 퍼져 있는지’를 숫자로 둔 거예요. (각 값 − 평균)을 제곱해서 확률로 평균을 내면 분산이 되고, 그 제곱근이 표준편차예요.
정규분포(연속) — 밀도 f(x)=1σ2πe(xμ)2/(2σ2)f(x)=\frac{1}{\sigma\sqrt{2\pi}}\,e^{-(x-\mu)^2/(2\sigma^2)}. μ\mu=평균, σ\sigma=표준편차로 종형 곡선이 정해져요.
풀어쓰면: 평균 μ를 중심으로 좌우 대칭인 종 모양 곡선이에요. σ(표준편차)가 크면 넓게 퍼지고, 작으면 뾰족해요. 키·측정 오차·노이즈처럼 자연스럽게 퍼진 값들이 이 분포를 많이 따릅니다.
포아송분포(이산)P(X=k)=λkeλk!P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!} (k=0,1,2,k=0,1,2,\ldots). λ\lambda는 평균 발생 횟수예요.
풀어쓰면: ‘일정 시간이나 구간 안에 사건이 몇 번 일어나는지’를 셀 때 쓰는 분포예요. λ는 평균 발생 횟수고, k=0,1,2,… 각각에 대한 확률을 위 식으로 구해요. 한쪽으로 치우친 막대 그래프가 나와요.
이항분포(이산)P(X=k)=(nk)pk(1p)nkP(X=k)=\binom{n}{k}p^k(1-p)^{n-k}. nn=시행 횟수, pp=한 번의 성공 확률이에요.
풀어쓰면: 같은 시행을 n번 반복할 때 ‘성공’이 k번 나올 확률을 주는 분포예요. p는 한 번 시행에서 성공할 확률이에요. 동전을 n번 던져 앞면이 k번 나오는 경우처럼, 가운데가 높은 대칭에 가까운 막대 그래프가 자주 나와요.
예측할 때 모델 출력을 ‘가능한 값과 그 확률’로 두면 확률변수·분포가 됩니다. 위 그림의 세 분포처럼, AI는 정규·포아송·이항 등을 써서 불확실한 결과를 확률로 표현해요.
인공지능과 위 그림(정규) 회귀·노이즈·잠재공간에, (포아송) 조회수·클릭 수·이벤트 횟수에, (이항) 이진 분류·성공 확률·A/B 테스트에 쓰여요. 분류의 소프트맥스, 생성 모델의 샘플링, 손실(교차엔트로피)도 모두 확률분포와 연결돼요.
일상 — 동물원 입장객(이산), 강수량·전구 수명·버스 대기 시간(연속)처럼 셀 수 있는 값연속적인 값을 구분하면 위 그림의 막대(이산)와 곡선(연속)과 자연스럽게 연결돼요.
AI 활용 — 위 그림의 정규분포는 오차 분포·가우시안 노이즈로, 포아송은 count 데이터·언어 모델의 단어 빈도로, 이항은 클래스 확률·성공/실패 모델링에 쓰입니다. Ch11·Ch12에서 평균·분산·정규분포를 더 배워요.
이산확률변수에서는 ① 가능한 값과 각 확률 확인 → ② 확률의 합이 1인지 확인 → ③ 기댓값은 (값)×(확률)을 모두 더한 것을 생각하면 돼요.
확률의 합P(X=1)+P(X=2)+P(X=3)=1P(X=1)+P(X=2)+P(X=3)=1. 분모를 6으로 두면 a/6+b/6+c/6=1a/6+b/6+c/6=1일 때 a+b+c=6a+b+c=6이에요. 두 개를 알면 나머지 하나를 구할 수 있어요.
기댓값E[X]=x1p1+x2p2+x3p3E[X]=x_1 p_1+x_2 p_2+x_3 p_3. 분모가 6이면 6E[X]6\cdot E[X]가 정수라서, 문제에서 ‘6×기댓값’을 구하라고 할 수 있어요.
예시 — 확률의 합이 1이 되도록 빈 칸을 채우거나, 6×기댓값을 구하는 문제예요.
예시 1. 세 확률이 a/6, b/6, c/6이고 합이 1일 때 a+b+c=6이에요. a=1, b=2이면 c=3이에요.
예시 2. 값 1, 2, 3에 확률 1/6, 2/6, 3/6이면 기댓값에 6을 곱한 값은 1×1+2×2+3×3=14예요.