Chapter 12

一様分布と正規分布

一様分布は区間で一様に広がる確率、正規分布は平均まわりに鐘形に広がる確率を表します。AIでは初期化・ノイズ・事前分布に使います。

home.mathDiagramTitle

home.mathDiagramDescription

一様分布と正規分布

一様分布は区間で一様に広がる確率、正規分布は平均まわりに鐘形に広がる確率を表します。AIでは初期化・ノイズ・事前分布に使います。

一様分布と正規分布とは

一様分布正規分布は連続確率分布のなかで最もよく使う二つです。Ch10・Ch11の平均・分散で形が決まります。
一様分布 — 区間 [a,b][a,b] のなかで同じ高さで広がります。密度は f(x)=1/(ba)f(x) = 1/(b-a)axba \le x \le b)。さいころの一つの目のように「均等に」出るときに使います。
一様分布の平均(a+b)/2(a+b)/2分散(ba)2/12(b-a)^2/12。区間の中央が平均で、区間が広いほど分散は大きくなります。
正規分布 — 平均 μ\mu、標準偏差 σ\sigma の二つで形が決まります。密度 f(x)=1σ2πe(xμ)2/(2σ2)f(x) = \frac{1}{\sigma\sqrt{2\pi}}\,e^{-(x-\mu)^2/(2\sigma^2)}。測定誤差・身長・点数のように平均付近に多く出るときによく合います。
鐘形曲線 — 正規分布は平均で最も高く、両側に行くほど低くなる鐘の形です。μ\mu で対称で、μ±σ\mu \pm \sigma に約68%、μ±2σ\mu \pm 2\sigma に約95%が入ります。
なぜこの二つ? — 一様は「情報がないとき」の初期値・事前分布に、正規は「誤差・ノイズ」と中心極限定理(多くの値の平均が正規に近づく)のため、AI・統計でよく現れます。
事前分布 — ベイズでは「情報がないとき」一様分布を、平均・分散についての信念があるとき正規を使います。
ノイズ・誤差 — 回帰の誤差、VAE・拡散モデルのノイズを正規分布で置きます。式が簡単で中心極限と合います。
中心極限定理 — 独立試行を多くすると標本平均が正規に近づきます。そのため信頼区間・検定では正規が基本です。
深層学習・機械学習 — 重みの初期化(一様/正規)、ドロップアウト・ノイズ(正規)、VAEの潜在空間(正規)、拡散モデル(ガウス)などで使います。
初期化 — 重みを一様または正規からサンプリングして入れます。大きすぎたり偏ったりすると学習が不安定なので、通常は分散の小さい正規を使います。
ノイズ — VAEでは潜在ベクトルを正規からサンプリングし、拡散モデルはガウスノイズを段階的に足したり引いたりします。
回帰 — 誤差を正規と仮定すると最小二乗(OLS)が最尤と一致します。予測区間も μ±kσ\mu \pm k\sigma で取ります。
ベイズ — 事前分布に一様・正規を使い、観測後に事後分布を求めます。ニューラルネットの重みにも正規事前を置けます。
数学の流れ — Ch10の確率変数・分布、Ch11の平均・分散を経て、Ch12で二つの具体的な分布(一様・正規)を学びます。この二つを知ると、AI論文の「初期化」「ノイズ」「事前」の表現が自然に読めます。
一様 — 区間 [a,b][a,b] で密度 1/(ba)1/(b-a)、平均 (a+b)/2(a+b)/2、分散 (ba)2/12(b-a)^2/12正規 — 平均 μ\mu、分散 σ2\sigma^2。区間の確率は標準正規表や計算機で求めます。
例(一様). 区間 [0,6][0,6] の一様分布なら平均 33、分散 36/12=336/12=3、標準偏差 3\sqrt{3}
例(正規). 平均 7070、標準偏差 1010 の正規分布なら約68%が 608060\sim80、約95%が 509050\sim90 に入ります。