Chapter 12

一様分布と正規分布：初期化から予測まで

一様分布は区間で一様に広がる確率、正規分布は平均まわりに鐘形に広がる確率を表します。AIでは初期化・ノイズ・事前分布に使います。

チャプター別数学図

チャプターを選ぶと、下の図がそのチャプターの内容に切り替わります。基礎数学の流れを一覧で確認できます。

一様分布と正規分布：初期化から予測まで

一様分布は区間で一様に広がる確率、正規分布は平均まわりに鐘形に広がる確率を表します。AIでは初期化・ノイズ・事前分布に使います。

一様分布と正規分布とは

世の中の連続データの多くは一定の規則で広がっています。そのなかで最も基本となる一様分布と正規分布を理解することは、AIの内部動作を把握する重要なステップです。前の章で学んだ平均（

\mu

）と分散（

\sigma^2

）の二つの指標が、これらの分布の形を決める遺伝子になります。

一様分布 — 区間

[a,b]

のすべての値が出る確率が同じな状態です。グラフにすると天井が平らな長方形になります。さいころの目が出る確率を連続な数に拡張したものと考えればよいです。「どちらにも偏らず、すべての可能性に公平に機会を与えたいとき」に使います。

一様分布の中心である平均は区間の真ん中

(a+b)/2

です。分散は区間の長さ（

b-a

）の2乗に比例する

(b-a)^2/12

で計算されます。区間が広いほどどんな値が出るか当てにくくなり（不確実性の増大）、分散も大きくなる構造です。

正規分布 — 平均を中心に左右対称な鐘形（ベルカーブ）の分布です。身長、試験の点数、測定誤差など自然の多くの現象がこの分布に従うので「正規」という名がついています。ガウス分布ともいい、平均（

\mu

）は鐘の頂点の位置、標準偏差（

\sigma

）は鐘の幅（広がり）を決めます。

正規分布の強みは経験則（68–95–99.7）にあります。

\mu \pm 1\sigma

にデータの約68%、

\mu \pm 2\sigma

に約95%、

\mu \pm 3\sigma

に約99.7%が入ります。この規則を知っていれば、データが平均からどれだけ離れているか（外れ値かどうか）をすぐ判断し、AIの予測の信頼度を評価できます。

一様分布は「何も知らない白紙の状態」を、正規分布は「平均という基準がある自然な状態」を表します。AIは学習を始めるとき一様分布で重みをまんべんなく散らし（初期化）、学習が進むにつれてデータの誤差を正規分布で分析しながら答えに近づいていきます。

事前情報の設計：ベイズ統計では、AIが学習前に持つ「先入観」を事前分布といいます。完全に公平な立場から始めたいときは一様分布を使い、特定の平均値の近くにあるという合理的な推測があるときは正規分布を使ってモデルの基礎体力を設計します。

誤差の数学的モデル化：世の中のデータにはすべてノイズが混ざっています。それらのノイズは互いに独立に起こり、合わさると結局正規分布に従います。AIが写真からノイズを除去したりかすんだ音声を復元したりするとき、ノイズが正規分布の形だと仮定して計算すると、はるかに正確な復元が可能になります。

中心極限定理：これは統計学の根幹です。データがどんな形であっても、そのデータをたくさん抽出して平均をとると、その平均値たちの分布は驚くべきことに正規分布に近づきます。このおかげでAIは、少数のサンプルデータだけから正規分布を借りて、母集団の性質を予測できます。

ディープラーニングでは重みの初期化が学習の成否を分けます。XavierやHeのような初期化では、一様・正規分布の分散を巧みに調整し、データの信号がネットワークの奥まで歪まずに届くようにします。

重みの初期化 — 重みを最初にすべて 0 にすると学習できません。そこで一様分布や正規分布から無作為に数を取り出して埋めます。正規分布を使うと、多くの重みが 0 付近にまとまり、学習がずっと安定して速く始まります。

ノイズ — VAEでは潜在ベクトルを正規からサンプリングし、拡散モデルはガウスノイズを段階的に足したり引いたりします。

回帰 — 誤差を正規と仮定すると最小二乗(OLS)が最尤と一致します。予測区間も

\mu \pm k\sigma

で取ります。

ベイズ — 事前分布に一様・正規を使い、観測後に事後分布を求めます。ニューラルネットの重みにも正規事前を置けます。

数学の流れ — Ch10の確率変数・分布、Ch11の平均・分散を経て、Ch12で二つの具体的な分布（一様・正規）を学びます。この二つを知ると、AI論文の「初期化」「ノイズ」「事前」の表現が自然に読めます。

一様分布

[a,b]

: 密度

1/(b-a)

、平均

(a+b)/2

、分散

(b-a)^2/12

。部分区間

[c,d]\subset[a,b]

に入る確率は長さの比

(d-c)/(b-a)

。

正規分布: 平均

\mu

、分散

\sigma^2

（標準偏差

\sigma

）。標準正規表・計算機、または 68-95-99.7（

\mu\pm\sigma

約68%、

\mu\pm2\sigma

約95%）。

一様の例:

[0,6]

で平均

(0+6)/2=3

、分散

36/12=

3。

以下は一様・正規のタイプ別例題です。

例（一様：平均・分散）

区間

[0,6]

の一様分布の平均と分散を求めなさい。

解答

平均

(0+6)/2=3

。分散

(6-0)^2/12=3

。

→ 平均 3、分散 3

例（一様：区間確率）

[0,6]

で一様のとき

2\le X\le 4

となる確率を求めなさい。

解答

長さ

4-2=2

、全体

6

なので

P=2/6=1/3

。

→ 答 $1/3$

例（正規： $\mu\pm\sigma$ ）

平均 70、標準偏差 10 の正規分布で

\mu\pm\sigma

区間（60～80）に入る割合は？

解答

経験則より約 68%。

→ 約 68%

例（正規： $\mu\pm2\sigma$ ）

同じ分布で

\mu\pm2\sigma

区間（50～90）に入る割合は？

解答

経験則より約 95%。

→ 約 95%

一様分布と正規分布とは

\mu

）と分散（

\sigma^2

）の二つの指標が、これらの分布の形を決める遺伝子になります。

一様分布 — 区間

[a,b]

一様分布の中心である平均は区間の真ん中

(a+b)/2

です。分散は区間の長さ（

b-a

）の2乗に比例する

(b-a)^2/12

で計算されます。区間が広いほどどんな値が出るか当てにくくなり（不確実性の増大）、分散も大きくなる構造です。

\mu

）は鐘の頂点の位置、標準偏差（

\sigma

）は鐘の幅（広がり）を決めます。

正規分布の強みは経験則（68–95–99.7）にあります。

\mu \pm 1\sigma

にデータの約68%、

\mu \pm 2\sigma

に約95%、

\mu \pm 3\sigma

ノイズ — VAEでは潜在ベクトルを正規からサンプリングし、拡散モデルはガウスノイズを段階的に足したり引いたりします。

回帰 — 誤差を正規と仮定すると最小二乗(OLS)が最尤と一致します。予測区間も

\mu \pm k\sigma

で取ります。

ベイズ — 事前分布に一様・正規を使い、観測後に事後分布を求めます。ニューラルネットの重みにも正規事前を置けます。

一様分布

[a,b]

: 密度

1/(b-a)

、平均

(a+b)/2

、分散

(b-a)^2/12

。部分区間

[c,d]\subset[a,b]

に入る確率は長さの比

(d-c)/(b-a)

。

正規分布: 平均

\mu

、分散

\sigma^2

（標準偏差

\sigma

）。標準正規表・計算機、または 68-95-99.7（

\mu\pm\sigma

約68%、

\mu\pm2\sigma

約95%）。

一様の例:

[0,6]

で平均

(0+6)/2=3

、分散

36/12=

3。

以下は一様・正規のタイプ別例題です。

例（一様：平均・分散）

区間

[0,6]

の一様分布の平均と分散を求めなさい。

解答

平均

(0+6)/2=3

。分散

(6-0)^2/12=3

。

→ 平均 3、分散 3

例（一様：区間確率）

[0,6]

で一様のとき

2\le X\le 4

となる確率を求めなさい。

解答

長さ

4-2=2

、全体

6

なので

P=2/6=1/3

。

→ 答 $1/3$

例（正規： $\mu\pm\sigma$ ）

平均 70、標準偏差 10 の正規分布で

\mu\pm\sigma

区間（60～80）に入る割合は？

解答

経験則より約 68%。

→ 約 68%

例（正規： $\mu\pm2\sigma$ ）

同じ分布で

\mu\pm2\sigma

区間（50～90）に入る割合は？

解答

経験則より約 95%。

→ 約 95%

一様分布と正規分布：初期化から予測まで

チャプター別 数学図

一様分布と正規分布とは

一様分布と正規分布：初期化から予測まで

チャプター別 数学図

一様分布と正規分布とは

チャプター別数学図

チャプター別数学図