合同会社小村ソフト
第 3 章

平均 = 分散 — 形とばらつきを読む

Poisson は平均も分散も λ。絶対的なばらつきと相対的なばらつき(変動係数)を分けて読めるようにする。

λ が大きいと何が変わるか

λ を大きくすると、棒グラフの中心は右に動き、絶対的な広がりも大きくなります。ただし平均に対するばらつきの割合(相対的ばらつき、いわゆる変動係数)はむしろ小さくなります。

平均 = λ分散 = λ標準偏差 = √λ相対的ばらつき(変動係数)= 1 / √λ
λ = 1 λ = 9

λ = 1λ = 9 の比較。山の中心が右に動き、絶対的な広がりも大きくなります。

Poisson は平均と分散が同じ

Poisson の特徴的な性質は、分布の中心も、ばらつきの大きさも、同じ λ で読めることです。

  • E[X] = λ(長い目で見た平均件数)
  • Var(X) = λ(件数のばらつきの大きさ)
  • SD(X) = √λ(分散の平方根が標準偏差)

平均と分散が同じという性質は、実務で「Poisson が当てはまっているかの粗い診断」にも使えます。データから標本平均と標本分散を出し、両者の比(分散 / 平均、過分散指標)を見ます。

  • 分散 / 平均 ≈ 1: Poisson が無理なく当てはまる目安。
  • 分散 / 平均 ≫ 1(過分散): 例えば平均 3 なのに分散 10 のような状態。Poisson では説明できないため、負の二項分布や混合モデル(クラスタ性、観測されない異質性を含むモデル)を検討する。
  • 分散 / 平均 ≪ 1(過小分散): 件数の上限や強い規則性が背景にある可能性。生成過程の前提を見直す合図。

「平均 = 分散」という性質を覚えておくと、ヒストグラムを眺めた段階で「この件数データは Poisson で十分か、追加の構造が必要か」の当たりを早くつけられます。

理解チェック 1 — 平均・分散・標準偏差

数式をそのまま使って平均・分散・標準偏差を出します。

Q1. λ = 4 のポアソン分布の平均はいくつですか。

Q2. 同じ λ = 4 の分散はいくつですか。

Q3. λ = 9 のとき、標準偏差 σ = √λ はいくつですか。

絶対的なばらつきは増えるが、相対的なばらつき(変動係数)は減る

λ が大きい分布は、棒グラフの幅も広く見えます。実際、標準偏差 √λλ とともに大きくなります。

ただし平均も同時に大きくなるので、標準偏差 / 平均 = 1 / √λ という意味では、相対的なばらつき(変動係数, coefficient of variation)は小さくなります。本講座では以降、この量を「相対的ばらつき」または「変動係数」と呼びます。件数が多い場面ほど形がなめらかに見えるのはこのためです。

理解チェック 2 — 絶対的なばらつきと相対的ばらつき(変動係数)

λ が大きいほど絶対的な広がりは増える一方、相対的ばらつき(変動係数) 1 / √λ は小さくなります。

Q1. λ = 1λ = 9 を比べたとき、棒グラフの中心がより右にあるのはどちらですか。

Q2. λ = 2λ = 8 を比べたとき、標準偏差 / 平均 = 1 / √λ(変動係数)の意味で相対的ばらつきが小さいのはどちらですか。

第 3 章のまとめ

  • Poisson では平均も分散も λ
  • 標準偏差は √λ なので、λ が大きいほど絶対的な広がりは増える。
  • 一方で 標準偏差 / 平均 = 1 / √λ だから、相対的ばらつき(変動係数)は小さくなる。
  • 分散 / 平均 が 1 から大きくずれるなら、Poisson 単体では足りないかもしれないと疑う。