平均 = 分散 — 形とばらつきを読む
Poisson は平均も分散も λ。絶対的なばらつきと相対的なばらつき(変動係数)を分けて読めるようにする。
λ が大きいと何が変わるか
λ を大きくすると、棒グラフの中心は右に動き、絶対的な広がりも大きくなります。ただし平均に対するばらつきの割合(相対的ばらつき、いわゆる変動係数)はむしろ小さくなります。
λ = 1 と λ = 9 の比較。山の中心が右に動き、絶対的な広がりも大きくなります。
Poisson は平均と分散が同じ
Poisson の特徴的な性質は、分布の中心も、ばらつきの大きさも、同じ λ で読めることです。
E[X] = λ(長い目で見た平均件数)Var(X) = λ(件数のばらつきの大きさ)SD(X) = √λ(分散の平方根が標準偏差)
平均と分散が同じという性質は、実務で「Poisson が当てはまっているかの粗い診断」にも使えます。データから標本平均と標本分散を出し、両者の比(分散 / 平均、過分散指標)を見ます。
- 分散 / 平均 ≈ 1: Poisson が無理なく当てはまる目安。
- 分散 / 平均 ≫ 1(過分散): 例えば平均 3 なのに分散 10 のような状態。Poisson では説明できないため、負の二項分布や混合モデル(クラスタ性、観測されない異質性を含むモデル)を検討する。
- 分散 / 平均 ≪ 1(過小分散): 件数の上限や強い規則性が背景にある可能性。生成過程の前提を見直す合図。
「平均 = 分散」という性質を覚えておくと、ヒストグラムを眺めた段階で「この件数データは Poisson で十分か、追加の構造が必要か」の当たりを早くつけられます。
理解チェック 1 — 平均・分散・標準偏差
数式をそのまま使って平均・分散・標準偏差を出します。
Q1. λ = 4 のポアソン分布の平均はいくつですか。
Poisson では E[X] = λ なので、平均は 4。
Q2. 同じ λ = 4 の分散はいくつですか。
Poisson は平均だけでなく分散も λ。ここでは分散も 4。
Q3. λ = 9 のとき、標準偏差 σ = √λ はいくつですか。
σ = √9 = 3。
絶対的なばらつきは増えるが、相対的なばらつき(変動係数)は減る
λ が大きい分布は、棒グラフの幅も広く見えます。実際、標準偏差 √λ は λ とともに大きくなります。
ただし平均も同時に大きくなるので、標準偏差 / 平均 = 1 / √λ という意味では、相対的なばらつき(変動係数, coefficient of variation)は小さくなります。本講座では以降、この量を「相対的ばらつき」または「変動係数」と呼びます。件数が多い場面ほど形がなめらかに見えるのはこのためです。
理解チェック 2 — 絶対的なばらつきと相対的ばらつき(変動係数)
λ が大きいほど絶対的な広がりは増える一方、相対的ばらつき(変動係数) 1 / √λ は小さくなります。
Q1. λ = 1 と λ = 9 を比べたとき、棒グラフの中心がより右にあるのはどちらですか。
λ は平均件数そのものなので、大きいほど中心は右へ動きます。
Q2. λ = 2 と λ = 8 を比べたとき、標準偏差 / 平均 = 1 / √λ(変動係数)の意味で相対的ばらつきが小さいのはどちらですか。
相対的ばらつき(変動係数)は 1 / √λ なので、λ が大きいほど小さくなります。
第 3 章のまとめ
- Poisson では平均も分散も
λ。 - 標準偏差は
√λなので、λ が大きいほど絶対的な広がりは増える。 - 一方で
標準偏差 / 平均 = 1 / √λだから、相対的ばらつき(変動係数)は小さくなる。 - 分散 / 平均 が 1 から大きくずれるなら、Poisson 単体では足りないかもしれないと疑う。