導入 — どんな回数を数える分布か
固定区間の中の件数だけを見る、ポアソン分布の入口の感覚をつくる。
先に作りたい直感
ポアソン分布は「値の大きさ」ではなく、「固定区間の中で何回起きたか」を見る分布です。まずは 5 分箱を並べて、箱ごとの件数だけを見る感覚を作ります。
5 分を 1 箱として並べ、箱ごとの件数だけを見ています。それぞれの件数がどう分布するかがポアソン分布の対象です。
値ではなく、回数を数える
たとえば API のタイムアウト件数を考えるとき、1 分ごとに「0 件」「2 件」「5 件」と数えるのは自然です。ここでは 1 件ごとの詳細なタイミングよりも、その区間で何件起きたか を要約したいからです。
Poisson の入口で大切なのは次の 3 点です。
- 先に区間を決める。例: 1 分、10 分、1 日。
- 区間ごとの件数を見る。例: 今の 10 分で 3 件。
- イベントの細かい並び順は一度脇に置く。
| 考えたいもの | Poisson に向くか | 理由 |
|---|---|---|
| 1 時間の問い合わせ件数 | 向く | 固定区間の中の件数だから |
| 受講者の身長 | 向かない | 連続値であり、件数ではないから |
| 戻さない抽選で当たりを引く枚数 | 向きにくい(不適切) | 引く枚数に上限があり、1 枚引くたびに残りの構成が変わって試行が独立でない(超幾何分布の対象)。Poisson が「使えない」のではなく、前提が合わないため適切でない。 |
ポアソン分布が成り立つ前提(ポアソン過程)
ポアソン分布が自然に当てはまるのは、イベントの起こり方が次の 3 条件をおおむね満たすときです。これらは「ポアソン過程」と呼ばれる枠組みの仮定です。
- 独立性: ある区間で起きた件数は、他の区間で起きた件数と独立。あるイベントが起きたかどうかが次のイベントの起こりやすさに影響しない。
- 希少性(同時に複数起きない): ごく短い区間に着目したとき、同じ瞬間に 2 件以上が起きる確率は無視できるほど小さい。
- 定常性(一様な発生率): 区間のどの位置でも、平均的な発生率が同じ。
身長が正規分布で扱われるのは、値そのものが連続的な大きさで、件数ではないからです。Poisson はあくまで「固定区間で何件起きたか」を扱う離散分布で、上の 3 条件を意識しておくと、実務での適用判断がしやすくなります。
理解チェック 1 — 率を区間へ運ぶ
まずは「件数データ」と「固定区間」の感覚を、率の掛け算で確かめます。
Q1. 10 分あたり平均 6 件のタイムアウトが出るとします。5 分区間で見たときの λ はいくつですか。
10 分で平均 6 件なら、1 分あたり平均 0.6 件。5 分では 0.6 × 5 = 3 なので λ = 3。
Q2. ポアソン分布で考えるのがいちばん自然なのはどれでしょうか。
Poisson は、固定区間に起きた 件数 を表すのが得意です。身長は連続値で、戻さない抽選は上限付きの組合せ問題なので向きません。
λ は「その区間で平均何件か」
Poisson の主役は λ です。これはその区間での平均件数を表します。観測幅を 2 倍にすれば平均件数も 2 倍、半分にすれば平均件数も半分になります。
λ = 発生率 × 区間の長さここでいう「平均」は、長い目で同じ条件の区間を何度も観測したときの中心です。1 回の区間でぴったり λ 件になるとは限りません。
件数だけを見ると、何が残って何が消えるか
Poisson で区間ごとの件数を見ると、何件だったか は残ります。一方で、その 1 分の中のどの秒に集中していたか、先に起きたのはどれか、といった細かい情報はまとめて捨てています。
これは大まかに扱っているのではなく、まずは件数モデルに集中するための整理です。必要になったら、後で待ち時間や到着時刻のモデルへ進みます。
ここで大事なのは、Ch1 で件数を確率モデルに繋げる橋渡しを意識しておくことです。固定区間で観測した件数のばらつきを「ある分布」として書き出したいので、次章では P(X = k) という形で件数ごとの確率を与える関数(確率質量関数)を導入します。
理解チェック 2 — 区間と捨てている情報
λ は『率をその区間に持ち込んだ値』です。件数を見ると同時に何を捨てているかも確認します。
Q1. 1 分あたり平均 0.3 件の警告が出る監視系を考えます。20 分ぶんをまとめて見るときの λ はいくつですか。
0.3 × 20 = 6。したがって λ = 6。
Q2. この講座でいう「固定区間」の説明として正しいものを選んでください。
Poisson で数えるのは、先に決めた幅の中に入ったイベントの件数です。区間をあとから動かすと、同じ λ で比較しにくくなります。
Q3. 「同じ 1 分間に 3 件起きた」という記録から、どの情報が捨てられているでしょうか。
Poisson の入口では、まず 何件 起きたかを見ます。その代わり、1 分の中のどの秒で起きたかという時刻情報は持ちません。
第 1 章のまとめ
- Poisson は、固定区間に起きたイベントの件数を見る分布。
- 主役の λ は、その区間での平均件数を表す。
- 件数を見る代わりに、区間内の細かいタイミングは一度捨てている。