Zスコア確率を理解する
標準正規分布(Standard Normal Distribution)は、平均 μ=0、標準偏差 σ=1 の正規分布です。この尺度上の値は Z と表記され、曲線上の特定の位置をZスコアと呼びます。
Zスコア確率とは、標準正規曲線の下の面積を指します。たとえば P(Z<z) は、Zスコア z の左側にある面積です。曲線下の全面積が1であるため、これらの面積は確率またはパーセンテージとして読み取ることができます。
累積分布関数(CDF)の役割
標準正規累積分布関数(CDF)は Φ(z) と書かれ、左側確率を与えます:
Φ(z)=P(Z<z) Φ(z) が求まれば、他の一般的な確率の形は余事象、差分、および対称性から導き出せます。
確率の各形式の読み方
- 左側確率:P(Z<z)=Φ(z) は z の左側すべてを色付けします。
- 右側確率:P(Z>z)=1−Φ(z) は z の右側すべてを色付けします。
- 2つのZスコアの間:P(z1<Z<z2)=Φ(z2)−Φ(z1)。小さいZスコアを先に使います。
- 中心確率:P(−z<Z<z)=Φ(z)−Φ(−z)。正の距離 z に対して適用されます。
- 両側確率:P(Z<−z または Z>z)=1−[Φ(z)−Φ(−z)]。中心の外側の面積を表します。
1つのZスコアの計算例
z=1.25 の場合、CDF値はおよそ:
Φ(1.25)≈0.8944 したがって P(Z<1.25)≈0.8944 であり、右側確率は:
P(Z>1.25)=1−Φ(1.25)≈0.1056 平均から z=1.25 までの面積は 0.8944−0.5=0.3944 です。−1.25 から 1.25 の対称的な中心面積は約 0.7888 であり、2つの外側のテールには約 0.2112 が残ります。
2つのZスコアの計算例
P(−1<Z<2) を求める場合、両端点でCDFを使います:
P(−1<Z<2)=Φ(2)−Φ(−1) 標準正規の値を用いると、Φ(2)≈0.9772、Φ(−1)≈0.1587 なので:
P(−1<Z<2)≈0.9772−0.1587=0.8185 計算機は2つの外側の部分、P(Z<−1) および P(Z>2) も表示します。
グラフの色付けと公式の対応
色付けされた各曲線は、公式が示す同じ面積を視覚化しています。左側確率の結果は、左端からZマーカーまでを色付けします。右側確率の結果は、マーカーから右端までを色付けします。区間の確率の結果は、2つのマーカー間の部分だけを色付けします。両側確率や外側確率の結果は、両端を色付けして中央を空白のままにします。
注意事項
- これらの確率は標準正規分布を使用します。Z が標準正規モデルに従う場合に直接適用されます。
- 連続分布では、P(Z<z) と P(Z≤z) は実質的に同じです。単一の点の確率が0であるためです。
- 正規分布に従わないデータの場合、Zスコア確率は近似にすぎない可能性があります。Zスコアは標準化された距離を表すことができますが、正規確率の解釈はモデルに依存します。
よくある質問
なぜ P(Z<0)=0.5 なのか?
標準正規曲線は0を中心に対称です。全面積の半分が平均より左側にあり、残りの半分が右側にあるため、Φ(0)=0.5 となります。
片側確率と両側確率の違いは何ですか?
片側確率は、カットオフから一方向だけを見ます(例:P(Z>z))。両側確率は両方の極端を合わせます(例:P(Z<−z または Z>z))。
なぜ計算機は中心確率と外側確率に −z と z を使うのですか?
これらの形式は、平均を中心とした対称な問いに答えるものです。中心確率は0の両側で同じ距離内にある面積を問い、外側(両側)確率はその距離を超えたどちらかのテールにある面積を問います。