理解Z分數機率
標準常態分配(Standard Normal Distribution)是均值 μ=0、標準差 σ=1 的常態分配。此尺度上的值記作 Z,曲線上的特定位置稱為Z分數。
Z分數機率是指標準常態曲線下方的面積。例如,P(Z<z) 是Z分數 z 左側的面積。由於曲線下方的總面積為1,這些面積可作為機率或百分比來理解。
累積分配函數(CDF)的作用
標準常態累積分配函數(CDF)記作 Φ(z),給出左尾機率:
Φ(z)=P(Z<z) 一旦求得 Φ(z),其他常見的機率形式均可透過補集、差值和對稱性推導得出。
如何解讀各機率形式
- 左尾機率:P(Z<z)=Φ(z) 對 z 左側的所有區域著色。
- 右尾機率:P(Z>z)=1−Φ(z) 對 z 右側的所有區域著色。
- 兩個Z分數之間:P(z1<Z<z2)=Φ(z2)−Φ(z1),先使用較小的Z分數。
- 中心機率:P(−z<Z<z)=Φ(z)−Φ(−z),適用於正數距離 z。
- 雙尾機率:P(Z<−z 或 Z>z)=1−[Φ(z)−Φ(−z)],即中心以外的面積。
單個Z分數計算範例
設 z=1.25,CDF 值約為:
Φ(1.25)≈0.8944 因此 P(Z<1.25)≈0.8944,右尾機率為:
P(Z>1.25)=1−Φ(1.25)≈0.1056 均值到 z=1.25 之間的面積為 0.8944−0.5=0.3944。−1.25 到 1.25 之間的對稱中心面積約為 0.7888,兩側尾部合計約 0.2112。
兩個Z分數計算範例
求 P(−1<Z<2) 時,在兩個端點處使用CDF:
P(−1<Z<2)=Φ(2)−Φ(−1) 利用標準常態數值,Φ(2)≈0.9772,Φ(−1)≈0.1587,故:
P(−1<Z<2)≈0.9772−0.1587=0.8185 計算機還會給出兩個外側部分的數值:P(Z<−1) 和 P(Z>2)。
圖形著色與公式的對應關係
每條著色曲線都直觀地展示了公式所描述的同一面積。左尾結果從最左端著色到Z標記處。右尾結果從Z標記處著色到最右端。區間結果只對兩個標記之間的部分著色。雙尾或外側結果對兩端著色,中間部分保持空白。
常見注意事項
- 上述機率使用標準常態分配,直接適用於 Z 服從標準常態模型的情形。
- 對於連續分配,P(Z<z) 與 P(Z≤z) 實際上相同,因為單一點的機率為0。
- 對於非常態資料,Z分數機率可能只是近似值。Z分數仍可描述標準化距離,但常態機率的解釋取決於所使用的模型。
常見問題
為什麼 P(Z<0)=0.5?
標準常態曲線以0為中心對稱分布。總面積的一半在均值左側,另一半在右側,因此 Φ(0)=0.5。
單尾機率和雙尾機率有什麼區別?
單尾機率只從截斷值出發看一個方向,例如 P(Z>z)。雙尾機率則合併了兩個極端,例如 P(Z<−z 或 Z>z)。
為什麼計算機對中心機率和外側機率使用 −z 和 z?
這些形式用於回答圍繞均值的對稱問題。中心機率詢問在0兩側相同距離內有多少面積,而外側(雙尾)機率詢問超出該距離在任一尾部有多少面積。