理解Z分数概率
标准正态分布(Standard Normal Distribution)是均值 μ=0、标准差 σ=1 的正态分布。该尺度上的值记作 Z,曲线上的特定位置称为Z分数。
Z分数概率是指标准正态曲线下方的面积。例如,P(Z<z) 是Z分数 z 左侧的面积。由于曲线下方的总面积为1,这些面积可以用作概率或百分比来理解。
累积分布函数(CDF)的作用
标准正态累积分布函数(CDF)记作 Φ(z),给出左尾概率:
Φ(z)=P(Z<z) 一旦求得 Φ(z),其他常见的概率形式均可通过补集、差值和对称性推导得出。
如何解读各概率形式
- 左尾概率:P(Z<z)=Φ(z) 对 z 左侧的所有区域着色。
- 右尾概率:P(Z>z)=1−Φ(z) 对 z 右侧的所有区域着色。
- 两个Z分数之间:P(z1<Z<z2)=Φ(z2)−Φ(z1),先使用较小的Z分数。
- 中心概率:P(−z<Z<z)=Φ(z)−Φ(−z),适用于正数距离 z。
- 双尾概率:P(Z<−z 或 Z>z)=1−[Φ(z)−Φ(−z)],即中心之外的面积。
单个Z分数示例
设 z=1.25,CDF 值约为:
Φ(1.25)≈0.8944 因此 P(Z<1.25)≈0.8944,右尾概率为:
P(Z>1.25)=1−Φ(1.25)≈0.1056 均值到 z=1.25 之间的面积为 0.8944−0.5=0.3944。−1.25 到 1.25 之间的对称中心面积约为 0.7888,两侧尾部合计约 0.2112。
两个Z分数示例
求 P(−1<Z<2) 时,在两个端点处使用CDF:
P(−1<Z<2)=Φ(2)−Φ(−1) 利用标准正态值,Φ(2)≈0.9772,Φ(−1)≈0.1587,故:
P(−1<Z<2)≈0.9772−0.1587=0.8185 计算器还会给出两个外侧部分的值:P(Z<−1) 和 P(Z>2)。
图形着色与公式的对应关系
每条着色曲线都直观地展示了公式所描述的同一面积。左尾结果从最左端着色到Z标记处。右尾结果从Z标记处着色到最右端。区间结果只对两个标记之间的部分着色。双尾或外侧结果对两端着色,中间部分保持空白。
常见注意事项
- 上述概率使用标准正态分布,直接适用于 Z 服从标准正态模型的情形。
- 对于连续分布,P(Z<z) 与 P(Z≤z) 实际上相同,因为单个点的概率为0。
- 对于非正态数据,Z分数概率可能只是近似值。Z分数仍可描述标准化距离,但正态概率的解释取决于所使用的模型。
常见问题
为什么 P(Z<0)=0.5?
标准正态曲线以0为中心对称分布。总面积的一半在均值左侧,另一半在右侧,因此 Φ(0)=0.5。
单尾概率和双尾概率有什么区别?
单尾概率只从截断值出发看一个方向,例如 P(Z>z)。双尾概率则合并了两个极端,例如 P(Z<−z 或 Z>z)。
为什么计算器对中心概率和外侧概率使用 −z 和 z?
这些形式用于回答围绕均值的对称问题。中心概率询问在0两侧相同距离内有多少面积,而外侧(双尾)概率询问超出该距离在任一尾部有多少面积。