均值置信区间计算器
根据汇总统计量,使用 z 值或 t 值临界值估计总体均值。
输入汇总统计量
计算结果
置信区间
在 95% 置信水平下,总体均值估计位于 39.940766 和 45.059234 之间。
Auto 选择了 df = 24 的 t 值,因为标准差是由样本估计的。
下限
39.940766
上限
45.059234
样本均值
42.5
误差范围
2.559234
标准误
1.24
临界值
2.063899
方法
t 值
df
24
分布与临界值
逐步计算
1. 确认输入值
2. 计算标准误
3. 查找临界值
4. 计算误差范围
5. 计算置信区间
理解均值置信区间
均值置信区间使用样本数据,为未知的总体均值估计一个合理范围。它不是只报告一个数值,例如样本均值 ,而是报告一个以该均值为中心、两侧带有误差范围的区间。
基本结构是:
对于均值,标准误为:
因此,当标准差更小或样本量 更大时,区间会变得更窄。
置信水平是什么意思
90%、95% 或 99% 的置信水平描述的是这种方法的长期可靠性。如果你反复抽取随机样本,并用同样的方法构造区间,那么大约 90%、95% 或 99% 的这些区间会包含真实的总体均值。
更高的置信水平需要更大的临界值,所以在使用相同数据时,99% 区间会比 95% 区间更宽。90% 区间更窄,但它对应的方法在长期重复抽样中的覆盖率更低。
双侧区间和单侧区间
此计算器构造的是双侧置信区间。这意味着区间有一个下端点和一个上端点,不确定性会平均分配到分布的两侧尾部。
例如,95% 双侧区间会在区间外留下 5%:左尾 2.5%,右尾 2.5%。因此,临界值来自第 97.5 百分位:
单侧置信界限回答的是另一个问题。上限回答“总体均值合理地可能有多大?”,形式为 。下限回答“总体均值合理地可能有多小?”,形式为 。有时也会把它们称为右侧界限或左侧界限,但“上限”和“下限”通常更清楚。
由于单侧界限把全部错误概率放在一侧,它们的临界值不同于这里显示的双侧值。95% 单侧界限使用第 95 百分位,而不是 95% 双侧区间使用的第 97.5 百分位。当你需要围绕均值的一个范围时,请使用双侧结果;只有当统计问题明确关注上限或下限时,才使用单侧界限。
z 值或 t 值
当总体标准差 已知时,使用 z 值。这在教科书题目中很常见,题目会明确给出 。
当标准差来自样本,并写作 时,使用 t 值。t 值取决于自由度:
对于小样本,t 分布的尾部更厚,因此区间会更宽。随着样本量增大,t 值会接近 z 值。
这就是计算器会询问你的标准差是样本 还是总体 的原因。在 Auto 模式下,样本 使用 t 值,总体 使用 z 值。当课程、表格或工作流程要求特定方法时,也可以手动选择 z 值或 t 值。
如何使用计算器
输入样本均值、标准差、样本量和置信水平。选择标准差是样本 还是总体 。大多数问题可以将方法保持为 Auto;如果作业或查表要求特定方法,再手动选择 z 值或 t 值。
如果你有原始观测值,而不是汇总统计量,可以使用原始数据助手。粘贴用逗号、空格或换行分隔的数值,然后应用它们来填入 、样本标准差和 。
计算示例
假设某个样本的均值为 ,样本标准差为 ,样本量为 ,置信水平为 95%。
由于标准差来自样本,因此使用 t 值,其自由度为:
在 95% 置信水平且 时,临界值约为:
标准误为:
误差范围为:
置信区间为:
用现实语言来说:在 95% 置信水平下,总体均值估计位于大约 39.94 和 45.06 之间。约 2.56 的误差范围,就是从样本均值到区间任一端点的距离。
假设与注意事项
数据应来自随机样本或具有代表性的样本。观测值应相互独立,也就是说,一个观测值不应决定另一个观测值。
总体应大致服从正态分布,或者样本量足够大,使正态近似具有合理性。异常值、强偏态、测量问题和有偏样本都可能让区间产生误导,即使公式本身计算正确也是如此。
常见问题
我应该使用 z 值还是 t 值?
当总体标准差 已知时,使用 z 值。当你的标准差是样本标准差 时,使用 t 值。在大多数真实的样本汇总问题中,t 值是更安全的默认选择。
为什么样本量更小会让区间更宽?
标准误会除以 。较小的 会得到更大的标准误,因此误差范围会增大。
为什么更高的置信水平会让区间更宽?
更高的置信水平使用更大的临界值。这个更大的临界值会乘以标准误,从而增加误差范围。
这个计算器是双侧还是单侧?
它是双侧的。计算器会报告下限和上限,并把剩余概率平均分配到两侧尾部。对于单侧上限或下限,请使用单侧临界值,而不是结果中显示的双侧临界值。
如果标准差为 0 会怎样?
标准误为 0,误差范围为 0,区间会收缩为均值本身。当所有观测值都相同时可能会出现这种情况,但你也应该借此检查数据输入是否正确。
可以用于非正态数据吗?
有时可以。如果样本量较大,并且数据没有极端偏斜,也没有被异常值主导,正态近似可能是合理的。对于来自强非正态数据的小样本,请谨慎使用,并考虑适用于该情况的方法。
相关工具
其他适合与置信区间计算搭配使用的统计计算器。