均值置信区间计算器

根据汇总统计量，使用 z 值或 t 值临界值估计总体均值。

输入汇总统计量

计算结果

置信区间

$39.940766 \le \mu \le 45.059234$

公式

\bar{x} - ME \le \mu \le \bar{x} + ME

数值

42.5 - 2.559234 \le \mu \le 42.5 + 2.559234

在 95% 置信水平下，总体均值估计位于 39.940766 和 45.059234 之间。

Auto 选择了 df = 24 的 t 值，因为标准差是由样本估计的。

下限

39.940766

上限

45.059234

样本均值 $\bar{x}$

42.5

误差范围

2.559234

标准误 $\mathrm{SE}$

1.24

临界值 $t_{1-\alpha/2,df}$

2.063899

方法

t 值

df

24

分布与临界值

95% 置信区域

\pm t_{1-\alpha/2,\ 24}=\pm 2.0639

ME=2.5592

下限39.940766

均值42.5

上限45.059234

逐步计算

1. 确认输入值

\bar{x}=42.5,\ s=6.2,\ n=25,\ C=95\%,\ \text{method}=t\text{-score}

2. 计算标准误

SE=\frac{s}{\sqrt{n}}=\frac{6.2}{\sqrt{25}}=1.24

3. 查找临界值

df=n-1=24,\ t_{1-\alpha/2,\ 24}=2.063899

4. 计算误差范围

ME=2.063899\times 1.24=2.559234

5. 计算置信区间

\bar{x}\pm ME=42.5\pm 2.559234\Rightarrow 39.940766 \le \mu \le 45.059234

理解均值置信区间

均值置信区间使用样本数据，为未知的总体均值估计一个合理范围。它不是只报告一个数值，例如样本均值 $\bar{x}$ ，而是报告一个以该均值为中心、两侧带有误差范围的区间。

基本结构是：

\bar{x} \pm \text{临界值} \times \text{标准误}

对于均值，标准误为：

SE = \frac{\text{标准差}}{\sqrt{n}}

因此，当标准差更小或样本量 $n$ 更大时，区间会变得更窄。

置信水平是什么意思

90%、95% 或 99% 的置信水平描述的是这种方法的长期可靠性。如果你反复抽取随机样本，并用同样的方法构造区间，那么大约 90%、95% 或 99% 的这些区间会包含真实的总体均值。

更高的置信水平需要更大的临界值，所以在使用相同数据时，99% 区间会比 95% 区间更宽。90% 区间更窄，但它对应的方法在长期重复抽样中的覆盖率更低。

双侧区间和单侧区间

此计算器构造的是双侧置信区间。这意味着区间有一个下端点和一个上端点，不确定性会平均分配到分布的两侧尾部。

例如，95% 双侧区间会在区间外留下 5%：左尾 2.5%，右尾 2.5%。因此，临界值来自第 97.5 百分位：

1 - \frac{1 - 0.95}{2} = 0.975

单侧置信界限回答的是另一个问题。上限回答“总体均值合理地可能有多大？”，形式为 $\bar{x} + \text{临界值} \times SE$ 。下限回答“总体均值合理地可能有多小？”，形式为 $\bar{x} - \text{临界值} \times SE$ 。有时也会把它们称为右侧界限或左侧界限，但“上限”和“下限”通常更清楚。

由于单侧界限把全部错误概率放在一侧，它们的临界值不同于这里显示的双侧值。95% 单侧界限使用第 95 百分位，而不是 95% 双侧区间使用的第 97.5 百分位。当你需要围绕均值的一个范围时，请使用双侧结果；只有当统计问题明确关注上限或下限时，才使用单侧界限。

z 值或 t 值

当总体标准差 $\sigma$ 已知时，使用 z 值。这在教科书题目中很常见，题目会明确给出 $\sigma$ 。

当标准差来自样本，并写作 $s$ 时，使用 t 值。t 值取决于自由度：

df = n - 1

对于小样本，t 分布的尾部更厚，因此区间会更宽。随着样本量增大，t 值会接近 z 值。

这就是计算器会询问你的标准差是样本 $s$ 还是总体 $\sigma$ 的原因。在 Auto 模式下，样本 $s$ 使用 t 值，总体 $\sigma$ 使用 z 值。当课程、表格或工作流程要求特定方法时，也可以手动选择 z 值或 t 值。

如何使用计算器

输入样本均值、标准差、样本量和置信水平。选择标准差是样本 $s$ 还是总体 $\sigma$ 。大多数问题可以将方法保持为 Auto；如果作业或查表要求特定方法，再手动选择 z 值或 t 值。

如果你有原始观测值，而不是汇总统计量，可以使用原始数据助手。粘贴用逗号、空格或换行分隔的数值，然后应用它们来填入 $\bar{x}$ 、样本标准差和 $n$ 。

计算示例

假设某个样本的均值为 $\bar{x}=42.5$ ，样本标准差为 $s=6.2$ ，样本量为 $n=25$ ，置信水平为 95%。

由于标准差来自样本，因此使用 t 值，其自由度为：

df = 25 - 1 = 24

在 95% 置信水平且 $df=24$ 时，临界值约为：

t_{0.975,24} = 2.0639

标准误为：

SE = \frac{6.2}{\sqrt{25}} = 1.24

误差范围为：

ME = 2.0639 \times 1.24 \approx 2.56

置信区间为：

42.5 \pm 2.56 = [39.94,\ 45.06]

用现实语言来说：在 95% 置信水平下，总体均值估计位于大约 39.94 和 45.06 之间。约 2.56 的误差范围，就是从样本均值到区间任一端点的距离。

假设与注意事项

数据应来自随机样本或具有代表性的样本。观测值应相互独立，也就是说，一个观测值不应决定另一个观测值。

总体应大致服从正态分布，或者样本量足够大，使正态近似具有合理性。异常值、强偏态、测量问题和有偏样本都可能让区间产生误导，即使公式本身计算正确也是如此。

常见问题

我应该使用 z 值还是 t 值？

当总体标准差 $\sigma$ 已知时，使用 z 值。当你的标准差是样本标准差 $s$ 时，使用 t 值。在大多数真实的样本汇总问题中，t 值是更安全的默认选择。

为什么样本量更小会让区间更宽？

标准误会除以 $\sqrt{n}$ 。较小的 $n$ 会得到更大的标准误，因此误差范围会增大。

为什么更高的置信水平会让区间更宽？

更高的置信水平使用更大的临界值。这个更大的临界值会乘以标准误，从而增加误差范围。

这个计算器是双侧还是单侧？

它是双侧的。计算器会报告下限和上限，并把剩余概率平均分配到两侧尾部。对于单侧上限或下限，请使用单侧临界值，而不是结果中显示的双侧临界值。

如果标准差为 0 会怎样？

标准误为 0，误差范围为 0，区间会收缩为均值本身。当所有观测值都相同时可能会出现这种情况，但你也应该借此检查数据输入是否正确。

可以用于非正态数据吗？

有时可以。如果样本量较大，并且数据没有极端偏斜，也没有被异常值主导，正态近似可能是合理的。对于来自强非正态数据的小样本，请谨慎使用，并考虑适用于该情况的方法。