ZestCalc
Appearance
Language

均值置信区间计算器

根据汇总统计量,使用 z 值或 t 值临界值估计总体均值。

输入汇总统计量

样本观测值的平均数。

用于估计的观测值数量。

输入数值,然后标明它来自样本还是总体。

此标准差属于

由同一样本估计得到。Auto 使用 t 值。

使用预设值,或输入自定义百分比。常见自定义值为 50 到 99.99。

将填写xˉ\bar{x}均值ss样本偏差nn样本量

汇总预览

nn

0

xˉ\bar{x}

--

ss

--

临界值方法

自动选择的方法

t 值t1α/2, 24t_{1-\alpha/2,\ 24}df = 24

Auto 选择了 df = 24 的 t 值,因为标准差是由样本估计的。

临界值

2.063899

计算结果

置信区间

39.940766μ45.05923439.940766 \le \mu \le 45.059234

公式
xˉMEμxˉ+ME\bar{x} - ME \le \mu \le \bar{x} + ME
数值
42.52.559234μ42.5+2.55923442.5 - 2.559234 \le \mu \le 42.5 + 2.559234

在 95% 置信水平下,总体均值估计位于 39.940766 和 45.059234 之间。

Auto 选择了 df = 24 的 t 值,因为标准差是由样本估计的。

下限

39.940766

上限

45.059234

样本均值xˉ\bar{x}

42.5

误差范围

2.559234

标准误SE\mathrm{SE}

1.24

临界值t1α/2,dft_{1-\alpha/2,df}

2.063899

方法

t 值

df

24

分布与临界值

95% 置信区域±t1α/2, 24=±2.0639\pm t_{1-\alpha/2,\ 24}=\pm 2.0639ME=2.5592ME=2.5592
分布曲线,显示阴影置信水平、临界值和置信区间端点。95% 置信区域-t*+t*2.5%2.5%下限均值上限样本均值
下限39.940766
均值42.5
上限45.059234

逐步计算

1. 确认输入值

xˉ=42.5, s=6.2, n=25, C=95%, method=t-score\bar{x}=42.5,\ s=6.2,\ n=25,\ C=95\%,\ \text{method}=t\text{-score}

2. 计算标准误

SE=sn=6.225=1.24SE=\frac{s}{\sqrt{n}}=\frac{6.2}{\sqrt{25}}=1.24

3. 查找临界值

df=n1=24, t1α/2, 24=2.063899df=n-1=24,\ t_{1-\alpha/2,\ 24}=2.063899

4. 计算误差范围

ME=2.063899×1.24=2.559234ME=2.063899\times 1.24=2.559234

5. 计算置信区间

xˉ±ME=42.5±2.55923439.940766μ45.059234\bar{x}\pm ME=42.5\pm 2.559234\Rightarrow 39.940766 \le \mu \le 45.059234

理解均值置信区间

均值置信区间使用样本数据,为未知的总体均值估计一个合理范围。它不是只报告一个数值,例如样本均值 xˉ\bar{x},而是报告一个以该均值为中心、两侧带有误差范围的区间。

基本结构是:

xˉ±临界值×标准误\bar{x} \pm \text{临界值} \times \text{标准误}

对于均值,标准误为:

SE=标准差nSE = \frac{\text{标准差}}{\sqrt{n}}

因此,当标准差更小或样本量 nn 更大时,区间会变得更窄。

置信水平是什么意思

90%、95% 或 99% 的置信水平描述的是这种方法的长期可靠性。如果你反复抽取随机样本,并用同样的方法构造区间,那么大约 90%、95% 或 99% 的这些区间会包含真实的总体均值。

更高的置信水平需要更大的临界值,所以在使用相同数据时,99% 区间会比 95% 区间更宽。90% 区间更窄,但它对应的方法在长期重复抽样中的覆盖率更低。

双侧区间和单侧区间

此计算器构造的是双侧置信区间。这意味着区间有一个下端点和一个上端点,不确定性会平均分配到分布的两侧尾部。

例如,95% 双侧区间会在区间外留下 5%:左尾 2.5%,右尾 2.5%。因此,临界值来自第 97.5 百分位:

110.952=0.9751 - \frac{1 - 0.95}{2} = 0.975

单侧置信界限回答的是另一个问题。上限回答“总体均值合理地可能有多大?”,形式为 xˉ+临界值×SE\bar{x} + \text{临界值} \times SE。下限回答“总体均值合理地可能有多小?”,形式为 xˉ临界值×SE\bar{x} - \text{临界值} \times SE。有时也会把它们称为右侧界限或左侧界限,但“上限”和“下限”通常更清楚。

由于单侧界限把全部错误概率放在一侧,它们的临界值不同于这里显示的双侧值。95% 单侧界限使用第 95 百分位,而不是 95% 双侧区间使用的第 97.5 百分位。当你需要围绕均值的一个范围时,请使用双侧结果;只有当统计问题明确关注上限或下限时,才使用单侧界限。

z 值或 t 值

当总体标准差 σ\sigma 已知时,使用 z 值。这在教科书题目中很常见,题目会明确给出 σ\sigma

当标准差来自样本,并写作 ss 时,使用 t 值。t 值取决于自由度:

df=n1df = n - 1

对于小样本,t 分布的尾部更厚,因此区间会更宽。随着样本量增大,t 值会接近 z 值。

这就是计算器会询问你的标准差是样本 ss 还是总体 σ\sigma 的原因。在 Auto 模式下,样本 ss 使用 t 值,总体 σ\sigma 使用 z 值。当课程、表格或工作流程要求特定方法时,也可以手动选择 z 值或 t 值。

如何使用计算器

输入样本均值、标准差、样本量和置信水平。选择标准差是样本 ss 还是总体 σ\sigma。大多数问题可以将方法保持为 Auto;如果作业或查表要求特定方法,再手动选择 z 值或 t 值。

如果你有原始观测值,而不是汇总统计量,可以使用原始数据助手。粘贴用逗号、空格或换行分隔的数值,然后应用它们来填入 xˉ\bar{x}、样本标准差和 nn

计算示例

假设某个样本的均值为 xˉ=42.5\bar{x}=42.5,样本标准差为 s=6.2s=6.2,样本量为 n=25n=25,置信水平为 95%。

由于标准差来自样本,因此使用 t 值,其自由度为:

df=251=24df = 25 - 1 = 24

在 95% 置信水平且 df=24df=24 时,临界值约为:

t0.975,24=2.0639t_{0.975,24} = 2.0639

标准误为:

SE=6.225=1.24SE = \frac{6.2}{\sqrt{25}} = 1.24

误差范围为:

ME=2.0639×1.242.56ME = 2.0639 \times 1.24 \approx 2.56

置信区间为:

42.5±2.56=[39.94, 45.06]42.5 \pm 2.56 = [39.94,\ 45.06]

用现实语言来说:在 95% 置信水平下,总体均值估计位于大约 39.94 和 45.06 之间。约 2.56 的误差范围,就是从样本均值到区间任一端点的距离。

假设与注意事项

数据应来自随机样本或具有代表性的样本。观测值应相互独立,也就是说,一个观测值不应决定另一个观测值。

总体应大致服从正态分布,或者样本量足够大,使正态近似具有合理性。异常值、强偏态、测量问题和有偏样本都可能让区间产生误导,即使公式本身计算正确也是如此。

常见问题

我应该使用 z 值还是 t 值?

当总体标准差 σ\sigma 已知时,使用 z 值。当你的标准差是样本标准差 ss 时,使用 t 值。在大多数真实的样本汇总问题中,t 值是更安全的默认选择。

为什么样本量更小会让区间更宽?

标准误会除以 n\sqrt{n}。较小的 nn 会得到更大的标准误,因此误差范围会增大。

为什么更高的置信水平会让区间更宽?

更高的置信水平使用更大的临界值。这个更大的临界值会乘以标准误,从而增加误差范围。

这个计算器是双侧还是单侧?

它是双侧的。计算器会报告下限和上限,并把剩余概率平均分配到两侧尾部。对于单侧上限或下限,请使用单侧临界值,而不是结果中显示的双侧临界值。

如果标准差为 0 会怎样?

标准误为 0,误差范围为 0,区间会收缩为均值本身。当所有观测值都相同时可能会出现这种情况,但你也应该借此检查数据输入是否正确。

可以用于非正态数据吗?

有时可以。如果样本量较大,并且数据没有极端偏斜,也没有被异常值主导,正态近似可能是合理的。对于来自强非正态数据的小样本,请谨慎使用,并考虑适用于该情况的方法。