ZestCalc
Appearance
Language

比例置信区间计算器

通过成功次数与样本量,或样本比例与样本量来估计总体比例的置信区间。

输入样本信息

输入模式

已知观测到的成功次数 x 和样本量 n 时使用。

观测到的成功次数 x、赞成数或转化数。

样本中的总观测次数 n。

使用预设值,或输入 50 到 99.99 之间的自定义百分比。

z 分数临界值

推荐大多数情况使用。

z 临界值

z-scorez1α/2z_{1-\alpha/2}

除非您需要匹配特定的统计表,否则请保持为自动。

z 临界值

1.959964

计算结果

置信区间

35.1598%p48.8402%35.1598\% \le p \le 48.8402\%

公式
p^MEpp^+ME\hat{p} - ME \le p \le \hat{p} + ME
数值
0.420.068402p0.42+0.0684020.42 - 0.068402 \le p \le 0.42 + 0.068402

在 95% 的置信水平下,估计总体比例介于 35.1598% 和 48.8402% 之间。

由于 n p̂ = 84 且 n(1 - p̂) = 116 都至少为 10,正态近似看起来是合理的。

下限

35.1598%

上限

48.8402%

样本比例p^\hat{p}

0.42

样本比例 (%)

42%

误差范围

0.068402

标准误SE\mathrm{SE}

0.0349

z 临界值z1α/2z_{1-\alpha/2}

1.959964

成功次数

84

样本量

200

近似样本分布

95% 置信区域±z=±1.96\pm z^*=\pm 1.96ME=0.0684ME=0.0684
正态近似曲线,显示了阴影置信区域、z 临界值以及样本比例的置信区间端点。95% 置信区域-z*+z*2.5%2.5%下限上限样本比例
下限35.1598%
42%
上限48.8402%

分步计算过程

1. 确定输入值

x=84, n=200, C=95%x=84,\ n=200,\ C=95\%

2. 计算或重申样本比例

p^=xn=84200=0.42\hat{p}=\frac{x}{n}=\frac{84}{200}=0.42

3. 计算标准误 (SE)

SE=p^(1p^)n=0.42(10.42)200=0.0349SE=\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}=\sqrt{\frac{0.42(1-0.42)}{200}}=0.0349

4. 查找 z 临界值

z0.975=1.959964z_{0.975}=1.959964

5. 计算误差范围 (ME)

ME=1.959964×0.0349=0.068402ME=1.959964\times 0.0349=0.068402

6. 计算置信区间

p^±ME=0.42±0.0684020.351598p0.488402\hat{p}\pm ME=0.42\pm 0.068402\Rightarrow 0.351598 \le p \le 0.488402

理解比例置信区间

核心要点:这个计算器能告诉你什么

每当你抽取样本——例如调查 200 人或检测 500 个产品——你都在尝试推断*整个总体*的某种情况。由于样本只是总体的一小部分,你得到的结果只是一个估计值。

这个计算器的核心目标,就是将这个单一估计值转化为一个可靠的区间范围。它不只是给你一个数字,而是提供如下清晰、实用的结论:

> "在 95% 的置信水平下,总体真实比例估计在 35.16% 到 48.84% 之间。"

这为你提供了一个真实答案可能所在的合理范围,并附带支撑你结论所需的误差范围和标准误差。


核心概念:揭开统计学的神秘面纱

在深入数字之前,先了解计算背后的关键概念会大有帮助。

什么是置信区间?

置信区间利用你的样本数据,对未知的总体比例估算一个合理的范围。与其只报告你的样本比例(数学上记为 p^\hat{p}),不如报告一个以该估计值为中心、两侧各有一定余量的区间。

"置信水平"是什么意思?

常见的置信水平有 90%、95% 和 99%。这个百分比描述的是该统计方法的长期可靠性。如果你反复抽取随机样本并以完全相同的方式构建区间,大约 95% 的这些区间会包含总体真实比例。

  • 置信水平越高,区间越宽(以确保不遗漏真实值)。
  • 置信水平越低,区间越窄、越精确。

什么是"z 分数"(临界值)?

对于比例置信区间,标准教材方法使用 z 分数临界值。该值来自标准正态分布,根据你选择的置信水平作为乘数使用。置信水平越高,所需的 z 分数越大,最终导致误差范围越大。


方法背后的数学原理

对于标准的双侧 Wald 区间,数学结构相对简单:

p^±z1α/2×SE\hat{p} \pm z_{1-\alpha/2} \times SE

该公式由以下几部分组成:

  • p^\hat{p}:你的样本比例。
  • z1α/2z_{1-\alpha/2}:z 分数临界值。
  • SESE:标准误差。

标准误差根据你的比例距离 50% 的远近以及样本量大小来计算:

SE=p^(1p^)nSE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

样本量(nn)越大,标准误差越小。当观测比例接近 50% 时,标准误差最大,这也是为什么区间在 50/50 附近往往较宽的原因。

假设条件与注意事项

要准确使用此方法,你的样本应当是随机抽取的或具有合理代表性,且各观测值必须相互独立。此外,Wald 区间依赖于正态近似。一个常见的经验法则是确保样本中至少有 10 次"成功"和 10 次"失败":

np^10n(1p^)10n\hat{p} \ge 10 \quad \text{且} \quad n(1-\hat{p}) \ge 10

如果这些值太小,正态近似可能不够准确。此外,当样本量极小或比例极端时,原始公式有时会产生低于 0% 或高于 100% 的结果。由于实际比例不可能超出这个范围,实际解读时应始终将结果限制在 0% 到 100% 之间。

一个完整的计算示例

假设一项调查记录了 200 名参与者中 84 名"是"的回答,你希望计算 95% 置信水平的区间。

1. 计算样本比例:

p^=84200=0.42\hat{p} = \frac{84}{200} = 0.42

2. 确定 z 临界值: 对于 95% 的双侧区间,z 值约为:

z0.975=1.96z_{0.975} = 1.96

3. 计算标准误差:

SE=0.42(10.42)2000.0349SE = \sqrt{\frac{0.42(1-0.42)}{200}} \approx 0.0349

4. 计算误差范围:

ME=1.96×0.03490.0684ME = 1.96 \times 0.0349 \approx 0.0684

5. 计算最终区间:

0.42±0.0684=[0.3516, 0.4884]0.42 \pm 0.0684 = [0.3516,\ 0.4884]

换算成百分比,最终置信区间为 35.16% 至 48.84%


如何使用这个计算器

这个工具的设计非常灵活,可根据你手头的数据来使用。

第一步:选择输入方式

你可以通过两种方式输入数据:

  1. 成功次数与样本量: 输入观测到的成功次数(xx)和总样本量(nn),计算器会自动完成除法。*(这种方式通常更清晰,避免歧义。)*
  2. 样本比例与样本量: 直接输入样本比例和 nn。可以输入小数(0.42)或整数百分比(4242%)。计算器将大于 1 的值视为百分比。

> "成功"是什么意思? > 在统计学中,"成功"只是你所计数的特定结果的标准标签。它可以是调查中的"是"回答、网站上的转化、装配线上的不合格零件,或任何你感兴趣的结果。

第二步:设置置信水平

选择你所需的置信水平(通常为 95%)。计算器将自动填写正确的 z 分数临界值。

*注意:如果特定课程、表格或作业要求你手动输入自定义 z 分数,可以使用高级覆盖选项。启用后,计算器将忽略自动查找,直接使用你输入的精确数值。*

第三步:开始计算

点击计算,立即获取你的置信区间下限和上限、标准误差、误差范围,以及逐步计算过程!