比例置信区间计算器

通过成功次数与样本量，或样本比例与样本量来估计总体比例的置信区间。

输入样本信息

计算结果

置信区间

$35.1598\% \le p \le 48.8402\%$

公式

\hat{p} - ME \le p \le \hat{p} + ME

数值

0.42 - 0.068402 \le p \le 0.42 + 0.068402

在 95% 的置信水平下，估计总体比例介于 35.1598% 和 48.8402% 之间。

由于 n p̂ = 84 且 n(1 - p̂) = 116 都至少为 10，正态近似看起来是合理的。

下限

35.1598%

上限

48.8402%

样本比例 $\hat{p}$

0.42

样本比例 (%)

42%

误差范围

0.068402

标准误 $\mathrm{SE}$

0.0349

z 临界值 $z_{1-\alpha/2}$

1.959964

成功次数

样本量

200

近似样本分布

95% 置信区域

\pm z^*=\pm 1.96

ME=0.0684

下限35.1598%

p̂42%

上限48.8402%

分步计算过程

1. 确定输入值

x=84,\ n=200,\ C=95\%

2. 计算或重申样本比例

\hat{p}=\frac{x}{n}=\frac{84}{200}=0.42

3. 计算标准误 (SE)

SE=\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}=\sqrt{\frac{0.42(1-0.42)}{200}}=0.0349

4. 查找 z 临界值

z_{0.975}=1.959964

5. 计算误差范围 (ME)

ME=1.959964\times 0.0349=0.068402

6. 计算置信区间

\hat{p}\pm ME=0.42\pm 0.068402\Rightarrow 0.351598 \le p \le 0.488402

理解比例置信区间

核心要点：这个计算器能告诉你什么

每当你抽取样本——例如调查 200 人或检测 500 个产品——你都在尝试推断*整个总体*的某种情况。由于样本只是总体的一小部分，你得到的结果只是一个估计值。

这个计算器的核心目标，就是将这个单一估计值转化为一个可靠的区间范围。它不只是给你一个数字，而是提供如下清晰、实用的结论：

> "在 95% 的置信水平下，总体真实比例估计在 35.16% 到 48.84% 之间。"

这为你提供了一个真实答案可能所在的合理范围，并附带支撑你结论所需的误差范围和标准误差。

核心概念：揭开统计学的神秘面纱

在深入数字之前，先了解计算背后的关键概念会大有帮助。

什么是置信区间？

置信区间利用你的样本数据，对未知的总体比例估算一个合理的范围。与其只报告你的样本比例（数学上记为 $\hat{p}$ ），不如报告一个以该估计值为中心、两侧各有一定余量的区间。

"置信水平"是什么意思？

常见的置信水平有 90%、95% 和 99%。这个百分比描述的是该统计方法的长期可靠性。如果你反复抽取随机样本并以完全相同的方式构建区间，大约 95% 的这些区间会包含总体真实比例。

置信水平越高，区间越宽（以确保不遗漏真实值）。
置信水平越低，区间越窄、越精确。

什么是"z 分数"（临界值）？

对于比例置信区间，标准教材方法使用 z 分数临界值。该值来自标准正态分布，根据你选择的置信水平作为乘数使用。置信水平越高，所需的 z 分数越大，最终导致误差范围越大。

方法背后的数学原理

对于标准的双侧 Wald 区间，数学结构相对简单：

\hat{p} \pm z_{1-\alpha/2} \times SE

该公式由以下几部分组成：

$\hat{p}$ ：你的样本比例。
$z_{1-\alpha/2}$ ：z 分数临界值。
$SE$ ：标准误差。

标准误差根据你的比例距离 50% 的远近以及样本量大小来计算：

SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

样本量（ $n$ ）越大，标准误差越小。当观测比例接近 50% 时，标准误差最大，这也是为什么区间在 50/50 附近往往较宽的原因。

假设条件与注意事项

要准确使用此方法，你的样本应当是随机抽取的或具有合理代表性，且各观测值必须相互独立。此外，Wald 区间依赖于正态近似。一个常见的经验法则是确保样本中至少有 10 次"成功"和 10 次"失败"：

n\hat{p} \ge 10 \quad \text{且} \quad n(1-\hat{p}) \ge 10

如果这些值太小，正态近似可能不够准确。此外，当样本量极小或比例极端时，原始公式有时会产生低于 0% 或高于 100% 的结果。由于实际比例不可能超出这个范围，实际解读时应始终将结果限制在 0% 到 100% 之间。

一个完整的计算示例

假设一项调查记录了 200 名参与者中 84 名"是"的回答，你希望计算 95% 置信水平的区间。

1. 计算样本比例：

\hat{p} = \frac{84}{200} = 0.42

2. 确定 z 临界值：对于 95% 的双侧区间，z 值约为：

z_{0.975} = 1.96

3. 计算标准误差：

SE = \sqrt{\frac{0.42(1-0.42)}{200}} \approx 0.0349

4. 计算误差范围：

ME = 1.96 \times 0.0349 \approx 0.0684

5. 计算最终区间：

0.42 \pm 0.0684 = [0.3516,\ 0.4884]

换算成百分比，最终置信区间为 35.16% 至 48.84%。

如何使用这个计算器

这个工具的设计非常灵活，可根据你手头的数据来使用。

第一步：选择输入方式

你可以通过两种方式输入数据：

成功次数与样本量：输入观测到的成功次数（ $x$ ）和总样本量（ $n$ ），计算器会自动完成除法。*（这种方式通常更清晰，避免歧义。）*
样本比例与样本量：直接输入样本比例和 $n$ 。可以输入小数（0.42）或整数百分比（42 或 42%）。计算器将大于 1 的值视为百分比。

> "成功"是什么意思？ > 在统计学中，"成功"只是你所计数的特定结果的标准标签。它可以是调查中的"是"回答、网站上的转化、装配线上的不合格零件，或任何你感兴趣的结果。

第二步：设置置信水平

选择你所需的置信水平（通常为 95%）。计算器将自动填写正确的 z 分数临界值。

*注意：如果特定课程、表格或作业要求你手动输入自定义 z 分数，可以使用高级覆盖选项。启用后，计算器将忽略自动查找，直接使用你输入的精确数值。*

第三步：开始计算

点击计算，立即获取你的置信区间下限和上限、标准误差、误差范围，以及逐步计算过程！