平均數信賴區間計算機

根據摘要統計量，使用 z 值或 t 值臨界值估計母體平均數。

輸入摘要統計量

計算結果

信賴區間

$39.940766 \le \mu \le 45.059234$

公式

\bar{x} - ME \le \mu \le \bar{x} + ME

數值

42.5 - 2.559234 \le \mu \le 42.5 + 2.559234

在 95% 信心水準下，母體平均數估計位於 39.940766 和 45.059234 之間。

Auto 選擇了 df = 24 的 t 值，因為標準差是由樣本估計的。

下限

39.940766

上限

45.059234

樣本平均數 $\bar{x}$

42.5

誤差範圍

2.559234

標準誤 $\mathrm{SE}$

1.24

臨界值 $t_{1-\alpha/2,df}$

2.063899

方法

t 值

df

24

分配與臨界值

95% 信賴區域

\pm t_{1-\alpha/2,\ 24}=\pm 2.0639

ME=2.5592

下限39.940766

平均數42.5

上限45.059234

逐步計算

1. 確認輸入值

\bar{x}=42.5,\ s=6.2,\ n=25,\ C=95\%,\ \text{method}=t\text{-score}

2. 計算標準誤

SE=\frac{s}{\sqrt{n}}=\frac{6.2}{\sqrt{25}}=1.24

3. 查找臨界值

df=n-1=24,\ t_{1-\alpha/2,\ 24}=2.063899

4. 計算誤差範圍

ME=2.063899\times 1.24=2.559234

5. 計算信賴區間

\bar{x}\pm ME=42.5\pm 2.559234\Rightarrow 39.940766 \le \mu \le 45.059234

理解平均數信賴區間

平均數信賴區間使用樣本資料，為未知的母體平均數估計一個合理範圍。它不是只報告一個數值，例如樣本平均數 $\bar{x}$ ，而是報告一個以該平均數為中心、兩側帶有誤差範圍的區間。

基本結構是：

\bar{x} \pm \text{臨界值} \times \text{標準誤}

對於平均數，標準誤為：

SE = \frac{\text{標準差}}{\sqrt{n}}

因此，當標準差更小或樣本大小 $n$ 更大時，區間會變得更窄。

信心水準是什麼意思

90%、95% 或 99% 的信心水準描述的是這種方法的長期可靠性。如果你反覆抽取隨機樣本，並用同樣的方法建立區間，那麼大約 90%、95% 或 99% 的這些區間會包含真正的母體平均數。

更高的信心水準需要更大的臨界值，所以在使用相同資料時，99% 區間會比 95% 區間更寬。90% 區間更窄，但它對應的方法在長期重複抽樣中的涵蓋率較低。

雙側區間和單側區間

此計算機建立的是雙側信賴區間。這表示區間有一個下端點和一個上端點，不確定性會平均分配到分配的兩側尾部。

例如，95% 雙側區間會在區間外留下 5%：左尾 2.5%，右尾 2.5%。因此，臨界值來自第 97.5 百分位：

1 - \frac{1 - 0.95}{2} = 0.975

單側信賴界限回答的是另一個問題。上限回答「母體平均數合理地可能有多大？」形式為 $\bar{x} + \text{臨界值} \times SE$ 。下限回答「母體平均數合理地可能有多小？」形式為 $\bar{x} - \text{臨界值} \times SE$ 。有時也會把它們稱為右側界限或左側界限，但「上限」和「下限」通常更清楚。

由於單側界限把全部錯誤機率放在一側，它們的臨界值不同於這裡顯示的雙側值。95% 單側界限使用第 95 百分位，而不是 95% 雙側區間使用的第 97.5 百分位。當你需要圍繞平均數的一個範圍時，請使用雙側結果；只有當統計問題明確關注上限或下限時，才使用單側界限。

z 值或 t 值

當母體標準差 $\sigma$ 已知時，使用 z 值。這在教科書題目中很常見，題目會明確給出 $\sigma$ 。

當標準差來自樣本，並寫作 $s$ 時，使用 t 值。t 值取決於自由度：

df = n - 1

對於小樣本，t 分配的尾部更厚，因此區間會更寬。隨著樣本大小增加，t 值會接近 z 值。

這就是計算機會詢問你的標準差是樣本 $s$ 還是母體 $\sigma$ 的原因。在 Auto 模式下，樣本 $s$ 使用 t 值，母體 $\sigma$ 使用 z 值。當課程、表格或工作流程要求特定方法時，也可以手動選擇 z 值或 t 值。

如何使用計算機

輸入樣本平均數、標準差、樣本大小和信心水準。選擇標準差是樣本 $s$ 還是母體 $\sigma$ 。大多數問題可以將方法保持為 Auto；如果作業或查表要求特定方法，再手動選擇 z 值或 t 值。

如果你有原始觀測值，而不是摘要統計量，可以使用原始資料助手。貼上用逗號、空格或換行分隔的數值，然後套用它們來填入 $\bar{x}$ 、樣本標準差和 $n$ 。

計算範例

假設某個樣本的平均數為 $\bar{x}=42.5$ ，樣本標準差為 $s=6.2$ ，樣本大小為 $n=25$ ，信心水準為 95%。

由於標準差來自樣本，因此使用 t 值，其自由度為：

df = 25 - 1 = 24

在 95% 信心水準且 $df=24$ 時，臨界值約為：

t_{0.975,24} = 2.0639

標準誤為：

SE = \frac{6.2}{\sqrt{25}} = 1.24

誤差範圍為：

ME = 2.0639 \times 1.24 \approx 2.56

信賴區間為：

42.5 \pm 2.56 = [39.94,\ 45.06]

用實際語言來說：在 95% 信心水準下，母體平均數估計位於大約 39.94 和 45.06 之間。約 2.56 的誤差範圍，就是從樣本平均數到區間任一端點的距離。

假設與注意事項

資料應來自隨機樣本或具有代表性的樣本。觀測值應相互獨立，也就是說，一個觀測值不應決定另一個觀測值。

母體應大致服從常態分配，或者樣本大小足夠大，使常態近似具有合理性。離群值、強偏態、測量問題和有偏樣本都可能讓區間產生誤導，即使公式本身計算正確也是如此。

常見問題

我應該使用 z 值還是 t 值？

當母體標準差 $\sigma$ 已知時，使用 z 值。當你的標準差是樣本標準差 $s$ 時，使用 t 值。在大多數真實的樣本摘要問題中，t 值是更安全的預設選擇。

為什麼樣本大小更小會讓區間更寬？

標準誤會除以 $\sqrt{n}$ 。較小的 $n$ 會得到更大的標準誤，因此誤差範圍會增加。

為什麼更高的信心水準會讓區間更寬？

更高的信心水準使用更大的臨界值。這個更大的臨界值會乘以標準誤，從而增加誤差範圍。

這個計算機是雙側還是單側？

它是雙側的。計算機會報告下限和上限，並把剩餘機率平均分配到兩側尾部。對於單側上限或下限，請使用單側臨界值，而不是結果中顯示的雙側臨界值。

如果標準差為 0 會怎樣？

標準誤為 0，誤差範圍為 0，區間會收縮為平均數本身。當所有觀測值都相同時可能會出現這種情況，但你也應該藉此檢查資料輸入是否正確。

可以用於非常態資料嗎？

有時可以。如果樣本大小較大，並且資料沒有極端偏斜，也沒有被離群值主導，常態近似可能是合理的。對於來自強非常態資料的小樣本，請謹慎使用，並考慮適用於該情況的方法。