ZestCalc
Appearance
Language

平均數信賴區間計算機

根據摘要統計量,使用 z 值或 t 值臨界值估計母體平均數。

輸入摘要統計量

樣本觀測值的平均數。

用於估計的觀測值數量。

輸入數值,然後標明它來自樣本還是母體。

此標準差屬於

由同一樣本估計得到。Auto 使用 t 值。

使用預設值,或輸入自訂百分比。常見自訂值為 50 到 99.99。

將填寫xˉ\bar{x}平均數ss樣本偏差nn樣本大小

摘要預覽

nn

0

xˉ\bar{x}

--

ss

--

臨界值方法

自動選擇的方法

t 值t1α/2, 24t_{1-\alpha/2,\ 24}df = 24

Auto 選擇了 df = 24 的 t 值,因為標準差是由樣本估計的。

臨界值

2.063899

計算結果

信賴區間

39.940766μ45.05923439.940766 \le \mu \le 45.059234

公式
xˉMEμxˉ+ME\bar{x} - ME \le \mu \le \bar{x} + ME
數值
42.52.559234μ42.5+2.55923442.5 - 2.559234 \le \mu \le 42.5 + 2.559234

在 95% 信心水準下,母體平均數估計位於 39.940766 和 45.059234 之間。

Auto 選擇了 df = 24 的 t 值,因為標準差是由樣本估計的。

下限

39.940766

上限

45.059234

樣本平均數xˉ\bar{x}

42.5

誤差範圍

2.559234

標準誤SE\mathrm{SE}

1.24

臨界值t1α/2,dft_{1-\alpha/2,df}

2.063899

方法

t 值

df

24

分配與臨界值

95% 信賴區域±t1α/2, 24=±2.0639\pm t_{1-\alpha/2,\ 24}=\pm 2.0639ME=2.5592ME=2.5592
分配曲線,顯示陰影信心水準、臨界值和信賴區間端點。95% 信賴區域-t*+t*2.5%2.5%下限平均數上限樣本平均數
下限39.940766
平均數42.5
上限45.059234

逐步計算

1. 確認輸入值

xˉ=42.5, s=6.2, n=25, C=95%, method=t-score\bar{x}=42.5,\ s=6.2,\ n=25,\ C=95\%,\ \text{method}=t\text{-score}

2. 計算標準誤

SE=sn=6.225=1.24SE=\frac{s}{\sqrt{n}}=\frac{6.2}{\sqrt{25}}=1.24

3. 查找臨界值

df=n1=24, t1α/2, 24=2.063899df=n-1=24,\ t_{1-\alpha/2,\ 24}=2.063899

4. 計算誤差範圍

ME=2.063899×1.24=2.559234ME=2.063899\times 1.24=2.559234

5. 計算信賴區間

xˉ±ME=42.5±2.55923439.940766μ45.059234\bar{x}\pm ME=42.5\pm 2.559234\Rightarrow 39.940766 \le \mu \le 45.059234

理解平均數信賴區間

平均數信賴區間使用樣本資料,為未知的母體平均數估計一個合理範圍。它不是只報告一個數值,例如樣本平均數 xˉ\bar{x},而是報告一個以該平均數為中心、兩側帶有誤差範圍的區間。

基本結構是:

xˉ±臨界值×標準誤\bar{x} \pm \text{臨界值} \times \text{標準誤}

對於平均數,標準誤為:

SE=標準差nSE = \frac{\text{標準差}}{\sqrt{n}}

因此,當標準差更小或樣本大小 nn 更大時,區間會變得更窄。

信心水準是什麼意思

90%、95% 或 99% 的信心水準描述的是這種方法的長期可靠性。如果你反覆抽取隨機樣本,並用同樣的方法建立區間,那麼大約 90%、95% 或 99% 的這些區間會包含真正的母體平均數。

更高的信心水準需要更大的臨界值,所以在使用相同資料時,99% 區間會比 95% 區間更寬。90% 區間更窄,但它對應的方法在長期重複抽樣中的涵蓋率較低。

雙側區間和單側區間

此計算機建立的是雙側信賴區間。這表示區間有一個下端點和一個上端點,不確定性會平均分配到分配的兩側尾部。

例如,95% 雙側區間會在區間外留下 5%:左尾 2.5%,右尾 2.5%。因此,臨界值來自第 97.5 百分位:

110.952=0.9751 - \frac{1 - 0.95}{2} = 0.975

單側信賴界限回答的是另一個問題。上限回答「母體平均數合理地可能有多大?」形式為 xˉ+臨界值×SE\bar{x} + \text{臨界值} \times SE。下限回答「母體平均數合理地可能有多小?」形式為 xˉ臨界值×SE\bar{x} - \text{臨界值} \times SE。有時也會把它們稱為右側界限或左側界限,但「上限」和「下限」通常更清楚。

由於單側界限把全部錯誤機率放在一側,它們的臨界值不同於這裡顯示的雙側值。95% 單側界限使用第 95 百分位,而不是 95% 雙側區間使用的第 97.5 百分位。當你需要圍繞平均數的一個範圍時,請使用雙側結果;只有當統計問題明確關注上限或下限時,才使用單側界限。

z 值或 t 值

當母體標準差 σ\sigma 已知時,使用 z 值。這在教科書題目中很常見,題目會明確給出 σ\sigma

當標準差來自樣本,並寫作 ss 時,使用 t 值。t 值取決於自由度:

df=n1df = n - 1

對於小樣本,t 分配的尾部更厚,因此區間會更寬。隨著樣本大小增加,t 值會接近 z 值。

這就是計算機會詢問你的標準差是樣本 ss 還是母體 σ\sigma 的原因。在 Auto 模式下,樣本 ss 使用 t 值,母體 σ\sigma 使用 z 值。當課程、表格或工作流程要求特定方法時,也可以手動選擇 z 值或 t 值。

如何使用計算機

輸入樣本平均數、標準差、樣本大小和信心水準。選擇標準差是樣本 ss 還是母體 σ\sigma。大多數問題可以將方法保持為 Auto;如果作業或查表要求特定方法,再手動選擇 z 值或 t 值。

如果你有原始觀測值,而不是摘要統計量,可以使用原始資料助手。貼上用逗號、空格或換行分隔的數值,然後套用它們來填入 xˉ\bar{x}、樣本標準差和 nn

計算範例

假設某個樣本的平均數為 xˉ=42.5\bar{x}=42.5,樣本標準差為 s=6.2s=6.2,樣本大小為 n=25n=25,信心水準為 95%。

由於標準差來自樣本,因此使用 t 值,其自由度為:

df=251=24df = 25 - 1 = 24

在 95% 信心水準且 df=24df=24 時,臨界值約為:

t0.975,24=2.0639t_{0.975,24} = 2.0639

標準誤為:

SE=6.225=1.24SE = \frac{6.2}{\sqrt{25}} = 1.24

誤差範圍為:

ME=2.0639×1.242.56ME = 2.0639 \times 1.24 \approx 2.56

信賴區間為:

42.5±2.56=[39.94, 45.06]42.5 \pm 2.56 = [39.94,\ 45.06]

用實際語言來說:在 95% 信心水準下,母體平均數估計位於大約 39.94 和 45.06 之間。約 2.56 的誤差範圍,就是從樣本平均數到區間任一端點的距離。

假設與注意事項

資料應來自隨機樣本或具有代表性的樣本。觀測值應相互獨立,也就是說,一個觀測值不應決定另一個觀測值。

母體應大致服從常態分配,或者樣本大小足夠大,使常態近似具有合理性。離群值、強偏態、測量問題和有偏樣本都可能讓區間產生誤導,即使公式本身計算正確也是如此。

常見問題

我應該使用 z 值還是 t 值?

當母體標準差 σ\sigma 已知時,使用 z 值。當你的標準差是樣本標準差 ss 時,使用 t 值。在大多數真實的樣本摘要問題中,t 值是更安全的預設選擇。

為什麼樣本大小更小會讓區間更寬?

標準誤會除以 n\sqrt{n}。較小的 nn 會得到更大的標準誤,因此誤差範圍會增加。

為什麼更高的信心水準會讓區間更寬?

更高的信心水準使用更大的臨界值。這個更大的臨界值會乘以標準誤,從而增加誤差範圍。

這個計算機是雙側還是單側?

它是雙側的。計算機會報告下限和上限,並把剩餘機率平均分配到兩側尾部。對於單側上限或下限,請使用單側臨界值,而不是結果中顯示的雙側臨界值。

如果標準差為 0 會怎樣?

標準誤為 0,誤差範圍為 0,區間會收縮為平均數本身。當所有觀測值都相同時可能會出現這種情況,但你也應該藉此檢查資料輸入是否正確。

可以用於非常態資料嗎?

有時可以。如果樣本大小較大,並且資料沒有極端偏斜,也沒有被離群值主導,常態近似可能是合理的。對於來自強非常態資料的小樣本,請謹慎使用,並考慮適用於該情況的方法。