平均數信賴區間計算機
根據摘要統計量,使用 z 值或 t 值臨界值估計母體平均數。
輸入摘要統計量
計算結果
信賴區間
在 95% 信心水準下,母體平均數估計位於 39.940766 和 45.059234 之間。
Auto 選擇了 df = 24 的 t 值,因為標準差是由樣本估計的。
下限
39.940766
上限
45.059234
樣本平均數
42.5
誤差範圍
2.559234
標準誤
1.24
臨界值
2.063899
方法
t 值
df
24
分配與臨界值
逐步計算
1. 確認輸入值
2. 計算標準誤
3. 查找臨界值
4. 計算誤差範圍
5. 計算信賴區間
理解平均數信賴區間
平均數信賴區間使用樣本資料,為未知的母體平均數估計一個合理範圍。它不是只報告一個數值,例如樣本平均數 ,而是報告一個以該平均數為中心、兩側帶有誤差範圍的區間。
基本結構是:
對於平均數,標準誤為:
因此,當標準差更小或樣本大小 更大時,區間會變得更窄。
信心水準是什麼意思
90%、95% 或 99% 的信心水準描述的是這種方法的長期可靠性。如果你反覆抽取隨機樣本,並用同樣的方法建立區間,那麼大約 90%、95% 或 99% 的這些區間會包含真正的母體平均數。
更高的信心水準需要更大的臨界值,所以在使用相同資料時,99% 區間會比 95% 區間更寬。90% 區間更窄,但它對應的方法在長期重複抽樣中的涵蓋率較低。
雙側區間和單側區間
此計算機建立的是雙側信賴區間。這表示區間有一個下端點和一個上端點,不確定性會平均分配到分配的兩側尾部。
例如,95% 雙側區間會在區間外留下 5%:左尾 2.5%,右尾 2.5%。因此,臨界值來自第 97.5 百分位:
單側信賴界限回答的是另一個問題。上限回答「母體平均數合理地可能有多大?」形式為 。下限回答「母體平均數合理地可能有多小?」形式為 。有時也會把它們稱為右側界限或左側界限,但「上限」和「下限」通常更清楚。
由於單側界限把全部錯誤機率放在一側,它們的臨界值不同於這裡顯示的雙側值。95% 單側界限使用第 95 百分位,而不是 95% 雙側區間使用的第 97.5 百分位。當你需要圍繞平均數的一個範圍時,請使用雙側結果;只有當統計問題明確關注上限或下限時,才使用單側界限。
z 值或 t 值
當母體標準差 已知時,使用 z 值。這在教科書題目中很常見,題目會明確給出 。
當標準差來自樣本,並寫作 時,使用 t 值。t 值取決於自由度:
對於小樣本,t 分配的尾部更厚,因此區間會更寬。隨著樣本大小增加,t 值會接近 z 值。
這就是計算機會詢問你的標準差是樣本 還是母體 的原因。在 Auto 模式下,樣本 使用 t 值,母體 使用 z 值。當課程、表格或工作流程要求特定方法時,也可以手動選擇 z 值或 t 值。
如何使用計算機
輸入樣本平均數、標準差、樣本大小和信心水準。選擇標準差是樣本 還是母體 。大多數問題可以將方法保持為 Auto;如果作業或查表要求特定方法,再手動選擇 z 值或 t 值。
如果你有原始觀測值,而不是摘要統計量,可以使用原始資料助手。貼上用逗號、空格或換行分隔的數值,然後套用它們來填入 、樣本標準差和 。
計算範例
假設某個樣本的平均數為 ,樣本標準差為 ,樣本大小為 ,信心水準為 95%。
由於標準差來自樣本,因此使用 t 值,其自由度為:
在 95% 信心水準且 時,臨界值約為:
標準誤為:
誤差範圍為:
信賴區間為:
用實際語言來說:在 95% 信心水準下,母體平均數估計位於大約 39.94 和 45.06 之間。約 2.56 的誤差範圍,就是從樣本平均數到區間任一端點的距離。
假設與注意事項
資料應來自隨機樣本或具有代表性的樣本。觀測值應相互獨立,也就是說,一個觀測值不應決定另一個觀測值。
母體應大致服從常態分配,或者樣本大小足夠大,使常態近似具有合理性。離群值、強偏態、測量問題和有偏樣本都可能讓區間產生誤導,即使公式本身計算正確也是如此。
常見問題
我應該使用 z 值還是 t 值?
當母體標準差 已知時,使用 z 值。當你的標準差是樣本標準差 時,使用 t 值。在大多數真實的樣本摘要問題中,t 值是更安全的預設選擇。
為什麼樣本大小更小會讓區間更寬?
標準誤會除以 。較小的 會得到更大的標準誤,因此誤差範圍會增加。
為什麼更高的信心水準會讓區間更寬?
更高的信心水準使用更大的臨界值。這個更大的臨界值會乘以標準誤,從而增加誤差範圍。
這個計算機是雙側還是單側?
它是雙側的。計算機會報告下限和上限,並把剩餘機率平均分配到兩側尾部。對於單側上限或下限,請使用單側臨界值,而不是結果中顯示的雙側臨界值。
如果標準差為 0 會怎樣?
標準誤為 0,誤差範圍為 0,區間會收縮為平均數本身。當所有觀測值都相同時可能會出現這種情況,但你也應該藉此檢查資料輸入是否正確。
可以用於非常態資料嗎?
有時可以。如果樣本大小較大,並且資料沒有極端偏斜,也沒有被離群值主導,常態近似可能是合理的。對於來自強非常態資料的小樣本,請謹慎使用,並考慮適用於該情況的方法。
相關工具
其他適合與信賴區間計算搭配使用的統計計算機。