標準差計算機
計算母體或樣本的標準差,並提供逐步的過程解析。
輸入數據
計算模式
當您擁有整個數據集時使用(除數:N)。
以逗號、空格或換行符分隔的數字組。
計算結果
標準差(σ)
2.467793
數據個數(N)
10
總和
51
最小值
1
最大值
9
平均數(μ)
5.1
變異數(σ²)
6.09
標準差 — 它的衡量意義與使用方法
標準差(Standard Deviation)是資料集中最常用的離散程度測量指標。它量化了各個數值通常偏離平均數的距離程度。較小的標準差代表資料緊密聚集在平均數周圍;較大的標準差則代表資料分佈得比較分散。
什麼是標準差?
假設有一組包含 個數值的資料 ,標準差的計算包含以下五個步驟:
- 求出平均數(均值)
- 計算每個數值的離差
- 將每個離差平方
- 求出這些離差平方的平均數,計算出變異數
- 計算平方根,得出標準差
最後一步計算平方根,可將單位還原成與原始資料一致的維度,讓標準差可以直接跟平均數放在一起解讀。
對於母體(Population)運算(當你掌握了一個群體的全部 個數值時):
對於樣本(Sample)運算(你的 個數值是從一個更大的群體中抽取的):
為什麼樣本標準差要除以 N−1(貝塞爾校正)
當你只有樣本資料時,樣本平均數 當然會比真實的母體平均數 更靠近這些樣本數值。這就會導致計算出來的原始離差平方和比本來應有的值偏小——換句話說,如果除以 ,會對母體變異數給出一個有偏估計(系統性偏低)。
為了解決這個問題,除以 正是為了修正這種偏差。這種校正方法被稱為貝塞爾校正(Bessel's correction),它使得 成為母體變異數 的不偏估計量。
直觀理解:對於一個樣本大小為 的樣本,只有 個離差是真正「自由」的——一旦你確定了前 個離差和平均數,最後一個離差就已經注定了。因此,你只有 個自由度。
隨著樣本大小的增加, 和 變得幾乎相等,這種差異也就隨之消失——這是符合邏輯的,因為一個極其龐大的樣本,本質上幾乎等同於整個母體。
從樣本推算母體:標準誤
樣本標準差 描述了你的樣本內部數值的離散程度。但在很多時候,研究人員更關心的是:樣本平均數 在估計母體平均數 時究竟有多精準?
答案就是平均數標準誤(SEM, Standard Error of the Mean):
隨著你收集的資料越多,SEM 就會縮小(它與 成正比),這就證實了「樣本越大、估計越可靠」的直觀感覺。
舉個例子,如果有 名學生的測試分數樣本,標準差為 ,那麼 SEM 就是 。對於真實平均分數的 95% 信賴區間,大約為 ,其中的 1.96 是來自標準常態分配中涵蓋中心 95% 面積的臨界值。
如何使用本計算機
- 在文字方塊中輸入你的數值,用逗號、空格或是換行分隔都可以。
- 選擇運算模式 — 如果你的資料代表你所關心的整個群體,請使用「母體」;如果它只是更大母體的子集,請使用「樣本」。
- 點擊「計算」(或者直接保留預設資料看看範例)。
- 讀取計算結果 — 統計卡片會顯示資料的個數、總和、平均數、變異數以及標準差,並帶有相對應的統計學符號(/,/,/)。
- 展開「逐步解析方案」區塊,你能夠看到完整的推導計算過程,全部使用高質感的 LaTeX 公式渲染。
如何解讀結果
| 統計項 | 母體符號 | 樣本符號 | 意義 |
|---|---|---|---|
| 個數 | 輸入的數值數量 | ||
| 總和 | 所有數值加起來的總計 | ||
| 平均數 | 平均大小 | ||
| 變異數 | 離差平方的平均值 | ||
| 標準差 | 偏離平均數的典型距離 |
標準差接近 0 代表所有的數值幾乎是相同的。如果標準差大過平均數,常常顯示有極高的相對變異性。