ZestCalc
Appearance
Language

標準差計算機

計算母體或樣本的標準差,並提供逐步的過程解析。

輸入數據

計算模式

當您擁有整個數據集時使用(除數:N)。

以逗號、空格或換行符分隔的數字組。

計算結果

標準差(σ)

2.467793

數據個數(N)

10

總和

51

最小值

1

最大值

9

平均數(μ)

5.1

變異數(σ²)

6.09

標準差 — 它的衡量意義與使用方法

標準差(Standard Deviation)是資料集中最常用的離散程度測量指標。它量化了各個數值通常偏離平均數的距離程度。較小的標準差代表資料緊密聚集在平均數周圍;較大的標準差則代表資料分佈得比較分散。

什麼是標準差?

假設有一組包含 NN 個數值的資料 {x1,x2,,xN}\{x_1, x_2, \ldots, x_N\},標準差的計算包含以下五個步驟:

  1. 求出平均數(均值) xˉ=i=1NxiN\bar{x} = \dfrac{\sum_{i=1}^{N} x_i}{N}
  2. 計算每個數值的離差 di=xixˉd_i = x_i - \bar{x}
  3. 將每個離差平方 di2d_i^2
  4. 求出這些離差平方的平均數,計算出變異數
  5. 計算平方根,得出標準差

最後一步計算平方根,可將單位還原成與原始資料一致的維度,讓標準差可以直接跟平均數放在一起解讀。

對於母體(Population)運算(當你掌握了一個群體的全部 NN 個數值時):

σ=i=1N(xiμ)2N\sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}}

對於樣本(Sample)運算(你的 NN 個數值是從一個更大的群體中抽取的):

s=i=1N(xixˉ)2N1s = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \bar{x})^2}{N - 1}}

為什麼樣本標準差要除以 N−1(貝塞爾校正)

當你只有樣本資料時,樣本平均數 xˉ\bar{x} 當然會比真實的母體平均數 μ\mu 更靠近這些樣本數值。這就會導致計算出來的原始離差平方和比本來應有的值偏小——換句話說,如果除以 NN,會對母體變異數給出一個有偏估計(系統性偏低)。

為了解決這個問題,除以 N1N - 1 正是為了修正這種偏差。這種校正方法被稱為貝塞爾校正(Bessel's correction),它使得 s2s^2 成為母體變異數 σ2\sigma^2不偏估計量

直觀理解:對於一個樣本大小為 NN 的樣本,只有 N1N - 1 個離差是真正「自由」的——一旦你確定了前 N1N - 1 個離差和平均數,最後一個離差就已經注定了。因此,你只有 N1N - 1自由度

隨著樣本大小的增加,NNN1N - 1 變得幾乎相等,這種差異也就隨之消失——這是符合邏輯的,因為一個極其龐大的樣本,本質上幾乎等同於整個母體。

從樣本推算母體:標準誤

樣本標準差 ss 描述了你的樣本內部數值的離散程度。但在很多時候,研究人員更關心的是:樣本平均數 xˉ\bar{x} 在估計母體平均數 μ\mu 時究竟有多精準?

答案就是平均數標準誤(SEM, Standard Error of the Mean)

SEM=sN\text{SEM} = \frac{s}{\sqrt{N}}

隨著你收集的資料越多,SEM 就會縮小(它與 1/N1/\sqrt{N} 成正比),這就證實了「樣本越大、估計越可靠」的直觀感覺。

舉個例子,如果有 N=25N = 25 名學生的測試分數樣本,標準差為 s=10s = 10,那麼 SEM 就是 10/25=210 / \sqrt{25} = 2。對於真實平均分數的 95% 信賴區間,大約為 xˉ±1.96×SEM\bar{x} \pm 1.96 \times \text{SEM},其中的 1.96 是來自標準常態分配中涵蓋中心 95% 面積的臨界值。

如何使用本計算機

  1. 在文字方塊中輸入你的數值,用逗號、空格或是換行分隔都可以。
  2. 選擇運算模式 — 如果你的資料代表你所關心的整個群體,請使用「母體」;如果它只是更大母體的子集,請使用「樣本」。
  3. 點擊「計算」(或者直接保留預設資料看看範例)。
  4. 讀取計算結果 — 統計卡片會顯示資料的個數、總和、平均數、變異數以及標準差,並帶有相對應的統計學符號(μ\mu/xˉ\bar{x}σ2\sigma^2/s2s^2σ\sigma/ss)。
  5. 展開「逐步解析方案」區塊,你能夠看到完整的推導計算過程,全部使用高質感的 LaTeX 公式渲染。

如何解讀結果

統計項母體符號樣本符號意義
個數NNNN輸入的數值數量
總和xi\sum x_ixi\sum x_i所有數值加起來的總計
平均數μ\muxˉ\bar{x}平均大小
變異數σ2\sigma^2s2s^2離差平方的平均值
標準差σ\sigmass偏離平均數的典型距離

標準差接近 0 代表所有的數值幾乎是相同的。如果標準差大過平均數,常常顯示有極高的相對變異性。