ZestCalc
Appearance
Language

标准差计算器

计算总体或样本的标准差,并提供逐步的过程解析。

输入数据

计算模式

当您拥有整个数据集时使用(除数:N)。

以逗号、空格或换行符分隔的数字组。

计算结果

标准差(σ)

2.467793

数据个数(N)

10

总和

51

最小值

1

最大值

9

平均数(μ)

5.1

方差(σ²)

6.09

标准差 — 它的衡量意义与使用方法

标准差(Standard Deviation)是数据集中最常用的离散程度度量指标。它量化了各个数值通常偏离平均值的距离程度。较小的标准差意味着数据紧密聚集在平均值周围;较大的标准差则表明数据分布得比较分散。

什么是标准差?

假设有一组包含 NN 个数值的数据 {x1,x2,,xN}\{x_1, x_2, \ldots, x_N\},标准差的计算包含以下五个步骤:

  1. 求平均值(均值) xˉ=i=1NxiN\bar{x} = \dfrac{\sum_{i=1}^{N} x_i}{N}
  2. 计算每次的离差 di=xixˉd_i = x_i - \bar{x}
  3. 将每次的离差平方 di2d_i^2
  4. 求这些离差平方的平均值,计算出方差
  5. 计算平方根,得出标准差

最后一步计算平方根,可将单位还原为与原始数据一致的尺度,使标准差可以和平均值放在一起直接解读。

对于总体(Population)运算(当你掌握了一个群体的全部 NN 个数值时):

σ=i=1N(xiμ)2N\sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}}

对于样本(Sample)运算(你的 NN 个数值是从一个更大的群体中抽取的):

s=i=1N(xixˉ)2N1s = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \bar{x})^2}{N - 1}}

为什么样本标准差要用 N−1(贝塞尔校正)

当你只有样本数据时,样本均值 xˉ\bar{x} 显然会比真实的总体均值 μ\mu 更靠近这些样本数值。这就会导致计算出来的原始离差平方的数值比本来应有的值偏小——换句话说,如果除以 NN,会对总体方差给出一个有偏估计(系统性偏低)。

相反,除以 N1N - 1 正是为了修正这种偏差。这种校正方法被称为贝塞尔校正(Bessel's correction),它使得 s2s^2 成为总体方差 σ2\sigma^2无偏估计量

直观理解:对于一个样本容量为 NN 的样本,只有 N1N - 1 个离差是真正“自由”的——一旦你确定了前 N1N - 1 个离差和平均值,最后一个离差就已经注定了。因此,你只有 N1N - 1自由度

随着样本容量的增大,NNN1N - 1 变得几乎相等,这种差异也就随之消失——这是符合逻辑的,因为一个极其庞大的样本,本质上几乎等同于整个总体。

从样本推算总体:标准误

样本标准差 ss 描述了你的样本内部数值的离散程度。但在很多时候,研究人员更关心的是:样本均值 xˉ\bar{x} 在估计总体均值 μ\mu 时究竟有多准确?

答案就是均值标准误(SEM, Standard Error of the Mean)

SEM=sN\text{SEM} = \frac{s}{\sqrt{N}}

随着你收集的数据越多,SEM 就会缩小(它与 1/N1/\sqrt{N} 成正比),这就将“样本越大、估计越可靠”的直观感觉公式化了。

举个例子,如果有 N=25N = 25 名学生的测试分数样本,标准差为 s=10s = 10,那么 SEM 就是 10/25=210 / \sqrt{25} = 2。对于真实平均分数的 95% 置信区间,大约为 xˉ±1.96×SEM\bar{x} \pm 1.96 \times \text{SEM},其中的 1.96 是来自标准正态分布中覆盖中心 95% 面积区域的临界值。

如何使用本计算器

  1. 在文本框中输入你的数值,用逗号、空格或者回车换行分隔都可以。
  2. 选择计算模式 — 如果你的数据代表你所关心的整个群体,请使用“总体”;如果它只是更大总体的子集,请使用“样本”。
  3. 点击“计算”(或是直接保留默认数据看看演算示例)。
  4. 读取计算结果 — 结果卡片会展示数据的个数、总和、均值、方差以及标准差,并带有相应的统计学符号(μ\mu/xˉ\bar{x}σ2\sigma^2/s2s^2σ\sigma/ss)。
  5. 展开“逐步解析(Step-by-Step)”面板,你能够看到完整的推导演算计算过程,全部使用高雅的 LaTeX 公式渲染。

如何解读结果

统计项总体符号样本符号含义
数据个数NNNN输入的数值数量
总和xi\sum x_ixi\sum x_i所有数值加起来的总计数
均值μ\muxˉ\bar{x}平均大小
方差σ2\sigma^2s2s^2离差平方的均值
标准差σ\sigmass偏离平均值的典型距离尺度

标准差接近 0 意味着所有的数值几乎是相同的。如果标准差大过平均值,常常标志着极高的相对变异性。