ZestCalc
Appearance
Language

標準偏差計算機

母集団または標本の標準偏差をステップバイステップで計算します。

データ入力

計算モード

データ一式が揃っている場合に使用(除数: N)。

カンマ、スペース、改行で区切られた数字。

計算結果

標準偏差(σ)

2.467793

個数(N)

10

合計

51

最小

1

最大

9

平均(μ)

5.1

分散(σ²)

6.09

標準偏差 — その意味とは、そしてどう活用するか

標準偏差(Standard Deviation)は、データセットのばらつき(散らばり)を示す最も一般的な指標です。個々の値が平均からどれくらい離れているかを数値化します。標準偏差が小さい場合はデータが平均の周りに密集していることを意味し、大きい場合はデータが広く散らばっていることを示します。

標準偏差とは?

NN 個の値を持つデータセット {x1,x2,,xN}\{x_1, x_2, \ldots, x_N\} があるとき、計算は以下の5つのステップで行われます:

  1. 平均を求める xˉ=i=1NxiN\bar{x} = \dfrac{\sum_{i=1}^{N} x_i}{N}
  2. それぞれの偏差を計算する di=xixˉd_i = x_i - \bar{x}
  3. それぞれの偏差を2乗する di2d_i^2
  4. 2乗した偏差の平均を計算して「分散」を求める
  5. 平方根をとることで「標準偏差」を得る

最後のステップで平方根をとることにより、単位が元のデータと同じスケールに戻るため、平均値と一緒に直感的に理解しやすくなります。

母集団(Population)の場合(グループ全体の NN 個すべての値が手元にある場合):

σ=i=1N(xiμ)2N\sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}}

標本(Sample)の場合( NN 個の値がより大きなグループから抽出された一部である場合):

s=i=1N(xixˉ)2N1s = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \bar{x})^2}{N - 1}}

なぜ標本標準偏差では N−1 で割るのか(ベッセルの補正)

標本のみが手元にある場合、標本平均 xˉ\bar{x} は自然と標本の値に少しだけ近づき、真の母集団の平均 μ\mu よりばらつきが小さく見えてしまいます。その結果、そのまま計算した偏差の2乗は本来のもっと大きな数値よりもわずかに小さくなります。つまり、NN で割ると、母分散の推定量としては偏った(系統的に過小評価された)結果になります。

その代わりとして N1N - 1 で割ることで、この偏りを修正します。この調整はベッセルの補正(Bessel's correction)として知られており、s2s^2 を母分散 σ2\sigma^2不偏推定量にするためのものです。

直感的な考え方:大きさ NN の標本では、本当に自由に動ける「自由な」偏差は N1N - 1 個だけです。最初の N1N - 1 個の偏差と平均が決まれば、最後の1つの偏差は自動的に決まってしまいます。したがって、自由度N1N - 1 となります。

サンプルサイズが大きくなるにつれて、NNN1N - 1 の差はほとんどなくなり、違いも見られなくなります — これは、非常に大きな標本が事実上母集団全体と同じであると考えると理にかなっています。

標本から母集団へ:標準誤差

標本標準偏差 ss は、手元の標本内のばらつきを表します。しかし、研究者は「標本平均 xˉ\bar{x}母集団の平均 μ\mu をどれだけ正確に推定しているか」により関心がある場合がよくあります。

その答えが標準誤差(Standard Error of the Mean, SEM)です:

SEM=sN\text{SEM} = \frac{s}{\sqrt{N}}

SEMはデータを多く集めれば集めるほど小さくなり(1/N1/\sqrt{N} としてスケールします)、「標本サイズが大きいほど推定が信頼できる」という直感を数式化したものです。

例えば、N=25N = 25 人の生徒のテスト点数のサンプルがあり、標準偏差が s=10s = 10 だとします。このときSEMは 10/25=210 / \sqrt{25} = 2 となります。真の平均スコアの95%信頼区間は、およそ xˉ±1.96×SEM\bar{x} \pm 1.96 \times \text{SEM} となります。ここで1.96は、面積の中央95%を捉える標準正規分布からの臨界値です。

この計算機の使い方

  1. 値を入力します。カンマ、スペース、または改行で区切ってください。
  2. モードを選択します — データが対象とする集団全体を表す場合は「母集団」を、より大きな集団の一部である場合は「標本」を選択します。
  3. 「計算する」をクリックします(またはデフォルトの値のままにして例を確認してください)。
  4. 結果を確認します — カードには件数、合計、平均、分散、標準偏差が、適切な記号(μ\mu/xˉ\bar{x}, σ2\sigma^2/s2s^2, σ\sigma/ss)とともに表示されます。
  5. 「ステップ・バイ・ステップの解説」セクションを開くと、LaTeXできれいに表示された詳細な導出プロセスを見ることができます。

結果の見方

指標母集団の記号標本の記号意味
件数NNNNデータ値の数
合計xi\sum x_ixi\sum x_iすべての値の合計
平均μ\muxˉ\bar{x}平均値(アベレージ)
分散σ2\sigma^2s2s^2偏差の平方(2乗)の平均
標準偏差σ\sigmass平均からの一般的な距離(ばらつき)

標準偏差がゼロに近い場合、値がほぼ同一であることを意味します。標準偏差が平均より大きい場合は、データの相対的なばらつきが非常に大きいことを示していることが多いです。