母平均の信頼区間計算機

要約統計量から、z値またはt値の臨界値を使って母平均を推定します。

要約統計量を入力

標本平均

\bar{x}

標本観測値の平均です。

標本サイズ

n

推定に使う観測値の数です。

標準偏差

s

値を入力し、それが標本から得たものか母集団のものかを選択してください。

この標準偏差は

同じ標本から推定した値です。Auto では t値を使います。

信頼水準

プリセットを使うか、任意のパーセントを入力します。一般的な任意値は 50 から 99.99 です。

観測値

入力される項目

\bar{x}

平均

s

標本偏差

n

標本サイズ

要約プレビュー

$n$

0

$\bar{x}$

--

$s$

--

臨界値の方法

自動選択された方法

t値

t_{1-\alpha/2,\ 24}

df = 24

標準偏差が標本から推定されているため、Auto は df = 24 の t値を選びました。

臨界値

2.063899

計算結果

信頼区間

$39.940766 \le \mu \le 45.059234$

式

\bar{x} - ME \le \mu \le \bar{x} + ME

値

42.5 - 2.559234 \le \mu \le 42.5 + 2.559234

95% の信頼水準では、母平均は 39.940766 から 45.059234 の間にあると推定されます。

標準偏差が標本から推定されているため、Auto は df = 24 の t値を選びました。

下限

39.940766

上限

45.059234

標本平均 $\bar{x}$

42.5

誤差範囲

2.559234

標準誤差 $\mathrm{SE}$

1.24

臨界値 $t_{1-\alpha/2,df}$

2.063899

方法

t値

df

24

分布と臨界値

95% 信頼領域

\pm t_{1-\alpha/2,\ 24}=\pm 2.0639

ME=2.5592

下限39.940766

平均42.5

上限45.059234

ステップごとの計算

1. 入力値を確認

\bar{x}=42.5,\ s=6.2,\ n=25,\ C=95\%,\ \text{method}=t\text{-score}

2. 標準誤差を計算

SE=\frac{s}{\sqrt{n}}=\frac{6.2}{\sqrt{25}}=1.24

3. 臨界値を求める

df=n-1=24,\ t_{1-\alpha/2,\ 24}=2.063899

4. 誤差範囲を計算

ME=2.063899\times 1.24=2.559234

5. 信頼区間を計算

\bar{x}\pm ME=42.5\pm 2.559234\Rightarrow 39.940766 \le \mu \le 45.059234

平均の信頼区間を理解する

平均の信頼区間は、標本データを使って未知の母平均に対する妥当な範囲を推定します。標本平均 $\bar{x}$ のような1つの値だけを示すのではなく、その平均を中心に、両側へ誤差範囲を持つ区間として示します。

基本形は次のとおりです。

\bar{x} \pm \text{臨界値} \times \text{標準誤差}

平均に対する標準誤差は次のようになります。

SE = \frac{\text{標準偏差}}{\sqrt{n}}

そのため、標準偏差が小さいほど、または標本サイズ $n$ が大きいほど、区間は狭くなります。

信頼水準の意味

90%、95%、99% の信頼水準は、その方法の長期的な信頼性を表します。無作為標本を繰り返し取り、同じ方法で区間を作ると、その区間の約 90%、95%、99% が真の母平均を含む、という意味です。

信頼水準を高くするには、より大きな臨界値が必要になります。したがって同じデータを使う場合、99% 区間は 95% 区間より広くなります。90% 区間は狭くなりますが、長期的に真の値を含む割合が低い方法になります。

両側区間と片側区間

この計算機は両側の信頼区間を作ります。つまり、区間には下側の端点と上側の端点があり、不確実性は分布の両側の裾に均等に分けられます。

たとえば 95% の両側区間では、区間の外に 5% が残ります。左側の裾に 2.5%、右側の裾に 2.5% です。そのため臨界値は 97.5 パーセンタイルから得られます。

1 - \frac{1 - 0.95}{2} = 0.975

片側の信頼限界は、別の問いに答えるものです。上限は「母平均は合理的にどこまで大きくなり得るか」に答え、形は $\bar{x} + \text{臨界値} \times SE$ です。下限は「母平均は合理的にどこまで小さくなり得るか」に答え、形は $\bar{x} - \text{臨界値} \times SE$ です。これらを右側限界、左側限界と呼ぶこともありますが、通常は上限、下限のほうが明確です。

片側限界では誤差確率をすべて片側に置くため、臨界値はここで示す両側の値とは異なります。95% の片側限界では 95 パーセンタイルを使い、95% の両側区間で使う 97.5 パーセンタイルは使いません。平均の周りの範囲が必要なときは両側の結果を使い、統計的な問いが上限または下限に特化しているときだけ片側限界を使ってください。

z値またはt値

母標準偏差 $\sigma$ が既知の場合は z値を使います。これは、 $\sigma$ が明示的に与えられている教科書の問題でよく見られます。

標準偏差が標本から得られ、 $s$ と表される場合は t値を使います。t値は自由度に依存します。

df = n - 1

t分布は小さい標本では裾が厚いため、区間は広くなります。標本サイズが大きくなるにつれて、t値は z値に近づきます。

このため、計算機では標準偏差が標本 $s$ なのか母集団 $\sigma$ なのかを確認します。Auto モードでは、標本 $s$ は t値を使い、母集団 $\sigma$ は z値を使います。授業、表、手順で特定の方法が求められる場合は、z値または t値を手動で選択できます。

計算機の使い方

標本平均、標準偏差、標本サイズ、信頼水準を入力します。標準偏差が標本 $s$ なのか母集団 $\sigma$ なのかを選びます。ほとんどの問題では方法を Auto のままにし、課題や参照表で指定されている場合だけ z値または t値を手動で選びます。

要約統計量ではなく生の観測値がある場合は、生データ入力を使います。カンマ、スペース、改行で区切った値を貼り付け、適用すると $\bar{x}$ 、標本標準偏差、 $n$ が入力されます。

計算例

ある標本について、平均 $\bar{x}=42.5$ 、標本標準偏差 $s=6.2$ 、標本サイズ $n=25$ 、信頼水準 95% だとします。

標準偏差は標本から得られているので、次の自由度で t値を使います。

df = 25 - 1 = 24

95% の信頼水準で $df=24$ の場合、臨界値はおよそ次の値です。

t_{0.975,24} = 2.0639

標準誤差は次のとおりです。

SE = \frac{6.2}{\sqrt{25}} = 1.24

誤差範囲は次のとおりです。

ME = 2.0639 \times 1.24 \approx 2.56

信頼区間は次のとおりです。

42.5 \pm 2.56 = [39.94,\ 45.06]

実務的に言うと、95% の信頼水準では、母平均はおよそ 39.94 から 45.06 の間にあると推定されます。約 2.56 の誤差範囲は、標本平均から区間の各端点までの距離です。

前提と注意点

データは無作為または代表性のある標本から得られている必要があります。観測値は独立している必要があり、つまり1つの観測値が別の観測値を決めてはいけません。

母集団はおおむね正規分布であるか、正規近似が妥当と考えられるほど標本サイズが大きい必要があります。外れ値、強い歪み、測定上の問題、偏った標本があると、式を正しく計算していても区間が誤解を招くことがあります。

FAQ

z値とt値のどちらを使うべきですか？

母標準偏差 $\sigma$ が既知の場合は z値を使います。標準偏差が標本標準偏差 $s$ の場合は t値を使います。実際の標本要約の問題では、多くの場合 t値を既定にするほうが安全です。

標本サイズが小さいとなぜ区間が広くなるのですか？

標準誤差は $\sqrt{n}$ で割ります。 $n$ が小さいほど標準誤差は大きくなり、その結果、誤差範囲が大きくなります。

信頼水準が高いとなぜ区間が広くなるのですか？

信頼水準が高いほど、大きな臨界値を使います。その大きな臨界値が標準誤差に掛けられるため、誤差範囲が大きくなります。

この計算機は両側ですか、片側ですか？

両側です。この計算機は下限と上限の両方を表示し、残りの確率を左右の裾に均等に分けます。片側の上限または下限を求める場合は、結果に表示される両側の臨界値ではなく、片側の臨界値を使ってください。

標準偏差が 0 の場合はどうなりますか？

標準誤差は 0、誤差範囲も 0 になり、区間は平均に一致します。これは観測値がすべて同じ場合に起こり得ますが、データ入力が正しいか確認するきっかけにもなります。

正規分布ではないデータにも使えますか？

使える場合もあります。標本サイズが大きく、データが極端に歪んでいたり外れ値に支配されていたりしない場合、正規近似は妥当なことがあります。強く非正規なデータからの小標本では注意し、その状況向けに設計された方法も検討してください。