Pooled Standard Deviation
複数のデータ群を統合し、全体のばらつきを推定。
POOLED STANDARD DEVIATION
-
Total Sample Size (N): 0
Degrees of Freedom (df): 0
Degrees of Freedom (df): 0
合併標準偏差(Pooled SD)とは
統計分析において、独立した2つ(またはそれ以上)のグループを比較する際、それぞれのグループの分散が等しい(等分散性)と仮定できるなら、それらを統合して全体のばらつきを推定するほうが精度が高くなります。この統合された標準偏差を合併標準偏差(Pooled Standard Deviation, $S_p$)と呼びます。
計算公式
各グループのサンプルサイズを $n_i$、標準偏差を $s_i$、グループ数を $k$ とすると、分散の加重平均の平方根として定義されます。
$S_p = \sqrt{ \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2 + \dots + (n_k-1)s_k^2}{(n_1-1) + (n_2-1) + \dots + (n_k-1)} }$
分母は自由度の合計(Total Degrees of Freedom)となります。
いつ使うのか?
- 2標本t検定(Student's t-test): 等分散を仮定したt検定では、t統計量の分母(標準誤差)の計算にこの $S_p$ を使用します。
- 効果量の計算(Cohen's d): 2つの平均値の差がどれくらい大きいかを標準化して表す際、分母として $S_p$ が使われます。
- 工程能力指数(Process Capability): 複数のサブグループから全体の工程能力を推定する場合などに利用されます。
ウェルチのt検定との違い
等分散性が仮定できない場合(分散が明らかに異なる場合)は、合併標準偏差を使わず、ウェルチのt検定(Welch's t-test)を使用すべきです。ウェルチの検定では、それぞれの分散を個別に扱います。