2つの平均値の差の検定にt検定を、3つ以上の平均値の差の検定に分散分析を用いることは、心理屋なら誰でも知っていることである。
しかし、大学などの高等教育機関では煩瑣な検定の手続きを教わりはするが、なぜそうするのかはなかなか教えてもらえない、と言うのが現状であろう。
そこで、今回はt検定と分散分析に共通するものの考え方、つまりロジックについてお話させていただきたい。
平均値が少しの違いでも、分散(データのばらつき)が非常に小さければ、それらの平均値の差が統計的に有意(有効)になり、平均値が大きく隔たっていても分散が非常に大きければ、n.s(not significant 有意ではない)なことがあるように、平均値の差の検定をする場合には、平均値の大きさの差と分散の小ささの2つの要因についての正確な情報が欠かせない。
(標本数が同じなどで)簡素化されたt検定の式を見ていただくと、それは非常にはっきりする。
分散分析でもそれは同じことで、手続きを知っているひとから見れば、分散が小さな要因探しが大きなテーマになっていることに気付かないであろうか。
平均値自体はt検定と同じ扱いになり、要因数の効果を相殺しながら分散の小さな要因探しをするのが分散分析の本質である。そのさいに、平均値のそれとしての強さと平均値の差の強さを規定するのが分散なのである。
そのように見てくると、t検定も分散分析もあるグループの分散の小ささに注目しているわけである。要するに平均値の差の検定にはそう言うロジックが生きているのである。