心理統計学においては、スティーブンスによればある集合の名前以上でない尺度を名義尺度、順番を表しているに過ぎない尺度を順序尺度、絶対0点が定まっていないが四則演算ができる尺度を間隔尺度、絶対0点が定まっている四則演算ができる尺度を比尺度と呼び、それぞれに適用可能な統計的検定がある。
まず手始めに名義尺度でできる統計的演算を取り上げる。
期待度数と観測度数に大きなズレがあるかどうか、またはデータ全体から部分数値同士が独立ではないと言えるかどうかの統計的検定を「χ(カイ)二乗検定」と言う。例を2つ使ってそれぞれを説明する。
例1・・・六肢選択で麻雀が一番好きな人が20人、パチンコが一番好きな人が35人、将棋が一番好きな人が15人、囲碁が一番好きな人が10人、トランプが一番好きな人が10人、花札が一番好きな人が10人、の計100人がいたとする。このそれぞれの好みは期待度数(それぞれ6分の1)通り(つまりランダムに)に分布していると言えるかを統計的に検定せよ。
検定統計量χ二乗は以下の式で求められる。
χ2=(O1-E1)2/E1+・・・・・・・・+(On-En)2/En ここで自由度は(n(カテゴリー数)-1)となる。
χ2=(20-16.6)2/16.6+(35-16.6)2/16.6+(15-16.6)2/16.6+(10-16.6)2/16.6+(10-16.6)2/16.6+(10-16.6)2/16.6=0.696+20.395+0.154+3(2.624)=22.117
自由度5のχ二乗値は22.117であった。この値は(心理統計の本の巻末に載っている)χ2値の有意水準p≦.01の15.086より大きいため、1%水準で有意である。よって、この100人の嗜好は偏っている、と言える。ここで言う「有意」とは「嗜好が偏っていると言える確度の高さ」のことである。1%水準で有意ということは、100回同じ調査をして1回だけ「偏りがない」と言う結果が期待されると言う意味である。なお、断りがなかったが、ここでは帰無仮説(特徴はない、と言う仮説)を対立仮説「特徴がある」で退けているが、このことを「帰無仮説の棄却」あるいは「対立仮説の採択」という。正しい帰無仮説を棄却してしまう誤りのことを「第1種の誤り」と言いこの可能性は有意水準に等しい。逆に誤った帰無仮説を棄却できない誤りのことを「第2種の誤り」と言いβで表す。(1-β)のことを「検定力」と言う。
例2・・・水泳をしているか否かとウォーキングをしているか否かについて200人から以下のような結果を得たとする。水泳とウォーキングに関連があるか否かを検定せよ。
水泳 する しない 計
ウォーキングする 40 60 100
しない 15 85 100
計 55 145 200
このような場合、計から期待確率を推計する。この場合、ウォーキングをする人は100:100で200人、水泳をする人は55:145で200人だから期待値は、
水泳 する しない 計
ウォーキングする27.5 72.5 100
しない 27.5 72.5 100
計 55 145 200
となります。早速χ二乗値を求めてみましょう。
χ2=(27.5-40)2/27.5+(72.5-60)2/72.5+(27.5-15)2/27.5+(72.5-85)2/72.5=5.68+2.16+5.68+2.16=15.68 となって自由度3のχ二乗表を見ると1%水準の値が11.345以上なので、帰無仮説「水泳とウォーキングには関連がない」が棄却され、「水泳とウォーキングには関連がある」と言う対立仮説を採択する。
χ二乗値は、その計算式からわかるように、期待値と実現値のズレの総和である。それゆえ期待値が分かる場合の検定となっている。