χ2乗検定は2つ以上の群間の頻度や比率を比較する際に用いられる検定法である。 なおz検定はχ2乗検定と同等のP値を算出する。
![]() |
(12.1) |
例えば、次のような観察データあるとする。
| 心筋梗塞 | 対照群 | ||
| 経口避妊薬暴露 | 10 | 5 | 15 |
| 非暴露 | 10 | 35 | 45 |
| 20 | 40 | 60 |
仮説 H0 を「経口避妊薬と心筋梗塞のあいだには何ら関係はない」とたてる。
ここで全体として心筋梗塞に陥る確率は 20/60=1/3 だから、したがって仮説 H0 のもとで表を再作成すると 理論値は以下のようになる。
| 心筋梗塞 | 対照群 | ||
| 経口避妊薬暴露 | 5 | 10 | 15 |
| 非暴露 | 15 | 30 | 45 |
| 20 | 40 | 60 |
以上をもとにχ2乗統計量を計算する。
apply(f,Lx,Ly) :=
if is_nil(Lx) then nil
else if is_nil(Ly) then nil
else cons(f(first(Lx),first(Ly)),apply(f,rest(Lx),rest(Ly)));
chi_square(re,th) :=
sum(apply(lam(re,th) square(re - th)/th,re,th));
chi_square([10,5,10,35],[5,10,15,30]) -> 10.0
χ2乗検定は頻度が少なくとなるとχ2乗分布への近似が悪くなり、検定の信頼性が低下する。 いずれかの expected frequency が2以下あるいは expected frequency の20%以上が5以下の場合にはχ2乗検定よ りもFisher検定を利用することが望ましい。
Akimichi Tatsukawa