最近また色々な新刊書で「パラメトリックvs.ノンパラメトリック検定の違い」について正確でない説明を見かけることが増えてきたので、ちょっと出典を明示して備忘録的に書いておこうと思ったのでした。
『自然科学の統計学』(東大出版会)pp.213-219に、仮説検定に対して分布の形が検出力に及ぼす影響について論じた箇所があり、そこからの発展としてパラメトリック検定とノンパラメトリック検定との違いについて述べられています。
- 作者: 東京大学教養学部統計学教室
- 出版社/メーカー: 東京大学出版会
- 発売日: 1992/08
- メディア: 単行本
- 購入: 26人 クリック: 308回
- この商品を含むブログ (21件) を見る
以下、同書pp.217-218より抜粋。
7.3.2 ノンパラメトリック検定
誤差分布の形を特定しなくても、それが原点について対称であると仮定できるときは、*1が観測値の分布の中央値になるので、以下のようにして仮説を検定できる。すなわち
(7.33)
とすると、仮説はと同等になる。そして
のうち、のものの個数
とすると、は二項分布に従う。したがって、のとき
(7.34)
となるように定数を定め、のとき仮説を棄却することにすれば、有意水準の検定方式が得られる。
たとえばのとき、二項分布において
となるから
または
を棄却域とすれば、有意水準は
となり、ほぼ有意水準5%の検定方式が得られる。ただし、の取り得る値が離散的であるため、(7.34)の左辺が正確に*2に等しくなるように棄却域を決めることが一般にはできない。
このような検定方式は、分布が対称であればその形に関係なく、仮説が正しいときに仮説を棄てる確率がつねにになり、正しい結論を与える。このように分布の形に関係なく妥当な結論を与えるような検定方式をノンパラメトリック検定 non-parametric test という。これに対し、t検定のように分布の形について正規分布のような厳密な形を仮定して導かれる検定をパラメトリック検定 parametric test とよぶことがある。上に述べた検定方式はノンパラメトリック検定の一種であるが、観測値の符号のみに注目して結論を導くので一般に符号検定 sign test といわれる。
(太字は原文ママ、ただし上記脚注部の太字のみ原文では圏点)
一応まとめておくと、
というのが教科書通りの定義だということですね。特にノンパラメトリック検定の場合は順位和検定が使われることが多く、順位和が元の標本の分布形状にほとんど依存しない*4ことを利用している手法である、ということも知っておいて損はないと思います。