第201回 仮説と有意確率


画像


このブログでは多くの学術的データを引用しています。
その中で頻繁に使われている“P<0.05、P<0.01とは何だろう”、と疑問に思っている方も少なからずおられることでしょう。
そこで、今回は統計学について簡単に説明します。
いかにも難しそうな内容ですが、データを見るときに大いに参考になるので是非とも通読してください。

画像


統計学上の仮説(hypothesis)の検定は、一般的な仮説のケースと異なります。
つまり、研究者がある事実を証明する為に、調査または実験を行い、そのデータを収集して仮説を立てます。これを「対立仮説(H1)」と位置付けます。
次に、経験的理論的な見地から、この仮説(H1)を否定する「帰無仮説(H0)」が設定されます。
仮説検定の対象となるのは帰無仮説で、「棄却」されれば対立仮説が支持され、研究者の調査・実験の意図が達せられることになります。帰無仮説(無に帰される仮説)と呼ばれる所以です。

因みに、このブログでは「有意」という言葉を頻繁に使っていますが、これは確率論、統計学の用語で、“確率的に偶然とは考えにくく、意味があると考えられること”を指します。英語では「significantly」と云う単語で表現されています。

上記の帰無仮説を棄却し、対立仮説を採択する時の基準を有意確率と称し、P値(probability)で表示されます。
つまり、p<0.05とは、仮説を立てた場合に、帰無仮説が起こる確率が5%未満であることを意味し、極めて稀なこということで、帰無仮説を棄却して対立仮説が正しいと判定します。
但し、有意確率は限りなく0に近づくことはできても、決して0にはなりません。コインを千回投げて千回表が出ても、次に0が出る確率は0ではなく、やはり二分の一なのです。ですから、ある一定の水準(有意水準)を決めて、P値がその基準より小さい場合に、無視できるとして、帰無仮説を捨てることにします。有意水準としてはふつう、5%か1%が用いられますが、これは人間の指の数を基準に決めた便宜的な値であって、数学的な必然性があるわけではありません。

ここで見落としてはいけないことは、統計的な仮説検定法は、完全な方法ではなく、ときには誤った結論に導かれることもあります。
有意確率5%で検定を行うということは、第1種の過誤をおかす危険率が5%であることを意味しており、同様の調査・検定を行うと、20回に1回は得られた結論が誤っていることを表します。
因みに、第1種の過誤とは、“帰無仮説が実際には真であるのに棄却してしまうこと”、第2種の過誤とは、“対立仮説が実際には真であるのに帰無仮説を採用してしまうこと”を意味します。

何故このような回りくどい論理を使うのだろうか?
この考え方は、統計的な仮説検定法だけではなく、実は、科学的な方法論の考え方でもあります。
科学的仮説は、検証できないが、反証はできるという考えかたに基づいています。つまり、実証主義は、実証可能性を科学的仮説の必要条件としますが、反証主義では、反証可能性を科学的仮説の必要条件とします。
たとえば「黒いカラスが存在する」という「特称命題」は、黒いカラスを一匹見つければ証明できますが、「すべてのカラスは黒い」という「全称命題」を実証するためには、この世のすべてのカラスを観察して、全部が黒いことを示さなければならないので、事実上は不可能です。しかし、これを反証するためには、白いカラスを一匹見つけるだけで良いという考え方なのです。

参考・引用文献:
統計的仮説検定の考えかた(2006/2549-12-08 蛭川 立氏)