![]()
|
Neyman-Pearson, Fisher, and Bayesian Statistics |
J. Neyman (1894-1981) |
繁桝算男『ベイズ統計入門』東京大学出版会、1985。
メイヨーの本では、ベイズ主義を基盤とした科学方法論が「科学の実践の場」では実状にあわず、誤謬統計ほどの威力をもたないという趣旨の批判が頻繁になされている。また、ベイズ主義では仮説に対する事前確率分布について主観性ないし恣意性が避けられないので、科学的認識のめざす「客観性」が著しく損なわれるという批判も繰り返される。しかし、ベイズ主義の基本的な考え方を採用し、その考え方に基づいた手法を用いる実地の統計学も現に行なわれていることを無視してはならない。わたしがアメリカから帰国した頃(1971年頃)には、日本語で読めるベイズ統計の入門書はリンドレーの『確率統計入門』二巻(培風館、1968、1969)くらいしか見あたらなかった。しかし、最近では日本人のベイズ主義者による優れた入門書も見られるようになった。東大の繁桝教授による表記の本がその一例である。
メイヨーが誤謬統計の基準モデルとして取り上げる例も含め、実地の統計的課題がベイズ主義ではどのように扱われるか、また、ネイマン-ピアーソンの統計的検定の方法がどのような弱点を持つか、この本を一読しておくべきであろう。メイヨーはなかなかはっきり言ってくれないが、「くり返しにおける誤りの確率をもっとも小さくする推論のルールをつくり、それを観測値へ適用することが、伝統的な仮説検定の方法である」(41ページ)。彼らの方法が、頻度説を下敷きにする以上、「数多くの適用」のなかで「誤謬統計」と確率は初めて意味を持ってくる。しかも、彼らの方法が恣意性(ないし主観性)をまったく免れていると信じるのは偏見にすぎない。なぜなら、少なくともネイマンの公式見解では、彼らの統計的検定は推論だけではなく仮説の受容、棄却という実践的決定にまで踏み込むので、その前提となるべき価値判断が必要なはずであるが、これが多くの場合伏せられたままになっているからである。仮に統計的確率が客観的だとしても、この伏せられた価値基準に主観的要素が入る。ここまで考慮すれば、メイヨーが強調するような誤謬統計の方法の大半は、ベイズ統計でも形を変えて、そして単一のケースに対する適用について妙な言い訳を援用することなく、再現できるのである。
Egon Pearson (1895-1980)
![]()
ただし、これら二つの立場には、「尤度原理 likelihood principle」の是非をめぐって両立できないという対立が残る(と見るのが普通である)。「尤度ゆうど」とは、簡単に言えば次のように説明される。例えば、コイン投げのようなベルヌーイ試行においては、n 回の試行でx 回表が出る(この命題をe と表す)確率は、表の確率をp とすれば、p, n, x の関数として表現される。
(1) P(e) = f(p, n, x)
例えば、3回の試行で2回表が出る確率は、pp(1−p) に3 個のものから2個選ぶ組み合わせの数(二項係数)をかける、というおなじみの計算によって決まる。このとき、(1)式で n と x は既知でpを未知数と見なすなら、右辺の関数 f はp の値が本当の値である可能性の度合──これが尤度──を表していると見ることができる。
これは、次のように考えてみればわかりやすい。例えば、3回の試行の例では、
表の出る回数 確率 0 (1-p)(1-p)(1-p) 1 3p(1-p)(1-p) 2 3pp(1-p) 3 pppという確率分布が得られるが、それぞれの積の値は p の大きさに応じて当然変わる。いま、表が2回出たとしよう(3行目)。このとき、p の正しい値として尤もらしいのはどれだろうか?候補として、p=0.5、p=0.6、p=0.7 の値を入れて計算してみれば、それぞれ 0.375、0.432、0.441 となって、このうちではp=0.7の場合が最も値が大きいことがわかる。つまり、このデータに照らして p の値を推測するなら、0.7がこの中では一番「尤もらしい」ということになろう(他の条件が等しいと仮定して)。これは、われわれの直観的な判断にも合致している。実際の推測はこのように簡単にはいかないが 、尤度が可能性の度合を表すということの意味は直観的に理解できるであろう。
さて、ベイズ主義にあって重視される尤度原理とは、「このたぐいのデータにおける統計情報は、尤度によってすべて表現されているので、同じ尤度から導かれる統計的結論は同じでなければならない」という原理である。ベイズ主義者が必ずしもこれを無条件に支持するわけではないが、これをめぐって統計学派の対立があることは確かである。(これについては Mayo, Ch. 10 で論じられる。 なお、日本の優れた統計学者、赤池弘次氏が提唱した情報量基準、AIC, Akaike Information Criterion は、尤度の考察にある種の補正──サンプルの大きさなど、尤度以外の要因も勘案する──を加えた基準である。)
ついでに述べておくと、ネイマン-ピアーソンの学派とは犬猿の仲だったフィッシャーの理論については、『統計的方法と科学的推論』(原著1959)の邦訳が岩波から1962年に出ている。ピアーソン親子に対する悪口を拾い読みするのもおもしろいが、訳者(渋谷政昭・竹内啓)解説も参考になる。その解説によれば、フィッシャーは極端な頻度説ではなく、「相対頻度に基礎をおいた命題の信頼性の尺度」を認める立場だとされる(211ページ)。しかし、わたしの率直な意見を言えば、これは実質的に二種の確率概念を認めるのと変わらない折衷説であり、メイヨーに対するのと同じ疑念を表明せざるを得ない。
INDEX- CV- PUBLS.- PICT.ESSAYS- ABSTRACTS- INDEX・LAPLACE- OL.ESSAYS-CRS.MATERIALS
Last modified October 19, 2001. (c) Soshichi Uchii