ベイズ統計学基本解説

統計学について

鈴木雪夫(東京大学名誉教授)*

災害科学研究会傷害疾病部会『災害研究』平成12年9月


ベイズ統計学はのびのびした自由なひろがりをもつ

 「ベイズ統計学」サイト
* サイト作成者松原望のかっての研究指導者


 統計学をベイズ統計学と非ベイズ統計学に分類することができる。後者は、伝統的統計学とか古典的統計学と呼ばれることもある。ここで、統計学の理論の中核である数理統計学に注目し、数理統計学を、ベイズ(数理)統計学と非ベイズ(数理)統計学に分類して話を進めてみよう。いずれにしても、数理統計学では、現在の統計的問題について適切な数理モデルを構成する。

 このモデルに含まれる未知母数に事前分布を設定して話を進めるのがベイズ統計学であり、そのような事前分布を考えないのが非ベイズ統計学であるということもできる。

 ベイズ統計学では、(未知)母数の事前分布と(観測データに基づく)母数の尤度とをベイズの定理で結合することにより、母数の事後分布が導出されるので、この事後分布に基づいて(未知)母数に関する推論が行われうるのである。また、将来に得られる観測値に関する予測は、事後分布と予測の対象となる確率変数の密度関数より求められる予測分布に基づいて行われうる。

 適切な数理モデルを前提として、ベイズ統計学の特徴は、事前分布と尤度関数(観測データの持つ情報)とから、事後分布あるいは予測分布を求めるという数理的操作が、数学理論の確たる裏付けをもって、論理的整合性をもって進められることである。このような理論的枠組みを用いることにより、さまざまの現実の統計的問題に対処しうるのである。もちろん、現実の問題を扱う場合には、いかなるデータをとるべきかという調査計画を考慮にいれた数理的モデルが必要となることもありうる。また、問題が大規模で複雑であれば、そのための数理モデルは、多くの要素あるいは変数を含み、未知母数の個数も多くなり、観測データも厖大なものとなるであろう。このような数理モデルについては、未知母数の事前分布の設定、尤度関数の算出、事後分布の導出あるいは予測分布の導出といった一連の計算過程は莫大な計算を必要とするであろう。また、この計算過程をシミレーションで置き換えることも少なくない。いずれにしても、優れたコンピュータの使用なしでは、ベイズ統計学の現実問題への応用は考えられないのである。また、ベイズ統計学の活用のために必要な大規模な計算をコンピュータにより効率的に実行するための計算法の研究が1990年代に大いに進展したことは喜ばしいことである。

 ベイズ統計学の考え方の原初的な形はT・ベイズ(1701〜1760)とかP・S・ラプラス(1749〜1827)の著作に見られる。それが20世紀の中頃まで重視されずにきたのは、それ自体興味深いことである。英国は統計学の宗主国とも言えるが、二人の個性的な統計学者K・ピアソン(1857〜1936)とR・A・フィシャー(1890〜1962)のいずれも非ベイズ統計学の立場をとっている。1960年以降となり、D・V・リンドレイによりベイズ統計学が英国で生命をふき込まれるのである。

 第二次世界大戦後となり、統計学研究の新しい方向として、ゲーム理論を統計学にとり入れて、A・ワルドが「統計的決定関数」(1950)を発表した。当時としては、数学的にも高級な内容のものであり、若い数理統計学者には大変魅力的な本であった。180頁の書物に過ぎないが、理解するためには、現代数学の知識がある程度必要であった。間もなく、イエール大学のL・J・サベージが「統計学の基礎」(1954)を著し、ベイズ統計学の基礎となる個人確率とか主体的確率あるいは主観的確率を論じた。また、1954年には、D・ブラックウェルとM・A・ガーシックの共著「ゲームの理論と統計的決定」が教科書として出版されたが、これは、前記のワルドの専門書の優れた啓蒙版とも言うべきものであった。数学、統計学はもちろんのこと経済学、経営科学、ORなどの分野で教科書として広く用いられたことであろう。ブラックウェルとガーシックはそれぞれカリフォルニア大学(バークレイ)とスタンフォード大学の教授であった。東部ではハーバード大学のビジネススクールの教授達が、1960年前後に続々と、統計的決定理論とか、ベイズ意思決定理論に関する優れた教科書を出版したのである。意思決定理論の教育・研究、特にその実例研究は時代の要請に応えて発展するのであるが、ベイズ統計学の中核であり、あらゆる分野の科学や技術における研究活動に必要とされるベイズ統計理論の研究も、地味ではあるが着実に進んでいった。

 統計学の代表的なジャーナルである英国のJRSS(Journal of Royal Statistical Society)と米国のJASA(Journal of American Statistical Association)を1950年から現在までにわたって調べれば、ベイズ統計学の発展過程について興味深い情報が得られるはずである。英国ではベイズ統計学は早い時期から受け入れられ、急速に広がっていった。これは、ロンドン大学D・V・リンドレイ教授の尽力によるところが大きいと私は思っている。彼は、ベイス統計学に関する論文を1960年頃から発表し出し、ロンドン大学でベイズ統計学の教育と研究に尽力し、優れた統計学研究者を多く生み出し、他方では、教育放送を積極的に利用して、ベイズ統計学の啓蒙教育にも熱心であったのである。彼の教え子達は1970年代ともなれば、英国の各大学で地位を得て、ベイズ統計学の教育・研究を強力に推進することとなる。米国と違って小さい国であること、米国におけるような強力な反対者が存在しなかったこと、などと考えられるが、英国でのベイズ統計学の発展の重要な要因として、統計学の教育・研究活動におけるロンドン大学の伝統と実績が、他大学、特に例の有名私立大学を圧倒していたことがあげられると思う。また、中東、アフリカ、南米などからの留学生が帰国して、大学教授としてベイズ統計学の教育・研究を進めていることも注目しておきたい。

 米国では、その広大な国に統計学界で強力な有名大学が散在し、統計学界の有力な長老教授の多くがベイズ統計学に反対であり、ベイズ統計学の研究者は少数派であるという状況が1980年代半ばまで続く。しかし、ベイズ統計学の研究者は質と量の両面で増加していく。米国では、統計学科以外のOR学科とか経営科学あるいはビジネス・スクールでは、ベイズ統計学やベイズ意思決定理論が重要な科目と考えられ、非統計学は教える必要はないとまで考えられたと思う。このような事情はベイズ統計学の発展にとって非常に有利に働いていると考える。

 さて、1980年代には、米国の統計学界においても、ベイズ統計学の実績が認められ、反対勢力の中心となった長老教授たちも退職していき、大学院生もベイズ統計学の優れた教授の指導を選択するということとになる。このようにして、1990年代に入ると、一種のなだれ現象が生じ、急速にベイズ統計学が広まる。ある大学の統計学科では、ベイズ統計学の研究者が多数を占め、今や非ベイズ統計学の研究者は一人しかいないという状態となっているところもあるという。30年かかって生じた逆転である。米国は広大であるから、このような逆転現象が一様に発生するわけではないが、次世紀の最初の10年間で、この逆転現象はほとんど一巡するのではないかと思う。

 米国統計協会の学会誌JASAに発表されたベイズ統計学関係の論文の数は、1990年代は1980年代の約2倍となり、毎年約30篇の論文が採択されている。これらの論文の3分の1ぐらいは、現実の問題を扱ったものであり、その内容はベイズ統計学の理論的枠組が現実の問題に対していかに有効であるかを語っていると思う。従って、ベイズ統計学を学び、現実のさまざまの統計的問題の解明に真正面から取り組み、意味のある優れた研究を実施し、その成果を論文として発表するという傾向は益々強まるに違いないと思う。米国では、統計学者の教育組織が充実しており、統計学研究者の層が厚く、これらの厖大な人材が、大学をはじめ政府機関、公的機関、あらゆる業種の民間企業あるいは国連などの国際機関において、統計学の研究、統計調査、情報の収集・分析などに従事し、活躍している。

 最後に、わが国の統計学はどうかということになるが、残念ながら、甚だ不十分で見劣りがすると言わざるをえない。わが国の統計学界の過去を分析し、統計学の研究の後進性について議論を展開することも意味あることと思うが、それよりも今後のことを考える必要がある。英国や米国の統計学者達のように、さまざまの科学的研究、社会のさまざまの重要な問題の研究における統計的問題に取り組み、優れた研究成果をあげていかねばならない。
同時に、わが国の統計学の教育と研究をいかなる組織の下で推進したらよいかを、自由かつ創造的に考えていく必要があると思う。


ベイズ統計学関係専門書

1. Wald, A. (1950), Statistical Decision Functions, John Wiley & Sons.

2. Blackwell, D. and Girshick, M. A. (1954), Theory of Games and Statistical Decisions,John Wiley & Sons.

3. Savage, L. J. (1954), Foundations of Statistics, John Wiley & Sons.

4. Raiffa, H. and Schlaifer, R. (1961), Applied Statistical Decision Theory, Harvard Univ.

5. DeGroot, M. H. (1970),Optimal Statistical Decisions, McGraw-Hill.

6. Zellner, A. (1971), An Introduction to Bayesian Inference in Econometrics, John Wiley & Sons.

7.Lindley, D. V. (1972), Bayesian Statistics, A Review, Society for Industrial and Applied Mathematics.

8. Box, G. E. P. and Tiao, G. C. (1973), Bayesian Inference in Statistical Analysis, Addison Wesley.

9. Rosenkrantz, R. D. (1977), Inference, Methods and Decision: Towards in Bayesian Philosophy of Science, D. Reidel.

10.West, Mike and Harrison, Jeff (1989), Bayesian Forecasting and Dynamic Models, Springer-Verlag.

11.Klugman S. A.(1992), Bayesian Statistics in Actuarial Science with Emphasis on Credibility, Kluwer Academic Publishers.

12.Bernardo, J. M. and Smith, A. F. M. (1994), Bayesian Theory, John Wiley & Sons.

13.Gelman, A., Carlin, J. B., Stern, H.S., and Rubin, D.B. (1995), Bayesian Data Analysis, Chapman & Hall.

14.Gilks, W. R., Richardson, S. and Spiegelhalter. D. J. (1996),Markov Chain Monte Carlo in Practice, Chapman & Hall.