読者です 読者をやめる 読者になる 読者になる

基礎からのベイズ統計学 Skype読書会(2): 参加メモ

この勉強会に参加させていただきました: 基礎からのベイズ統計学 Skype読書会(2) - connpass
読んでいる本(出典): 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 | 豊田 秀樹 | 本 | Amazon.co.jp

前回:メモ1 / 次回:メモ3
目次:基礎からのベイズ統計学 ハミルトニアンモンテカルロ法による実践的入門

今日読んだ範囲: 10~23ページ

  • 逆確率(10ページ)の例を自分でも考えてみたら5ページ後で思い切り天気の例が出てかぶった。
    • p( 実際に雨 | 天気予報によると雨 ) ・・・ 通常の条件付確率
    • p( 天気予報によると雨 | 実際に雨 ) ・・・ 逆確率
  • 一般の多くの人にとっては「天気予報を見たら雨だったけど、実際雨だった」というのが自然な時系列のはずで、それに逆らう流れの後者が逆確率になるはず。ただ、気象予報に従事する人にとっては、雨をもたらす大気の状態を観測して雨と診断する、というのが時系列なので、前者が逆確率なのかもしれない(ただその場合、「実際に雨」というのは、「実際に雨をふらせる大気」などと言い換えた方がよいだろう)。
    • 教科書において挙げられている逆確率の例が p( 病気 | 検診 ) だが、気象予報士が大気を診察するお医者さんなら前者がこの例のはずだろう、というイメージ。
  • ベイズ更新とその実用例(11~14ページ)は受け入れやすい。実際、ここまで主観確率は未登場。
  • 客観確率で表現できる事象主観確率で表現できますが、逆は必ずしも成り立ちません(15ページ)。」
    • 勉強会中に、地震が起こる客観確率は定義できるか、天気の例と違うのか違わないのか、という質問と議論があって、何か言おうと思っているうちに思っていたことは先に他の方が言われたので参加できなかったけど、メモ帳に書いていたこと。
      いや、天気の話は、天気の話というよりは「天気予報」の話です。

      「天気予報が降水確率30%と予報したときに、何%の確率で本当に雨だったか」
      客観確率です。

      もし地震予報のようなことを継続的にやってきていて、
      地震予報が地震確率30%と予報したときに、何%の確率で本当に地震だったか」
      であればそれは客観確率です。

      「明日地震が起こる確率」というと客観確率を与えるのは難しい気がします。
      「富士山の周辺で何らかの地殻変動が観測されたときに
       明日静岡県で震度1以上の地震が起こる確率」
      であったらデータがある範囲である程度客観的な確率が出せると思います。
      ただし、他の方も指摘していたように、「明日も地球の内部の状態は
      変化しない」などの主観的な仮定は排除できないです。

      ものすごく厳密なことをいうと主観は完全に排除できないと思います。
      「地球の状態は変化ない」レベルを気にすると、天気予報の例も客観確率ではないと思います。
      「コインを投げて表が出る確率」のような確率すら、
      「投げ続けているうちに投げ方は変わらないものとする」「重力の向きは変わらないとする」
      「テーブルに傷がついて着地の仕方が変わるようなことはないものとする」
      という主観が入っているということになってくると思います(これらは受け入れやすい仮定ですが)。
  • 主観確率しか出せない上に、主観確率をどう設定するかによって結論が全然変わる例(17~18ページ)。
    • どの主観確率をつかうのが適切だろう、自分ならどうするだろう、と考えてみようと思ったけど、血液鑑定以外に情報はありません、という状態なら他に情報を探すだろう。あと確率で人を裁かないでほしい。もっと確かなものがあるのかは、知らないけど…。
  • 3囚人問題(21ページ)はモンティ・ホール問題と実質同じ。
    • モンティ・ホール問題 - Wikipedia
    • 勉強会中にも議論になっていたけど、 B_d は、Bが死刑になる事象ではなく、Aが「BとCのうち処刑される1人を教えてくれてもいいだろう」と聞いたときに看守が「Bは処刑される」と答える事象

主観確率客観確率を、確率に対する別の態度としか思っていなかったので、本質的に客観確率が定義できないこともあってかつそれを元に事後確率を更新していく問題もあるのをわかってよかった。
それに加えて、21ページのベイズの定理の「3つの使用法」、つまり下表があって、はじめてあちらこちらの本でベイズ統計学が恐る恐る導入される理由が腑に落ちた。この辺の説明がなく、主観だとか偉い人が忌み嫌っていたとかで終わる本もあったので…。

 P(B|A) P(A)
客観確率客観確率全く何も問題ない使用方法。
客観確率主観確率目的や仮定に十分注意すれば、強力な使用方法(かつて忌避された)。
主観確率主観確率絶対にやってはいけない(3囚人問題やモンティ・ホール問題の誤謬)。