参考文献
- 日本統計学会公式認定 統計検定1級対応 統計学 | 二宮嘉行, 大西俊郎, 小林 景, 椎名 洋, 笛田 薫, 田中研太郎, 岡田謙介, 大屋幸輔, 廣瀬英雄, 折笠秀樹, 日本統計学会, 竹村彰通, 岩崎学 |本 | 通販 | Amazon
- ネイマン・ピアソンの補題 - Wikipedia
- probability - Proof of Karlin-Rubin's theorem, detail about a real analysis fact. - Mathematics Stack Exchange
- https://www.soph.uab.edu/sites/edu.ssg/files/People/KZhang/BST695-11Fall/BST695-2011-Fall-Chapter-08.pdf
参考文献1. の93、94ページに「ネイマン-ピアソンの基本定理」と「単調尤度比と一様最強力検定」がありますが、証明がなかったので、前者は参考文献2. を、後者は参考文献3. にリンクがあった参考文献4. を参考にかきました。ただ後者の証明はだいぶ自分でかいたのでおかしい点があるかもしれません。私の誤りは私に帰属します。お気付きの点がありましたらコメントでご指摘いただけますと幸いです。
ネイマン-ピアソンの補題
を確率変数(または確率変数ベクトル)、 を の確率密度関数( が離散型の場合は確率質量関数)とし、帰無仮説を とし、対立仮説を とする。このとき、もし以下のような検定 の第一種の誤りの確率が であれば、この検定 は有意水準 の検定の中で最強力検定である。証明のイメージ
証明
検定 の棄却域を とする。示すべきことは、任意に取ってきた有意水準 の検定 (棄却域 )に対して、以下が成り立つことである。ここで、任意の に対して以下が成り立つことから、- 検定 の棄却域 は以下である。よって、この領域内では が成り立つ。
- 有意水準 の検定(つまり、第一種の誤りの確率が 以下の検定) を任意に取ってきて、その棄却域を とすると、以下が成り立つ。よって、以下が成り立つ。
- の外では が成り立つ。
カーリン-ルビンの定理
を確率変数(または確率変数ベクトル)、 を の確率密度関数( が離散型の場合は確率質量関数)、 を1次元のパラメータとする。また、任意の について、尤度比 が、ある統計量 と広義単調増加関数 を用いて、証明
検定 の棄却域を とする。示すべきことは、一つは、 である任意の について以下が成り立つ(棄却の確率が 以下である)ことである(そもそもこの検定 が有意水準 の検定である)。もう一つは、 である任意の と任意に取ってきた有意水準 の検定 (棄却域 )について以下が成り立つことである(一様最強力検定である)。
ここで、 である任意の を一つとって、帰無仮説を 、対立仮説を とし、検定 をする。 は広義単調増加関数なので、 という条件は にかきかえることができる。つまり、 とかきかえることができる。よって、ネイマン-ピアソンの補題より、検定 は有意水準 の最強力検定であり、その検出力は である。ところで、 の実現値にかかわらず確率 で帰無仮説を棄却する検定 も有意水準 の検定であり、その検出力は だが、検定 が有意水準 の最強力検定であることから、 が成り立たなければならない。これは任意の について成り立つ。
次に、 である任意の を一つとって、帰無仮説を 、対立仮説を とし、検定 をする。上と同様に議論により、検定 は有意水準 の最強力検定である。これは任意の について成り立つ。ので、検定 は帰無仮説 、対立仮説 に対する有意水準 の一様最強力検定である。他方、帰無仮説を にすることは有意水準に影響を及ぼさない(第一種の誤りの確率が大きくなることはない)。したがって結局、検定 は帰無仮説 、対立仮説 に対する有意水準 の一様最強力検定である。
素朴には「帰無仮説が正しいならばまれなこと」が起きたときに帰無仮説を棄却しますが、いったいどこを囲んで「まれなこと」としてぬりつぶすべきかは本当は帰無仮説だけみつめていてもよくわかりません。渡辺ベイズ本の6章の章末にも「『りんごとXのどちらが好きですか? Xはわかりません』という質問にあなたは答えられますか?」という問いがあった気がします。いま渡辺ベイズ本が手元にありません。
帰無仮説を棄却することで支持したい対立仮説があればもっとはっきりします。「1の出る目が1/6だという帰無仮説を立てる(内心、1の出る目がそれより高いと思っている)」というのだったら、サイコロをn回投げて1の目が出た回数が閾値より大きいことを「まれなこと」として、このときに帰無仮説を棄却すればいいです。閾値は、帰無仮説が正しいにもかかわらず帰無仮説を棄却してしまう確率がある値以下になるように決めます(この値を有意水準といい、よく 0.05 などにされます)。
しかし、こうしてつくった検定は、帰無仮説が正しいときに誤る確率が有意水準以下であることは保証されているものの、帰無仮説が正しくないときに帰無仮説をいい感じに棄却してくれるのかはわかりません。例えばあなたはうっかりしていて、帰無仮説を棄却することで1の出る目が1/6よりも大きいことを示したいのに、1の目が出た回数が閾値以下のときに帰無仮説を棄却するというとんちんかんな検定をつくってしまうかもしれません。こんな検定は有意水準が 0.05 であっても、あなたが思い描く対立仮説を検出する力はほとんど皆無です。
なのでネイマンさんとピアソンさんは、「『1の目の出る目が1/6』という帰無仮説と『1の出る目が1/3』という対立仮説を検定したいなら、後者÷前者の尤度比が閾値以上のときに棄却するのが同じ有意水準の検定の中では最強ですよ」といいました(いったかはわかりません)。これが最強なのは上の図から明らかです。もし有意水準が同じである他の検定があったとしても、棄却域の差の部分で絶対勝てるのです。こっちは尤度比が閾値以上かどうかで棄却域を囲っていますので。そもそも内心では後者なのではないかと疑っているときに、後者÷前者の尤度比を基準に棄却域をつくるべきなのは当然です。# なお、「1の目が出た回数」が閾値より大きいかどうかで検定すると尤度比検定になっています。
また、尤度比がある統計量の広義単調増加関数になっていれば、「『1の目の出る目が1/6』という帰無仮説と『1の出る目が1/3』という対立仮説」から「『1の目の出る目が1/6以下』という帰無仮説と『1の出る目が1/6を超える』という対立仮説」に広げることができます。1/6 とそれより小さい任意の p との間、1/6 とそれより大きい任意の p との間にネイマン-ピアソンの補題がつかえるからです。