お気付きの点がありましたらご指摘いただけますと幸いです。
まとめ
- 母分布が正規分布であることを仮定する検定について、母分布が正規分布でないときにはどう修正すべきなのかに興味があることがあるはずである。
- 母分布が正規分布でなくとも、検定統計量が「標本平均と真の平均との差」といった形(の連続変換)のときは中心極限定理によって検定統計量が漸近的に正規分布にしたがうとわかる場合もあるが(Ex. t 検定)、検定統計量が「標本平均と真の平均との差」といった形ではないときは漸近的にもしたがう分布がわからなくて困る(Ex. カイ2乗検定)。
- しかし、検定統計量が「標本平均」(の連続変換)の形にはもち込めるなら、「真の平均」の周りでテイラー展開することで、「標本平均と真の平均との差」をひねり出して中心極限定理を利用できそうである。
- 実際そのように求めることができ、そのような状況での確率ベクトル列の連続変換の分布収束先を与えるのがデルタ法である。
|
母分散のカイ2乗検定は母分布が正規分布のときにしか適用できないのですね(実験ノート)。母分布がヘビーテールであるときに無理に同じ枠組みで検定すると、「真の分散は1以下である」という帰無仮説が正しいのに棄却してしまう確率が有意水準を超えています。
これは困るわけです。例えば……私はねじを生産する工場を経営しているとしましょう。私は日々生産されたねじが均一であるか検査します。「ねじの外径の分散が基準値以下である」という帰無仮説が棄却されたら、製造機械に不具合が生じているとしてメンテナンスするものとします。しかしここで、生産されるねじの外径の分布が正規分布でないならば、帰無仮説を誤って棄却し、過剰な回数メンテナンスすることになる恐れがあります……メンテナンスコストを必要十分に抑えるために、母分布が正規分布でなくとも母分散を検定することはできないのでしょうか?
それ以前に生産されるねじの外径がヘビーテールになるってまずいんじゃないか……? いやねじの製造に詳しくないから実際は知らないけど、分布の裾にあたるねじを買わされるお客様がかわいそうだぞ……。
さておき、母分布が正規分布でないときの母分散の検定だけど、そもそも母分布が正規分布でないときには何が違ってくるのか考えてみようよ。
が大きい場合を考えよう。中心極限定理を利用することはできないかな?
以前にもそのようにしたのでそれは検討しましたが、 は中心極限定理を適用できる形になっていませんよね。中心極限定理を適用するからには、「 個の観測の平均」といった形になっていなければなりませんが、そうなっていません。
定理〈 中心極限定理 〉 をそれぞれ独立に同一の分布(平均
,分散
)にしたがう確率変数とする。このとき、
は
に分布収束する。
一応
と変形できますが、こうしたからといってやはり
は「
個の観測の平均」にはなっていませんし……。
そうなんだよね。だから、真の平均の周りでテイラー展開できないかな。
(中略)
デルタ法をまとめておきます。
定理〈 デルタ法 〉
を
で
微分可能な関数とする。
を確率ベクトル列とする。このとき、
であるような数列
に対して、
が
に分布収束するならば、以下の両方が成り立つ。
- は に分布収束する。
- は に確率収束する。
ヤコビ行列
の定義より
であるので、
とおくと、
ですが、ここで、
ランダウ記号と確率的
ランダウ記号の関係の
補題から、
です。この両辺に
をかけることで 2. を得ます(詳細略)。1. は
連続写像定理とスラツキーの定理などを駆使すると得られます。
中略の箇所が途中