雑記

お気付きの点がありましたらご指摘いただけますと幸いです。

母分布が正規分布のときは標本分散がしたがう分布がわかります。ここで、 \chi_{n-1}^2 は自由度  n のカイ2乗分布の意です。

命題 ア〈 正規分布からの標本の分散がしたがう分布 〉
 X_1, \, X_2, \, \cdots, \, X_n をそれぞれ独立に \mathcal{N}(\mu, \, \sigma^2) にしたがう確率変数とする。
 X_1, \, X_2, \, \cdots, \, X_n の分散を S_n^2 \equiv n^{-1} \sum_{i=1}^n (X_i - \overline{X_n})^2 とおく。

このとき、 n S_n^2 / \sigma^2 \chi_{n-1}^2 にしたがう。

母分布が正規分布でないときには標本分散がしたがう分布がわかりませんが、4次までの中心モーメントが有限であれば漸近分布がわかります。モーメントよりも尖度を分布の性質として議論することが多そうなので、尖度でも表記しておきます。
命題 イ〈 標本分散が漸近的にしたがう分布 〉
F を 1, 2, 3, 4 次の中心モーメント  \mu_1, \, \mu_2, \, \mu_3, \, \mu_4 が有限であるような分布とし、 X_1, \, X_2, \, \cdots, \, X_n をそれぞれ独立に F にしたがう確率変数とする。
 X_1, \, X_2, \, \cdots, \, X_n の分散を S_n^2 \equiv n^{-1} \sum_{i=1}^n (X_i - \overline{X_n})^2 とおく。

このとき、 \sqrt{n}(S_n^2 - \mu_2) \mathcal{N}(0, \mu_4 - \mu_2^2) に分布収束する。

命題 ウ〈 標本分散が漸近的にしたがう分布(尖度で表記する版) 〉
F を 1, 2, 3, 4 次の中心モーメント  \mu_1, \, \mu_2, \, \mu_3, \, \mu_4 が有限であるような分布とし、 X_1, \, X_2, \, \cdots, \, X_n をそれぞれ独立に F にしたがう確率変数とする。
 X_1, \, X_2, \, \cdots, \, X_n の分散を S_n^2 \equiv n^{-1} \sum_{i=1}^n (X_i - \overline{X_n})^2 とおく。

このとき、 \sqrt{n}(S_n^2 / \mu_2 - 1) \mathcal{N}(0, \kappa + 2) に分布収束する。

ただし、\kappa \equiv \mu_4 / \mu_2^2 - 3F の尖度である。

ここまでくると、母分布が正規分布でないときにカイ2乗検定をするとどのように誤るかがわかります。先に結論をいうと、以下のようになります。
命題 エ〈 母分布が正規分布でないときにカイ2乗検定をしたとき帰無仮説が棄却される確率 〉
F を 1, 2, 3, 4 次の中心モーメント  \mu_1, \, \mu_2, \, \mu_3, \, \mu_4 が有限、特に \mu_2 = 1 であるような分布とし、 X_1, \, X_2, \, \cdots, \, X_n をそれぞれ独立に F にしたがう確率変数とする。
 X_1, \, X_2, \, \cdots, \, X_n の分散を S_n^2 \equiv n^{-1} \sum_{i=1}^n (X_i - \overline{X_n})^2 とおく。

また、c_{n-1, \alpha} を自由度  n-1 のカイ2乗分布の上側 100 \alpha パーセント点とする。
z_{\alpha} を標準正規分布の上側 100 \alpha パーセント点とする。
\Phi(x) を標準正規分布の累積分布関数とする。

このとき、 a_n \equiv \mathbb{P} (n S_n^2 > c_{n-1, \alpha}) \displaystyle 1 - \Phi \left( z_\alpha \sqrt{\frac{2}{\kappa + 2}} \right) に収束する。

これを示すには、以下のようにかき換えて、

 \displaystyle a_n = \mathbb{P} (n S_n^2 > c_{n-1, \alpha}) =  \mathbb{P} \left( \frac{\sqrt{n} S_n^2 -1}{\sqrt{\kappa + 2}} > \frac{c_{n-1, \alpha} - n}{\sqrt{2n}} \sqrt{\frac{2}{\kappa + 2}} \right)

このうえで n を大きくとり、命題 ウ と後述の命題 オ の漸近分布によみかえます。

命題 オ〈 カイ2乗分布の自由度を大きくしたときの漸近分布 〉
 X_1, \, X_2, \, \cdots, \, X_n をそれぞれ  \chi_{1}^2, \, \chi_{2}^2, \, \cdots, \chi_{n}^2 にしたがう確率変数とする。このとき、 (X_n - n) / \sqrt{2n}\mathcal{N}(0, \, 1) に分布収束する。
命題 エ の帰結は、母分布 F の尖度  \kappa0 より大きいならばそれだけ棄却限界が近づいてきてしまう、といえるでしょう。

途中