雑記

2022-04-05 解釈がおかしいのでそのうち修正します。改行がおかしいのは修正できません。

参考文献

  1. 井手 剛. 入門 機械学習による異常検知―Rによる実践ガイド―. コロナ社, 2015.
  2. 入門 機械学習による異常検知―Rによる実践ガイド: ノート2 - クッキーの日記
  3. 日本統計学会 編. 日本統計学会公式認定統計検定 統計検定1級対応 統計学. 東京図書株式会社, 2013.
    • 22 ページに確率変数の変換公式 $f_{UV}(u,v) = f_{XY} \bigl( h(u, v)\bigr)| J(u,v)|$ がある。ここで $h$ は変数変換 $g$ の逆変換であり、$J$ は $h$ のヤコビアンである。縦線は単に絶対値である。この式は以下のように解釈できる。
      • $f_{UV}(u,v) dudv$: 変換後の座標で点 $(u,v)$ を起点にした微小な正方形に対応する確率。
      • $ f_{XY} \bigl( h(u, v)\bigr)| J(u,v)| dudv$: 変換前の座標で点 $(u,v)$ に対応する点を起点にした微小な平行四辺形に対応する確率。$h$ が座標のメッシュを引き延ばすならそれだけ広い範囲の確率が変換後の正方形に集まる。


いま考えたい問題は以下である。参考文献の [1] 26~36ページで示されている。
問題.
それぞれ独立に 1 次元正規分布 \mathcal{N}(\mu, \sigma^2) にしたがうサイズ $N+1$ の標本 $X_1, \cdots, X_N, X_{N+1}$ がある。 $X_1, \cdots, X_N$ の標本平均を \overline{X}_{1:N}、標本分散を $V_{1:N}$ とするとき A \equiv (X_{N+1} - \overline{X}_{1:N})^2 / V_{1:N} がしたがう分布を求めよ。
以下の証明は不完全であるというか [2] のときのノートのままである。
証明.
分子と分母は独立にカイ2乗分布にしたがうので以下を求める。
 x \sim \chi^2(m, a), \; y \sim \chi^2(n, b) のとき、 \displaystyle z \equiv \frac{x/(am)}{y/(bn)} \sim \mathcal{F}(m, n) を示せ。
確率密度関数を書き下す。  \displaystyle f_X(x) = \frac{1}{2a \Gamma (m/2)} \left( \frac{x}{2a} \right) ^{m/2 -1} \exp \left( -\frac{x}{2a} \right)  \displaystyle f_Y(y) = \frac{1}{2b \Gamma (n/2)} \left( \frac{y}{2b} \right) ^{n/2 -1} \exp \left( -\frac{y}{2b} \right)  w=y, \; z=bnx/(amy) に変数変換する。 x = amwz/(bn), y = wヤコビアン \displaystyle J(w, z) = \begin{vmatrix} amz/(bn) & amw/(bn) \\ 1 & 0 \end{vmatrix} = -\frac{amw}{bn} なので、 w, \; z の同時確率密度関数は、  f_{WZ}(w, z) = f_{XY}\bigl( amwz/(bn), \; w \bigr) \bigl| J(w, z) \bigr|       \; \displaystyle = \frac{1}{2a \Gamma (m/2)} \left( \frac{mwz}{2bn} \right) ^{m/2 -1} \exp \left( -\frac{mwz}{2bn} \right) \cdot \frac{1}{2b \Gamma (n/2)} \left( \frac{w}{2b} \right) ^{n/2 -1} \exp \left( -\frac{w}{2b} \right) \cdot \frac{amw}{bn}       \; \displaystyle = \frac{z^{m/2 -1}}{2b \Gamma (m/2) \Gamma (n/2)} \left( \frac{m}{n} \right) ^{m/2}  \left( \frac{w}{2b} \right) ^{(m+n)/2 - 1} \exp \left( -\frac{w}{2b} \bigl( \frac{mz}{n} + 1 \bigr) \right) z の分布を出すには、これを  w について積分すればよい。  \displaystyle f_Z(z) = \int_0^{\infty} dw f_{WZ}(w, z)     \displaystyle \, = \frac{z^{m/2 -1}}{2b \Gamma (m/2) \Gamma (n/2)} \left( \frac{m}{n} \right) ^{m/2} \int_0^{\infty} dw \left( \frac{w}{2b} \right) ^{(m+n)/2 - 1} \exp \left( -\frac{w}{2b} \bigl( \frac{mz}{n} + 1 \bigr) \right)     \displaystyle \, = \frac{z^{m/2 -1}}{\Gamma (m/2) \Gamma (n/2)} \left( \frac{m}{n} \right) ^{m/2} \left( 1 + \frac{mz}{n} \right) ^{-(m+n)/2} \int_0^{\infty} dt \cdot t ^{(m+n)/2 - 1} \exp (-t)     \displaystyle \, = \frac{\Gamma (m/2 + n/2)}{\Gamma(m/2) \Gamma(n/2)} \left( \frac{m}{n} \right) ^{m/2} z^{m/2 - 1} \left( 1 + \frac{mz}{n} \right) ^{-(m+n)/2} これは自由度 $(m, n)$ の F 分布である。