以下の論文を読みます。
[1803.06336] Applying the Delta method in metric analytics: A practical guide with novel ideas
KDD 2018 | Applying the Delta method in metric analytics: A practical guide with novel ideas
タイトルは「指標の分析への、デルタ法の応用―斬新なアイデアと実践ガイド」かな。
斬新なアイデアて。
それくらい発想して。
その次の節では、なんかもう所望の指標をモデリングしようという話になっていますね。中心極限定理は、独立に同一の分布にしたがう確率変数 の標本平均を 、真の平均と分散を とすると、 は で標準正規分布に分布収束するというものですね。昨日やりました。このことから母平均の信頼区間が見積れると。科学分野でエラーバーをみたらだいたいこれだろうと。ただこれだけだと利用できる場面が限定的すぎるということでデルタ法というのが続いて紹介されていますね。何か に依存する確率変数 と定数 が 以下を満たすとき( は分布収束)、
なるほど…この式の後にこの計算は parallelizable とありますが、この は標本平均 であるという前提で進んでいくんでしょうか。標本平均でなかったらサーバクラスタごとに並列に情報を蓄積していけるかわからないと思うんですが…まあ標本平均以外にどのような標本依存の確率変数がデルタ法の条件を満たすかわからないですが。それで、問題は、指標を計測するのに適切な がわからない? え?? 「指標を計測しよう → 並列化のためにデルタ法 を使おう → って何だっけ ← 今ここ」という状況なんですか?? どうしてその見通しなくデルタ法を使おうと思ったんですか??
まあそれだけ並列化する必要性が逼迫していたんじゃないかな…。それで、この論文では以下の4つの事例(多いな)への応用を紹介するらしいよ。
- ratio metrics(同じ指標の対照群と処置群における値の比)
- cluster randomized experiments(クラスターランダム化比較試験)
- outer confidence intervals
- within-subject studies(被験者内実験)
では一つ目からみていきましょう。
id | ||
---|---|---|
1 | 対照群での1人目の指標の値 | 処置群での1人目の指標の値 |
2 | 対照群での2人目の指標の値 | 処置群での2人目の指標の値 |
3 | 対照群での3人目の指標の値 | 処置群での3人目の指標の値 |
それはどちらも平均が とかの場合だね…。
まあでも確かに、まずはまともに出そうとしてみるべきだろう。ただそうするとなんだか分布自体が複雑だ。これじゃ信頼区間がよくわからない。だから Fieller は工夫した。たぶんこんな考え方だと思う。 は本来定数なんだと思ってノイズ を分離すれば となる。 の漸近分布は を用いてかける( が定数なら正規確率変数の線形結合なんだから簡単だ)。ただ本当は は になってくれなくちゃならない。 を大きくしても残る のノイズは が不確定だったせいなんじゃないか、と考えて に差し戻す…というのは以下の PDF の「1.2 Fieller’s theorem による比の信頼区間」を読んだ適当な解釈だけど。この Fieller の方法による信頼区間(タイプするのはしんどかったから論文をみて)は精度がよいらしい(サンプルがそこまで多くないときは;上の PDF にもデルタ法より Fieller の方法の方がよいとある)。そしてさらに、デルタ法を用いる方法がある(上の PDF にも 1.1 として載ってるね)。こっちの方が表式はシンプルになる。 を上の2変量のデルタ法に代入するとこうだ。Fieller さんの手法は検算しましたか?
めんどいからやってない。まあそれで、デルタ法はエッジワース展開によりさらによい近似に拡張できるとある。
エッジワース展開?
え? いや確かに、現実のシチュエーションでは、厳密にはそうでしょうけど。
そんな調整ができるんですか。私はてっきり、 次以上のモーメントはあきらめるしかないものだと…救出する方法があったんですね。
ただ Edgeworth series - Wikipedia には、一般にエッジワース展開は確率分布の「非負」「積分して1」という性質を保証しなくなってしまうことや、平均の周りでの展開であるので裾について誤差が出やすいなどの欠点がかいてあるね。