以下の論文を読みます。
https://hal.archives-ouvertes.fr/hal-00780300/document
喩えが大災害だな…。
しかし、隕石がいつ庭に落ちてくるかずっと監視しているほど暇ではありませんので、一定時間間隔 ごとに、その時点までに降ってきた隕石の総質量 が観測されるのみとしましょう。このときに隕石の質量がしたがう確率密度 を推測するのが今回のやりたいことですね。無論 も も未知です。
いや庭に隕石が振ってきたら気付くよね普通…。
複合ポアソン過程はレヴィ過程の特別な場合で、レヴィ密度が の場合に相当します。なので、もし が既知ならば の推定はジャンプのみからなるレヴィ過程のレヴィ密度の推定に等しいと。これについてはこれまでに多くの論文で取り扱われているとあります。しかし、複合ポアソン過程に特化した推定手法も研究されていて、Buchmann and Grübel (2003) は初めて特に を推定する手法を考案したのですかね? 実際、1回の観測間隔の増分 の確率密度は以下のようになるということです。
まず時刻 までに隕石の降ってくる回数 がしたがう確率分布は だから、時刻 までに1個も隕石が振ってこない確率は で、1個以上隕石が振ってくる確率は だね。さらに 回隕石が振ってくるとき、その質量の和 がしたがう密度関数は、 を 回畳み込んだ関数になる。…あたりをつかえば、 と が成り立つことが容易にわかるよ。
だから増分 をたくさん観測しても のデータについては を知る上で「何の足しにもならない」…その 間に隕石が降ってこなかったら隕石の質量がしたがう分布について何も得るものがないのは当然だよね。だから van Es et al. (2007) はゼロでない観測だけ抜き出したらしい。以下のようにすれば増分がゼロでないインデックス だけ取ってこれるね。…合成積ってフーリエ変換すると、合成積する前の関数のフーリエ変換の積になるよね。そう考えると、 って両辺をフーリエ変換すれば右辺がエクスポネンシャルのマクローリン展開にみえる。そう考えて式変形すると以下までたどり着けるかな。
なるほど…先に進むと、以降、 を表記するとき を省くとあります。そして、「確率密度 からの 個のサンプルから、 の『-consistent nonparametric estimator』がつくれることはよく知られている」とありますね。これはどういう意味ですか? 私によく知られていないんですが。
おお、これで隕石の質量がしたがう分布 が手に入り…ませんね。副部長、いま隕石が到着する頻度の強度 は未知です。右辺に があっては駄目でしょう。
え、ああ、まだイントロダクションだったんですね…普通に番号付きの数式がどんどん出てくるのでてっきりもう本論に入っているのかと…。それでようやく2節に進むと、この節は Proposition 2つからなっていますね。1つ目の Proposition の主張は、 に対して、以下が成り立つということですか?
「k-1回目までの観測ですべて『隕石が1個も降ってこない」を引く確率」
×「k回目の観測で『隕石が1個は降ってくる』を引く確率」
×「その観測での増分がゼロでない条件の下で、その観測の増分 が 以下である確率」
証明は 9 ページにあるね。まず とおいている。これは 間に「『隕石が1個は降ってくる』を引く確率」だね。これは、 の関係がある。そうすると、 となる。 は 間に「『隕石が1個は降ってくる』を引く確率」(の逆数)を求める量に変換してくれる関数だったってだけだね。そして、 間に「『隕石が1個は降ってくる』を引く確率」の最尤推定量は になる。 は「隕石が1個は降ってくる」を 回観測するのに費やした観測の回数だからね。だから としたいけど、 は になりうるのでこれはできない、か。確かに観測する度に隕石が1個以上落ちているケースだと、隕石が落ちたインデックスから強度を逆算しようとしても「常に隕石が落ちてる」にしかならないね。 が より大きくないと困る。だから、真の強度が入っている区間を だろうということにしておいて、観測された が想定される範囲をずれていたら はゼロにしてしまうという回避策を入れたみたいだ。実際、 は強度が大きいとゼロに近づくし…ただ、 だと の推定はできなさそうだな…。
その推定方法で目的の量を推定した結果を貼っておきます。いまサンプルの強度しか関係しないので単なるポアソン過程を生成しました。まあこれだけだとだから何なんですが…。