雑記


母集団分布という言葉がある。英語では population distribution らしい。しかし、population distribution で検索すると(ある国の地域ごとや年齢ごとの)人口の分布が出てくるケースが多い。それはそれとして母集団分布とは、母集団の分布であるらしい。が、有限母集団の場合にはこの言葉は曖昧なように思われる [注1]。自分は以下の 3 つの派閥があるのではないかと勝手に想像している。

  • 有限母集団であったときの「母集団分布」とは、
    1. 有限母集団には断りなく定義されないよ派
    2. 有限母集団のヒストグラムがつくる離散分布をそのまま指しているよ派
    3. 有限母集団に対して統計的推測の都合上仮定した生成分布を暗に指しているよ派

場面場面で察すればいいので何も本質的な話ではない。ただ、断りなく 3. を指しているような文献がみられるようにも思われたので母集団分布とはこのような意味をもつ用語なのか調べたところそう明記する文献をみつけられなかったというだけの話である。「母集団分布の意味は 2. であるが 3. を仮定する(3. で近似する)」といった文献はみられた。


分布のパラメータ(しばしば「母数」とも)というとポアソン分布に対する期待値のような、確率(密度)関数に陽に出てくる定数といった印象を受けるが(筆者は)、分布のパラメータといったときは一般に分布を特徴付ける量であるはずなので、「特徴」といった方がわかりやすいと思う。しかし、例えばポアソン分布の期待値ではなく歪度をパラメータとしたいのであれば、歪度を主役にしたポアソン分布 ′ を定義して確率関数に陽に登場させることはできるので、何も本質的な話ではない、はずである。



[注1] 無限母集団の場合は、そもそも前提として 3. の生成分布が存在するので、これが自然に「母集団分布」であるとは思われる(そもそも 2. と 3. が一致するともいえる)。[日本統計学会, 2013] の 54 ページにも以下のように「確率分布が考えられ」→「無限母集団と呼ぶ」とある。もっとも、この本では「母集団分布」なる言葉はつかっていない。
同一条件で繰り返して実験や調査、観測が行えると仮定できる場合に、ある確率分布からの無作為抽出により標本が得られると考えられ、この確率分布と、得られるであろう無限の標本を同一視して無限母集団と呼ぶ。