読者です 読者をやめる 読者になる 読者になる

Machine Learning: A Probabilistic Perspective: ノート1

本読み 機械学習

この本を読みます。

Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series)Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series)
Kevin P. Murphy

The MIT Press 2012-08-24
売り上げランキング : 1840

Amazonで詳しく見る
by G-Tools

次回:ノート2
目次:Machine Learning: A Probabilistic Perspective

今日読んだページ: まえがき、1~9ページ
以下、自分の解釈・感想。雑感多い。PRML は持っているけど読んでいない。

  • そもそもこれは学部後期生~修士の学生向けの本で、多変量解析・確率・線形代数・プログラミングの知識は前提としていますよ、統計学は望ましいが必須ではないですよ、とのこと。
  • ベイジアンアプローチ」だとちょっと言葉が強烈なので「確率的なアプローチ」という言葉をつかうと(xxviiページ最後の方)。わかる。といっても最尤推定とか実際ベイジアンでない手法もしばしばつかうと。
  • 本筋から逸れるけど、「modularity(xxviiiページ)」というのは "差異の体系" のような意味でつかわれるのだろうか。ここでは、モデルとアルゴリズムを区別した方が便利だから区別するよ、という強調と理解。
    • ネットワーク用語の modularity も、どのようにグループ分けするとどれくらいよいか、を指すので、なんかそんな感じ。
  • MATLAB の PMTK パッケージにほとんどの手法が実装されており、フリーウェアの Octave でも一部使用できると。MATLAB は使ったことがないが、もし入れたくなったら Octave を入れてみよう。
  • 1.1.1 節は日本語 PRML 上巻の2~3ページに該当する機械学習のタイプの紹介で、説明していることは全く同じだけど、こちらの方が具体的な表式があって個人的にはその分読みやすい。
  • 1.2.1.2 節の括弧書き=2クラスしかないならベクトルでなく実数でよい(4ページ)の意味。一応。
    • 「このメールがスパムかそうじゃないか」という2値分類だったら、p(y|x, D) = 0.23 で表現できる。
    • 「この手書き数字は 0, 1, ..., 9 のどれか」という10値分類だったら、p(y|x, D) = (0.14, 0.03, ..., 0.06) のようなベクトルにする必要。
  • 確率的な予測が必要なのは、曖昧さを扱わないといけないから、というのもそうだけど、実際、いつも判断を下すだけでなく「"I don't know"(4ページ)」という回答をすることも場合によっては重要だから。そう思う。
  • Figure 1.2 がグレースケールに見えるのは解像度の問題ですよね…共起行列ですよねこれ…。
  • iris は R でもお馴染み。この機会にメモしておくと、sepal=がく片、petal=花弁。setosa の花びらが versicolor,virginica に比べて小さいのか写真からはよくわからないけど長さも幅も同じくらい小さいから形だとよくわからないんだろう。植物学のことはよくわからないけど、がく片と花弁のサイズから品種を推定するわけではあるまいし(そうだったらすみません)、品種ごとの特徴を見出すのに機械学習をつかうということなのだろうか。だとしたら、他の教師あり学習の用途とは毛色が違うのかなあと。
  • Figure 1.5 (b) はとても手書き数字に見えないけど分類器ではばっちり手書き数字に認識されてしまうパターン、という理解だけど、暗号などにつかえそうで面白そうだなあと思いました。
  • ロボットアームの位置は実際DLMのようなモデルで扱うのだろうかと思いました。