雑記

お気付きの点がありましたらご指摘いただけますと幸いです。

💜

f:id:cookie-box:20211229165400p:plain:w70
  • 参考文献 [1] に A~F の 6 つの DAG がありますね。
  • A は、X が「ピアノを習っていた」で、Y が「東大生」で、Z_1 が「家が金持ち」というやつでしょうか。ピアノを習うと頭がよくなるのではなく教育にお金をかけられるだけとよくいわれるあれです。真偽は知りません。そしてこの Z_1 はまさしく「交絡因子」ですね。交絡因子の要件は以下でした。
  • E は、X が「砂糖の価格」で、Y が「カカオの価格」で、C_1 が「チョコレートの価格」という例はどうでしょうか。現実にはこのような例で因果を取り違えないでしょうが……。
  • では D は……X が「カカオの価格」で、M が「チョコレートの価格」で、Y が「アーモンドチョコレートの価格」とか……食べ物の例ばかりになってしまいました。
  • 面倒なので開き直って全部食べ物で考えましょう。B は、X が「強力粉の価格」で、Y が「カスタードクリームパン」の価格です。一見問題がなさそうにみえますが(?)、カスタードクリームの原料には薄力粉が含まれます。そこで U_1「小麦の価格」を考慮するために Z_1「薄力粉の価格」で調整すると。……これをしなければ因果効果を見誤るケースって、「強力粉は小麦粉の価格に鈍感だが、薄力粉は小麦の価格に敏感であるために、クリームパンの価格の強力粉の価格への敏感度合いを見誤ってしまう」とかでしょうか。
  • C は逆に、X がカスタードクリーム、Y がカスタードクリームパン、U_2 が小麦、Z_3 が薄力粉でいいですね。
  • D は、X が小麦、Y がカスタードクリームパン、であるときに、薄力粉 M で調整してはいけないと。
  • というか本文の「合流点バイアス」という言葉をみて思い出しましたが、E は、X が大学入試での数学の点数、Y が大学入試での英語の点数、C_1 が大学入試に合格したかどうか、という例が有名でしたね……。
  • とすると F の Z_4, Z_5 は、高校での数学のテストの点数と英語のテストの点数になるでしょうか。
  • そもそも参考文献の [1] の下の方までみると具体例がありますね……。