因果推論における手法や用語について、(私自身が)要点を定着させるために一言二言でまとめました。

1.ATE、ATT

どちらも「処置(介入)による効果(介入によってYがどの程度UP/Downするか?)を意味します。
「ATE」は「平均処置効果」(Average Treatment Effect)を意味し、「ATT」は「処置群における平均処置効果」(Average Treatment effect on Treated)を意味します。
前者(ATE)は、「データ全体における “介入時と非介入時のYの差の平均” 」であり、後者(ATT)は「処置群のデータにおける “ 〃 ” 」です。
ATTは、下記にある「傾向スコアマッチング」における推定対象になっています。

2.共分散分析

一言でいうと「(介入/非介入を示す)ダミー変数と共変量を用いて線形回帰を行う」手法であり、「回帰パラメータの値よりATEを推定する」目的で行われます。ダミー変数と共変量の両方を説明変数にする事で、「共変量とダミー変数の交絡(セレクションバイアス)の除外」を目指しています。

Zをダミー変数(介入⇒1)とし、共変量をXとする。\\
その時、下記のような回帰式を設定して、\\
介入によってYに与える効果(ATE)を推定する。\\
 \\
Y=β_0 + β_1 Z + β_2X\\
 \\
上記式の場合、得られたβ_1の推定量が、\\
ATEの推定量となる。

3.傾向スコア

一言でいうと「(共変量から推測した)介入となる確率」です。
なので「傾向スコアが近いデータ間はセレクションバイアスが小さいだろう」と考えられ、傾向スコアを用いて下記のような方法でATEやATTを推定します。

3-1. 傾向スコアマッチング

一言でいうと「処置群の各データそれぞれに対して、傾向スコアが近い非処置群データを1データ選定し、処置群データと選定された非処置群データから”処置による効果”を推定する手法」です。
これは(上記の通り、処置群の件数しか非処置群を使わないので)処置群のデータを対象にした推定、つまり(ATEでなく)ATTを推定する形になります。

3-2.逆確率重み付け(IPW: Inverse Probability weighting)

一言でいうと「各データについて、傾向スコアの逆数を重みとして(処置群、非処置群の)加重平均より処置効果を算出する」です。
上記の傾向スコアマッチングとは異なり、非介入データも全て使うので、ATEを推定する形になります。

4.DID(差分の差分法)

一言でいうと、「介入時期とその前の時期における差分を処置群、非処置群で算出し、それら差分の差分を算出することでATEを推定する」手法です。
つまり、介入”前”の時期のデータを用いる方法です。
注意点として、DIDの前提に「平行トレンド仮定」という仮定があります。
それは「処置群と非処置群それぞれの 時期トレンドの上昇/下降度合い が同じ」という仮定です。これが成り立たなさそうな場合、DIDは不適です。

5.Causal Impact

一言でいうと「処置群の “非処置時(観測不可)のY” を、処置前の時期における非処置のデータを用いて予測し、その予測値(処置群の非処置時のY)と観測値(処置群の処置時のY)より処置効果を推定する」方法です。
DIDの前提になっている平均トレンド仮定や、(予測にYを用いなければ)非処置群のYが不明であったも推定できる利点があります。

6.回帰不連続デザイン(RDD: Regression Discontinuity Design)

一言でいうと(特定の閾値で介入/非介入が決まる時に)「閾値付近のデータのみを用いてATEを推定する」方法です。
上記の通り、特定の閾値ではっきり介入/非介入が分かれるケースで用いられます。「閾値付近ではセレクションバイアスが小さいだろう」という考えが前提にあります。

By clear

データエンジニア・機械学習・分析等を主とし、Webアプリ開発も行っているフリーランスです。