因果推論の仮定について
はじめに
本記事では、統計的因果推論を実行する際に置かれている仮定について書いていきます。
実務においても、傾向スコアやDIDなど、因果推論の手法が使われることはよく耳にしますし、利用されている方も多いと思います。
一方で、実務の現場では、これらの手法が利用できる条件や、因果効果を識別するために必要とされている仮定についてまで真剣に向き合っている分析は多くはないように思います。一度、本記事を通して、因果推論の際の仮定について向き合ってみましょう。
因果推論では、欠測データの解析を基調としたRubinの因果推論(傾向スコアを用いたマッチング・層別解析など)と、パス解析やグラフィカルモデルを基調としたPearlの因果推論(因果ベイジアンネット・構造的因果モデルなど)、大きく2つの流派があります。(2つの流派の定義・考え方の違いについてはまた別の記事にしようと思いますが、本記事では、ざっくり上記の定義で話を進めます。)
これら2つの流派によっても、必要とされる仮定が一部異なっていることがあります。その場合は、2つの流派での捉え方の違いついても触れていきます。2つの流派を分けて考えることに意味があるかはわかりませんが、科学哲学的にも面白い思ったので、整理します。
潜在的結果変数の存在について
早速、仮定としては聞きなれない部分かもしれません。というより、当然として分析に入っているケースが多いように思います。潜在的結果(Potential Outcome, 反実仮想)が存在する、という仮定です。
Rubin流の因果推論では、欠測した潜在的結果変数の予測が前提になっていることから、実は潜在的結果変数の存在が前提となっています。その前提条件の正しさを検証できないという点は、形而上学的であり、非科学的であると指摘されています。(Dawid, 2000)
一方のPearl流の因果推論では、do演算子を用いた介入表現により、潜在的結果変数を直接は利用しません。因果効果は、do演算子を用いた介入前後の期待値の差として定義されます。潜在的結果も構成する(計算する)ことはできますが、仮定としては必要なく、前提としているわけではありません。
SUTVA(Stable Unit Treatment Value Assumption)について
SUTVAは、次の2つの仮定のことを指しています。
- ① No Interference between units
他者が介入を受けることが、それ以外の人の潜在的結果について影響を及ぼさないという仮定。例えばワクチン接種がウイルスの感染しにくさに対して与える影響を分析することを考える。この時、Aさんがワクチン接種をすることで、身近にいるBさんのウイルス感染確率にも影響が発生することが予想される。この場合は、仮定が成り立たない。 - ② No versions of treatments
処置がすべて同一、という仮定。例えば、手術による治療の効果を考える際には、担当医師の技術力に関わらず潜在的結果変数の値が変わらない、という仮定となる。
Pearl流の因果推論では、①の仮定は必要とするものの②の仮定は必要ありません。仮定というよりはむしろ、データ生成過程から導き出される性質(定理)として解釈されます。
Rubin流の因果推論では、上記の2条件に基づいて、後述の一致性が定義されます。
②の仮定や、①②の仮定を合わせて、後述の"一致性"と同義とみなす文献(大久保, 2023)もあれば、別で定義する文献もあります。(黒木, 2012)
交換可能性(exchangeability)について
exchangeabilityは、因果推論において最も重要な仮定であり、因果推論手法は、exchangeabilityを満たすための工夫です。(大久保, 2019)
言い換えると、「介入群と対照群の2群の差は介入の有無のみであり、2群を入れ替えたとしても、観察されるYの差が変わらない」という仮定です。
理想的な実験ではexchangeabilityが成立しますが、調査観察を用いる場合には、exchangeabilityはまず成立しません。そのような場合には、共変量で条件づけた交換可能性(Conditional Exchangeability)が成立するように調整を行うことで、因果効果を推定します。
Conditional Exchangeabilityをもう少しイメージ的に書くと、同じ共変量をもつA群とB群を介入群と対照群に分けて分析する場合、介入群としてA群を選ぼうがB群を選ぼうが、介入群と対照群の結果変数の期待値の差は変わらない、ということです。
exchangeabilityは、他にも無視可能性(ignorability)や独立性(independence)、と呼ばれることがあります(大久保, 2023)。ややこしいですね。
Rubin流の因果推論でもPearl流の因果推論でも必要とされている仮定です。(Pearl流の因果推論では、バックドア基準を用いて変数選択をすることで、Conditional Exchangeabilityを満たすことが知られています。)
一致性(consistency)について
一致性は、「処置を実際に受けた(受けていない)時の結果は、処置を受けた(受けていない)場合のYの値(潜在的結果変数)に一致する」、という仮定です。より具体的には、次の2つの仮定として整理できます(大久保, 2023)。
1つ目は、「処置が具体的に十分に定義されている」、という仮定です。マーケティングでいうならば、例えばテレビ広告の効果を検証する場合、介入群の中に、"テレビ広告に1回接触した人達" と"テレビ広告に1回、デジタル広告に1回接触した人達" がいてはいけないということです。
2つ目は、「潜在的結果で想定する処置が観測された処置と一致する」、という仮定です。具体的かつ十分に定義された仮想的な処置が、観測された処置と一致していなければ、潜在的結果が条件付き確率で表現できないためです。例えば、介入群の中に、薬を処方されたのにも関わらず薬を摂取しない、というようなサンプルがいると、この過程が成り立たなくなります。
一致性が担保されにくい処置の例としては、肥満・性別・所得・人種、などがあります。
例えば肥満を例にすると、肥満には、運動不足・食べ過ぎ、など、複数の原因が考えられます。肥満が健康に対して及ぼす影響を分析する際に、運動不足で肥満になった人と食べ過ぎで肥満になった人のどちらを介入群に設定するかで、分析結果がかわってしまうことは想像がつきます(肥満という介入を起こすための処置の乖離によって、結果が変わってしまう)。
肥満になる原因が、処置によって肥満を誘発する方法と異なると、"潜在的結果で想定する処置 = 観測された処置" が必ずしも成立しなくなってしまう、ということですね。
SUTVAの説明で触れた通り、一致性は、Rubin流の因果推論の際に必要とされる仮定のことです。
一方で、Pearl流の因果推論では、一致性は仮定ではなく、データ生成過程から導かれる定理となります。
また、SUTVAの②の仮定や①②の仮定を合わせて、一致性と解釈されることもあります。
正値性(positivity)について
特定の共変量を条件づけた際に、いずれの処置に当てはめられる確率も0でない、という仮定です。言い換えれば、どのサンプルも、処置群・対照群それぞれに当てはめられる確率が0でないという仮定です。0である場合、潜在的結果を定義できなくなってしまうため、positivityの仮定が必要となります。
数式では、$P[T=t] > 0$、のように表記できます。positivityは共変量で条件づけるときも必要な条件であり、その場合は、$P[T=t|X=x] > 0$のように表記できます。
positivityは、Rubin流・Pearl流、ともに必要な仮定となります。
SITA(Strongly Ignorable Treatment Assignment)条件について
上述の、交換可能性(exchangeability, ignorability)と、positivity(正値性)を合わせて、SITA条件とされています。日本語でいうと、「強く無視できる割り当て条件」となります。
傾向スコア解析の際に議論になることが多いですが、ignorability, positivityを合わせた考え方という点から、実際は、Rubin・Pearlどちらの流派でも必要となる仮定だと考えています。
(この部分、自信がないので、間違いがあればぜひコメントでご指摘ください。)
Pearl流の因果推論ならではの仮定
これまでは、RubinとPearl、どちらの場合でも話題に挙がる仮定をメインで記載していました。ここからは、特にPearl流の因果推論特有の仮定について記載します。本節は、(黒木, 2017)から引用しています。
データ生成過程の仮定
因果関係は、有効グラフ上に記述される変数、グラフ上には現れないもののグラフ上にある変数の挙動を規定する錯乱項、そしてデータ生成過程を表現した構造方程式モデルに基づいて記述される。
自律性
構造方程式モデルに含まれる構造方程式のいくつかが構造的に変化したとしても、そのほかの構造方程式の構造に影響を与えることはない。具体的には、回帰式の一部をdo演算子を用いた介入表現で固定しても、他の変数や係数に影響しない、という性質。
まとめ
それぞれの流派と前提としている仮説について、表に整理してみました。
一口にRubin流といっても様々な手法が存在し、手法によっても必要な仮定は異なる部分がありそうなので、その部分の整理は今後の課題とさせてください。
最後に
因果推論の仮定についていざ調べてみると、研究者によって使っている単語や意味合いが異なる部分があり、かなりややこしかったです。本記事では、代表的な仮定については記載しましたが、まだ書ききれていない仮定も存在すると思います。
また、今回は整理のためもあってRubin流/Pearl流という分け方をしていましたが、すべての手法がRubin流/Pearl流に分けられるわけではないと思いますし、そもそも分けて考えることには意味がないかもしれません。
本記事ではいくつか仮定を紹介しましたが、正直なところ実務においては、記載した仮定をすべて満たした上で分析することはほぼ不可能だと思います。(というより、そもそも仮定が成り立っていることを示すこと自体が難しい)
重要なのは、こういった仮定があるということを知ったうえで分析を実行にうつし、分析の解釈・考察を深めることを通して、少しでもマシな意思決定に繋げることだと考えています。
参考文献
・大久保将貴. (2019). 因果推論の道具箱. 理論と方法, 34(1), 20-34.
・大久保将貴. (2023). 統計的因果推論入門: 関連が因果となる条件. 理論と方法, 38(1), 169-180.
・黒木学, & 小林史明. (2012). 構造的因果モデルについて. 計量生物学, 32(2), 119-144.
・星野崇宏, & 岡田謙介. (2006). 傾向スコアを用いた共変量調整による因果効果の推定と臨床医学・疫学・薬学・公衆衛生分野での応用について. 保健医療科学, 55(3), 230-243.
・https://www2.econ.tohoku.ac.jp/~isgk/lec_material/suri_tokei2023/SuriTokei2023_26.pdf