こんにちは。やまもとです。
相変わらず、しばらく積読していた「因果性」(ダグラス・クタッチ2019)の続きを読み進めています。
前回までの、因果の反事実条件説や因果の決定性説では、「ある原因によってある結果が大抵引き起こされる」場合、「その結果が引き起こされないこともある」ため、「因果性がある」と判断できませんでした。しかし、ある原因に対して、ほとんどいつも同じ結果が得られれば、人は因果性を感じるでしょう。従って、これらの理論は、常識的な判断と差異が生まれてしまっています。
このような差異が生まれてしまうのは、ここまでの因果性の理論が「必然性」を前提にしていたためです。基礎的な物理学理論は、例外を1例も許さない(「99%正しい」は「間違い」となる)理論なので「必然性(100%正しい)」とうまく整合していました。しかし、高分子の化学や生物学、さらに上の医学のように、マクロな出来事の因果を扱おうとすると「必然性」は成立しにくくなります。
例えば、ある病気の原因であるウイルスが体に侵入したからといって、体調や免疫、生活習慣の違いによって、必ずしも発症するわけではありません。つまり、「出来事〈ウィルスの侵入〉が、絶対に出来事〈発症〉を引き起こす」とは言えません。それにも関わらず、その病気の原因はウイルスであることは特定できています。
つまり、必然性はなくとも因果性を確信することはできるわけです。
必然性の緩和
そこで、必然性を前提とした因果性の考え方「原因とは、結果を何らかの意味で必然化する単称の出来事である」を、以下の確率関係を前提とした因果性の考え方に変更します。
確率上昇
Cタイプの出来事からEタイプの出来事に向かう因果的規則性が存在する場合、C以外の事情が全て等しいとすると、Cの実例が生じなかった時よりもCの実例が生じた時の方がEの実例は生じやすい。
「因果性」(ダグラス・クタッチ、2019)
この考え方のポイントは以下の3点があります。
- 因果的規則性を前提にしており、ヒューム主義の因果の規則性説を土台にしている
- 「C以外の事情が全て等しい」とすることで、因果の決定性説における無条件性を適用している
- 「Cの実例が生じなかった時」と「Cの実例が生じた時」という反事実を比較しており、因果の反事実条件説とよく似ている
ポイント1からは、確率上昇の考え方には、規則性説のように因果的活力や物理学理論のような結果を生み出す何かを含まず、産出的因果ではないことが分かります。この点は、因果プロセス説や決定性説と明らかに異なる点です。
ポイント3からは、反事実条件説が差異形成因果の理論であったことから、確率上昇の考え方も差異形成因果を考えていることが分かります。ただし、反事実的依存性といった基本法則に頼らず、確率上昇説は現実世界で観測される統計的関係に基づいている点で、因果の反事実条件説とは異なります。
なお、統計学を知っている人には、「条件付き確率が条件なしの確率より大きい場合、因果性とみなす」と言うだけでわかってもらえるかもしれません。
因果の確率関係
哲学では、確率概念の定義にも論争があるそうですが、クタッチは難しく考えずに次のような考え方を推奨しています。
確率概念
私見だが、この問題を立てるにあたっては「一般に「確率」とはコルモゴロフの公理(あるいは適切な代替公理)によって統制された任意の量である」と考えた方がいい。そうすれば、この形式的な確率の構造を備えたさまざまな量を発見し、特徴づけられるようになる。
「因果性」(ダグラス・クタッチ、2019)
ここに出てくる公理とは次のようなものです。
確率の公理
公理1:任意の出来事タイプ(事象)がもてる最小の確率は0である。
公理2:考慮中の全ての可能性を網羅した集合(標本空間)の確率は1である。
公理3:互いに排反な出来事タイプ(事象)の集まりと、それらの出来事タイプ(事象)をすべて含む単一の出来事タイプ(事象)との間には、加法(足し算)的な関係が成り立つ。
「因果性」(ダグラス・クタッチ、2019)
ここで、数学の定義では出来事タイプを「事象」と言いますが、これは概念的には同じものです。
また、この公理を数学的に書き直すと、次のようになります。
3つ目の公理において、は和集合を、は積集合(共通部分)を、は空集合を表しています。3つ目の公理は、積集合(共通部分)が空集合なので、事象X,Yは互いに排反な(同時発生しない)関係であり、その場合はX,Yの和集合の確率がXの確率とYの確率の足し算に等しいことを表しています。
また、確率を物事を考える場合、頻度と確率の関係には注意が必要です。
例えば、正六面体のサイコロの「1」が出る確率は1/6ですが、60回サイコロを振ったとしても必ず「1」が10回出るとは限りません。また、もし「1」が8回出たとしても、確率が8/60になるわけではありません。この場合、頻度が8/60であって、確率は相変わらず1/6と考える必要があります。このとき、「十分に多くの試行を行えば、ある結果が出現する頻度は、ほぼ確率と等しくなる」(大数の法則)という仮定を信じて考えることになります。
そのため、因果性についても、次のように考えなければなりません。
確率と頻度
因果の確率上昇説における「確率」は、指定の結果が生じた現実の頻度にほぼ等しい大きさをもつが、ある種の状況では現実の頻度とズレることもある。
「因果性」(ダグラス・クタッチ、2019)
以上を踏まえて、ある2つの出来事タイプ(事象)に確率的な関係があるとは、次のように考えることができます。
因果の確率関係
ある出来事タイプCから別の出来事タイプEに向かう確率関係がもつ値は、Cタイプの出来事にEタイプの出来事が後続する現実の頻度を補正係数で修正したものに等しい。
こうした補正を経て最終的に得られる値が「CのもとでのEの確率」、記号で書けば、である。
数学用語で言い換えると、条件付き確率は、適切に定義されている場合、に等しい。
「因果性」(ダグラス・クタッチ、2019)
つまり、ある2つの出来事タイプの確率関係を、条件付き確率で表すということです。
因果の確率上昇説
ところで、先行する出来事Cと後続する出来事Eの間に確率関係があったとしても、それによって因果性があるとは考えられません。因果の確率上昇説とは、「潜在的な共通原因を全て考慮に入れても、なおCがEの確率を上昇させているなら、CはEの原因に違いない」というものです。
ただし、「CがEの確率を上昇させている」と言っても、これは「Cが生じた時の方がEが生じやすい」(差異形成)ことを意味しているだけで、「CがEを生じやすくさせている」(産出)を意味しているわけではありません。たとえ、CとEに何も相互作用が無かったとしても、CとEの確率関係は適切に定義できます。そのため、確率上昇説は、因果の産出性は考慮していないと念頭に置く必要があります。
これを踏まえた上で、最もシンプルな確率上昇説は、次のように定義できます。
シンプルな確率上昇説
- 「Cが原因でEが生じる」とは「CがEの確率を上昇させる」ことにほかならない
- 「CがEの確率を上昇させる」とは、以下のどちらかで定義される
- が成り立つ
- が成り立つ
しかし、ほとんどの研究者はシンプルな定義を用いていません。なぜなら、シンプルな定義には「因果の非対称性(結果から原因が生じることはない)」がない問題と「擬似相関の可能性(原因と結果の間には相互作用がないかもしれない)」がある問題があるためです。
シンプルな定義に従うと「EがCの確率を上昇させ」ていれば「Eが原因でCが生じる」と言えてしまうため、「因果の非対称性」を規定できていません。この問題の単純な解決策は「CはEより先に生じる」と規定することでした。ライヘンバッハ、グッド、スッピスがこの規定を用いましたが、ライヘンバッハは後に「共通原因原理」という複雑な処理を規定しました。
擬似相関は、出来事タイプCと2つの出来事タイプE1とE2に対して、CがE1とE2の共通原因になっている場合、E1とE2の間に発生します。シンプルな定義に従うと、またはさえ成り立てば、実際には因果性はなかったとしてもE1とE2の間に「因果性がある」と判断してしまいます。
擬似相関は、スクリーン・オフ(遮断)という性質で判断されます。スクリーン・オフとは、の場合、が成り立つことです。これは、「出来事Cさえ起きていれば、出来事E2が起きても起きなくても、出来事Cのもとで起こる出来事E1の確率は変わらない」ことを意味しており、これを「出来事CはE1からE2をスクリーン・オフする」といいます。結局のところ、「Cの存在が前提される場合、E1とE2は確率的に独立である」ことを意味しています。
確率上昇説の定義
上記のE2をスクリーン・オフした出来事Cは、確率関係にとっては背景要因です。すなわち、擬似相関の問題は、確率上昇を「適切な背景要因を条件に入れた上での確率上昇」と考えることで、回避できることになります。ですが、この「適切な背景要因」が確率上昇説の提唱者によって異なります。
以下では、「適切な背景要因」を考慮した確率上昇説の提唱者別の定義を、「因果性」(ダグラス・クタッチ2019)から引用します。
ライヘンバッハの定義
「Cが原因でEが生じる」とは、以下の条件が全て満たされていることにほかならない。
- CはEより先に生じる
- Cの生起に先行(または同時発生)し、かつ、CとEの相関関係をスクリーン・オフする出来事が存在しない
グッドの定義
「Cが原因でEが生じる」と言える度合いは、
で測定される。なお、FはCが生じる前に成立する全ての背景条件を示している。
スッピスの定義
「Cが原因でEが生じる」とは、以下の条件が全て満たされていることにほかならない
- CはEより先に生じる
- Cの生起に先行する出来事は、CとEの相関関係をスクリーン・オフするグループに入らない
カートライト&イールスの定義
「Cが原因でEが生じる」とは、「C以外のEの原因であり、かつ、CとEの間に位置しない全ての状態Bについて、が成り立つ」ことにほかならない。
利点と問題点
利点
因果の確率上昇説には、因果性に備わるいくつかの特徴を説明するのに役立ちます。
- 因果性は決定性を必要としない。
- 確率上昇説は、反事実条件文や架空の可能性に頼らない種類の差異形成を確立する。
- 交絡因子をコントロールしておくことで、統計的頻度から因果性をうまく推定できることがよくある。
問題点
「因果の非対称性」「擬似相関の可能性」を無事に回避できたとしても、因果の確率上昇説には次のような問題が残ります。
- 定義にデータの選択規則が含まれていないため、選んだデータによって結果が反転することがある(データ選択規則の欠如)
- 確率上昇説で単称因果を説明しようとすると反例が出てきて、うまく説明できないことがある(単称因果の反例)
まとめ
「因果関係をデータに基づいて統計的に推定する」という方法は、統計学や機械学習を学んだ方には理解しやすかったのではないでしょうか?
因果の決定性説が科学的で演繹的な因果性理論なのに対し、因果の確率上昇説は統計学的で帰納的な因果性理論と考えても良さそうです。
ともあれ、これでようやく因果性の程度を扱うことができるようになりました。