観察研究のデザイン概論①

東京大学大学院情報学環 准教授 篠崎 智大

介入の有無

治療や健康行動に関して、研究目的で実験的な介入1厚生労働省、人を対象とする生命科学・医学系研究に関する倫理指針ガイダンス、厚生労働省ホームページ、2021年、https://www.mhlw.go.jp/content/000769923.pdf、2025年1月27日
このガイダンスによれば、介入とは「研究目的で、人の健康に関する様々な事象に影響を与える要因(健康の保持増進につながる行動及び医療における傷病の予防、診断又は治療のための投薬、検査などを含む。)の有無又は程度を制御する行為(通常の診療を超える医療行為であって、研究目的で実施するものを含む。)」と定義されています。つまり、治療や健康行動に関して、対象者に制限を与えて実験的な環境に置くことだといえます。
を含む研究を介入研究(interventional study)と呼びます。特に、介入をランダムに割り付ける研究が RCT です。RCT が因果推論の「ゴールドスタンダード」と位置づけられる主な理由は、ランダム化により、介入群と対照群が平均的には同じような集団になることが期待できるからです。この性質は、因果推論では交換可能性(exchangeability)2特定の介入群A(例えば「試験治療群」)と別の介入群B(例えば「通常治療群」)が同じような集団構成になっているなら、介入群AとBの介入内容を入れ替えたとしても(この例ではAを「通常治療群」、Bを「試験治療群」としても)期待的に同じ結果が得られることから名づけられました。もちろん介入群をランダムに分ける際の偶然性によって結果は確率的に変動しますが、これは統計的に評価できます。として知られています。2群が交換可能であれば、これらを比較した結果は因果効果として解釈できることになります3現代の因果推論で受け入れられている因果効果とは「同じ集団の異なる状態の比較」です。例えば、曝露群Aと非曝露群Bから成る対象集団における曝露の因果効果とは「AとBを合わせた集団全体が曝露を受けた場合」と「同じ集団全体が曝露を受けなかった場合」の比較です。2つの集団AとBが交換可能なら、曝露群Aは「集団全体が曝露を受けた場合」の、非曝露群Bは「集団全体が曝露を受けなかった場合」の結果に期待的に等しくなり、「異なる曝露状態にある、異なる集団AとBの比較」(これを関連:associationと呼びます)が因果効果に等しくなります。

介入を伴わない(したがってランダム化も行われない)観察研究では、一般に上の交換可能性が期待できません。これを交絡(confounding)が生じているといい、そのまま群どうし(曝露群 vs. 非曝露群など)を比較しても、RCTのように因果効果として解釈できる値を得ることができません。しかし、アウトカムリスク因子の組み合わせで集団を均質なサブグループに分けることで、各サブグループの中では比較しようとしている群どうし(曝露群 vs. 非曝露群)が概ね交換可能と見なせるならば、交絡を含む観察研究からも因果効果を推測できるようになります。このように「その組み合わせでできるサブグループ内では交絡がないと見なせるリスク因子」のことを交絡変数(confounders)と呼びます。

ここで強調したいのは、少なくとも現代の因果推論では、RCT・介入研究・観察研究を切り分けている「ランダム化や実験的介入の有無」は本質的に因果推論に必要でも十分でもなく、「同じ問い(因果効果)を、異なる条件下でどのように推定するか」という地続きの見方がなされている点です。一方では、介入研究として実際に医療や行動を制御することによって「もし介入を受けた場合のアウトカム」と「介入を受けた対象者で観察されたアウトカム」(観察データ)をリンクさせやすくし4因果一致性(causal consistency)という因果効果を観察データから求めるための条件の一つです。、さらにランダム化で介入確率を制御することができれば、上述の交換可能性とともに、各群に割り付けられる対象者が0ではないことを保証できます5介入確率の正値性(positivity)といい、因果一致性・交換可能性と合わせて因果効果のデータから求めるための十分条件の1セットとなります。。他方では観察研究であっても、上に挙げた条件が保証されないものの、交絡変数の十分な測定や対象集団の選定、さらに統計モデルによる近似などによって、「本来はどのようなRCTを行いたかったか」という視点から因果に迫る議論をする可能性が開かれていることになります。この発想が、第4回で扱う標的試験エミュレーションの基本思想となっています。

これを裏返すと、RCTが常に「最善のデザイン」とは限らないということです。費用や時間、倫理面の制約によってRCTが実施困難な場合があるだけでなく、一般に厳しい適格基準を満たし、さらに研究参加に同意してくれる対象集団は、実臨床への結果の移送可能性(transportability)や広い集団への一般化可能性(generalizability)を制限してしまいます。このようなRCTの問題の本質とその対策も、現代の因果推論で整理されてきています。

  • 1
    厚生労働省、人を対象とする生命科学・医学系研究に関する倫理指針ガイダンス、厚生労働省ホームページ、2021年、https://www.mhlw.go.jp/content/000769923.pdf、2025年1月27日
    このガイダンスによれば、介入とは「研究目的で、人の健康に関する様々な事象に影響を与える要因(健康の保持増進につながる行動及び医療における傷病の予防、診断又は治療のための投薬、検査などを含む。)の有無又は程度を制御する行為(通常の診療を超える医療行為であって、研究目的で実施するものを含む。)」と定義されています。つまり、治療や健康行動に関して、対象者に制限を与えて実験的な環境に置くことだといえます。
  • 2
    特定の介入群A(例えば「試験治療群」)と別の介入群B(例えば「通常治療群」)が同じような集団構成になっているなら、介入群AとBの介入内容を入れ替えたとしても(この例ではAを「通常治療群」、Bを「試験治療群」としても)期待的に同じ結果が得られることから名づけられました。もちろん介入群をランダムに分ける際の偶然性によって結果は確率的に変動しますが、これは統計的に評価できます。
  • 3
    現代の因果推論で受け入れられている因果効果とは「同じ集団の異なる状態の比較」です。例えば、曝露群Aと非曝露群Bから成る対象集団における曝露の因果効果とは「AとBを合わせた集団全体が曝露を受けた場合」と「同じ集団全体が曝露を受けなかった場合」の比較です。2つの集団AとBが交換可能なら、曝露群Aは「集団全体が曝露を受けた場合」の、非曝露群Bは「集団全体が曝露を受けなかった場合」の結果に期待的に等しくなり、「異なる曝露状態にある、異なる集団AとBの比較」(これを関連:associationと呼びます)が因果効果に等しくなります。
  • 4
    因果一致性(causal consistency)という因果効果を観察データから求めるための条件の一つです。
  • 5
    介入確率の正値性(positivity)といい、因果一致性・交換可能性と合わせて因果効果のデータから求めるための十分条件の1セットとなります。