観察研究のデザイン概論①

東京大学大学院情報学環 准教授 篠崎 智大

はじめに

疫学・臨床研究におけるデータサイエンスの目的を、記述(description)、予測(prediction)、因果推論(causal inference)に分類することが提案されています1Hernán MA, Hsu J, Healy B. A second chance to get causal inference right: a classification of data science tasks. CHANCE. 2019;32(1):42-49. doi:10.1080/09332480.2019.1579578.。本シリーズではこのうち因果推論、すなわち異なる曝露(exposure)や治療(treatment)どうしを公平に比較したい状況を想定した研究を主な対象として、観察研究(observational study)のデザインの考え方を4回にわたって解説していきます。

導入となる本稿(第1回、第2回)では、疫学・臨床研究で頻繁に登場する研究デザインを取り上げ、いくつかの観点で整理します。学習目標は研究デザインを暗記することではありません。むしろ、各デザインに共通して置かれる研究目的と、デザイン間の違いの論点を理解することで、第3回で扱うケースコントロール研究(case-control study)およびマッチング手法の意義や、第4回の標的試験エミュレーション(target trial emulation、臨床試験を模倣する観察研究デザインのフレームワーク)の位置づけを見通せるようにすることです。

代表的な研究デザインとして、ランダム化比較試験(RCT: randomized controlled trial)、コホート研究(cohort study)、ケースコントロール研究が挙げられます。これらの違いを説明する切り口として、例えば次のような分類軸がよく用いられます。

  • 介入(intervention)があるか、ないか
  • 前向き(prospective)か、後ろ向き(retrospective)か
  • 全対象者でデータを測定するのか、一部をサンプリング(sampling)して測定するのか

このほか、「アウトカム測定のための追跡をおこなうか(縦断研究:longitudinal study)、1時点で曝露もアウトカムも測定するか(断面研究:cross-sectional study)」という観点もあります。ただし、今回主題とする「因果推論を目的とした研究」では、時間的に曝露後に生じるアウトカムに限定されるため、縦断的な枠組みが前提になります。もっとも、断面研究であっても、調査票などにより過去の情報を取得でき、その情報を「追跡で得られたであろうデータ」とみなせる場合があります。この点は後述します。

  • 1
    Hernán MA, Hsu J, Healy B. A second chance to get causal inference right: a classification of data science tasks. CHANCE. 2019;32(1):42-49. doi:10.1080/09332480.2019.1579578.