ランダムでないサンプリングを伴う観察研究のデザイン②

東京大学大学院情報学環 准教授 篠崎 智大

ケースコホート研究とネステッドケースコントロール研究

元々は特に理論的な裏付けがなく実用上の効率性(やりやすさ)から行われていたケースコントロール研究が、実はコホート研究のオッズ比を正しく求めるデザインである、という正当化は非常に心強い発見だったわけですが、どうせ求まるならオッズ比よりも、リスク比や発症率比(incidence rate ratio)が欲しくなってしまうというのが人情です。そのためのケースコントロールデザインの変法があります。

ケースコホート(case-cohort)デザインでは、追跡開始時点でコホート全体(将来の発症・非発症を問わない)からサブコホート(sub-cohort)をランダムに抽出しコントロールとします。その後、イベント発症者を全員ケースとして選びます。例えば、サブコホートを 340人ランダムに抽出したとすると、元コホート全体では曝露あり 200人、曝露なし 800人(1:4)だったので期待的に以下のようになります。

ケースコントロール
(サブコホート)
曝露あり6068
曝露なし100272
合計160340
表1.ケースコホートサンプリング(500人)


この表からケースとコントロールで曝露オッズ比を求めると

ORcasecohort=60/68100/272=2.4OR_{case-cohort} = \frac{60/68}{100/272} = 2.4

と元コホートのリスク比RRcohort= 2.4に一致します。理由は単純で、コントロール(サブコホート)の曝露オッズ(=68/272)がコホート全体の曝露オッズ(=200/800)に等しいので、ORcase-cohortとRRcohortの計算式が一致するというだけの話です。ただし、ケースコントロール研究と同様に、このデータから(行を見て)各曝露群での「リスク」を求めても無意味です。

ケースコホート研究では、発症の有無と無関係にサブコホートを選ぶので、コントロールとケースが重複することが起こりえます。この非独立性から信頼区間計算には工夫が必要となり、単純な2×2表の標準誤差推定の公式をそのまま当てはめてはいけません1現代疫学 原著第4版、Lash TL, VanderWeele TJ, Rothman KJ, Haneuse S, 編. 佐藤俊太朗, 芝孝一郎, 藤井亮輔, 後藤匡啓, 今村文昭, 監訳、学術図書出版、2024年

データベース研究で多く使われるのが、ネステッドケースコントロール(nested case-control)デザインです。この方法では、イベント発症時点ごとに、その時点でまだ発症していない人(リスクセット)がコントロール候補となります。全てのイベント発症時点におけるコントロール候補から時点を区別せずランダムにサンプリングすることを密度サンプリング(density sampling)といい、発症率が一定である等、特定の条件2Greenland S, Thomas DC. On the need for the rare disease assumption in case-control studies. American Journal of Epidemiology 1982; 116: 547-553. によれば、密度サンプリングをした場合は(1) 発症率一定、または (2) (開いたコホートで)曝露割合が時間とともに一定ならば、コントロールの曝露オッズが追跡人時間(person time;発症率の分母)での曝露オッズに等しくなることで、ケースコントロールのオッズ比がコホートでの発症率に一致します。の下でオッズ比が発症率比に等しくなります(図1)。