ランダムでないサンプリングを伴う観察研究のデザイン①

東京大学大学院情報学環 准教授 篠崎 智大

前回の記事を読む

はじめに

「観察研究のデザイン概論①」「観察研究のデザイン概論②」では、観察研究のデザインを「前向き・後ろ向き」など 形式的な分類で機械的に整理するのではなく、同じ目的(本連載では特に比較による因果推論を想定します)を目指して行われるデータ測定と解析方法の異なる実装手段として整理しました。
第3回となる本稿では、対象者のイベント有無に応じてサンプリング確率を変えるケースコントロール研究(case-control study)と、対象者背景によってサンプリング確率を変えるマッチング(matching)を通して、少ない測定データから全体での結果を「効率的」に再現できることを数値例で学んでいきたいと思います。

ケースコントロールデザイン

ケースコントロール研究の目的は、イベント発症者(ケース)と非発症者(コントロール)を比較することではなく、効果の知りたい集団を源泉集団(source population)として、適切に選ばれたコントロールから源泉集団での曝露効果を求めることです。ここでは源泉集団として、いわゆる「閉じた」コホート(“closed” cohort)を考えます1閉じたコホートとは、狭義にはイベント発症以外の対象者の出入りのないコホートを指します。もう少し広く、脱落による現象は許容されるコホートをこう呼ぶこともあります。閉じていないコホートを「開いた」コホート(“open” cohort)といいます。

イベント発症非発症合計
曝露あり60140200
曝露なし100700800
表1.コホート全体(1000人)


このコホートで求まるはずのオッズ比(OR: odds ratio)は

ORcohort=60/140100/700=3.0OR_{cohort} = \frac{60/140}{100/700} = 3.0

リスク比(RR: risk ratio)は