観察研究のデザイン概論①

東京大学大学院情報学環 准教授 篠崎 智大

前向きと後ろ向き

研究が「前向き」か「後ろ向き」かという区別ほど、定義をめぐって議論が起こりやすいトピックはそうないかもしれません。一般的には、(i) 研究計画時点とデータ測定時点との時間関係に基づく定義と、(ii) 曝露の測定時点とアウトカムの測定時点との時間関係に基づく定義のどちらかが用いられるのではないでしょうか。

どちらの定義にも一定の合理性はありますが、大事なのはこうした多義的な用語を取り上げて形式的に定義を統一することではなく、「データの質」や「バイアスの入りやすさ」がどのように影響を受けるかです1(i) については、過去に遡って測定することで、変数の種類やデータの粒度を後から変えることができない点で理想的な「データの質」を達成しにくいこと、(ii) については、因果の向き(曝露→アウトカム)とは逆の順序で情報を得ることで、思い出しバイアス(recall bias)などの強烈な差異的(differential)誤分類・測定誤差が生じやすいこと、などが挙げられます。なお、誤分類が差異的であるとは、ある変数の値を誤ったカテゴリに分類してしまう確率が他の変数の値によって異なることをいいます。例えば、疾患ありの人たちでは(そう思い込んで)「曝露あり」と答えやすく、疾患なしの人たちでは(忘れてしまっていて)「曝露なし」と答えやすい状況は、アウトカムの値(疾患の有無)に応じて「曝露あり」を「なし」に、「曝露なし」を「あり」に誤分類する確率が変わることです。これはまさに典型的な思い出しバイアスです。。上の(i)と(ii)の観点を組み合わせて、その研究がどのようなバイアス構造を持ちうるのか、そして研究目的に照らしてそれを許容できるのかという点を整理できれば、形式的に研究デザインが「前向きか後ろ向きか」を特定することは、科学的なコミュニケーションにおいて建設的ではないように思われます2Lash TL, VanderWeele TJ, Rothman KJ, Haneuse S, 編. 佐藤俊太朗, 芝孝一郎, 藤井亮輔, 後藤匡啓, 今村文昭, 監訳. 現代疫学 原著第4版. 東京:学術図書出版;2024. 3佐藤俊哉, 山口拓洋, 石黒智恵子, 編. これからの薬剤疫学:リアルワールドデータからエビデンスを創る. 東京:朝倉書店;2021.

サンプリングの有無

方法論として「研究デザイン」を整理するうえでは、どのようなルールで対象者を抽出(サンプリング)して曝露・交絡変数・アウトカムを測定するかという観点で区別することが有用です。以下ではコホート研究とケースコントロール研究を分けるサンプリングについて説明します。第3回ではサンプリングの仕方がデータから計算した統計量の性質にどう関係するかを見ていきます。

東京大学大学院情報学環 准教授

篠崎 智大
しのざき ともひろ

  • 1
    (i) については、過去に遡って測定することで、変数の種類やデータの粒度を後から変えることができない点で理想的な「データの質」を達成しにくいこと、(ii) については、因果の向き(曝露→アウトカム)とは逆の順序で情報を得ることで、思い出しバイアス(recall bias)などの強烈な差異的(differential)誤分類・測定誤差が生じやすいこと、などが挙げられます。なお、誤分類が差異的であるとは、ある変数の値を誤ったカテゴリに分類してしまう確率が他の変数の値によって異なることをいいます。例えば、疾患ありの人たちでは(そう思い込んで)「曝露あり」と答えやすく、疾患なしの人たちでは(忘れてしまっていて)「曝露なし」と答えやすい状況は、アウトカムの値(疾患の有無)に応じて「曝露あり」を「なし」に、「曝露なし」を「あり」に誤分類する確率が変わることです。これはまさに典型的な思い出しバイアスです。
  • 2
    Lash TL, VanderWeele TJ, Rothman KJ, Haneuse S, 編. 佐藤俊太朗, 芝孝一郎, 藤井亮輔, 後藤匡啓, 今村文昭, 監訳. 現代疫学 原著第4版. 東京:学術図書出版;2024.
  • 3
    佐藤俊哉, 山口拓洋, 石黒智恵子, 編. これからの薬剤疫学:リアルワールドデータからエビデンスを創る. 東京:朝倉書店;2021.