1:1マッチング(ペアマッチング)
1人1人の対象者に対して、(データで明示的に得られていない)背景因子がよく似た相手をマッチできる状況があります。例えば、
- きょうだい(血縁):遺伝要因に加えて、幼少期の生活環境が似やすい
- 夫婦:生活習慣・社会経済状況・居住環境が似やすい
- 近所の人:地理要因、地域の医療アクセス、環境曝露が似やすい
などをマッチしてペアとすれば、測定が難しい交絡変数であってもペア内で自動的に揃えられることが期待できます。これにより、未測定の交絡を減らす方策としてマッチングを用いることができます。
もちろん、ケースコントロール研究の場合はこの「ペア」を層別しなければいけません。コホート研究においても、点推定値だけでなく正しい信頼区間を得るためには同様の解析方法が必要です。しかし、「ペアで層別する」ということは、各層内には2人しかデータはなく、ペアの数(全体の人数の半分)だけ層ができることになります。すると、通常の統計手法(最尤法など聞いたことがあるでしょうか)のように「限られた数の層内に十分な人数がいる」ことを前提とする方法は使えません。しかし、(層の大きさでなく)層の数さえ多ければ統計的によい性質をもつ方法もあり、代表的なものに以下があります。
- Mantel–Haenszel法(多くの層の2×2表のオッズ比・リスク比・リスク差を統合)
- 条件付きロジスティック回帰(conditional logistic regression;各ペアを「固定効果」として調整するが、ペアの数だけある固定効果は推定しないままオッズ比だけを求める)
- (コホートの場合のみ)層別Cox回帰(stratified Cox regression;ペアごとに異なる「ベースラインハザード」を置くが、このベースラインハザードは推定せずハザード比だけを求める)
上で紹介したネステッドケースコントロール研究の risk set sampling は、ケースが起きた時点ごとに、同じ時点にリスク集合にいる人からコントロールを選びます。これは「発症時点ごとのマッチング」とみなせ、時点ごとのリスクセットを層とした解析(時点でマッチされたオッズ比の推定)を行うことが一般的です。特に、risk set samplingされたデータを条件付きロジスティック回帰で解析することは、コホート研究で通常のCox 回帰からハザード比を求める計算と本質的に同じことをしています。
まとめ
今回は、背後のコホート研究で得られる結果を効率的に再現するようなサンプリングとして、ケースコントロール研究とマッチングを説明し、それぞれの注意点を示してきました。ただし、ケースコホート研究などでは実際のデータ解析はもっと複雑になる場合があるので、実務上は先行研究に倣い、統計パッケージの解説なども参考にしながら、個別に調べて解析を進めていただく必要があります1例えば、ケースコホート研究では重み付け生存時間解析が用いられ、個人をクラスターとした分散推定が必要になるかもしれません。傾向スコア(propensity score)マッチングは他の連載で扱われますが、実行方法にも幅があり、マッチ後の解析手法の選択も一筋縄ではいきません。。
ケースコントロール研究には過去に多くの研究の蓄積があり、例えば『現代疫学 原著第4版』2現代疫学 原著第4版、Lash TL, VanderWeele TJ, Rothman KJ, Haneuse S, 編. 佐藤俊太朗, 芝孝一郎, 藤井亮輔, 後藤匡啓, 今村文昭, 監訳、学術図書出版、2024年の引用文献から数十年にわたる理論の展開を紐解くことができます。マッチングには比較的新しく無料でアクセスできる解説3Iwagami M, Shinozaki T. Introduction to Matching in Case-Control and Cohort Studies. Ann Clin Epidemiol. 2022;4(2):33-40. doi: 10.37737/ace.22005.がありますので、ぜひ手に取ってみてください。
この記事はメール会員専用の記事です。
メール会員登録すると続きをお読みいただけます。