ランダムでないサンプリングを伴う観察研究のデザイン③

東京大学大学院情報学環准教授　篠崎智大

#研究デザイン #識者コラム

1：1マッチング（ペアマッチング）

1人１人の対象者に対して、（データで明示的に得られていない）背景因子がよく似た相手をマッチできる状況があります。例えば、

きょうだい（血縁）：遺伝要因に加えて、幼少期の生活環境が似やすい
夫婦：生活習慣・社会経済状況・居住環境が似やすい
近所の人：地理要因、地域の医療アクセス、環境曝露が似やすい

などをマッチしてペアとすれば、測定が難しい交絡変数であってもペア内で自動的に揃えられることが期待できます。これにより、未測定の交絡を減らす方策としてマッチングを用いることができます。

もちろん、ケースコントロール研究の場合はこの「ペア」を層別しなければいけません。コホート研究においても、点推定値だけでなく正しい信頼区間を得るためには同様の解析方法が必要です。しかし、「ペアで層別する」ということは、各層内には２人しかデータはなく、ペアの数（全体の人数の半分）だけ層ができることになります。すると、通常の統計手法（最尤法など聞いたことがあるでしょうか）のように「限られた数の層内に十分な人数がいる」ことを前提とする方法は使えません。しかし、（層の大きさでなく）層の数さえ多ければ統計的によい性質をもつ方法もあり、代表的なものに以下があります。

Mantel–Haenszel法（多くの層の2×2表のオッズ比・リスク比・リスク差を統合）
条件付きロジスティック回帰（conditional logistic regression；各ペアを「固定効果」として調整するが、ペアの数だけある固定効果は推定しないままオッズ比だけを求める）
（コホートの場合のみ）層別Cox回帰（stratified Cox regression；ペアごとに異なる「ベースラインハザード」を置くが、このベースラインハザードは推定せずハザード比だけを求める）

上で紹介したネステッドケースコントロール研究の risk set sampling は、ケースが起きた時点ごとに、同じ時点にリスク集合にいる人からコントロールを選びます。これは「発症時点ごとのマッチング」とみなせ、時点ごとのリスクセットを層とした解析（時点でマッチされたオッズ比の推定）を行うことが一般的です。特に、risk set samplingされたデータを条件付きロジスティック回帰で解析することは、コホート研究で通常のCox 回帰からハザード比を求める計算と本質的に同じことをしています。

まとめ

今回は、背後のコホート研究で得られる結果を効率的に再現するようなサンプリングとして、ケースコントロール研究とマッチングを説明し、それぞれの注意点を示してきました。ただし、ケースコホート研究などでは実際のデータ解析はもっと複雑になる場合があるので、実務上は先行研究に倣い、統計パッケージの解説なども参考にしながら、個別に調べて解析を進めていただく必要があります¹。

ケースコントロール研究には過去に多くの研究の蓄積があり、例えば『現代疫学原著第4版』²の引用文献から数十年にわたる理論の展開を紐解くことができます。マッチングには比較的新しく無料でアクセスできる解説³がありますので、ぜひ手に取ってみてください。

この記事はメール会員専用の記事です。
メール会員登録すると続きをお読みいただけます。

新規会員登録

ランダムでないサンプリングを伴う観察研究のデザイン③

1：1マッチング（ペアマッチング）

まとめ

おすすめ記事

シグナル検出とガイドライン

ランダムでないサンプリングを伴う観察研究のデザイン②

ランダムでないサンプリングを伴う観察研究のデザイン①

メール会員の
ご案内

人気記事ランキング

おすすめ記事

DATuM IDEA® にご興味をお持ちの方へ

お問い合わせ

ランダムでないサンプリングを伴う観察研究のデザイン③

1：1マッチング（ペアマッチング）

まとめ

おすすめ記事

シグナル検出とガイドライン

ランダムでないサンプリングを伴う観察研究のデザイン②

ランダムでないサンプリングを伴う観察研究のデザイン①

メール会員のご案内

人気記事ランキング

おすすめ記事

DATuM IDEA® にご興味をお持ちの方へ

お問い合わせ

メール会員の
ご案内