RWDの統計解析に必要なPC環境・スキル
前処理により、データベースから研究対象とする患者とその解析項目(患者背景やアウトカムなど)が抽出されて解析用のローデータとして成形されることで、統計学的な解析が実施可能となります。統計学的な解析として、性別などのカテゴリカルデータであれば度数・割合の集計、年齢などの数量データであれば平均値・標準偏差・四分位数をはじめとした基本統計量の集計が行われます。また、医学系研究であれば、研究結果を結論付けるために、基本的にすべての研究で集計結果の統計的仮説検定や単変量解析・多変量解析などの専門的な知識が必要な解析が行われます。
統計的仮説検定や多変量解析については、研究目的によって様々な手法が存在します。これらの高度な手法を研究で用いる際に最も重要で注意が必要なことは、検証したいリサーチクエスチョンと解析に用いるデータの性質に応じて適切な手法を選択できているかにあります。ここでは詳細な説明は割愛させていただきますが、個別の手法の性質や利用のタイミングについて詳しく知りたい場合は、専門的なウェブサイトや書籍を参照して学んでいただくことをお勧めします。
度数・割合、基本統計量などの簡単な集計や一部の統計的仮説検定や多変量解析はエクセルでも実施可能ですが、より多くの解析項目を一度に処理したい場合や、より先端的で高度な解析手法を利用したい場合は統計解析ソフトを用いることとなります。SAS、SPSS、Stataなどの有償の統計解析ソフトのほか、RやPythonなどの無償で使用できるプログラミング言語により解析を行うことができます。RやPythonでは解析を行うためのパッケージ/ライブラリがインターネットを介して提供されており、それらを利用することにより自身で一からプログラミングをするよりも簡便に解析が可能です。また、それらのパッケージ/ライブラリを紹介しているウェブサイトから情報収集をすることで基本的な使用方法についての学習が可能です。どのソフトウェアを用いるかは研究組織のソフトウェアの導入状況に依存しますが、研究目的で行う解析の多くはどのソフトウェアでも実施可能であると考えられます。
補足
本ページでは、レセプトデータや電子カルテデータベースの解析に焦点をあてて、前処理や統計解析に必要な環境やスキルについて紹介させていただきました。
前処理や統計解析には、専門的な知識が必要とされるため、それを得意とする人材を製薬企業内に確保することが難しいことがあります。その場合は解析ベンダーを研究体制に入れて協力を得ることも選択肢の一つとなります。
また、より良い知見を創出していくには、解析によって得られたデータを臨床的な視点から正しく解釈することが重要と考えられます。そのため、解析に詳しい者だけでなく、臨床に詳しい者も研究に参画し、解析結果とその解釈を共有するなかで結果と臨床的な経験との合致性を繰り返し協議し、研究結果の妥当性を担保する努力が必要となります。
- 1
- 2