東京大学

医学研究のデータマネジメントと統計解析を支えるSAS
―データ分析を高度な研究に生かせる人材を育成―

東京大学は、医学系研究科・医学部すべての学生・教職員が自由にSASの様々なソフトウェアを利用できる教育機関向けサイトライセンス契約を導入している。中でも、医学部 健康総合科学科では、医学研究の一環として、高度なデータ分析を行う。そして、統計学とSASプログラミングの初歩を学ぶ統計情報処理実習が必修科目になっており、卒業論文や修士論文の執筆においてもSASは欠かせない存在となっている。

統計解析の習得が必須となる医学部健康総合科学科

1877年に日本初の国立大学として設立された東京大学は、国内はもとより海外でも高い評価を受ける世界水準の総合大学である。学問の自由の精神に基づき、真理の探究と知の創造を求め、「世界を担う知の拠点」として世界最高水準の教育・研究を維持、発展させることを目標とする。

東京大学特有の制度として、進学振り分けが挙げられる。入学したすべての学生は教養学部に所属し、2年間の前期課程を駒場キャンパスで履修する。入学から1年半は文科I類~III類、理科I類~III類の6つの科類に分かれ、後期課程の専門教育を受けるために必要な教養を養う。2年夏学期までの成績をもとに進学振り分けが行われ、後の半年は進学が内定した学部・学科における学修の基礎となる専門教育科目を学ぶ。そして、3年生以上になると、ほぼすべての学生が本郷キャンパスにある各学部へ進学。10の学部に分かれて2年間の後期課程を履修する。

その1つに医学部 健康総合科学科がある。同科では、生命科学・行動科学・社会科学・情報科学など医学関連の基礎研究から、回復力・治癒力を引き出す臨床科学としての看護学まで、幅広く最新のヘルスサイエンスを学ぶことができる。そこで指導にあたっているのが東京大学 大学院医学系研究科 公共健康医学専攻 生物統計学分野 教授 大橋 靖雄氏である。また同氏は、日本の疫学・生物統計学の第一人者でもある。

大橋氏とSASの出会いは、30年以上前。実際にSASを活用して統計解析を行うノウハウの蓄積・共有を産学で進める「統計解析パッケージ研究会」を主催者として発足させたのだ。同組織は、SASユーザー会の先駆け的な存在になる。大橋氏は、「当時、統計の専門家なら自らプログラムを組んでデータを解析するのが当たり前で、パッケージソフトウェアを使えば専門家の名折れという風潮がありました。しかし、そうした考えはナンセンスです。SASのさまざまなメリットを体感してから、私の研究は常にSASとともにあります」と語る。

医学研究の実践的なデータ分析にSASを活用

医学部 健康総合科学科に進学する全学生は、2年生の後期と3年生の前期にまたがる「統計情報処理実習」を必修科目として学ぶ。大橋氏が教鞭をとる統計情報処理実習の前半では、座学とSASが提供するデスクトップ統計ソフトウェアであるJMPを使った実習を通じ、データ解析と統計的推論の初歩を学習する。後半では、医学研究の計画から実施、データ解析、報告書作成までの一連のプロセスを、課題別のチームに分けて実践する。

2013年に実施された研究のひとつでは、被験者の医学生を「オルニチンを摂取するグループ」と「プラセボ(偽薬)食品を摂取するグループ」に分け、それを数週間にわたって継続することで、両グループに見られる変化を検証した。このユニークな実習は、毎年テーマを変えて行われている。前年のテーマはカフェイン。検証すると、カフェインが集中力を高め、計算能力を向上させる効果があるという結論が導かれた。

こうした研究の統計データ解析に欠かせない存在なのがSASである。課題別のチームに分かれて行う実習では各学生がさまざまな知識やスキルを持ち寄り、共同作業で報告書を完成させる。あらかじめ講義の前半でデータ収集から分析までの基礎を学ぶため、学生がSASを使用する際のとまどいはほとんどない。

大橋氏はこのほか、4年生前期の「医学データ解析」の講義も受け持つ。この講義は、午前と午後の2部で構成される。午前は、分散分析、重回帰分析、繰り返しデータの解析、カテゴリカルデータ解析、生存時間解析などの手法とその適用領域などを学習する。午後は、SASデータセットをFREQなどのプロシジャで処理してデータ収集し、さまざまな統計手法を用いてデータ解析の実践を学ぶスタイルをとる。複雑なデータ解析が求められるシーンを例示し、さまざまな参考文献を参照しながらデータ解析のセオリーを教示する。

医学研究における世界標準の統計解析ソフトウェアとして信頼性の担保されたSAS

こうして学んできた学生は、卒業論文・修士論文の執筆においてもSASを活用する。研究にSASを使用するメリットは大きい。大橋研究室 助教 篠崎 智大氏は、「疫学・臨床の医学研究ではSASがデータマネジメントと統計解析の標準ですし、臨床試験データの統計解析結果の品質に問題がないことを検証するポリシーが厳格です。分析結果の再現性も保証されます。仮にオープンソースのソフトウェアなどを使ってしまうと、研究における"責任"の所在があいまいになってしまう可能性が否めません」と話す。

医学研究におけるデータ収集や解析の方法論を研究する大橋研究室では、論文の執筆において生物統計学とSASを扱える知識・ノウハウが必須となる。具体的には、同研究室では地域や集団内で疾病・健康に関連する事象を計量的にとらえ、その原因や危険因子の影響度を評価し、予防手段につなげる疫学と、開発段階の医薬品の効果を検証し、最良の治療法を明らかにする臨床試験の2分野を扱う。論文のテーマは大きく、方法論の理論的研究とフィールドでの実証研究の2つに分かれる。

大学院修士1年の福田 武蔵氏は、ケース・コホート研究における最適な研究手法を考察する論文を執筆した。ケース・コホート研究は、ある病態にかかった人物が過去にどのような危険因子にさらされたことがあるかを調査するケース・コントロール研究と、ある危険因子にさらされた人物が将来、どのような病気にかかるかを調査するコホート研究を組み合わせた疫学研究モデルだ。実際には、自らがデザインした研究手法が従来のそれと比べて優れているかどうかをシミュレーションするのにSASを活用した。

大橋氏は、「データ分析を実務に生かせる人材を社会に送り出すための教育が社会的な要請として強まっています。この中で、SASをベースに大量のデータからビジネスに役立つ知見を引き出せるデータ・サイエンティストの育成は急務です。SASには、データ・サイエンティストの育成と業界の健全な発展に向けた継続的な取り組みを期待しています」と話している。

The University of Tokyo

課題

(研究テーマ)

  • 生物統計学

ソリューション