同志社大学、データサイエンスを核としたカリキュラムにSASを活用

大学に必ず図書館があるように、SASは分析環境として必要不可欠な存在

同志社大学はSASの教育機関向けライセンス「SAS® Academic Program」を利用している。キャンパス全体で導入可能な利用形態を選択し、SASのほぼすべてのソフトウェアを学生および教職員が利用できる状態にある。中でも、データサイエンスを学ぶ文化情報学部では、大学院生を含むおよそ1,200人の全学生がデータ分析の講義を受け、特にデータ科学を専門とする学部生院生はSASを使った大規模かつ複雑なデータ分析に取り組んでいる。


データ解析のカリキュラムを整備

同志社大学文化情報学部は、人間のあらゆる営みを文化ととらえ、文化を科学的に探求するデータサイエンスを研究する場である。データサイエンスは、データを収集・解析して事実を浮かび上がらせる手法であり、自然科学だけでなく、芸術や心理学など多彩な分野が研究対象になる文理融合の学術分野だ。

研究活動では必然的にデータを扱うため、同学部で学ぶすべての学生にとって、データ分析スキルは必須となる。カリキュラムも、時間をかけてデータ分析を学べるように出来ている。1回生で記述統計と推測統計を学び、2回生では定量的/定性的データ分析の課目がある。学生は、この基礎課目で表計算ソフトや他の統計解析ツールを使い、3回生で学ぶデータハンドリングの講義からSASを利用することになる。

同志社大学教授 文化情報学部/文化情報学研究科 博士(工学)宿久 洋氏は、「SASを使った講義では、扱いやすいGUIを備えたSAS Enterprise Guideから使い始め、大規模で複雑なデータ分析の実践を学ぶことができます。さらに深く学びたい学生は、ゼミで応用を行い、さらに大学院になると理論を研究することになります」と話す。

宿久氏の研究室では、SASの高度なプログラミングやデータマイニング製品「SAS Enterprise Miner」により、マーケティングや株価、スポーツなど、実際に社会で起きている事象について、大規模かつ複雑なデータの分析を行っている。ゼミ発足以来4年で、「データ解析コンペティション」や「スポーツデータ解析コンペティション」などのコンテストでゼミ生が最優秀賞や優秀賞を受賞するなどの成果が挙がった。

突出したSASのデータハンドリング能力

同志社大学文化情報学部では、社会の状況に応じて2回生の講義で利用する統計解析ツールを変更してきた。一方、3回生の講義では変わらずSASを使用している。その理由について宿久氏は、「3回生レベルで実施するデータハンドリングでは、SAS以外の選択肢は考えられませんでした。大規模で複雑なデータを扱えるのはSASだけだと判断していますから」と話す。

統計系の学術分野では伝統的に、分析することを目的として生成されたデータを扱ってきた。ビッグデータに注目が集まるとともに、統計関連の学会などで、大規模データのハンドリングに光が当たるようになってはきたものの、まだ積極的に研究する層は厚くないという。

実際に企業がデータ分析を行う現場では、分析に使うデータを準備する作業に多くの時間を割くことになるが、SASを使うと、このプロセスを大幅に効率化することができる。同志社大学文化情報学部では、この現実を学生に理解させ、さらに実践的なスキルを身につけさせるために、SASを使って大規模で複雑な生データをハンドリングし、生データから分析までを一連のプロセスとして構成することが有効だと考えている。

「私たちは、目的に応じて最適なデータ分析ソフトウェアを使用しています。SASに求めているのは、大規模で複雑なデータを扱うための根幹的なハンドリング能力であり、SASは私たちの期待にこたえてくれています」(宿久氏)

SASは1つの手段

学生はどのようにSASを利用しているのだろうか。宿久研究室修士課程2年 北野 道春氏は、SASでデータの全体像をつかむことから作業を始めるという。SASはデータの読み込みが速く、度数分布表の作成や基礎集計は、容易に変数別で実行できる。社会ネットワーク解析を研究テーマとする北野氏は、研究活動に複数のツールを使う。SASだけで完結するデータ分析もあれば、途中で別のツールを使うものもある。ソフトウェアごとの特性や、自身の習熟度合いによって選択するという。

「私にとってSASは1つの手段ですが、どんな分析を行うにしても、最初にSASを使います。SASのよさは、速さと教えやすさ。後輩に教えるときには、GUIを使うとわかりやすいようです。また、就職活動の際に、SASの経験が高く評価されたことも、使ってよかった点ですね」(北野氏) 

宿久研究室では、分析対象となるデータを区間や分布としてとらえ、柔軟に扱うシンボリックデータ解析と呼ばれる理論も研究している。シンボリックデータ解析では、グループ化などを行わず、区間や分布としてデータをとらえるため、従来とは全く異なるデータ解析手法が必要になる。この研究に、SASも大きな役割を果たしそうだ。

宿久氏は、「今後はテキストデータの解析にも力を入れます。たとえば株価の動きと経済紙誌の情報を関連付けて解析したり、Twitterのデータを取り込んだりするニーズはすでに出てきています」と話している。


「データに基づく課題解決型人材育成に資する統計教育質保証」
同志社大学は、統計的なものの見方と統計分析の能力を備えた人材を育成すべく、東京大学、大阪大学、総合研究大学院大学、青山学院大学、多摩大学、立教大学、早稲田大学とともに、大学間連携共同教育推進事業に取り組んでおり「統計教育大学間連携ネットワーク」を組織している。統計教育における標準的カリキュラム体系の策定や、標準的な達成度評価制度による統計教育の質保証などの取り組みを行っている。

Doshisha University
写真:同志社大学 宿久研究室

課題

(研究テーマ)

  • マーケティングデータの解析
  • 株価データの解析
  • スポーツデータの解析
  • シンボリックデータ解析

ソリューション