データサイエンティストが「仮説」を生み出す

いま、データサイエンティストが活躍する現場~
塩野義製薬株式会社

医薬開発本部 解析センター
木口 亮氏

医薬品開発は、統計解析のスキルが必須になる分野として広く知られています。ですから、塩野義製薬のデータサイエンティストが何をやっているのかについて疑問を持たれている方も多いかもしれません。今日はその疑問にお答えします。

臨床試験は、「薬が効く」という仮説を立てて、それを検証するプロセスを何度も回します。医薬品開発は、成功確率の低い分野ですから、この部分を効率化することが大切になります。

データドリブンの医薬品開発では、4つの役割があります。生物統計家、データマネジャー、データサイエンティスト、プログラマーです。私はData Science Groupに所属していて、このグループはデータサイエンティストとプログラマーを中心に構成されています。生物統計家とデータサイエンティストは近いイメージを持たれているかと思いますが、次のような差があります。

生物統計家は、臨床試験データの解析で中心的な役割を果たします。生物統計家は、“統計のスペシャリスト”として、検定・推定などを利用して、仮説(例えば、薬の有効性)を検証します。一方、データサイエンティストは、“データのスペシャリスト”として、リアル・ワールド・データと呼ばれる医療ビッグデータやオープンデータ、過去の臨床試験データを含めた横断的解析など、様々なデータから仮説を立てる活動をします。理想としては、データサイエンティストが仮説を立てて、生物統計家が検証するというサイクルを回すことになるわけです。また、シミュレーションを実施して、臨床試験をバーチャルに想定し、効率的な検証ができるかどうかを検討することもデータサイエンティストの仕事になります。

データサイエンティストに求められる役割には、製品の価値を最大化すること(Product innovation) と業務改善を行うこと (Process innovation) の2つがあります。前者では、医薬品開発のプロセス効率化と新たな仮説の提案を行います。後者は、データを活かして業務の自動化を提案します。

では、データサイエンティストには、どのようなスキルが必要になるのでしょう。まずは、統計知識。業務に利用するすべてを習得している必要はありませんが、理解している必要はあります。次に、プログラミング知識。言語を覚えることと共に、データガバナンスのスキルも必要です。また、ITスキルは、プログラムを実装する際に必要になります。個人的に一番ポイントとなるのは、ビジネススキルです。新しい仮説や知見を見出したいときに、自分の当初想定していた道筋をそのままたどれるケースはほとんどありません。壁にぶつかってなかなか進まない仕事も、柔軟性をもちながら粘り強く推進することが必要です。そうしたときに、人脈やコミュニケーション能力はとても重要になります。

データサイエンティストの仕事は、さまざまな人の知見やデータ・ツールを組み合わせてパズルを完成させること。そして、完成させたら終わりではありません。反省点をきちんと振り返り、次の仕事に生かしていく必要があります。このようにして新しいInnovationを生み出していければと考えています。