Healthy Nevada Project がこの事例で活用した製品 • SAS® Analytics • SAS® AIソリューション
SAS® の機械学習と高度なアナリティクスの活用により、集団遺伝学データが健康施策のブレイクスルーを実現
米国における最初の地域社会ベースの公衆衛生研究のひとつであるHealthy Nevada Projectは、「盤石な科学の実施」、「健康の改善」、「人命の救済」という3つの単純明快な目標を掲げて2016年に発足した。
この画期的な健康および遺伝学プロジェクトは “3戦3勝” の成果を収めており、現在では同種の研究として国内最大規模となっている。
Renown Institute for Health Innovation(Renown IHI)が発展させてきたHealthy Nevada Projectは、自身の健康および遺伝子プロファイルについて詳しく知りたいネバダ州民に無料で遺伝子検査を提供している。
遺伝子データ、環境データ、個人の健康情報を組み合わせることで、研究者や医師は公衆衛生に関する新たな洞察を獲得しつつあり、その結果として、個人別医療を実現すると同時に、ネバダ州全体の地域社会における健康とウェルビーイングも改善しようとしている。
遺伝子検査の結果として予防手術を受けることができた、あるいは、治療可能なステージⅠの腫瘍が見つかった、という理由から、『どうもありがとうございます。皆さんは命の恩人です』と言っていただいたケースが複数あります。そうしたケースこそ、我々がこのプロジェクトでやりがいを感じていることです。 Jim Metcalf Chief Data Scientist Healthy Nevada Project
アナリティクスで健康アウトカムを予測する
健康アウトカムの理解・予測を促進するべく個人または人口集団の正確な “肖像” を描くためには、数多くの生活要因を表すデータが必要不可欠である。そうした要因には遺伝的特徴、社会経済的背景、物理的環境、ライフスタイル行動、医療の質などが含まれる。
「医学における最も複雑な疑問のひとつは、誰かの健康アウトカムがどう推移していくかをどのように予測するか、ということです」と語るのは、Healthy Nevada Projectの主任研究員を務めているジョセフ・グリジムスキー(Joseph Grzymski)博士だ。彼は非営利医療ネットワークのRenown Healthの最高科学責任者(CSO)、および非営利研究組織のDesert Research Instituteの計算生物学および遺伝学担当の研究教授でもある。「それは遺伝的特徴だけ、あるいは血圧や居住地だけの話ではありません。疾病に関する影響要因のすべてをモデル化しようとする取り組みです。公衆衛生研究における大きな課題は、一部の人々が病気になり他の人々はそうならない理由や、一部の人々が90歳以降まで生き続ける理由を解明し、その魔法の方程式が何であるかを判断するために、より優れた予測モデルを構築することです。」
Renown Healthは、Desert Research Instituteの環境データ分野のエキスパート陣との協働作業を通して、このプロジェクトに匿名化済みの電子カルテ(電子医療記録)を供給している。研究者たちは米環境保護庁(EPA)、米国勢調査局、誕生・死亡記録、その他のデータソースからのデータを用いてその電子カルテのデータを補完した上で、“公衆衛生の肖像” を構築する。
患者の遺伝情報とその他の健康要因を結びつけるにあたっては、データサイエンティストたちが、機械学習機能や人工知能(AI)機能を「集団ゲノム解析を専門とするパートナーのHelix社によって生成されたDNA解析結果」に対して適用する。
「我々が働いている目的は、誰がリスクに瀕している可能性があるかを予測する上で環境要因やその他の要因がどのように役立つかを理解すること、より迅速な診断を可能にすること、そして、より精密な治療法の開発を促進することです」と、Healthy Nevada Projectのチーフ・データサイエンティストであるジム・メトカーフ(Jim Metcalf)氏は言う。「SASによって実現された最新の統計手法や機械学習手法は、直感的なデータ・ビジュアライゼーション(視覚化)機能と共に、極めて重要な要素であり続けています。」
集団遺伝学研究を下支えする土台となるのは、データへのアクセスと、その後、我々がフォーカスしたい無数の健康アウトカムのどれに関してもデータを抽出、変換、研究することができる機能です。 Joseph Grzymski, PhD Principal Investigator, Healthy Nevada Project Chief Scientific Officer, Renown Health
早期の検知と予防:「我々がやりがいを感じていること」
プロジェクトの研究者たちは、既に同じ疾病を患っている人々の集団および部分集団を識別するためにアナリティクスを利用していることに加え、疾病が個々人に発現する前に予防的に対処する目的でもアナリティクスを適用している。
患者の自発的な遺伝子検査の後、研究チームは数多くの深刻なゲノム状態に関するリスクをチェックするが、その対象には米疾病予防管理センター(Centers for Disease Control and Prevention: CDC)によって「Medically Actionable(医学的に対処可能)」(CDC Tier 1)として識別されている以下の三大遺伝的リスクも含まれる。
- 遺伝性乳がん卵巣癌症候群(Hereditary Breast and Ovarian Cancer syndrome: HBOC症候群): BRCA1またはBRCA2遺伝子における変異が原因で胸部、卵巣、卵管、その他の部位におけるがんのリスクが増大する。
- リンチ症候群(Lynch syndrome): 大腸がん、卵巣がん、その他の特定のがんに対する遺伝的素因を有している。
- 家族性高コレステロール血症(Familial Hypercholesterolemia: FH): 遺伝子変異によって引き起こされる高コレステロール状態であり、治療せずに放置すると心臓発作または脳卒中につながる可能性がある。
これらの遺伝的リスクの影響を受ける個人の大部分は、自分にそうしたリスクがあることを認識していない。「我々は医師免許を持つ遺伝子カウンセラーを抱えており、参加者に特定の変異がある場合はカウンセラーが本人に連絡を取り、その情報を伝えます。ですから、そうした参加者は、かかりつけの医師に相談し、健康に関する重要な意思決定を行うことができます」と、メトカーフ氏は言う。
Healthy Nevada Projectの参加者であるジョーダン・スタイトラー(Jordan Stiteler)氏によると、想定外の電話が彼女の命を救ったという。
スタイトラー氏は若い母親だが、複数の家族が早い年齢で心臓発作や脳卒中を患っていた。彼女は自分がFHマーカーのキャリアであると知ったとき、健康的ライフスタイルと投薬選択についての支援を提供するガイダンスとサポートを受けた。ほどなくして、彼女の複数の家族が自身の遺伝的リスクについて学ぶために、この研究に参加した。
遺伝子スクリーニングは、がん診断に正面から取り組むことも可能にする。「理想は、どのような種類の腫瘍であれ、それが処置不能になる前に、これらの変異を検知することです」と、メトカーフ氏は言う。「遺伝子検査の結果として予防手術を受けることができた、あるいは、治療可能なステージⅠの腫瘍が見つかった、という理由から、『どうもありがとうございます。皆さんは命の恩人です』と言っていただいたケースが複数あります。そうしたケースこそ、我々がこのプロジェクトでやりがいを感じていることです。」
我々は200テラバイトの遺伝子および健康記録データを隅々まで調べ、操作し、抽出するためにSASを活用しています。適切なパラメータ群を設定することで、10億件の医師ノートを格納しているテーブルでも問題なく調べ上げることができます。 Jim Metcalf Chief Data Scientist Healthy Nevada Project
より多くのデータが、より優れた理解につながる
当初は10,000人の成人参加者で始まったHealthy Nevada Projectだが、現在では52,000人以上へと拡大し、地理的なカバー範囲も北ネバダから州南部のラスベガスとその辺境地域にまで広がっている。
グリジムスキー氏によると、参加者とそのゲノムデータが増えることは、特定の人物とその健康アウトカムとの “つながり” を理解するにあたっての統計的な有効性・正確性に直結するという。「集団遺伝学研究を下支えする土台となるのは、データへのアクセスと、その後、我々がフォーカスしたい無数の健康アウトカムのどれに関してもデータを抽出、変換、研究することができる機能です」と、彼は言う。
そうした取り組みのための基盤を提供しているのはSASのプラットフォームであり、このプロジェクトは米国HIPAA法(Health Insurance Portability and Accountability Act、直訳=医療保険の携行性と説明責任に関する法律)に準拠したオンプレミス・コンピューティング環境内の同プラットフォーム上で実行されている。
「(プログラミング)言語の強力さ、奥深さなど、SASがもたらすものすべてが盤石であり続けています」と、メトカーフ氏は言う。「我々は200テラバイトの遺伝子および健康記録データを隅々まで調べ、操作し、抽出するためにSASを活用しています。適切なパラメータ群を設定することで、10億件の医師ノートを格納しているテーブルでも問題なく調べ上げることができます。」
公衆衛生への継続的な取り組み
Healthy Nevada Projectは、公衆衛生に関する以下のような洞察の元になるテーブルに、多種多様なデータソースをもたらし続けている。
- 救急外来(ER)の全訪問者に関する全州規模のデータを分析することにより、人々がERに訪れる理由について広範な視野を提供
- ネバダ州ワショーバレーにおけるEPAの大気質モニター群から得られた数十年分のデータをマイニングすることにより、自然火災の煙と住民の呼吸疾患発生率とのつながりを判定
- 病院のCOVID-19データとEPAの大気質センサー群のデータを分析することにより、「自然火災が激しい季節の煙」と「COVID-19感染者数の増加」との間の相関を識別。「研究により、人々が森林火災の煙を吸い込むと、COVIDの感染者数が約18%増加することが判明しました。これは、このプロジェクトにおける環境要因の絶対的な重要性を強調しています」(メトカーフ氏)
同チームはSASの統計モデルや分析機能を活用して、その結果を病院の運営管理者に報告したり、査読のために科学界の同業者に研究成果を報告したりしている。
Healthy Nevada Projectに関する事実と数字
2016年
プロジェクトの発足年
52,000以上
参加者数
200
遺伝子および健康記録データのテラバイト数
SASのAIと機械学習により、分析力が向上
「SASのプラットフォームは、Healthy Nevada Projectの土台となる岩盤であり続けています」と、メトカーフ氏は言う。「我々はSASに用意されている機械学習プロシジャやAIプロシジャに没頭しており、それらを継続的に利用しています。」
例えば、ある病院では、患者が手術後に麻酔後治療室または回復室で過ごす時間を減らしたいと考えていた。そこでHealthy Nevada Projectは、一部の患者が回復室で長時間を過ごす理由を解明するべく、"分析プロセスにおける変数選択" などの多種多様なSASプロシジャを活用して機械学習を促進した。その狙いは、研究者たちが ”重要因子の候補となる原因” を識別・精査できるようにすることだった。
その結果、研究者たちは、回復室で過ごす時間の長さに最も直接的に寄与している上位の因子が「使われた麻酔のタイプ」、「患者の年齢」、「患者の相対的な健康状態」であることを発見した。
「Healthy Nevada Projectは、最先端の研究に取り組むことに関して、また、データを活用して"査読付きの学術誌やデータベースで公開できるエビデンスベースの結果" を提供することに関して、ネバダ州の知名度を向上させました」と、グリジムスキー氏は言う。「チーム全員が自分たちの仕事とその効果に誇りを感じています。我々は今後も、何が人々を病気または元気にし、何が予防的ケアを実現するのかを解明し続けます。」
本記事に掲載された導入効果は、各企業によって異なる状況やビジネスモデル、入力データ、業務環境に固有のものです。SASの紹介する顧客体験は、各企業に固有のものであり、業務面や技術面の背景もそれぞれ異なるため、各事例に掲載されたあらゆる証言は、導入の典型例を示すものではありません。導入にともなう金銭的効果、導入結果、ソリューションのパフォーマンスなどの特徴は、個別の顧客のコンフィグレーションや使用条件に左右されるものです。本事例は、すべてのSASの顧客が当該事例と同じ導入効果を得られるとするものではなく、そうした効果を保証するものでもありません。SAS製品および提供サービスの保証内容は、各製品・サービス向けに締結された契約書内の保証条項に記載された内容に限られます。したがって、本事例に掲載された内容は、それらの保証内容をなんら補足するものではありません。事例に掲載された顧客は、各事例をSASとの契約にもとづいて提供しているか、SASのソフトウェアの導入成功にともなう体験を共有しているものです。