무리 속의 특이 사례
SAS 데이터 사이언티스트가 머신 러닝을 활용하여 코끼리 전염병을 예방하고
코끼리 무리의 건강을 개선한 방법
작성자: 앨리슨 볼렌(Alison Bolen), SAS Insights 편집자
오리건 동물원에서 사랑을 한 몸에 받던 팩키라는 이름의 아시아 코끼리가 2015년에 결핵 판정을 받았을 때 사육사들은 그를 살리려고 모든 방법을 동원했습니다. 팩키는 미국에서 태어난 최초의 코끼리로, 52살이 되던 해에 매년 실시하던 검사 중 일부인 코 세척을 받다 결핵 판정을 받았습니다. 코 세척은 코끼리의 코를 액체로 씻어낸 후 그 액체를 검사용 대형 봉투에 담는 번거로운 작업입니다.
결핵 진단을 받은 후 해당 동물원에서는 1년 넘게 팩키를 치료하면서 희망의 끈을 놓지 않았습니다. 실제로 당시 그 동물원에 있던 다른 코끼리 두 마리도 결핵 치료를 받고 회복되었습니다.1 그러나 팩키가 2017년에 약물 저항성질병 검사에서 양성 반응을 보이자, 코끼리 전문가는 팩키의 고통을 끝내고 다른 코끼리의 감염을 막기 위해 안락사라는 힘든 결정을 내렸습니다.2
코끼리에게 결핵은 위험한 질병입니다.
팩키는 미국에서 결핵으로 가장 최근에 사망한 코끼리입니다. 지난 50년 동안 결핵 진단을 받은 코끼리는 약 1,300마리에 육박하며, 1996년 이후로는 약 60마리가 진단을 받았습니다. 결핵을 일으키는 요인에는 여러 가지가 있기 때문에 발병을 줄이기가 어렵습니다.
- 코끼리의 결핵 검사 절차는 비용이 많이 들며 정확도도 떨어집니다.이 질병은 잠복기가 수년에 달하기 때문에 결핵에 걸린 코끼리가 양성으로 판명될 때까지 아무런 징후를 보이지 않는 경우가 많습니다.
- 코끼리는 무리 속에서 긴밀한 관계를 유지하며 사는 사회적 동물이기 때문에 질병이 걸리면 전염되기 쉽습니다. 감염된 코끼리를 의학적 차원에서 격리할 수는 있지만, 사회적 동물이기에 장기간의 격리는 정신 건강에 좋지 않습니다.
- 미국에서는 코끼리가 다른 시설로 옮겨지면서 다른 코끼리들이나 인간들과 접촉하는 경우가 많으므로 질병이 큰 개체군으로 전파될 수 있습니다.
데이터를 통해 세상이 변화하는 모습을 확인해보세요.
자연 보호, 건강, 인권, 그리고 교육에 변화를 원하십니까? 공익 데이터 운동에 동참하세요.
전 세계 사람들이 세상에서 가장 까다로운 문제를 해결하기 위해 의기투합하여 데이터를 사용하고 있습니다.
코끼리들을 위협하는 요소
결핵은 폐를 공격하는 박테리아 감염성 질병입니다. 미국 질병관리예방센터에 따르면 결핵은 세상에서 가장 치명적인 질병 중 하나입니다. 미국에서는 사람이 감염되는 경우가 드물지만 2016년 전 세계 1,040만 명이 결핵 진단을 받았으며 결핵 관련 사망자는 연간 170만 명에 달합니다.
사람과 동물 모두 조기에 발견되면 대부분 항생제로 치료할 수 있지만, 유행병학자들은 이 질병의 약물 저항성 변종 결핵균이 등장하면 세계적인 전염병이 발발할 수 있다고 우려합니다.
동물에서 인간으로 결핵이 전염된 사례는 드문 아예 없습니다. 하지만 특이하게도 2013년 오리건에서 결핵에 걸린 코끼리와 가까이 접촉한 7명의 인간을 검사한 결과, 양성으로 판정됐습니다.3
보다 정확한 결핵 검사 방법
한 열정적인 데이터 사이언티스트이자 동물학 전문가는 제휴를 통해 머신 러닝의 일종인 신경망을 사용하여 정확도는 높이고 검사 과정은 간단하게 개선한 코끼리 결핵 검사 방법을 개발했습니다.
현재 동물원과 동물 보호소에서는 관리 중인 모든 코끼리를 대상으로 코 세척 방식의 결핵 검사를 매년 실시하고 있습니다. 그리고 무리에 새로 합사한 코끼리들은 종종 질병의 전염을 줄이기 위해 재검사를 받거나 임시 격리됩니다.
SAS의 시스템 엔지니어 사라 하든(Sarah Harden)과 플로리다 대학의 동물 의학 교수 라미로 이사자(Ramiro Isaza) 박사는 미국에서 20년간 수집된 코끼리 관련 데이터를 분석하는 연구에 돌입했습니다. 이 연구에서 이들은 로지스틱 회귀 분석이나 의사 결정 트리 같은 기존의 분석 방식을 신경망이나 앙상블 모델링 같은 고급 분석 방식과 비교했습니다.
하든의 연구에 따르면 신경망 모델은 각 코끼리의 결핵 발병 가능성을 식별하는 데 있어 뛰어난 결과를 도출했는데, 이는 바로 관계 요소를 분석하기 때문이었습니다. 이러한 요소로는 코끼리의 위치와 무리 행동, 코끼리 개체군 내에 형성된 무리 등이 있습니다.
네트워크 변수를 분석하면 코끼리 간의 관계와 접점을 찾아내어 질병에 걸릴 가능성이 높은 개체를 파악할 수 있습니다.
"네트워크 모델을 사용하면 표준 검사 결과가 나오기 전에 결핵 감염 사실을 알아낼 수 있는 경우가 많다"고 하든은 설명합니다. 사육사들은 이 정보를 이용하여 검사와 치료, 혹은 격리가 필요한 코끼리를 식별할 수 있습니다. 또한 이 분석법은 침습성이 낮으며, 비용과 시간 측면에서 유리합니다.
코끼리나 인간 중 소수만 예방하여도 질병 확산이나 약물 저항성 변종의 진화를 막을 수 있습니다. 사라 하든 시스템 엔지니어 SAS
코끼리 결핵 현장 검사용 모델
하든과 이사자는 다음의 두 가지 연구 목표를 세웠습니다.
- 사육사와 수의사가 무리에 속한 모든 코끼리의 결핵 감염 가능성을 빠르게 예측할 수 있는 실용적인 현장 검사 모델 개발
- 동물 개체군에 대한 질병 예측의 정확도를 높일 수 있는 고급 모델링 기법의 장려
궁극적으로 이 두 가지 목표를 모두 달성하면 코끼리의 결핵 확산을 줄일 수 있습니다. 하든 박사에 따르면 "신종 병원균의 경우 정확도가 매우 중요합니다. 코끼리나 인간 중 소수만 예방하여도 질병 확산이나 약물 저항성 변종의 진화를 막을 수 있습니다."
"그와 마찬가지로 건강한 코끼리를 감염된 것으로 잘못 판정하게 되면 코끼리, 무리, 동물원이 큰 피해를 볼 수 있다"고 이사자는 덧붙입니다.
전반적으로, 하든은 새로운 신경망 모델이 현장에서 사용하는 기존 모델보다 6% 더 정확하다고 추정합니다. 즉, 약 15마리의 감염 코끼리를 더 찾아낼 수 있고 허위 양성 판정도 줄일 수 있습니다.
실제로 동물원이 새 코끼리의 합사를 고려하는 경우 이 분석 방식으로 다음과 같은 질문에 대한 답을 구하면 코끼리의 결핵 감염 여부를 쉽게 예측할 수 있습니다.
- • 아프리카 코끼리인가, 아니면 아시아 코끼리인가?
- • 어디에서 태어났는가?
- • 무리에는 몇 마리의 코끼리가 있었는가?
- • 서식처를 몇 번이나 옮겼는가?
- • 무리 속에서 몇 마리의 코끼리를 만났고 어떤 코끼리를 만났는가?
하든은 "신경망 모델은 진일보한 분석 방식입니다. 만약 동물원이 30살짜리 아시아 코끼리를 무리에 합사하려고 하는데 분석을 실시하지 않는다면 기존의 코끼리들에게 위험을 초래할 수 있습니다."라고 말합니다. 하지만 분석을 실시한다면 해당 코끼리에 내재된 위험을 더 정확히 파악하여 적절한 예방 조치를 취할 수 있습니다.
코 세척 비용은 회당 약 500달러이며 결핵 치료 비용은 연간 약 10만 달러에 이릅니다. 동물원은 이러한 작은 개선만으로 많은 돈을 절약함과 동시에 동물의 건강도 증진할 수 있습니다. 물론 가장 큰 이점은 코끼리들이 팩키와 같은 운명에 처하는 것을 막을 수 있다는 점입니다. 더 많은 코끼리의 건강을 유지하고 질병의 확산을 늦추는 것이 진정한 성공입니다.
1 The Infected Elephant in the Room. Slate, 2015년 3월 24일
2 Packy, Oregon Zoo's Beloved Elephant Dies at 54. Seattle Times, 2017년 2월 9일
3 Elephants infected seven Oregon zoo workers with tuberculosis: CDC. Reuters, 2016년 1월 8일
추천 자료
- 기사 Saving lives during a global pandemic through medical resource optimizationCleveland Clinic is operationalizing analytics to combat COVID-19, creating innovative models that help forecast patient volume, bed capacity, medical equipment availability and more.
- 기사 Improve child welfare through analyticsWith tremendous potential for child welfare agencies to use data and analytics to prevent child abuse and improve outcomes for children and families, child welfare advocates discuss the benefits of using data and establishing a data-driven culture to advance practice and policy.
- 기사 #Data4Good: Treating cancer, one patient at a timeDrawing on her experience as a cancer patient, Susan Weidner devotes her career to helping oncologists identify personalized treatments based on massive amounts of data.
- 회견 How does one of the largest cities in the world use data for social good? From data privacy to data quality, what are the challenges in using data for social good, and how does one large organization in New York City address them? Hear from a research scientist at the Center for Innovation through Data Intelligence about the data they have, the questions they ask of it, and the data they’d like to see in the future.
지금 바로 Insights를 구독하십시오.
SAS® Viya™
Make analytics accessible to everyone and bridge the talent gap in your organization