보건의료 빅데이터 개방 시대!

SAS® Visual Analytics를 이용한 건강보험
청구자료 분석

건강보험심사평가원(이하 심평원)은 국민의 진료 및 처방, 약국 조제 등 국민의료비의 적정성을 심사/평가하는 공공기관입니다. 정부3.0 및 공공데이터 개방법에 따라 심평원은 보유한 공공데이터를 개방하기 위해 ‘보건의료빅데이터개방시스템’을 구축하고, 6월 오픈했습니다.

심평원은 병원이나 약국 등 요양기관의 환자 진료 및 처방정보, 의료인력 및 시설/장비현황정보 등을 비롯해 보건복지부, 식품의약품안전처, 보건소, 국민건강보험공단, 제약업체 등의 정보를 각종 포털 시스템(국민 포털, 요양기관 포털, 진료비 청구 포털, 의약품 포털, 의약품안전점검시스템 등)을 통해 보유하고 있습니다. 이 데이터를 내부 업무용으로 처리/분석하여 사용하고, 이들 데이터를 가공하여 공공데이터(데이터셋, 오픈 API), 의료빅데이터분석(빅데이터센터), 의료통계정보(질병, 의약품, 의료기관) 등의 서비스를 제공해 전문가 및 일반 사용자 모두가 편리하게 이용할 수 있게 되었습니다.

심평원 보건의료빅데이터개방시스템

심평원 보건의료빅데이터개방시스템은 ‘개방포털시스템’과 ‘통계분석시스템’으로 구성되어 있습니다. 심평원은 원천 데이터를 개방하기 위해 주민등록번호를 비롯한 개인 식별정보를 암호화한 다음, 통계분석DB로 데이터를 이행하고, 개방포털에서 다운로드 등의 서비스를 제공하기 위해 통계분석DB를 가공하여 데이터개방DB로 이행했습니다. 데이터개방DB를 통해 국민은 공공데이터 및 오픈 API 서비스를 이용할 수 있고, 질병통계, 진료비 청구경향 등의 정보를 그래프와 차트, 맵의 형식으로 볼 수 있습니다.

한편 외부 연구자들이 심평원에 특정 질환, 특정 약제 사용 등에 대한 자료를 요청하면, 통계분석DB의 자료를 데이터 셋으로 가공하여 제공받받을 수 있으며, 연구자들은 SAS 분석, 시각화 분석, 마이닝분석 툴 등을 이용해 분석을 합니다. 이 분석시스템과 통계분석DB를 통계분석시스템이라고 합니다. 통계분석시스템은 심평원 내 빅데이터센터를 방문하거나, 원격시스템(150개 계정 운영)을 통해 자신의 사무실이나 연구실에서 인터넷으로 이용할 수 있습니다.

보건의료빅데이터 분석이 필요한 이유

2013년 매킨지의 한 보고서에서는 보건의료분야에서의 빅데이터 활용 및 분석의 가치를 ‘혁명’으로 일컬을 만큼 높게 평가했습니다. 빅데이터를 활용하면 보건의료서비스의 질과 효율을 평가할 수 있으며, 특정 질환을 연구하고 예방할 수 있습니다. 미국의 경우, 보건의료 빅데이터 분석으로 연간 3천억 달러를 절감할 수 있다는 보고도 있습니다.

그렇다면 보건의료분야에서 사용할 수 있는 빅데이터로는 무엇이 있을까요? 먼저, ‘클레임스 데이터(Claims Data, 건강보험 청구자료)’가 있습니다. 현재 심평원에 수집되는 모든 국민의 의료기관 이용 정보에는 급여대상이 되는 약물과 의료기술, 검사정보는 물론, 자세한 의료 이용내역도 포함되어 있습니다. 최근 대형병원을 중심으로 전자의무기록을 구축하고 있는데, 이처럼 개별 의료기관이 갖고 있는 ‘클리니컬 데이터(Clinical Data)’도 유의미한 빅데이터입니다. 이 외에도 제약 R&D 데이터, 환자의 행동 및 정서 데이터 등도 빅데이터 분석의 중요 자료원이 됩니다.

빅데이터를 이용하면 상상 이상으로 많은 인사이트를 확보할 수 있습니다. 먼저, 기존에 수집된 자료를 이용해 과거에 어떤 일이 발생했는지 그 현황을 분석하여 Reporting할 수 있습니다. 가령 청구자료를 이용해 전국적으로 의료비용이 많이 발생한 질병을 찾아낼 수도 있습니다. 현재 일어나고 있는 일을 Monitoring할 수도 있습니다. 또한 Data Mining 및 Evaluation을 통해 어떤 리스크 요인이 어떤 질환 발생에 영향을 주는지 인과관계를 파악할 수 있습니다. Prediction & Simulation도 가능해집니다. 예측 모델을 이용해 특정 사람에게 발생하는 특정 질병을 모델링하고, 이를 기반으로 위험 요인을 예측하고 관리할 수 있습니다.

심평원의 보건의료분야 빅데이터를 활용한 국민 의료 서비스 질 향상 기대

보건의료분야 빅데이터는 Clinical operations, Public health(공공의료), Evidence-based medicine(근거중심의학)에서 활용할 수 있습니다. ▶여러 치료방법 중 어떤 방법이 더 효과적이고 효율적인지를 규명(비교효과연구, Comparative Effectiveness Research)하고, ▶특정 질환의 발생률, 유병률, 비용 등을 분석하여 질환 발생현황을 파악하고, 이를 기반으로 보건의료분야의 정책개발 및 의사결정을 위해, ▶특정 환자에게 질환을 일으키는 위험요소를 찾아내고 예방하는데 빅데이터를 활용하고 있습니다.

건강보험 청구자료를 이용 할 수 있는 연구는 아주 다양하고, 창출할 수 있는 가치 또한 가늠할 수 없을 만큼 큽니다. 실제로 건강보험 청구자료에는 의약품에 대한 모든 자료가 자세히 담겨 있으므로 의약품 관련 연구에 유용하게 활용되고 있습니다. 또한 특정 질환 입원정보를 이용하여 시간의 흐름이나 계절에 따라 어떤 질환이 발생하는지 패턴분석을 할 수 있고, 역학조사에도 활용되고 있습니다. 질환별 환자수의 연도별 증감, 환자수 증가에 영향을 미치는 요인을 탐색, 분석 할 수 있습니다. 또 특정 질환과 검사•수술•처치 등의 진료비용을 파악하는 연구에도 활용됩니다.

SAS® Visual Analytics를 활용한 류마티스 관절염과 관련된 질병 연구 사례

SAS코리아는 심평원에 아래 세가지 핵심 솔루션을 제공해 프로그래밍 능력이나 통계에 대한 전문지식이 없는 일반인도 쉽게 데이터를 활용하고 분석할 수 있는 시스템을 구축할 수 있도록 했습니다.

첫째, SAS® Enterprise Guide ; SAS 프로그램을 직접 작성하지 않고서도 클릭만으로 테이블 조인, 새로운 변수 생성, 데이터 필터링, 데이터 정렬 등 데이터를 쉽게 핸들링할 수 있습니다. 둘째, SAS® Visual Analytics ; 관심 있는 변수에 대해 계층 관계를 정의하면 데이터를 탐색하고, 시각적으로 보여줍니다. 대용량 데이터를 빠르게 탐색하고 다양한 시각적인 방법으로 데이터에 숨어 있는 패턴을 찾아 통계분석을 할 수 있는 것입니다. 셋째, SAS® Enterprise Miner ; 다양한 분석도구(SAS® Visual Analytics, SAS® Enterprise Guide 등)로 데이터 탐색을 마친 다음에는 SAS® Enterprise Miner를 활용하여 예측모형을 개발하고, 로지스틱 회귀모형 등의 통계분석을 수행할 수 있습니다.

실제로 안동대학교 정보통계학과 장은진 교수팀은 심평원이 보유한 건강보험 청구자료를 기반으로, SAS® Visual Analytics를 이용해 류마티스 관절염 관련 질병통계를 작성했습니다. 먼저, 심평원 자료 중 환자들이 의료기관을 방문했을 때 발행되는 ‘명세서 일반내역’ 데이터를 기반으로 류마티스 관절염 환자(상병코드)를 대상으로 설정하고, 분석대상이 되는 구분 변수로서 입/내원 일수, 연령, 진료월/주, 지역 등을 선정했습니다.

분석대상 변수로는 환자수, 입내원일수, 진료비 등을 선택했습니다. 그리고 관심 있는 특정상병을 가진 명세서만을 필터링합니다. 즉, 먼저 류마티스 관절염 상병을 가진 입원/외래 명세서를 SAS® Visual Analytics를 이용해 필터링 한 다음, 필터링 데이터를 대상으로 류마티스 관절염 환자가 가진 동반질환을 클릭만으로 쉽게 분석합니다. 단순 클릭만으로 하위 레벨의 계층분석까지 할 수 있는 것입니다. 같은 방법으로 입원 및 외래, 연령군별 환자수, 내원일수, 비용 분석 등을 간단히 수행합니다.

SAS® Visual Analytics의 예측 기능을 사용하여 성별/월별 류마티스 관절염 환자수에 대한 분석과 예측도 쉽게 할 수 있었습니다. SAS® Visual Analytics가 알아서 예측 모델링을 해주기 때문입니다. 지역별 류마티스 관절염 환자수와 비용 분석도 가능합니다. 청구자료에 있는 지역의 위도와 경도를 매핑시켜 그려낼 수 있기 때문입니다. 이 모든 게 단순 드래그와 클릭만으로 가능하며, 데이터는 누구나 이해하기 쉽게 시각적으로 제시됩니다. 이처럼 SAS® Visual Analytics를 이용해 연구자들은 통계에 대한 전문지식 없이도 연구결과를 쉽게 산출할 수 있습니다.

심평원에서 제공하는 국민과 보건의료 산업분야, 의료연구기관 등 이용자에게 유익한 의료정보와 서비스를 통해 누구나 쉽고 편리하게 공공데이터를 활용할 수 있게 되기를 기대합니다.

본 문서에 나오는 결과는 본 문서에 설명된 특정 상황, 비즈니스 모델, 데이터 입력 및 컴퓨팅 환경에 적합하게 되어 있습니다. 각 SAS 고객의 경험은 고유한 것으로, 비즈니스 및 기술적 변수에 따라 달라집니다. 따라서 모든 서술은 비전형적인 것이라는 점을 고려해야 합니다. 실제 절약, 결과 및 성능 특성은 개별 고객의 구성 및 조건에 따라 달라질 수 있습니다. SAS는 모든 고객이 비슷한 결과를 달성할 수 있다고 보증하거나 진술하지 않습니다. SAS 제품과 서비스에 대한 유일한 보증은 해당 제품 및 서비스에 대한 서면 계약의 보증서에 명시되어 있습니다. 본 문서의 어떠한 내용도 추가 보증을 구성하는 것으로 해석될 수 없습니다. 고객은 SAS 소프트웨어의 성공적인 구현에 따라 합의된 계약적 교환 또는 프로젝트 성공 요약의 일환으로 성공 사례를 SAS와 공유했습니다. 브랜드 및 제품 명칭은 각 기업의 상표입니다.

hira logo

비즈니스 이슈

  • 보건의료데이터 개방 및 활용을 위한 전문화된 시스템 필요
  • 보건의료데이터 활용의 편의 제공

    Solution

      Benefits

      보건 의료 빅데이터 개방 시스템을 통해 누구나 쉽게 질환 별 환자수, 유병률, 의료비용 등의 의료 정보에 대한 시각적인 탐색 및 고급 분석 연구 수행이 가능해짐으로써 국민 의료 서비스 질 향상 기여