댄스카드공식 기반, 농구경기 대진표 96% 예측달성

매년 봄, 농구의 본고장 미국은 대학 농구 최대의 토너먼트 ‘미국대학스포츠협회(NCAA)’ 경기로 전역이 들썩입니다. 특히 올해에는 NCAA 남자 농구 토너먼트 2차전이 대중을 사로잡았는데요. 전년도 챔피언인 빌라노바 와일드캐츠가 올해도 결승에 진출할 것이란 전문가 예측을 깨고, 8번 시드를 받은 위스콘신에게 진 것이죠! 또 정규 시즌 동안 SEC(South Eastern Conference)에서 24승 10패를 기록한 사우스 캐롤라이나는 우승 후보인 듀크를 7점차로 이겼습니다. 연일 대진표 예측을 깨는 이변이 일어났습니다. 

토너먼트가 피닉스에서 열릴 4강전 ‘Final Four’를 향해 달려가고 있는 가운데 이러한 불확실성을 예측할 수 있는 사람이 있을까요? 정답은 ‘있다’입니다. 바로 애널리틱스! 분석을 통해서 말이죠.

노스 플로리다 대학(University of North Florida)의 B. 제이 콜맨(B. Jay Coleman) 교수와 머서 대학(Mercer University)의 앨런 린치(Allen Lynch) 교수는 경제 컨설팅 회사 이코노미스트 인코퍼레이티드(Economists Incorporated)의 마이크 듀몬드(Mike DuMond)와 함께 64강 토너먼트 모두를 정확히 예측했습니다! 더욱 놀라운 사실은 전 시즌 동 안 농구 경기를 단 한번도 보지 않았다는 사실이죠!

▲ 콜맨 교수는 전 시즌 동안 농구 경기를 단 한번도 보지 않고 64강 토너먼트 모두를 정확히 예측했습니다!

콜맨 교수는 예측을 위해 편향적이지 않은 버전(unbiased)의 모델을 사용했습니다. 특정 경기 컨퍼런스 또는 NCAA 위원회 대표자가 속해 있는 팀을 더 유리하게 하는 요인이 없다는 뜻인데요. 다른 많은 스포츠 분석 전문가들과는 달리 각 팀 별로 단 7가지 정보만을 사용해 단 몇 초 만에 정확한 예측을 도출했습니다!

SAS 애널리틱스 기반의 예측 공식, 96%의 정확도를 기록하다

모두를 놀라게 한 이 예측은 바로 SAS 애널리틱스를 기반으로 한 ‘댄스 카드(Dance Card)’ 공식을 통해 도출됐습니다. NCAA 토너먼트 대진표는 개별 컨퍼런스 경기에서 우승한 팀들이 받는 자동 출전권(automatic bid)과 NCAA 위원회가 직접 선정하는 초청권(at-large bid)을 받은 팀들로 최종 구성되는데요. 댄스 카드 공식은 초청팀이 발표되는 셀렉션 선데이(Selection Sunday)에 모든 36팀을 예측했습니다. 

댄스 카드 공식은 말 그대로 다른 견해들(opinions)을 제거하고, 애널리틱스는 팀마다 7개 요인에 대한 데이터를 이용하며, 공식에 따라 개별 요인에 가중치를 부여합니다. 세 사람은 댄스 카드를 이용해 지난 6년을 통틀어 초청권을 얻은 218개 팀 중 209개 팀을 정확히 예측했습니다. 더 놀라운 사실은 바로 NCAA 위원회의 결정과 96% 일치했다는 사실이죠! 

세 개발자는 이번 시즌 댄스 카드의 대진표 예측이 ‘깔끔(clean)’했다고 평가했습니다. 토너먼트에 진출한 마지막 팀과 안타깝게 제외된 첫 번째 팀 사이 격차가 상당히 컸기 때문이죠. 실제 캔자스 주립대는 초청권 획득 확률 81%로 가장 마지막에 진출할 것으로 예측됐는데요. 반면 첫 번째로 제외된 일리노이 주립대는 획득 확률이 33%였습니다. 콜맨 교수는 보통은 그 격차가 훨씬 작다며, 이번 정확한 예측을 통해 댄스 카드의 효과를 증명했다고 말했습니다. 

이 모델은 다른 많은 예측들을 앞서며 개발자들에게 큰 의미가 됐습니다. 실제 올해 댄스 카드는 미국 대표 스포츠 채널 ESPN의 대진표 예측가인 조 러날디(Joe Lunardi)보다 한 수 더 앞섰습니다! 러날디는 한 개 차이로 만점을 놓쳤죠. 콜맨 교수는 “어쩌만 나에게 일어난 최고의 일일 것”이라고 소감을 밝혔습니다.

▲ 댄스 카드 공식은 NCAA 위원회의 결정을 96% 정확성으로 예측하며, ESPN 대진표 전문가의 예측을 앞섰습니다.

댄스 카드 공식은 토너먼트 초청권을 예측할 목적으로 개발됐습니다. 그렇지만 많은 사람들의 관심은 3월과 4월 초에 나올 경기 결과에 쏠려 있죠. 콜맨 교수는 플로리다 지역 기자의 제안을 받아 재미 삼아 경기 승패를 예측해보고 있는데요. 현재까지 콜맨 교수는 그 결과에 크게 만족하고 있습니다. 그는 “지금까지 ESPN 승패 예측 콘테스트(bracket contest)에 접수된 1,900만 대진표의 정확도인 89.5% 정도이거나 그 이상이다. 나쁘지 않은 결과!”라고 덧붙였습니다.

About SAS

SAS는 산업별 솔루션을 포함한 인공지능(AI) 및 분석 소프트웨어 부문의 글로벌 선두 기업이다. SAS는 중요한 순간에 필요한 지식을 제공함으로써 기업이 데이터를 기반으로 신뢰할 수 있는 의사 결정을 더 빠르게 내릴 수 있도록 지원한다. SAS는 THE POWER TO KNOW®를 실현한다.

편집자 연락처:
KRMarketing@sas.com