Крупнейший игрок e-grocery, лидер рынка аналитики и факультет компьютерных наук НИУ ВШЭ провели открытый конкурс на лучшую прогнозную модель.
Хакатон проходил в два этапа – онлайн и оффлайн. В ходе онлайн-этапа (с 18 октября по 18 ноября 2019) участникам предлагалось спрогнозировать вероятность отказа клиента от заказа без учета времени и стадии формирования заказа. Для построения модели участникам предоставлялась подвыборка (sample) истории заказов клиентов за определенный период времени с бинарной целевой переменной – признаком того, что заказ был отменен клиентом. В конкурсе мог поучаствовать любой желающий. На онлайн-этапе модели на конкурс прислали 69 человек.
В финал конкурса, который проходил 23-24 ноября 2019 в Культурном центре ВШЭ, были отобраны 22 участника, авторы лучших моделей первого онлайн-этапа: 3 конкурсанта выступали в индивидуальном зачете, еще 19 – в составе пяти команд (от факультета компьютерных наук ВШЭ, от факультета вычислительной математики и кибернетики МГУ, а также сборные команды). В ходе двухдневного марафона участники должны были построить модель, способную уже не только просчитать отмену, но и спрогнозировать, за сколько часов до периода запланированной доставки это произойдет.
Конкурсанты учитывали такие факторы, как дата заказа и дата доставки. Были подтверждены гипотезы, что чем дальше срок доставки от момента заказа, тем вероятнее произойдет отмена, а в выходные дни это происходит чаще, чем в будние. Жюри высоко оценило использование участниками дополнительных внешних данных, которые могут повлиять на отмену покупки — например, погодные условия.
Финальный лидерборд был сформирован на основании точности построенных моделей, а также на возможной бизнес-применимости и оригинальности идеи, которые оценивались жюри в ходе презентаций решений участников.
Факты и цифры:
175 человек
заинтересовались задачей
69 человек
присылали решения в ходе онлайн-конкурса
8 команд
в финале
2 задачи
для онлайн-этапа и для финала
Победу в соревновании по анализу данных одержал разработчик из Норильска Дмитрий Федотов (FEDOTOVDN): именно ему удалось предложить наиболее точную и оптимальную модель прогнозирования отказов и рассчитать максимально приближенный к реальности временной промежуток отмены покупки. Он обнаружил, что самый яркий признак отмены — наличие в личном кабинете пользователя похожих заказов на одну и ту же дату доставки.
«Общие впечатления от конкурса самые положительные. Все было организовано строго по таймингу. Условия задачи четко поставлены, всегда была возможность уточнить некоторые неясные и/или спорные моменты у организаторов, которые всегда были доступны и открыты к общению. Питание – выше всяческих похвал. Уровень сложности задачи был средним. Не назову сложным, так как не было огромного количества таблиц и признаков, которыми нужно было оперировать. Все признаки не были анонимизированными, что большой плюс. Намного приятнее работать с данными, которые понимаешь. Но и простой задачу не могу назвать, так как требовалась некоторая предобработка предоставленных данных, как минимум группировки по номеру заказа. Также нужно было глубоко проанализировать распределение целевой переменной, найти в ней выбросы, понять, что с ними можно сделать и почему», - говорит победитель.
Илья Горшков, магистрант программы ФКН НИУ ВШЭ «Анализ данных в биологии и медицине», принимал участие в хакатоне впервые. Он тоже был единственным участником команды и занял второе место. Третье место поделили две команды взрослых разработчиков, а четвертое и пятое место заняли команды студентов МГУ.
Поздравляем лучших решателей и благодарим всех финалистов за участие!
1 место – команда FEDOTOVDN: Дмитрий Федотов
2 место – команда bsfireworks: Илья Горшков
3 место – команда 1x0r: Давид Казарян, Антон Савинков и команда polo: Павел Половников
4 место – команда qwertyasdf: Мария Яворская, Алексей Письменный, Валентин Александров, Андрей Соловьев, Алексей Щекалев
5 место – команда Dreamteam: Алексей Медведев, Николай Скачков, Иван Сомов, Дмитрий Медведев, Павел Коробов
Пятёрка лидеров хакатона получила ценные призы от спонсоров и организаторов (Яндекс.Станции, умные часы Garmin, планшеты Apple (iPad)).
После церемонии награждения компании-организаторы пригласили участников финала на вакансии сотрудников и стажеров.
Такие соревнования помогают участникам развивать профессиональные навыки и на практике учиться применять теоретические знания. В будущем это поможет им стать востребованными специалистами — в первую очередь дата-сайентистами, которых сегодня остро не хватает во всех отраслях. А для бизнеса это хороший способ проверить их рабочие гипотезы и посмотреть, как сторонние специалисты подойдут к решению задачи.
-
Цель SAS Data Hack Platypus — не просто собрать вместе единомышленников и способных студентов, чтобы предложить им выполнить какую-то абстрактную задачу. Мы стремились сделать наш хакатон максимально приближенным к реальным условиям бизнеса, поэтому и задачу ставили очень актуальную для рынка. Теоретические знания должны согласовываться с реальными бизнес-процессами. Это поможет будущему специалисту развиваться с профессиональной точки зрения. И конечно, нам важно в таких условиях знакомиться со студентами, которые, возможно, захотят пройти стажировку в SAS. Михаил Петровский руководитель Академической программы SAS Россия/СНГ
-
Совместный хакатон с SAS стал для “Утконоса” отличной возможностью посмотреть на способы решения сложных нестандартных задач с помощью аналитики больших данных. Построение точных моделей аналитики потребительского поведения и прогнозирования отмены заказа на основе работы с большими данными открывает новые возможности для оптимизации всего бизнес-процесса и позволяет нам минимизировать убытки. Мария Артамонова Директор по IT Утконос ОНЛАЙН
-
Когда хакатон организовывает компания-лидер в области аналитики вместе со своим заказчиком на реальных данных – это приносит участникам двойную пользу. Во-первых, хакатоны способствуют развитию бизнес-мышления студентов, что пригодится им в будущем за стенами учебного заведения. Во-вторых, такие соревнования – это приятное времяпрепровождение с единомышленниками и возможность получить награду за свой труд. Рады были принимать гостей в новом здании на Покровке. Будем ждать еще. Тамара Вознесенская первый заместитель декана факультета компьютерных наук НИУ ВШЭ
-
Хакатоны позволяют структурировать опыт решения задач, выработать свой стиль, оценить, как та или иная модель проявляет себя на практике. На самом деле, любой из участников хакатона мог в два клика проверить гипотезы в нашей программе, которая к тому же доступна для студентов, но ребята предпочли Python. Компания SAS поставляет софт для бизнеса, с помощью которого люди без навыков программирования могут строить сложные модели. Таким образом, даже бизнес-аналитики без специальных знаний имеют возможность получить приличный результат с помощью модели дата-майнинга. Елена Щенявская консультант, ментор на хакатоне SAS Россия/СНГ
Рекомендуем прочитать
- Public health infrastructure desperately needs modernizationPublic health agencies must flex to longitudinal health crises and acute emergencies – from natural disasters like hurricanes to events like a pandemic. To be prepared, public health infrastructure must be modernized to support connectivity, real-time data exchanges, analytics and visualization.
- Взгляд опытного дата-сайентиста: почему data literacy так важна сегодняУзнайте мнение дата-сайентиста и преподавателя о ценности фундаментальных знаний, чтобы вам было легче отличить факты от вымысла.
- 5 способов измерить здоровье улья с помощью аналитики и потоковых данныхТакой аналитический подход к пониманию здоровья пчелиных ульев может автоматически предупреждать пчеловодов об изменениях в весе улья, температуре, летной активности и многом другом.
Готовы подписаться на инсайты сейчас?