Прохождение «последней мили» аналитики в три шага
Тапан Пател, международный маркетинг решений SAS
Компании, осуществившие цифровую трансформацию, открывают для себя возможность принимать эффективные, основанные на данных, решения. Многие организации уже достигли этой цели, а кто-то еще находится на пути к ней. По словам представителей бизнеса, наибольшие сложности возникают на этапе прохождения «последней мили» аналитики – там, где происходит переход от данных к решениям.
В результате масштабных инвестиций в аналитику и искусственный интеллект, а также благодаря наличию большого количества готовых наработок и фреймворков, бизнес получил в распоряжение огромное количество аналитических активов. При этом сам по себе рост аналитических активов не является самоцелью. Дело в том, что именно операционализация или внедрение аналитических активов в эксплуатацию являются основным драйвером для получения практической пользы от инициатив направления Data Science и Искусственный Интеллект.
Скачать бесплатный документ
Статья под названием "Получение максимальной отдачи от вложений в ИИ благодаря операционализации аналитики" расскажет о том, как использование методологии ModelOps поможет быстрее и эффективнее встроить аналитику в ваш бизнес.
В рамках классической аналитической методологии, данные проходят по пути преобразования в инсайты для поддержки принятия решений. Но, если бизнес хочет «вырасти» и перейти с этапа экспериментирования с ИИ на этап его полноценного практического применения, а также хочет монетизировать аналитические активы, то проработку проектов стоит начинать непосредственно с детального определения задач, в рамках которых будут приниматься решения. Организациям следует определить, где и как они будут применять аналитику, откуда они будут брать для этого данные.
Наверняка, сейчас многие компании скажут, что они все делают правильно – нанимают талантливых аналитиков, создают должности, такие как chief data officer (CDO) или chief analytics officer (CAO), чтобы в ходе непосредственного взаимодействия с руководством организации и бизнес-подразделениями продвинуться в области применения аналитики. Но зачастую организации не видят желаемого эффекта от своих инициатив в области анализа данных и искусственного интеллекта, поскольку у них не получается своевременно перейти от пилотной стадии проектов к полноценному применению аналитики в бизнесе.
По данным исследования IDC, только 35% опрошенных организаций утверждают, что их аналитические модели полноценно встроены в бизнес. Основное препятствие на пути к достижению этой цели – интеграция и операционализация аналитики в корпоративный ИТ-ландшафт, а также сложности, связанные с текущими бизнес-процессами, принятыми в компании.
Представители некоторых компаний говорят о том, что в их аналитических проектах основное внимание уделяется созданию аналитических активов (таких как, скрипты для получения и обработки данных, обучения моделей, оценки их качества работы), но не их операционализации. Легче это признать, чем исправить. Данные и скрипты сами по себе не обеспечивают бизнесу конкурентное преимущество, в отличие от принимаемых на их основании решений. Использование инсайтов на постоянной основе для превращения информации в решения позволяет организациям создавать полноценный инструментарий, позволяющий развивать бизнес и оставлять конкурентов позади.
Каким образом компании могут эффективно пройти последнюю милю и использовать аналитику в рамках системного, масштабируемого подхода? Ниже представлены три основные темы, которым нужно уделять постоянное внимание:
1. Определение технических требований
Необходимо систематизировать процессы управления моделями, а именно процессы регистрации, внедрения, мониторинга, перетренировки аналитических моделей и другие. Разберем каждый процесс:
- Регистрация. Необходимо наличие централизованного хранилища моделей, шаблонов управления жизненным циклом с возможностью контроля версий. Благодаря этому обеспечивается наглядная картина, иллюстрирующая состояние всех моделей, разработанных на вендорских и Open-Source решениях. Создается единое пространство для совместной работы всех вовлеченных в аналитику ролей, что повышает эффективность связанных бизнес-процессов. Централизованное хранение моделей, их метаданных и кода снижает риски, возникающие на этапе эксплуатации моделей, и повышает общую ценность аналитических активов.
- Внедрение. Речь идет о процессе интеграции моделей в продуктивное окружение для их последующей эксплуатации. Зачастую это самый трудоемкий шаг для ИТ-специалистов или сотрудников DevOps. Но при этом он имеет ключевое значение в жизненном цикле аналитики. В идеале, организации должны уметь сравнивать работу вендорских и open-source моделей, созданных для решения одной и той же задачи, и выбирать лучшую модель для использования в бизнесе. В зависимости от сценария использования, модели могут применяться в пакетном режиме (например, на стороне баз данных, в Hadoop или Spark), в веб-приложениях, в облачных системах или в режиме реального времени, в том числе на потоковых данных.
- Мониторинг. После того как модель начинает эксплуатироваться в бизнесе, ее жизненный цикл не заканчивается. Качество её работы должно отслеживаться на постоянной основе. Необходимо понимать, как ведут себя модели в условиях появления новых данных, которые были недоступны при обучении, и которые появились ввиду изменения внутренних и внешних условий ведения бизнеса. Отчеты по качеству работы моделей должны формироваться для моделей-чемпионов и моделей-конкурентов в различных разрезах.
- Перетренировка. Если качество работы модели снижается, организации должны выбрать один из следующих путей решения проблемы:
- Перетренировать существующую модель на новых данных.
- Перестроить модель с помощью новых методов (таких как, построение признаков и т. д.).
- Полностью заменить модель на обученную заново.
У всех вовлеченных в аналитический процесс сотрудников должно быть ясное представление о том, на основании каких показателей была произведена замена старой модели на новую, и как это отразилось на бизнесе.
По данным исследования IDC, только 35% опрошенных организаций утверждают, что их аналитические модели полноценно встроены в бизнес.
2. Определение ролей и зоны ответственности сотрудников
Для успешного прохождения последней мили аналитики ключевое значение имеет тесное сотрудничество между всеми вовлеченными сторонами: дата-сайентистами, представителями операционных бизнес-подразделений, IT и DevOps-специалистами. В случае, если в реализации проекта (в частности, в интеграции и управлении моделями) будет заинтересована только одно подразделение (например, IT или DevOps), а у других не будет надлежащего стимула (например, в условиях отсутствия эффективной коммуникации), нужного результата такая ИИ-инициатива не принесет.
При разработке моделей дата-сайентисты должны держать в голове особенности процесса их интеграции в бизнес, в то время как сотрудники IT и DevOps должны понимать требования по эксплуатации моделей, состав используемых данных, особенности разработки моделей их перетренировки. Участие в процессе представителей бизнес-подразделений очень важно. Именно они должны четко определить ожидаемые результаты применения аналитических моделей и в сотрудничестве с дата-сайентистами следить за фактическими результатами работы.
3. Создание системного процесса операционализации
Ключевой фактор успеха в использовании аналитических моделей в бизнесе – создание прозрачного системного подхода операционализации аналитики. Многие организации уже сформировали четкий процесс создания моделей. Но отсутствие сформулированного процесса интеграции моделей и управления их жизненным циклом является серьезным барьером, который необходимо преодолеть.
Некоторые организации совершают ошибку и считают, что достаточно просто создать модель и оценить ее работу на тестовых данных, произведя валидацию в условиях, максимально приближенным к условиям «боевой» эксплуатации. На самом деле, чтобы получить максимальную пользу от применения моделей, необходимо организовать непрерывный процесс мониторинга их качества.
Неудивительно, что последняя миля аналитики – внедрение моделей в бизнес – является самой сложной частью реализации проектов в рамках цифровой трансформации компании. Но она имеет ключевое значение для того, чтобы организация смогла получить реальную отдачу от инвестиций в ИИ и аналитику. Для полной реализации всего потенциала инициатив в области анализа данных, организациям следует вовлекать IT и DevOps уже на раннем этапе проработки ИИ-проектов, чтобы своевременно определить пути операционализации аналитики; согласовать ожидаемые результаты от создаваемых аналитических моделей; иметь четкое представление о шагах, ролях, процессах и интеграции, начиная от подготовки данных и разработки моделей до внедрения аналитики в бизнес.
Рекомендуем прочитать
- Fraud detection and machine learning: What you need to knowМашинное обучение является важной частью инструментария обнаружения мошенничества. Вот что вам нужно для начала работы.
- Спасти жизнь в период пандемии, оптимизируя медицинские ресурсыCleveland Clinic внедряет аналитику для борьбы с COVID-19, создавая инновационные модели, которые помогают прогнозировать количество пациентов, коек, доступность медицинского оборудования и многое другое.
- Как прошел хакатон SAS и «Утконос ОНЛАЙН» SAS Data Hack PlatypusКрупнейший игрок e-grocery, лидер рынка аналитики и факультет компьютерных наук НИУ ВШЭ провели открытый конкурс на лучшую прогнозную модель.
Готовы подписаться на инсайты сейчас?