ModelOps: непрерывное управление
жизненным циклом модели
Внедряйте большее количество аналитических моделей
в бизнес в более сжатые сроки.
Джефф Алфорд, редактор SAS Insights
ModelOps – методика бесперебойной интеграции аналитических моделей в бизнес, когда модели, созданные командой аналитиков, реализуются в ИТ окружении компании в условиях внесения регулярных изменений и обновлений. Такой подход позволяет лидерам рынка применения ИИ в бизнесе получить существенное конкурентное преимущество.
Компании неуклонно расширяют практику применения моделей машинного обучения для принятия правильных и своевременных решений. Такие модели не ограничены количеством входных параметров, которые могут эффективно использовать, и способны обрабатывать огромные объемы структурированных и неструктурированных данных для выявления полезных паттернов.
Узнайте, что вы можете сделать для того, чтобы исправить ситуацию, когда более половины разработанных моделей так и не внедряются в бизнес.
Процесс регистрации, перетренировки, скоринга, интеграции, управления и мониторинга аналитических моделей будет занимать у вас всего несколько кликов в графическом интерфейсе.
Представляем...ModelOps
Многие организации сталкиваются со сложностями при попытках встроить аналитические модели в бизнес. В среднем, только половина разработанных моделей впоследствии используется бизнесом для принятия решений, а процесс их внедрения занимает до 3-х месяцев. Трудоемкость процесса может приводить к росту операционных затрат и задержкам в получении практической пользы от моделей.
Качество работы моделей не постоянно, и падает с течением времени, что в отсутствии инструментов контроля приводит к их неэффективному использованию. Как и автомобилям, моделям нужно проходить регулярную процедуру технического обслуживания для обеспечения стабильного функционирования. Качество работы модели зависит не только от ее параметров, но и от входных данных, своевременности внесения доработок и перетренировки.
ModelOps позволяет моделям быстрее выбраться из стен «лаборатории» аналитиков и оперативно перейти к этапам валидации, тестирования и интеграции в ИТ-ландшафт, обеспечивая получение качественного результата на основе. Такой подход позволяет управлять моделями, масштабировать их применение для решения бизнес-задач и постоянно отслеживать метрики качества работы, выявляя и устраняя признаки деградации на ранних стадиях. Пакетное предложение ModelOps основано на общепринятых принципах DevOps. Это ключевой компонент для успешной реализации масштабируемой предиктивной аналитики в бизнесе. Стоит отметить, что практика разработки моделей отличается от принципов разработки программного обеспечения. Особенности этого подхода приведены далее в тексте.
ModelOps позволяет моделям быстрее выбраться из стен «лаборатории» аналитиков и оперативно перейти к этапам валидации, тестирования и интеграции в ИТ-ландшафт, обеспечивая получение качественного результата на основе.
Непрерывная оценка результатов
В рамках подхода ModelOps организации начинают с оценки эффективности применения принципов в своей практике. Почему? Потому что ModelOps представляет собой концепцию непрерывной разработки, тестирования, интеграции и мониторинга, которая может быть эффективна только в том случае, если она ориентирована на решение бизнес-задач с нужным уровнем точности в нужных масштабах.
На концептуальном уровне необходимо определить эффективность подхода ModelOps в целом. Способствует ли текущая практика управления моделями решению задач нужного масштаба, с нужной точностью и с учетом текущих бизнес-процессов компании?
Далее на операционном уровне необходимо настроить регулярную оценку качества работы каждой модели. Поскольку им свойственно терять свою предиктивную силу со временем, модели нуждаются в перетренировке и повторной интеграции. Несколько советов для создания панели мониторинга производительности:
- Для отдельных моделей (или классов моделей) установите целевые показатели и отслеживайте их на этапах разработки, валидации и интеграции. Это могут быть параметры, относящиеся к оценке статистических свойств входных данных или общие метрики качества работы модели на различных временных срезах.
- Определите бизнес-показатели, на которые влияет работа модели. Например, сколько новых клиентов удалось привлечь благодаря использованию модели?
- Отслеживайте различные параметры, относящиеся к свойствам входных данных: их размер, частоту обновления, локализацию, категоризацию и типизацию. Зачастую проблемы бывают связаны со структурой данных, их качеством, которые меняются на протяжении всего жизненного цикла.
- Следите за тем, сколько вычислительных ресурсов используется моделями.
Описанные метрики оцениваются на этапе валидации – важной части жизненного цикла модели и неотъемлемом элементе концепции ModelOps. Некоторые совмещают понятия валидации и верификации, но при этом у этих понятий разный смысл.
На этапе верификации производится оценка того, как модель встроена в бизнес, и соответствие работы с ее назначением. Валидация нужна для того, чтобы убедиться, что модель показывает те результаты, на которые ориентируется бизнес. Оба понятия являются важной частью практики разработки и применения качественных моделей.
Три распространенные проблемы, решаемые с помощью подхода ModelOps.
Качество работы моделей начинает снижаться сразу после их разработки (иногда эффект заметен уже по итогам нескольких дней). Конечно, в различных случаях факторы, оказывающие влияние на производительность моделей, могут отличаться. Ниже приведены наиболее часто встречающиеся проблемы, с которыми сталкиваются компании.
Качество данных
Незначительные изменения в структуре и статических свойствах данных, которые сложно заметить или оценить их влияние в рамках традиционного подхода к аналитике, могут существенно повлиять на качество работы моделей машинного обучения.
В рамках концепции ModelOps важно правильно оценить входные данные для ваших моделей и ответить на следующие вопросы:
- Какие источники данных планируются к использованию?
- Могли бы вы объяснить клиенту, что причина принятого решения основывается на этих данных?
- Используемые данные прямо или косвенно относятся к области, которая регулируется законами и нормативами?
- Как вы решили вопрос баланса точности и стабильности модели?
- Как часто добавляются или изменяются входные переменные для модели?
- Насколько легко выполняется конструирование новых признаков для модели?
Время от разработки до внедрения модели
Поскольку длительность цикла разработки/внедрения модели может отличаться в зависимости от специфики компании, стоит исходить из оценки, сколько времени он сейчас занимает в вашей компании, а затем установить контрольные показатели для оценки результатов. Разбейте жизненный цикл модели на отдельные этапы, затем измерьте и сравните эти показатели для различных проектов, чтобы выявить сильные места и зоны роста. Оцените использование специального программного обеспечения для управления моделями, которое автоматизирует ручные действия.
Снижение качества работы во времени
Держите стабильность работы моделей под контролем. Эту проблему решает создание системного подхода к управлению моделями в вашей организации. Если все сотрудники вовлеченные в работу с моделями - от разработчиков до бизнес-пользователей, имеют понятную и зафиксированную зону ответственности за качество работы ваших моделей, то эти проблемы можно решить еще до того, как они повлияют на вашу прибыль.
Когда обновлять модели
Одними из самых сложных вопросов в практике применения машинного обучения в бизнесе являются внедрение моделей и поддержание их стабильной работы. Эта задача также связана с постоянным поиском новых данных, которые могут быть полезны для работы моделей и поддержания используемых данных в нужном формате.
Можно ли установить стандартное расписание для перетренировки любых моделей? Простой ответ «нет». Почему? Одной из причин является то, что модели теряют свои предиктивные свойства из-за различных факторов. Другая связана с тем, насколько сильно работа модели влияет на бизнес. Например, наиболее оперативного обновления требуют модели принятия решений, от которых напрямую зависит финансовый результат компании.
Вот почему важно сформулировать и регулярно отслеживать критерии качества работы ваших моделей.
Риск игнорирования ModelOps
Предиктивная способность аналитических моделей в сочетании с доступностью больших данных и наличием релевантных вычислительных мощностей будет и впредь служить источником важного преимущества в работе наиболее результативных организаций. Компании, которые окажутся не в состоянии использовать принципы ModelOps, столкнутся с растущими трудностями в масштабировании своих аналитических решений и могут отстать от более успешных конкурентов.
Рекомендуем прочитать
- 5 способов измерить здоровье улья с помощью аналитики и потоковых данныхТакой аналитический подход к пониманию здоровья пчелиных ульев может автоматически предупреждать пчеловодов об изменениях в весе улья, температуре, летной активности и многом другом.
- Визуализация данных для отслеживания распространения коронавирусаSAS считает, что в такое нестабильное время очень важно иметь надежные источники информации о вирусе. Поэтому SAS создал отчет, который отображает состояние, местоположение, распространение и анализ тенденций развития коронавируса.
- Как строится сотрудничество между НИУ ВШЭ и SAS РоссияВ рамках SAS Forum Russia 2019 обсуждалось взаимодействие между университетом и бизнесом, а также подготовка наиболее сильных и подходящих для рынка кадров на панельной дискуссии в секции «Мост между бизнесом и университетами: Академическая программа SAS».
Готовы подписаться на инсайты сейчас?