- Инсайты
- Машинное обучение для чайников (и не только)
Машинное обучение для чайников (и не только)
10 советов для тех, кто хочет преуспеть в области машинного обучения
Автор: Кимберли Невала (Kimberly Nevala), директор по стратегическому развитию бизнеса, SAS Best Practices
Машинное обучение. Этот термин вы десятки, а может, и сотни раз слышали у себя на работе и в новостях. Это активно развивающееся технологическое направление может показаться слишком сложным и даже пугающим. И на это есть причины. Самые очевидные среди них — необходимость в высокой квалификации и владение экспертизой для разработки и внедрения алгоритмов, которые позволяют компьютерам «учиться». При этом, по мере того как процесс освоения навыков в сфере data science становится все более доступным, а используемые для этого инструменты — более простыми, компании начинают понимать, что для грамотного и эффективного применения технологий машинного обучения недостаточно лишь технических знаний и опыта.
Как и в случае с передовыми аналитическими решениями предыдущих поколений, ценность подобных решений зависит от возможности применить на практике полученные результаты анализа данных. В этой статье мы предлагаем десять лучших советов и рекомендаций (нетехнического характера), которые помогут добиться успеха как новичкам, лишь начинающим знакомство с машинным обучением, так и опытным пользователям, планирующим расширить области применения этой технологии.
1. Используйте идеи и концепции, а не теоремы, требующие доказательств
Оценивая экономическую целесообразность затрат времени и средств на проекты машинного обучения, руководители и специалисты нетехнических направлений должны полностью понимать, какие задачи машинное обучение способно выполнять, а какие — нет. Но это не означает, что им требуется доскональное знание всей специфики новейших нейросетей.
Рассказ о том каким образом машинное обучение может быть применено в рамках вашего бизнеса, вызовет больший отклик, нежели сложные схемы алгоритмов и обсуждения P-значений. Изучайте кейсы, собирайте примеры решения конкретных задач с помощью машинного обучения, а также примеры его успешного внедрения в других отраслях и аналогичных компаниях. Если необходимо разъяснить непосредственно суть метода, старайтесь использовать образы и аналогии, а не инженерные диаграммы.
2. Включите машинное обучение на этапе планирования
На этапе знакомства с технологиями машинного обучения важно понимать, какие именно задачи стоят перед вами и какие из них способно решить машинное обучение. В отдельных случаях машинное обучение может помочь выявить области, которые требуют дальнейшего изучения. В других случаях можно интегрировать алгоритмы машинного обучения непосредственно в операционные системы, чтобы автоматизировать принятие решений на ключевых этапах или обрабатывать данные в режиме реального времени. Это необходимо учитывать при принятии решений в отношении бизнеса и политик, когда необходимо понять способы применения полученной аналитической информации на практике.
3. Избегайте упражнений типа «черный ящик»
Да, методы машинного обучения кажутся запутанными и зачастую бывают совершенно непонятными. Но машинное обучение однозначно не является технологией типа «черный ящик», результаты которой можно применять вслепую без должного изучения.
Пользователи (помимо исследователей данных, которые программируют алгоритм) должны ответить на следующие вопросы:
- Что именно мы пытаемся спрогнозировать?
- Какие входные данные оптимально использовать для этого процесса?
- Соответствует ли результат ожиданиям?
- Есть ли исключения, которые нужно учесть? Какие будут последствия возникнут, если этого не сделать?
- Как следует реагировать? Как можно (и нужно) применять полученные результаты?
Руководство по машинному обучению: электронный сборник советов и практических рекомендаций SAS
Загрузите полную версию электронного руководства по машинному обучению, в котором подробно описаны методы машинного обучения, а также чек-лист для быстрого старта.
Бесплатное электронное руководство по машинному обучению
4. Проявите разумный научный скепсис
При всех своих достоинствах машинное обучение все равно не является волшебной аналитической системой, в которой все ошибки исправляются сами собой. На практике разработка приложения для машинного обучения представляет собой итеративный и экспериментальный процесс. Это утверждение верно, даже если используются хорошо известные привычные алгоритмы. В любом случае, алгоритм необходимо обучить и настроить в соответствии с бизнес-контекстом и имеющимися данными.
Неважно, столкнулись ли вы с машинным обучением впервые или давно являетесь опытным специалистом в этой области, здоровая доля скептицизма не повредит, как и уверенное статистическое обоснование, а также научный анализ и анализ данных.
5. Не используйте слишком сложные модели
Будем кратки: чем больше данных, тем лучше. Однако улучшается ли качество результатов при увеличении количества функций (т. н. атрибутов и точек данных)? Не всегда. Дело в том, что чем больше наборы данных, тем больше в них отклонений и тем выше вероятность возникновения ошибок при прогнозировании.
В большинстве случаев сравнительно простые модели, содержащие большой объем данных, справляются с задачей лучше, чем более сложные модели, в которых данных меньше (даже если их данные более «грязные»). Это основа техник ансамблевого моделирования, в рамках которого для прогнозирования результатов используется «сила единства».
Грамотное развертывание технологии машинного обучения — это, в первую очередь, поиск баланса. И в этом случае, преимущества высокой сложности в плане прогнозирования следует оценивать, исходя из возможностей интерпретации данных, удобства их использования и практического применения.
6. Привлекайте бизнес-пользователей к проверке
При создании и настройке модели специалисты по data science должны провести надлежащую проверку. Для этого необходимо обеспечить эффективное взаимодействие и обмен информацией между исследователями данных и специалистами бизнес-направлений.
Помимо этого, рабочая группа также должна выполнить следующие действия:
- Убедиться в том, что изучены все доступные варианты.
- Сообщить о возможных отклонениях.
- Оценить результаты практического применения полученных данных.
Неважно, столкнулись ли вы с машинным обучением впервые или давно являетесь опытным специалистом в этой области, здоровая доля скептицизма не повредит, как и уверенное статистическое обоснование, а также научный анализ и анализ данных. Кимберли Невала (Kimberly Nevala) директор по стратегическому развитию бизнеса SAS Best Practices
7. Расскажите историю
Выводы, полученные с помощью машинного обучения, могут казаться такими же непонятными и неожиданными, как и сами алгоритмы. Особенно, когда новые результаты ставят под вопрос существующие представления или влияют на стандартные процедуры.
Работая над конкретным примером, постарайтесь создать интересную историю и вплести в нее полученные результаты, а не заваливать слушателей цифрами. Обратите внимание, мы не предлагаем вам что-то выдумывать. Просто нужно в понятной манере изложить все факты, которые наглядно показывают, как эти результаты могут способствовать повышению эксплуатационной эффективности или внедрению инновационных продуктов и услуг.
8. Оцените реальные и предполагаемые риски
Машинное обучение позволяет с высокой степенью вероятности прогнозировать действия людей в будущем, создавая возможности для того, что Джон Форман (John Foreman), старший специалист по обработке данных MailChimp, назвал «хитрыми аргументами с лазерным прицелом» в области таргетирования и маркетинга. Этические принципы (включая спор о преимуществах конфиденциальности в сравнении с ценностью) имеют важное значение и должны быть определены заранее.
Еще одним фактором, который следует учесть, является изменение ожидаемой вероятности возникновения ошибок в случае принятия решений компьютером. Учитывая, что компьютеры все чаще берут на себя принятие решений, необходимо выяснить, как реагируют на это ваши клиенты и сотрудники. Доверие чрезвычайно важно в плане максимально полного вовлечения пользователей в процесс.
9. Заранее адаптируйте бизнес-процессы
Для развертывания систем машинного обучения вам, возможно, потребуется отказаться от контроля по мере автоматизации принятия отдельных решений и выполнения некоторых операций. Машинное обучение также позволяет разрабатывать совершенно новые продукты, услуги или модели вовлечения клиентов.
Особенно тщательно следует изучить последствия для бизнеса. Убедитесь в том, что вы можете практически применить выводы, полученные от системы машинного обучения. Для этого необходимо изучить влияние на существующие бизнес-процессы и роли еще на самых ранних этапах внедрения. В случае автоматизации принятия решений на ключевых этапах или увеличения числа таких этапов необходимо четко понять и разъяснить, как такие системы будут работать в условиях рабочих процессов, выполняемых вручную.
10. Планируйте постоянную поддержку и обновления
Чтобы поддерживать актуальность и гарантировать неизменно качественный результат, нужно систематически обновлять и корректировать алгоритмы машинного обучения с учетом тех данных, которые отражают текущую ситуацию.
Если система машинного обучения внедрена успешно - и вам удалось убедить потребителей покупать больше, выбирать разные каналы для взаимодействия или повернуть направо, а не налево, - то в этом случае шаблоны, используемые для создания модели, будут изменены. Модели машинного обучения необходимо скорректировать, чтобы учесть такие изменения в поведении. Точно так же нужно изменить и ваши бизнес-процессы, и процессы разработки.
Об авторе
Кимберли Невала (Kimberly Nevala) — директор подразделения SAS Best Practices. Она отвечает за отраслевое обучение, ключевые стратегии работы с клиентами и анализ рынка в сфере бизнес-аналитики, регулирования данных и управления основными данными. Уже более 15 лет Кимберли консультирует клиентов во всех уголках мира по вопросам бизнес-стратегий, согласования бизнес-процессов и ИТ, а также развертывания корпоративных решений. Ее выдающиеся заслуги не раз отмечались журналами CIO Asia, Knowledge World, Network World и Datanami.World, Network World and Datanami.
Рекомендуем прочитать
- Article Shut the front door on insurance application fraud!Как выявить, что вас обманывают агенты и страхователи, а также распознать первые признаки будущего мошенничества.
- Article ТОП-5 схем мошенничества по предоплаченной картеЛучшие практики для предотвращения мошенничества, защиты репутации и обеспечения качественного клиентского обслуживания.
- Article Построение передней части пайплайна компьютерного зренияЭто третий пост, описывающий проект компьютерного зрения, над которым я работала в SAS для выявления опухолей печени при КТ-сканировании. Сегодня я расскажу об обработке данных для данных изображений.
- Article Утконос: работа с данными как часть трансформацииЕсть огромный объем задач, в которых применение продвинутой аналитики даст более существенный эффект, чем традиционные подходы. И они совершенно точно должны решаться централизованно.