Неиспользованный потенциал в неструктурированном тексте
Мэри Бет Мур , стратегический специалист по ИИ и языковой аналитике, SAS
Вы когда-нибудь наблюдали сверху за оживленными улицами? Или за тем, как люди «общаются» в переполненных кофейнях? В наши дни невозможно не заметить, как все постоянно что-то строчат в своих телефонах, планшетах и ноутбуках.
Наблюдая за людьми, поглощенными собственными устройствами, я представляю, как набираются символы (разговорные сокращения, аббревиатуры, смайлики) и используется автозамена.
Это процесс переноса мыслей в цифровой мир. Наши исследования, мнения, факты, отзывы и призывы к действию преобразуются из человеческого языка в данные через клавиатуру. Но что мы делаем со всеми этими данными?
Неструктурированный текст - крупнейший источник данных, созданный человеком, и этот источник с каждым днем увеличивается в геометрической прогрессии. Текст произвольной формы, который мы печатаем на клавиатуре или мобильном устройстве, является важным средством передачи наших мыслей и способом фиксирования нашей деятельности. Тем не менее, многие компании не используют потенциал своих неструктурированных текстовых данных, будь то внутренние отчеты, взаимодействия с клиентами, журналы обслуживания или другие деловые файлы. Таким образом лица, принимающие решения, упускают возможность принять действенные меры в отношении существующих и возникающих проблем.
Бесплатный документ
В документе «Текстовая аналитика для руководителей» исследуется, как текстовая аналитика используется во многих отраслях, включая банковское дело, производство и правительство. Неструктурированные данные - это огромный и, в основном, неиспользованный источник для совершенствования и инноваций.
Революционный подход с использованием обработки естественного языка
Обработка естественного языка (NLP) - это область искусственного интеллекта (ИИ), которая помогает компьютерам понимать, интерпретировать и манипулировать человеческим языком. В общем смысле, в задачи NLP входит разделение текста или речи на элементарные частицы. - Например, в медицинских учреждениях постоянно растет массив данных в формате электронных медицинских записей. Так можно понять отношения между этими частицами, чтобы изучить, как они работают вместе, а затем создают смысл. Сочетание NLP , машинного обучения и человеческой экспертизы дает возможность революционизировать подход к новым и существующим проблемам.
Применения NLP невероятно разнообразны и идеально подходят практически для любой ситуации, требующей быстрого и неутомимого анализа неструктурированного текста. Например, в медицинских учреждениях постоянно растет массив данных в форме электронных медицинских карт. Человеку почти невозможно обнаружить закономерность симптомов и анализ первопричин, просматривая каждую отдельную запись. Но ИИ-система может работать круглосуточно, чтобы проанализировать результаты анализов, отчеты пациентов, перечисленные симптомы и многое другое. NLP доказала свою эффективность в прогнозировании действий и оповещении больниц, когда данные в электронных медицинских записях указывали на наличие сепсиса.
Изучите неструктурированные тексты в вашей компании, который вы собираете, и, возможно, вы откроете для себя что-то новое.
Остановка убийцы с помощью данных и NLP
По данным Sepsis Alliance, сепсис является основной причиной смерти в больницах. Ранняя диагностика и быстрое вмешательство имеют решающее значение при лечении сепсиса, но симптомы не всегда очевидны на ранних стадиях его возникновения. Показатели смертности увеличиваются на 8 % за каждый час отсрочки лечения. Человеческий глаз может не заметить корреляции между данными в медицинских записях и ранними признаками смертельного состояния при большой рабочей нагрузке и у пациентов с бессимптомным течением болезни на ранних стадиях. Но применение NLP к данным в электронных медицинских записях является основой для прогностических моделей, которые запускают системы оповещения, уведомляя врачей и медсестер о том, что пациент может нуждаться в медицинском вмешательстве. Исследования показали, что предоставление полного медицинского лечения сепсиса в первые 180 минут от начала заболевания может спасти 80 % жизней, которые в противном случае могли бы быть потеряны.
Применения NLP выходят за рамки медицины. Её можно использовать для анализа материалов судебных дел, каналов социальных сетей, журналов колл-центра, исследовательских документов, требований исполнений гарантийных обязательств и многого другого. Большая часть данных, хранящихся в организациях, представлена в виде неструктурированного текста.
Чтобы разобраться в своих неструктурированных текстах, необходимо сочетание трех возможностей:
- Обработка естественного языка. NLP выполняет лингвистический анализ, который существенно помогает машине читать текст. NLP анализирует и преобразует текст в формы для обработки и понимания текста. Это включает в себя такие методы, как токенизация, частеречная разметка, определение происхождения, распознавание именованных объектов и многое другое.
- Машинное обучение. После применения NLP к тексту машинное обучение использует выходные данные для глубинного анализа данных и алгоритмов машинного обучения, чтобы автоматизировать выявление ценной информации и описательную аналитику.
- Человеческий вклад. Когда дело касается анализа текста, человеческий вклад все еще невероятно важен. Предметная экспертиза применяется в форме лингвистических правил, чтобы помочь машине уловить сленг, обнаружить сарказм и предоставить соответствующий контекст.
Технология анализа неструктурированного текста активно учится на данных по мере их поступления, комбинируя машинное обучение с человеческим руководством, чтобы генерировать новые инсайты. Конечная цель заключается в создании и развертывании моделей текстовой аналитики для оперативного воздействия, обеспечивая понимание с помощью тематического анализа, извлечения контекста, категоризации документов и анализа тональности текста.
Обработка естественного языка позволяет улучшить жизнь и работу. Она может помочь добиться прогресса в областях, которые трудно изменить без сотрудничества между людьми и технологиями. Изучите неструктурированные тексты в вашей компании, которые вы собираете, и, возможно, вы откроете для себя что-то новое. Эти данные отражают голоса тех, для кого вы работаете, и обладают потенциалом, который поможет вам улучшить качество обслуживания и привлечь еще больше клиентов. Ваши неструктурированные текстовые данные могут рассказать вам впечатляющие истории. Вы их слушаете?
Эта статья первоначально появилась в insideBIGDATA .
Об авторе
Мэри Бет Мур - стратегический специалист по искусственному интеллекту и языковой аналитике в SAS. Она отвечает за стратегическое маркетинговое направление и руководит глобальным обменом сообщениями SAS для искусственного интеллекта и текстовой аналитики. Она часто пишет на широкий спектр технологических тем, включая инициативы ИИ, NLP и SAS Data for Good. До прихода в SAS Мур служила в Корпусе морской пехоты США и несколько лет работала аналитиком разведки и старшим инструктором в Министерстве обороны и разведки США, в основном поддерживая экспедиционные подразделения и специальные операции. Она также является пропагандистом специального образования, консультантом по правам инвалидов и сторонником интеграции в общество людей всех способностей.
Рекомендуем прочитать
- Fraud detection and machine learning: What you need to knowМашинное обучение является важной частью инструментария обнаружения мошенничества. Вот что вам нужно для начала работы.
- 5 способов измерить здоровье улья с помощью аналитики и потоковых данныхТакой аналитический подход к пониманию здоровья пчелиных ульев может автоматически предупреждать пчеловодов об изменениях в весе улья, температуре, летной активности и многом другом.
- Монетизация данных в эпоху цифровой трансформации: роль и задачи ИТЦифровая трансформация стала основной темой обсуждений на недавней 22 ой конференции «ИТ в страховании». Участники сошлись во мнении, что внедрение и применение аналитических технологий для монетизации данных уже стало обязательным условием для качественных преобразований в отрасли.
Готовы подписаться на инсайты сейчас?