Неиспользованный потенциал в неструктурированном тексте
Мэри Бет Мур , стратегический специалист по ИИ и языковой аналитике, SAS
Вы когда-нибудь наблюдали сверху за оживленными улицами? Или за тем, как люди «общаются» в переполненных кофейнях? В наши дни невозможно не заметить, как все постоянно что-то строчат в своих телефонах, планшетах и ноутбуках.
Наблюдая за людьми, поглощенными собственными устройствами, я представляю, как набираются символы (разговорные сокращения, аббревиатуры, смайлики) и используется автозамена.
Это процесс переноса мыслей в цифровой мир. Наши исследования, мнения, факты, отзывы и призывы к действию преобразуются из человеческого языка в данные через клавиатуру. Но что мы делаем со всеми этими данными?
Неструктурированный текст - крупнейший источник данных, созданный человеком, и этот источник с каждым днем увеличивается в геометрической прогрессии. Текст произвольной формы, который мы печатаем на клавиатуре или мобильном устройстве, является важным средством передачи наших мыслей и способом фиксирования нашей деятельности. Тем не менее, многие компании не используют потенциал своих неструктурированных текстовых данных, будь то внутренние отчеты, взаимодействия с клиентами, журналы обслуживания или другие деловые файлы. Таким образом лица, принимающие решения, упускают возможность принять действенные меры в отношении существующих и возникающих проблем.
Бесплатный документ
В документе «Текстовая аналитика для руководителей» исследуется, как текстовая аналитика используется во многих отраслях, включая банковское дело, производство и правительство. Неструктурированные данные - это огромный и, в основном, неиспользованный источник для совершенствования и инноваций.
Революционный подход с использованием обработки естественного языка
Обработка естественного языка (NLP) - это область искусственного интеллекта (ИИ), которая помогает компьютерам понимать, интерпретировать и манипулировать человеческим языком. В общем смысле, в задачи NLP входит разделение текста или речи на элементарные частицы. - Например, в медицинских учреждениях постоянно растет массив данных в формате электронных медицинских записей. Так можно понять отношения между этими частицами, чтобы изучить, как они работают вместе, а затем создают смысл. Сочетание NLP , машинного обучения и человеческой экспертизы дает возможность революционизировать подход к новым и существующим проблемам.
Применения NLP невероятно разнообразны и идеально подходят практически для любой ситуации, требующей быстрого и неутомимого анализа неструктурированного текста. Например, в медицинских учреждениях постоянно растет массив данных в форме электронных медицинских карт. Человеку почти невозможно обнаружить закономерность симптомов и анализ первопричин, просматривая каждую отдельную запись. Но ИИ-система может работать круглосуточно, чтобы проанализировать результаты анализов, отчеты пациентов, перечисленные симптомы и многое другое. NLP доказала свою эффективность в прогнозировании действий и оповещении больниц, когда данные в электронных медицинских записях указывали на наличие сепсиса.
Изучите неструктурированные тексты в вашей компании, который вы собираете, и, возможно, вы откроете для себя что-то новое.
Остановка убийцы с помощью данных и NLP
По данным Sepsis Alliance, сепсис является основной причиной смерти в больницах. Ранняя диагностика и быстрое вмешательство имеют решающее значение при лечении сепсиса, но симптомы не всегда очевидны на ранних стадиях его возникновения. Показатели смертности увеличиваются на 8 % за каждый час отсрочки лечения. Человеческий глаз может не заметить корреляции между данными в медицинских записях и ранними признаками смертельного состояния при большой рабочей нагрузке и у пациентов с бессимптомным течением болезни на ранних стадиях. Но применение NLP к данным в электронных медицинских записях является основой для прогностических моделей, которые запускают системы оповещения, уведомляя врачей и медсестер о том, что пациент может нуждаться в медицинском вмешательстве. Исследования показали, что предоставление полного медицинского лечения сепсиса в первые 180 минут от начала заболевания может спасти 80 % жизней, которые в противном случае могли бы быть потеряны.
Применения NLP выходят за рамки медицины. Её можно использовать для анализа материалов судебных дел, каналов социальных сетей, журналов колл-центра, исследовательских документов, требований исполнений гарантийных обязательств и многого другого. Большая часть данных, хранящихся в организациях, представлена в виде неструктурированного текста.
Чтобы разобраться в своих неструктурированных текстах, необходимо сочетание трех возможностей:
- Обработка естественного языка. NLP выполняет лингвистический анализ, который существенно помогает машине читать текст. NLP анализирует и преобразует текст в формы для обработки и понимания текста. Это включает в себя такие методы, как токенизация, частеречная разметка, определение происхождения, распознавание именованных объектов и многое другое.
- Машинное обучение. После применения NLP к тексту машинное обучение использует выходные данные для глубинного анализа данных и алгоритмов машинного обучения, чтобы автоматизировать выявление ценной информации и описательную аналитику.
- Человеческий вклад. Когда дело касается анализа текста, человеческий вклад все еще невероятно важен. Предметная экспертиза применяется в форме лингвистических правил, чтобы помочь машине уловить сленг, обнаружить сарказм и предоставить соответствующий контекст.
Технология анализа неструктурированного текста активно учится на данных по мере их поступления, комбинируя машинное обучение с человеческим руководством, чтобы генерировать новые инсайты. Конечная цель заключается в создании и развертывании моделей текстовой аналитики для оперативного воздействия, обеспечивая понимание с помощью тематического анализа, извлечения контекста, категоризации документов и анализа тональности текста.
Обработка естественного языка позволяет улучшить жизнь и работу. Она может помочь добиться прогресса в областях, которые трудно изменить без сотрудничества между людьми и технологиями. Изучите неструктурированные тексты в вашей компании, которые вы собираете, и, возможно, вы откроете для себя что-то новое. Эти данные отражают голоса тех, для кого вы работаете, и обладают потенциалом, который поможет вам улучшить качество обслуживания и привлечь еще больше клиентов. Ваши неструктурированные текстовые данные могут рассказать вам впечатляющие истории. Вы их слушаете?
Эта статья первоначально появилась в insideBIGDATA .
Об авторе
Мэри Бет Мур - стратегический специалист по искусственному интеллекту и языковой аналитике в SAS. Она отвечает за стратегическое маркетинговое направление и руководит глобальным обменом сообщениями SAS для искусственного интеллекта и текстовой аналитики. Она часто пишет на широкий спектр технологических тем, включая инициативы ИИ, NLP и SAS Data for Good. До прихода в SAS Мур служила в Корпусе морской пехоты США и несколько лет работала аналитиком разведки и старшим инструктором в Министерстве обороны и разведки США, в основном поддерживая экспедиционные подразделения и специальные операции. Она также является пропагандистом специального образования, консультантом по правам инвалидов и сторонником интеграции в общество людей всех способностей.
Рекомендуем прочитать
- What is synthetic data? And how can you use it to fuel AI breakthroughs?There's no shortage of data in today's world, but it can be difficult, slow and costly to access sufficient high-quality data that’s suitable for training AI models. Learn why synthetic data is so vital for data-hungry AI initiatives, how businesses can use it to unlock growth, and how it can help address ethical challenges.
- Внутренние ИТ-отделы становятся более значимыми для бизнесаИнновация – это вопрос данных. Это не секрет. Но как компания преобразовывает свои данные в бизнес-модели, чтобы стимулировать изменения?
- Как использовать ИИ для выявления ракаНедавно мне предоставили удивительную возможность поработать над проектом в области биомедицинской аналитики изображений в сотрудничестве с крупным университетским медицинским центром. Целью проекта была разработка системы компьютерного зрения, которая будет выявлять опухоли при компьютерной томографии печени.
Готовы подписаться на инсайты сейчас?