Minería de datos
Qué es y por qué es importante
La minería de datos es el proceso de hallar anomalías, patrones y correlaciones en grandes conjuntos de datos para predecir resultados. Empleando una amplia variedad de técnicas, puede utilizar esta información para incrementar sus ingresos, recortar costos, mejorar sus relaciones con clientes, reducir riesgos y más.
Historia de la minería de datos
El proceso de escarbar en los datos para descubrir conexiones ocultas y predecir tendencias futuras tiene una larga historia. A veces denominado "knowledge discovery in databases," el término "data mining" no se acuñó hasta la década de 1990. Pero sus cimientos comprenden tres disciplinas científicas entrelazadas: la estadística (el estudio numérico de las relaciones entre datos), la inteligencia artificial (inteligencia similar a la humana desplegada por programas informáticos y/o máquinas) y el aprendizaje automático (algoritmos que pueden aprender de los datos para hacer predicciones). Lo que era viejo vuelve a ser nuevo, ya que la tecnología de extracción de datos sigue evolucionando para adaptarse al potencial ilimitado de los macrodatos y a una potencia informática asequible.
En la última década, los avances en el poder y la velocidad del tratamiento (datos) nos han permitido ir más allá de las prácticas manuales, tediosas y que consumen mucho tiempo al análisis de datos rápido, fácil y automatizado. Cuanto más complejo es el conjunto de datos recopilados, mayor es el potencial que hay para descubrir insights relevantes. Retailers, bancos, manufactureros, proveedores de telecomunicaciones y aseguradoras, entre otros, utilizan la minería de datos para descubrir relaciones entre todo, desde optimización de precios, promociones y demografía hasta cómo afectan la economía, el riesgo, la competencia y las redes sociales a su modelo de negocio, ingresos , operación y relaciones con clientes.
¿Por qué es importante la minería de datos?
¿Entonces por qué es importante la minería de datos? Ha podido apreciar los números asombrosos – el volumen de datos producidos se duplica cada dos años. Los datos no estructurados por sí solos conforman el 90% del universo digital. Pero más información no significa necesariamente más conocimientos.
La minería de datos le permite:
- Filtrar todo el ruido caótico y repetitivo en sus datos.
- Entender qué es relevante y luego hacer un buen uso de esa información para evaluar resultados probables.
- Acelerar el ritmo de la toma de decisiones informadas.
- Descubra nuevos insights a partir de los datos mediante el uso de la analítica predictiva.
Minería de datos en el mundo actual
La minería de datos es la piedra angular de la analítica, ya que le ayuda a desarrollar modelos capaces de descubrir conexiones entre millones o miles de millones de registros. Descubra cómo la minería de datos está dando forma al mundo en que vivimos.
Data mining software
Data mining software from SAS uses proven, cutting-edge algorithms designed to help you solve the biggest challenges.
¿Quién lo utiliza?
La minería de datos se sitúa en el corazón de esfuerzos analíticos en diversas industrias y disciplinas.
Telecomunicaciones, medios de comunicación & Tecnología
En un mercado saturado en el que la competencia es feroz, las respuestas suelen estar en los datos de los consumidores. Las empresas de telecomunicaciones, medios de comunicación y tecnología pueden utilizar modelos analíticos para dar sentido a montañas de datos de clientes, ayudándoles a predecir su comportamiento y ofrecer campañas muy específicas y pertinentes.
Gracias a los conocimientos analíticos, las aseguradoras pueden resolver problemas complejos relacionados con el fraude, el cumplimiento, la gestión de riesgos y la pérdida de clientes. Las empresas han utilizado técnicas de minería de datos para fijar el precio de los productos de forma más eficaz en todas las líneas de negocio y encontrar nuevas formas de ofrecer productos competitivos a su base de clientes actual.
Con vistas unificadas basadas en datos del progreso de los estudiantes, los educadores pueden predecir el desempeño de sus alumnos antes de que pongan un pie en el salón de clases – y desarrollar estrategias de intervención para mantenerlos en curso. La minería de datos ayuda a los educadores a acceder a datos de los estudiantes, a predecir niveles de logro y a detectar estudiantes o grupos de estudiantes que necesitan atención extra.
Alinear los planes de suministro con las previsiones de demanda es esencial, como también lo es la detección precoz de problemas, la garantía de calidad y la inversión en valor de marca. Los manufactureros pueden predecir el desgaste de los activos de producción y anticipar el mantenimiento, lo que puede maximizar el tiempo de actividad y mantener la línea de producción dentro de los plazos previstos.
Los algoritmos automatizados ayudan a los bancos a comprender su base de clientes, así como los miles de millones de transacciones que constituyen el núcleo del sistema financiero. La minería de datos ayuda a las empresas de servicios financieros a tener una mejor visión de los riesgos del mercado, detectar el fraude con mayor rapidez, gestionar las obligaciones de cumplimiento de la normativa y obtener un rendimiento óptimo de sus inversiones en marketing.
Las grandes bases de datos de clientes contienen información oculta sobre ellos que puede ayudarle a mejorar las relaciones, optimizar las campañas de marketing y prever las ventas. Gracias a modelos de datos más precisos y a la analítica de marketing las empresas del retail pueden ofrecer campañas más específicas y encontrar la oferta que más impacto tenga en el cliente.
Learn More About Industries Using This Technology
Cómo funciona
La minería de datos, como una disciplina compuesta, representa diversos métodos o técnicas que se utilizan en diferentes capacidades analíticas que abordan una gama de necesidades organizacionales, hacen diferentes tipos de preguntas y utilizan diferentes niveles de aportación humana o reglas para llegar a una decisión.
Modelado descriptivo: Descubre similitudes o agrupaciones compartidas en datos históricos para determinar razones detrás del éxito o el fracaso, como la clasificación de clientes por preferencias de productos o sentimiento. Entre las técnicas de muestra se incluyen:
Agrupación en clústeres | Agrupación de registros similares. |
Detección de anomalías
| Identificación de valores atípicos multidimensionales.
|
Aprendizaje de reglas de asociación
| Detección de relaciones entre registros.
|
Análisis de componentes principales
| Detección de relaciones entre variables. |
Agrupación por afinidad | Agrupación de personas con intereses comunes o metas similares (por ejemplo, personas que compran X a menudo compran Y y posiblemente Z). |
Modelado predictivo: Este modelado profundiza en la clasificación de eventos en el futuro o la estimación de resultados desconocidos; por ejemplo, el uso de la calificación crediticia para determinar la probabilidad de que una persona devuelva un préstamo. El modelado predictivo también ayuda a descubrir insights de cosas como la rotación de clientes, respuesta a campañas o coberturas por impago de créditos. Entre las técnicas de muestra se incluyen:
Regresión | Medida de la solidez de la relación entre una variable dependiente y una serie de variables independientes. |
Redes neurales | Programas de computadora que detectan patrones, hacen predicciones y aprenden. |
Árboles de decisión | Diagramas en forma de árbol en los que cada rama representa una incidencia probable. |
Máquinas vectoriales de soporte | Modelos de aprendizaje supervisado con algoritmos de aprendizaje asociados. |
Modelado prescriptivo. Con el incremento de los datos no estructurados de la Web, campos de comentarios, libros, correo electrónico, PDFs, audio y otras fuentes de texto, la adopción de la minería de texto como disciplina relacionada con la minería de datos también ha crecido de manera considerable. Necesita la posibilidad de analizar, filtrar y transformar con éxito datos no estructurados para incluirlos en modelos predictivos para mejorar la precisión de las predicciones.
Al final, no debe ver la minería de datos como una entidad independiente porque el preprocesamiento (preparación y exploración de datos) y el posprocesamiento (validación de modelos, calificación y monitoreo del desempeño de modelos) son igualmente esenciales. El modelado prescriptivo se centra en variables y restricciones internas y externas para recomendar uno o más cursos de acción – por ejemplo, determinar la mejor oferta de marketing para enviar a cada cliente. Entre las técnicas de muestra se incluyen:
Analítica predictiva más reglas | Creación de reglas qué pasaría si/entonces a partir de patrones y predicción de resultados. |
Optimización del marketing | Simulación de la mezcla de medios más ventajosa en tiempo real para lograr el más alto ROI posible. |
Lecturas recomendadas
- Shut the front door on insurance application fraud!Fraudsters love the ease of plying their trade over digital channels. Smart insurance companies are using data from those channels (device fingerprint, IP address, geolocation, etc.) coupled with analytics and machine learning to detect insurance application fraud perpetrated by agents, customers and fraud rings.
- Nerd in the herd: protecting elephants with data scienceA passionate SAS data scientist uses machine learning to detect tuberculosis in elephants. Find out how her research can help prevent the spread of the disease.
- Student lands dream job with help from SASA strong partnership between the University of Alabama and SAS put Cameron Jagoe on a path that led to his dream job with US Bank.
- Stopping the Zika virus: The potential of big data, analyticsHow do you stop global outbreaks? The answer may be in the data about the disease and how it spreads.