Redes neuronales artificiales
Definición e importancia
Las redes neuronales son sistemas informáticos con nodos interconectados que funcionan de forma muy parecida a las neuronas del cerebro humano. Mediante algoritmos, pueden reconocer patrones ocultos y correlaciones en los datos planos, agruparlos y clasificarlos, y –con el tiempo – aprender y mejorar continuamente.
Historia de las redes neuronales
La primera red neuronal fue concebida por Warren McCulloch y Walter Pitts en 1943. Ambos escribieron un artículo fundamental sobre cómo podrían funcionar las neuronas y modelaron sus ideas creando una red neuronal sencilla mediante circuitos eléctricos.
Este modelo innovador preparó el camino para la investigación en redes neuronales en dos ámbitos:
Procesos biológicos en el cerebro.
Aplicación de las redes neuronales en la inteligencia artificial (IA).
La IA se aceleró rápidamente, y en 1975, Kunihiko Fukushima desarrolló la primera red neuronal multicapa de verdad.
El objetivo original de las redes neuronales era crear un sistema informático capaz de resolver problemas como un cerebro humano. Sin embargo, con el tiempo, los investigadores pasaron a centrarse en el uso de redes neuronales para tareas específicas, lo que les llevó a desviarse de un enfoque estrictamente biológico. Desde entonces, las redes neuronales han servido para diversas tareas, como la visión por ordenador, el reconocimiento del habla, la traducción automática, el filtrado de redes sociales, los juegos de mesa y videojuegos o el diagnóstico médico.
A medida que el tamaño de los datos estructurados y no estructurados aumentaba hasta niveles de big data, se desarrollaron sistemas de deep learning, que son esencialmente redes neuronales con muchas capas. El deep learning permite capturar y extraer cada vez más datos, incluidos los desestructurados.
¿Por qué son importantes las redes neuronales?
Las redes neuronales también están perfectamente preparadas para ayudar a las personas a resolver problemas complejos en situaciones de la vida real. Pueden aprender y modelar relaciones entre entradas y salidas no lineales y complejas; hacer generalizaciones e inferencias; revelar relaciones ocultas, patrones y predicciones; y modelar datos altamente volátiles (como los datos de series temporales financieras) y las variaciones necesarias para predecir sucesos poco frecuentes (como la detección de fraudes). Como resultado, las redes neuronales pueden mejorar los procesos de decisión en áreas como:
- Detección de fraudes con tarjetas de crédito y Medicare.
- Optimización de la logística de las redes de transporte.
- Reconocimiento de caracteres y voz, también conocido como procesamiento del lenguaje natural.
- Diagnóstico médico y de enfermedades.
- Marketing objetivo.
- Predicciones financieras sobre cotizaciones bursátiles, divisas, opciones, futuros, quiebras y calificaciones de bonos.
- Sistemas de control robótico.
- Pronóstico de la carga eléctrica y de la demanda de energía.
- Control de procesos y calidad.
- Identificación de compuestos químicos.
- Evaluación de ecosistemas.
- Visión para interpretar fotos y vídeos sin procesar (por ejemplo, en imágenes médicas y robótica y reconocimiento facial).
Nuestro primer objetivo para estas redes neuronales, o modelos, es alcanzar una precisión de nivel humano. Hasta que llegas a ese nivel, siempre sabes que puedes hacerlo mejor. Ivan Gomez Data Scientist and Consultant Zencos
Tipos de redes neuronales
Hay distintos tipos de redes neuronales profundas, y cada una tiene ventajas e inconvenientes, según el uso. Algunos ejemplos son:
- Las redes neuronales convolucionales (CNN, por sus siglas en inglés) contienen cinco tipos de capas: de entrada, de convolución, de agrupamiento, totalmente conectadas y de salida. Cada capa tiene un propósito específico, como resumir, conectar o activar. Las redes neuronales convolucionales han popularizado la clasificación de imágenes y la detección de objetos. Sin embargo, las CNN también se han aplicado a otras áreas, como el procesamiento del lenguaje natural y la predicción.
- Las redes neuronales recurrentes (RNN, por sus siglas en inglés) utilizan información secuencial, como datos con marca de tiempo de un dispositivo sensor o una frase hablada, compuesta por una secuencia de términos. A diferencia de las redes neuronales tradicionales, todas las entradas de una red neuronal recurrente no son independientes entre sí, y la salida de cada elemento depende de los cálculos de sus elementos precedentes. Las RNN se utilizan en aplicaciones de previsión y series temporales, análisis de sentimiento y otras aplicaciones textuales.
- Redes neuronales prealimentadas, en las que cada perceptrón de una capa está conectado a todos los perceptrones de la capa siguiente. La información solo se transmite de una capa a la siguiente en la dirección de avance. No hay bucles de retroalimentación.
- Las redes neuronales autocodificadoras (Autoencoders) se utilizan para crear abstracciones denominadas codificadores, creadas a partir de un conjunto dado de entradas. Aunque son similares a las redes neuronales más tradicionales, los autocodificadores tratan de modelar las propias entradas, por lo que el método se considera no supervisado. La premisa de los autocodificadores es desensibilizar lo irrelevante y sensibilizar lo relevante. A medida que se añaden capas, se formulan más abstracciones en las capas superiores (capas más cercanas al punto en el que se introduce una capa decodificadora). Estas abstracciones pueden utilizarse por clasificadores lineales o no lineales.
Las redes neuronales en el mundo actual
Las redes neuronales están cambiando la forma en que las personas y las organizaciones interactúan con los sistemas, resuelven problemas, toman mejores decisiones y hacen mejores predicciones. Más información sobre el impacto de las redes neuronales.
Redes neuronales para la salud de las manadas de animales
Un apasionado científico de datos utiliza las redes neuronales para detectar la tuberculosis en elefantes. Descubra la forma en la que su investigación puede ayudar a prevenir la propagación de la tuberculosis.
Aprenda a modelar redes neuronales
Aprenda a elegir una arquitectura de red neuronal adecuada, a determinar el método de entrenamiento adecuado, a implementar modelos de red neuronal en un entorno informático distribuido y a construir redes neuronales personalizadas mediante el procedimiento NEURAL.
Cómo hacer deep learning con SAS®
¿Necesita una visión más técnica de las técnicas y aplicaciones del aprendizaje profundo? Lea este artículo y descubra cómo SAS facilita la creación de modelos de redes neuronales profundas.
¿Quién usa las redes neuronales?
Los sistemas de deep learning -y, por tanto, las redes neuronales que los posibilitan- se utilizan estratégicamente en muchas industrias y líneas de negocio.
Ciencias de la vida
Las organizaciones sanitarias y de ciencias de la vida utilizan redes neuronales para realizar diagnósticos predictivos, obtener imágenes biomédicas y vigilar la salud.
Manufactura
Las empresas energéticas y de fabricación utilizan redes neuronales para optimizar las cadenas de suministro, automatizar la detección de defectos y prever las necesidades energéticas.
Banca
Los bancos utilizan redes neuronales para detectar fraudes, realizar análisis crediticios y automatizar los servicios de asesoramiento financiero.
Administración pública
Las organizaciones del sector público utilizan redes neuronales para ciudades inteligentes, inteligencia de seguridad y reconocimiento facial.
Retail y bienes de consumo
Los sectores minorista y de bienes de consumo utilizan redes neuronales para impulsar chatbots conversacionales, mejorar y profundizar en la customer intelligence y realizar análisis de redes.
Más información sobre los industrias que utilizan esta tecnología
Las redes neuronales tienen la capacidad de identificar anomalías. En el futuro, podremos utilizarlas para dar a los médicos una segunda opinión: por ejemplo, si existe un cáncer o algún problema desconocido. Y podremos ofrecer estas segundas opiniones con mayor rapidez y precisión. Leigh Ann Herhold Data Scientist and Consultant Zencos
Creación de un modelo de red neuronal
En este vídeo aprenderá a utilizar SAS® Visual Data Mining and Machine Learning en el contexto de las redes neuronales. Este ejemplo examina las motivaciones de los visitantes de un sitio web y lo que les lleva a descargar un documento del sitio de una empresa de TI.
Cómo funcionan las redes neuronales
Una red neuronal sencilla incluye una capa de entrada, una capa de salida (u objetivo) y, entre ambas, una capa oculta. Las capas están conectadas mediante nodos, y estas conexiones forman una "red" –la red neuronal – de nodos interconectados.
Un nodo sigue el modelo de una neurona del cerebro humano. Con un comportamiento similar al de las neuronas, los nodos se activan cuando hay estímulos o entradas suficientes. Esta activación se propaga por toda la red, creando una respuesta a los estímulos (salida). Las conexiones entre estas neuronas artificiales actúan como simples sinapsis que permiten transmitir señales de una a otra. Las señales atraviesan las capas mientras viajan desde la primera entrada hasta la última capa de salida, y se procesan por el camino.
Cuando se les plantea una petición o un problema que resolver, las neuronas realizan cálculos matemáticos para averiguar si hay suficiente información para transmitirla a la neurona siguiente. Dicho de forma más sencilla, leen todos los datos y averiguan dónde existen las relaciones más fuertes. En el tipo más sencillo de red, las entradas de datos recibidas se suman y, si la suma es superior a un determinado valor umbral, la neurona se "dispara" y activa las neuronas a las que está conectada.
A medida que aumenta el número de capas ocultas de una red neuronal, se forman redes neuronales profundas. Los modelos de deep learning llevan las redes neuronales al siguiente nivel. Utilizando estas capas, los científicos de datos pueden construir sus propias redes de deep learning que permiten el machine learning, que puede entrenar a un ordenador para emular con precisión tareas humanas, como reconocer el habla, identificar imágenes o hacer predicciones. Y lo que es igual de importante, la computadora puede aprender por sí solo reconociendo patrones en muchas capas de procesamiento.
Pongamos en práctica esta definición. Los datos se introducen en una red neuronal a través de la capa de entrada, que se comunica con las capas ocultas. El procesamiento tiene lugar en las capas ocultas a través de un sistema de conexiones ponderadas. Los nodos de la capa oculta combinan los datos de la capa de entrada con un conjunto de coeficientes y asignan los pesos adecuados a las entradas. Seguidamente, se suman estos productos. La suma pasa por la función de activación de un nodo, que determina en qué medida una señal debe avanzar por la red para afectar a la salida final. Por último, las capas ocultas enlazan con la capa de salida, donde se obtienen los resultados.
Siguientes pasos
Vea el papel que desempeñan las redes neuronales en la inteligencia artificial.
Producto destacado para redes neuronales
SAS® Visual Data Mining and Machine Learning
Apoye el proceso integral de minería de datos y machine learning con una interfaz completa y visual (y de programación) que gestiona todas las tareas del ciclo de vida analítico.
Lecturas recomendadas
- Artículo ¿Qué son los chatbots?Los chatbots son una forma de IA conversacional diseñada para simplificar la interacción humana con las computadoras. Aprende cómo se utilizan los chatbots en las empresas, cómo pueden incorporarse a las aplicaciones analíticas
- Artículo The untapped potential in unstructured textText is the largest human-generated data source. It grows every day as we post on social media, interact with chatbots and digital assistants, send emails, conduct business online, generate reports and essentially document our daily thoughts and activities using computers and mobile devices.
- Artículo Data lineage: Making artificial intelligence smarterLear how data lineage plays a vital role in understanding data, making it a foundational principle of AI.