Reconocimiento de Imágenes
Qué es y por qué es importante
Computer Vision es un campo de la inteligencia artificial que capacita a las computadoras para interpretar y comprender el mundo visual. Utilizando imágenes digitales de cámaras y vídeos y modelos de deep learning, las máquinas pueden identificar y clasificar objetos con precisión - y luego reaccionar ante lo que "ven."
Historia de computer vision
Los primeros experimentos de computer vision tuvieron lugar en la década de 1950 y utilizaron algunas de las primeras redes neuronales para detectar los bordes de un objeto y clasificar objetos sencillos en categorías como círculos y cuadrados. En la década de 1970, el primer uso comercial de computer vision interpretó texto mecanografiado o manuscrito mediante el reconocimiento óptico de caracteres. Este avance se utilizaba para interpretar textos escritos para ciegos.
A medida que Internet maduraba en la década de 1990, haciendo que grandes conjuntos de imágenes estuvieran disponibles en línea para su análisis, florecieron los programas de reconocimiento facial. Estos crecientes conjuntos de datos ayudaron a que las máquinas pudieran identificar a personas concretas en fotos y vídeos.
En la actualidad, una serie de factores han convergido para propiciar un renacimiento de computer vision :
La tecnología móvil con cámaras incorporadas ha saturado el mundo de fotos y vídeos.
La potencia informática se ha vuelto más asequible y fácilmente accesible.
Cada vez se dispone de más hardware diseñado para computer vision analítica de cómputo.
Los nuevos algoritmos, como las redes neuronales convolucionales, pueden aprovechar las capacidades del hardware y el software.
Los efectos de estos avances en el campo de computer vision han sido asombrosos. Los índices de precisión en la identificación y clasificación de objetos han pasado del 50% al 99% en menos de una década, y los sistemas actuales son más precisos que los humanos a la hora de detectar y reaccionar rápidamente a las entradas visuales.
Una nueva era en el tratamiento del cáncer
Los métodos tradicionales de evaluación de tumores cancerosos requieren muchísimo tiempo. Basados en una cantidad limitada de datos, estos métodos pueden dar lugar a errores y son propensos a la subjetividad. En colaboración con SAS, el UMC de Ámsterdam ha transformado las evaluaciones de tumores gracias a la inteligencia artificial. Mediante el uso de tecnología de computer vision y modelos de deep learning para aumentar la velocidad y la precisión de las evaluaciones de respuesta a la quimioterapia, los médicos pueden identificar a los pacientes con cáncer candidatos a cirugía más rápidamente y con una precisión que salva vidas.
Computer vision parece un rompecabezas
Las computadoras ensamblan las imágenes visuales de la misma manera que se monta un rompecabezas.
Piense en cómo resuelve un rompecabezas. Tiene todas estas piezas y tiene que ensamblarlas en una imagen. Así funcionan las redes neuronales de computer vision. Distinguen muchas partes diferentes de la imagen, identifican los bordes y luego modelan los subcomponentes. Mediante el filtrado y una serie de acciones a través de capas de redes profundas, pueden recomponer todas las partes de la imagen, como si se tratara de un puzzle.
La computadora no recibe una imagen final en la parte superior de una caja de rompecabezas, sino cientos o miles de imágenes relacionadas para entrenarlo a reconocer objetos específicos.
En lugar de entrenar a las computadoras para que busquen bigotes, rabos y orejas puntiagudas para reconocer a un gato, los programadores cargan millones de fotos de gatos, y entonces el modelo aprende por sí solo los distintos rasgos que componen un gato.
Computer vision en el mundo actual
Desde el reconocimiento de rostros hasta el procesamiento de la acción en directo de un partido de fútbol, la visión por ordenador rivaliza y supera las capacidades visuales humanas en muchas áreas.
Deep learning y computer vision
¿Cómo entrena el deep learning a una computadora para ver? Aprenda cómo funcionan los distintos tipos de redes neuronales y cómo se utilizan para computer vision.
Análisis de imágenes e IA
Vea una introducción al análisis de imágenes y aprenda técnicas analíticas que podrá aplicar a los datos de imágenes.
Demostración de reconocimiento facial
Aprenda las técnicas subyacentes y los pasos de procesamiento de datos necesarios para el reconocimiento facial y computer vision. Esta demostración muestra cómo un modeloSAS® Viya® detecta, alinea, representa y clasifica imágenes faciales.
Who's using computer vision?
Computer vision is used across industries to enhance the consumer experience, reduce costs and increase security.
Retail
Retailers can use computer vision to enhance the shopping experience, increase loss prevention and detect out-of-stock shelves. Computer vision is already helping customers checkout more quickly – aiding using self-checkout machines or combining with machine learning to alleviate the checkout process completely.
Manufacturing
In manufacturing, businesses use computer vision to identify product defects in real time. As the products are coming off the production line, a computer processes images or videos, and flags dozens of different types of defects — even on the smallest of products.
Government
Public Sector agencies use computer vision to better understand the physical condition of assets under their control, including equipment and infrastructure. Computer vision can help agencies perform predictive maintenance by analyzing equipment and infrastructure images to make better decisions on which of these require maintenance. In addition, Public Sector agencies use computer vision to help monitor compliance with policies and regulations. For example, computer vision can be used to detect contraband in cargo, flag potential safety violations in buildings, review labels for adherence to guidelines, and ensure compliance with conservation regulations. Finally, as drones become used more defense and homeland security needs, the use of analytics to identify and analyze critical elements from the visual feed will rise to the forefront of computer vision use cases in the public sector.
Health Care
In the medical field, computer vision systems thoroughly examine imagery from MRIs, CAT scans and X-rays to detect abnormalities as accurately as human doctors. Medical professionals also use neural networks on three-dimensional images like ultrasounds to detect visual differences in heartbeats and more.
Defense and Security
In high-security environments like banking and casinos, businesses use computer vision for more accurate identification of customers when large amounts of money are being exchanged. It’s impossible for security guards to analyze hundreds of video feeds at once, but a computer vision algorithm can.
Insurance
In the insurance industry, companies use computer vision to conduct more consistent and accurate vehicle damage assessments. The advancement is reducing fraud and streamlining the claims process.
Computer vision es una de las cosas más notables que han surgido en el mundo del deep learning y la inteligencia artificial. Los avances que el deep learning ha aportado al campo de computer vision han marcado la diferencia. Wayne Thompson SAS Data Scientist
Computer vision para la conservación de animales
Aprenda cómo funciona un modelo de computer vision diseñado para analizar huellas de animales. ¿Se puede entrenar a la computadora para que vea una huella como lo haría un rastreador de animales autóctonos? Vea cómo la computadora procesa las distintas capas de información para determinar el animal y su sexo. En este vídeo, Jared Peterson, Senior Manager de SAS Advanced Analytics R&D, muestra cómo las redes neuronales son la ciencia que hay detrás de computer vision.
Ver resultados con computer vision.
Los usuarios de computer vision de muchas industrias están viendo resultados reales, y hemos documentado muchos de ellos en esta infografía. Por ejemplo, sabía que,
- ¿Con computer vision se puede distinguir entre daños reales y simulados?
- ¿computer vision le permite el reconocimiento facial para aplicaciones de seguridad?
- Computer vision hace posible la caja automática en las tiendas de retail.
Desde la detección de defectos en la manufactura hasta la detección precoz de enfermedades vegetales en la agricultura, computer vision se utiliza en más ámbitos de los que podría esperar.
Haga clic en la infografía para ver los resultados de las industrias retail, bancario y salud, entre otros.
Cómo funciona computer vision
Computer vision funciona en tres pasos básicos:
Adquirir una imagen
Las imágenes, incluso grandes conjuntos, pueden adquirirse en tiempo real mediante vídeo, fotos o tecnología 3D para su análisis.
Tratamiento de la imagen
Los modelos de deep learning automatizan gran parte de este proceso, pero a menudo se entrenan alimentándolos primero con miles de imágenes etiquetadas o preidentificadas.
Comprenda la imagen
La última etapa es la interpretativa, en la que se identifica o clasifica un objeto.
Los sistemas de IA actuales pueden ir un paso más allá y emprender acciones basadas en la comprensión de la imagen. Hay muchos tipos de computer vision que se utilizan de diferentes maneras:
- La segmentación de imágenes divide una imagen en varias regiones o fragmentos que se examinarán por separado.
- La detección de objetos identifica un objeto específico en una imagen. La detección avanzada de objetos reconoce muchos objetos en una misma imagen: un campo de fútbol, un jugador ofensivo, un jugador defensivo, un balón, etc. Estos modelos utilizan una coordenada X,Y para crear una caja delimitadora e identificar todo lo que hay dentro de la caja.
- El reconocimiento facial es un tipo avanzado de detección de objetos que no sólo reconoce un rostro humano en una imagen, sino que identifica a un individuo concreto.
- La detección de bordes es una técnica utilizada para identificar el borde exterior de un objeto o paisaje para identificar mejor lo que hay en la imagen.
- La detección de patrones es un proceso de reconocimiento de formas, colores y otros indicadores visuales repetidos en imágenes.
- La clasificación de imágenes las agrupa en diferentes categorías.
- La concordancia de características es un tipo de detección de patrones que compara similitudes en imágenes para ayudar a clasificarlas.
Las aplicaciones sencillas de computer vision pueden utilizar sólo una de estas técnicas, pero los usos más avanzados, como la visión por ordenador para coches autoconducidos, se basan en múltiples técnicas para lograr su objetivo.
Siguientes pasos
Ver para creer. Descubra lo que SAS puede ayudarle a conseguir con lcomputer vision.
Producto destacado para Computer Vision
SAS® Visual Data Mining and Machine Learning
Esta solución de SAS admite clústeres, diferentes tipos de regresión, bosques aleatorios, modelos de impulso de gradiente, máquinas de vectores soporte, análisis de sentimientos y mucho más, además de deep learning. Un entorno de canalización interactivo y visual presenta cada proyecto (u objetivo) como una serie de pasos codificados por colores que se suceden en una secuencia lógica.
Lecturas recomendadas
- Artículo AI anxiety: Calm in the face of changeAI anxiety is no joke. Whether you fear jobs becoming obsolete, information being distorted or simply missing out, understanding AI anxiety can help you conquer it.
- Artículo Three steps for conquering the last mile of analyticsPutting your analytical models into production can be the most difficult part of the analytics journey. It’s no surprise that this last mile of analytics – bringing models into deployment – is the hardest part of digital transformation initiatives for organizations to master, yet it’s the most crucial.
- Artículo An executive’s guide to cognitive computingCognitive computing is the latest buzzworthy term that everyone seems to be talking about in the technology industry. But can machines really think?