Computer Vision
Was es ist und was man darüber wissen sollte
Computer Vision ist ein Teilbereich der Artificial Intelligence, der Computern die Interpretation und das Verständnis der visuellen Welt ermöglichen soll. Anhand von digitalen Bildern und Videos sowie mithilfe von Deep Learning-Modellen können Maschinen Objekte korrekt identifizieren und klassifizieren – und dann auf das „Gesehene“ reagieren.
Die Geschichte der Computer Vision
Frühe Experimente im Computer Vision-Bereich fanden in den 1950er Jahren statt. Mithilfe einiger der ersten neuronalen Netze wurden die Umrisse von Objekten erkannt und einfache Objekte wurden in Kategorien wie Kreise und Rechtecke eingeordnet. In den 1970er Jahren wurde Computer Vision erstmals kommerziell zur Interpretation maschinengeschriebener oder handschriftlicher Texte mittels optischer Zeichenerkennung genutzt. Diese Fortschritte ermöglichten die Interpretation schriftlicher Texte für Blinde.
Mit dem Ausbau des Internets in den 1990ern wurden große Mengen von Bildern online verfügbar, die analysiert werden konnten, was der Gesichtserkennung zum Durchbruch verhalf. Dank dieser wachsenden Datenmengen wurde es möglich, mit Maschinen bestimmte Menschen in Fotos und Videos zu identifizieren.
Heute führt das Zusammenspiel einer Reihe von Faktoren zu einer Renaissance der Computer Vision:
Dank mobiler Technologien mit eingebauten Kameras steht weltweit eine Unmenge von Fotos und Videos zur Verfügung.
Rechenleistung ist mittlerweile erschwinglicher und leicht erhältlich.
Speziell für Computer Vision und Analyse geeignete Hardware ist weiter verbreitet als früher.
Neue Algorithmen wie konvolutionale neuronale Netze können die von Hardware und Software gebotenen Möglichkeiten nutzen.
Diese Fortschritte haben Computer Vision erstaunlich weit vorangebracht. Die Trefferquote bei der Objekterkennung und ‑klassifikation ist in weniger als 10 Jahren von 50 auf 99 Prozent gestiegen – und die heutigen Systeme können visuelle Inputs präziser schnell erkennen und darauf reagieren als der Mensch.
Computer Vision gleicht einem Puzzle
Computer stellen Bilder so zusammen, wie Sie ein Puzzle zusammenstecken würden.
Wie gehen Sie bei einem Puzzle vor? Sie haben viele Teile, die Sie zu einem größeren Bild zusammenfügen wollen. So funktionieren auch neuronale Netze für Computer Vision. Sie unterscheiden viele unterschiedliche Teile des Bilds, machen die Umrisse ausfindig und modellieren dann die Teilelemente. Mit Filterung und einer Reihe von Aktionen in tiefen Netzschichten können sie die Teile des Bildes zusammenfügen, ganz wie bei einem Puzzle.
Dem Computer liegt zwar nicht das fertige Bild auf dem Karton des Puzzles vor, aber er wird häufig anhand von Hunderten oder sogar Tausenden ähnlichen Bildern darauf trainiert, bestimmte Objekte zu erkennen.
Anstatt dem Computer beizubringen, Schnurrhaare, buschige Schwänze oder spitze Ohren als Katze zu erkennen, laden die Programmierer Millionen von Katzenfotos in den Computer und danach lernt das Modell eigenständig, welche verschiedenen Eigenschaften eine Katze ausmachen.
Computer Vision in der Welt von heute
Von der Gesichtserkennung bis zur Verarbeitung des Geschehens bei einem Fußballspiel ist Computer Vision dem Sehvermögen des Menschen in vielen Bereichen ebenbürtig oder überlegen.
Deep Learning und Computer Vision
Wie bringt Deep Learning einem Computer das Sehen bei? Erfahren Sie, wie die verschiedenen Typen neuronaler Netze funktionieren und wie sie für Computer Vision genutzt werden.
Bildanalyse und AI
Schauen Sie sich eine Einführung in die Bildanalyse an und lernen Sie analytische Verfahren kennen, die auf Bilddaten angewendet werden können.
Demo zur Gesichtserkennung
Erfahren Sie mehr über die zugrunde liegenden Verfahren und die erforderlichen Datenverarbeitungsschritte für Gesichtserkennung und Computer Vision. Diese Demo zeigt, wie ein SAS® Viya® Modell Bilder von Gesichtern erkennt, ausrichtet, darstellt und klassifiziert.
Wer nutzt Computer Vision?
Computer Vision wird in vielen Branchen eingesetzt, um das Kundenerlebnis zu verbessern, die Kosten zu reduzieren und die Sicherheit zu erhöhen.
Einzelhandel
Im Einzelhandel ermöglicht Computer Vision die Verbesserung des Einkaufserlebnisses, die Vermeidung von Warenverlusten und die Erkennung von Fehlbeständen in Regalen. Computer Vision wird bereits eingesetzt, um den Bezahlvorgang zu beschleunigen – für Selbstbedienungskassen oder in Kombination mit maschinellem Lernen für die vollautomatische Abrechnung, um den Bezahlvorgang im Geschäft vollständig zu vermeiden.
Fertigung
In der Produktion nutzen Unternehmen Computer Vision zur Erkennung von Produktdefekten in Echtzeit. Beim Verlassen der Produktionslinie verarbeitet ein Computer Bilder oder Videos der Produkte und zeigt gegebenenfalls Dutzende verschiedener Defekte auf – selbst an den kleinsten Bauteilen.
Government
Im öffentlichen Sektor werden mithilfe von Computer Vision der physische Zustand von verwalteten Liegenschaften sowie Anlagen und Infrastruktur untersucht. Computer Vision ermöglicht durch die bildliche Analyse von Anlagen und Infrastruktur eine vorausschauende Wartung, da Wartungsarbeiten besser bedarfsgerecht geplant werden können. Zudem unterstützt Computer Vision im öffentlichen Sektor die Kontrolle der Einhaltung von Richtlinien und Vorschriften. Mit Computer Vision wird es zum Beispiel möglich, Schmuggelware in Fracht zu erkennen, potenzielle Sicherheitsverstöße in Gebäuden aufzuzeigen, Aufkleber auf Richtlinienkonformität zu prüfen und die Einhaltung von Umweltschutzvorschriften sicherzustellen. Mit dem verstärkten Einsatz von Drohnen bei Polizei und Streitkräften dürfte der Einsatz von Analytics zur Erkennung und Analyse wichtiger Elemente in Bilddatenströmen zu einem wichtigen Anwendungsfall für Computer Vision im öffentlichen Sektor werden.
Gesundheitswesen
In der Medizin untersuchen Computer Vision-Systeme MRT-, CT- und Röntgenbilder mit der gleichen Präzision wie Ärzte auf auffällige Strukturen. Medizinische Fachkräfte nutzen zudem neuronale Netze zur Analyse dreidimensionaler Bilder wie Ultraschallaufnahmen, um krankhafte Herzveränderungen usw. zu erkennen.
Versicherungen
In der Versicherungsbranche nutzen Unternehmen Computer Vision für eine konsistentere und genauere Bewertung von Schäden an Fahrzeugen. Damit wird es möglich, Betrug einzudämmen und die Bearbeitung von gemeldeten Schäden zu rationalisieren.
Computer Vision ist eine der bemerkenswertesten Errungenschaften von Deep Learning und Artificial Intelligence. Mithilfe von Deep Learning wurden bei Computer Vision herausragende Fortschritte erzielt. Wayne Thompson SAS Data Scientist
Computer Vision zum Schutz bedrohter Tierarten
Erfahren Sie, wie ein Computer Vision-Modell zur Analyse von Tierspuren funktioniert. Kann der Computer so trainiert werden, dass er Tierspuren fast wie einheimische Fährtenleser erkennen kann? Schauen Sie sich an, wie der Computer die verschiedenen Informationsschichten verarbeitet, um das Tier und sein Geschlecht zu ermitteln. In diesem Video erläutert Jared Peterson, Senior Manager of SAS Advanced Analytics R&D, wie neuronale Netze die wissenschaftliche Grundlage für Computer Vision bilden.
Handfeste Ergebnisse mit Computer Vision
Mit Computer Vision werden in vielen Branchen ganz handfeste Ergebnisse erzielt. In dieser Infografik haben wir viele davon dokumentiert. Wussten Sie zum Beispiel, dass:
- Computer Vision zwischen fingierten und echten Schäden an Fahrzeugen unterscheiden kann?
- Computer Vision die Gesichtserkennung für Sicherheitsanwendungen ermöglicht?
- Computer Vision automatische Bezahlsysteme für den modernen Einzelhandel möglich macht?
Computer Vision wird in mehr Bereichen eingesetzt, als Sie vielleicht erwarten würden, von der Erkennung von Defekten in der Produktion bis zur Erkennung der ersten Anzeichen von Pflanzenkrankheiten in der Landwirtschaft.
Klicken Sie auf die Infografik, um Ergebnisse aus Einzelhandel, Bankwesen, Gesundheitswesen und mehr anzuzeigen.
So funktioniert Computer Vision
Computer Vision umfasst drei grundlegende Schritte:
Bilderfassung
Bilddaten, und zwar auch in großer Menge, können mittels Videos, Fotos oder 3D-Technologie in Echtzeit zu Analysezwecken erfasst werden.
Bildverarbeitung
Dieser Prozess wird mit Deep Learning-Modellen weitgehend automatisiert, aber für das anfängliche Training der Modelle werden häufig Tausende von bereits gekennzeichneten oder vorab identifizierten Bildern eingespielt.
Bildverständnis
In diesem Schritt erfolgt die Interpretation und das Objekt wird identifiziert bzw. klassifiziert.
Die heutigen AI-Systeme können in einem weitergehenden Schritt sogar auf der Grundlage des Bildverständnisses Maßnahmen ergreifen. Es gibt viele Computer Vision-Typen, die unterschiedlich eingesetzt werden:
- Bildsegmentierung: Ein Bild wird in mehrere Bereiche oder Teile unterteilt, die dann getrennt untersucht werden.
- Objekterkennung: dient zum Identifizieren eines bestimmten Objekts in einem Bild. Hochentwickelte Objekterkennungssysteme können viele Objekte in einem einzigen Bild erkennen: ein Fußballfeld, einen Spieler in der Offensive, einen Spieler in der Defensive, einen Ball usw. Diese Modelle erstellen mithilfe einer X-Y-Koordinate ein Begrenzungsfeld und identifizieren alles innerhalb des Felds.
- Gesichtserkennung: eine hochentwickelte Form der Objekterkennung, mit der nicht nur menschliche Gesichter in Bildern erkannt, sondern sogar bestimmte Personen identifiziert werden können.
- Kantenerkennung: ein Verfahren, mit dem sich die Außenkante eines Objekts oder einer Landschaft identifizieren lässt, damit besser zu erkennen ist, was sich im Bild befindet.
- Mustererkennung: ein Prozess zur Erkennung wiederholter Formen, Farben und anderer visueller Merkmale in Bildern.
- Bildklassifikation: dient zur Gruppierung von Bildern in verschiedene Kategorien.
- Merkmalsabgleich: eine Art der Mustererkennung, die Ähnlichkeiten in Bildern findet, um diese klassifizieren zu können.
Bei einfachen Computer Vision-Anwendungen wird unter Umständen nur eins dieser Verfahren eingesetzt, aber in hochentwickelten Einsatzbereichen wie beispielsweise autonom fahrenden Autos werden mehrere Verfahren kombiniert, um das Ziel zu erreichen.
Nächste Schritte
Sehen ist Glauben. Entdecken Sie, zu welchen Ergebnissen Ihnen SAS mit Computer Vision verhelfen kann.
Speziell für Computer Vision
SAS® Visual Data Mining and Machine Learning
Diese SAS Lösung unterstützt neben Deep Learning auch Clustering, verschiedene Regressionsverfahren, Random Forests, Gradient Boosting-Modelle, Support Vector Machines, Sentimentanalyse und mehr. Eine interaktive, visuelle Pipeline-Umgebung präsentiert jedes Projekt (oder Ziel) als eine Reihe farbcodierter Schritte, die in einer logische Abfolge ausgeführt werden.
Literaturempfehlungen
- Article Fraud detection and machine learning: What you need to knowMachine learning and fraud analytics are critical components of a fraud detection toolkit. Discover what you’ll need to get started defending against fraud – from integrating supervised and unsupervised machine learning in operations to maintaining customer service.
- Article Was sind AI-Halluzinationen?Es ist schwer, Fakten und AI-generierte Fiktion voneinander zu trennen. Erfahren Sie, welche Fehler bei Large Language Models auftreten können und wie es in der Folge zu AI-Halluzinationen kommt – und lernen Sie, GenAI verantwortungsvoll zu nutzen.
- Article 4 strategies that will change your approach to fraud detectionAs fraudulent activity grows and fighting fraud becomes more costly, financial institutions are turning to anti-fraud technology to build better arsenals for fraud detection. Discover four ways to improve your organization's risk posture.