Neuronale Netzwerke für die Datenanalyse
Neuronale Netze sind Computersysteme, bestehend aus miteinander verbundenen Knoten, die ähnlich wie Neuronen im menschlichen Gehirn funktionieren. Mithilfe von Algorithmen erkennen sie verborgene Muster und Verbindungen in den Rohdaten, clustern und klassifizieren sie, und im Laufe der Zeit lernen sie ständig dazu und verbessern sich.
Die Geschichte neuronaler Netze
Das erste neuronale Netz wurde 1943 von Warren McCulloch und Walter Pitts erdacht. Beide verfassten einen bahnbrechenden Artikel über die Funktionsweise von Neuronen und stellten ihre Ideen in einem Modell dar, indem sie mithilfe elektrischer Schaltkreise ein einfaches neuronales Netz konstruierten.
Dieses wegweisende Modell ebnete den Weg für die Forschung an neuronalen Netzen auf zwei Gebieten:
Biologische Prozesse im Gehirn
Anwendung neuronaler Netze auf dem Gebiet der Artificial Intelligence (AI)
Die KI-Forschung nahm rasch Fahrt auf und 1975 entwickelte Kunihiko Fukushima das erste echte, mehrschichtige neuronale Netz.
Ursprünglich zielte man bei dieser Herangehensweise an neuronale Netze auf den Bau von Computersystemen ab, die in der Lage sein sollten, bei der Problemlösung in etwa so vorzugehen wie das menschliche Gehirn. Im Lauf der Zeit verschob sich jedoch der Schwerpunkt in der Forschung hin zur Konzeption neuronaler Netze für bestimmte Aufgaben. Dies führte zur Abkehr vom streng biologischen Denkansatz. Seither werden neuronale Netze für ganz unterschiedliche Aufgaben genutzt, darunter Bildverarbeitung, Spracherkennung, automatische Übersetzung, Filterfunktionen für soziale Netzwerke, Brett- und Videospiele sowie die medizinische Diagnostik.
Da die strukturierten und unstrukturierten Daten stetig zunahmen und schließlich Big Data-Dimensionen erreichten, wurden so genannte Deep Learning-Systeme entwickelt, die im wesentlichen aus vielschichtigen neuronalen Netzen bestehen. Deep Learning ermöglicht Datenerfassung und Data Mining auch bei mehr und größeren Datenbeständen sowie unstrukturierten Daten.
Worin besteht die große Bedeutung neuronaler Netze?
Neuronale Netze eignen sich ideal, um Menschen bei der Lösung komplexer Probleme in realen Situationen zu unterstützen. Sie können lernen und sind in der Lage non-lineare, komplexe Zusammenhänge zwischen Ein- und Ausgaben nachzuahmen, zu generalisieren, Schlüsse zu ziehen, verborgene Zusammenhänge und Muster aufzudecken, Prognosen zu erstellen und hochgradig volatile Daten (beispielsweise finanzielle Zeitreihendaten) sowie Varianzen zu simulieren, die zur Prognose seltener Vorgänge erforderlich sind, beispielsweise zur Betrugserkennung. Auf dieser Grundlage können neuronale Netze Entscheidungsprozesse in vielen Bereichen unterstützen, zum Beispiel:
- Betrugserkennung, wie etwa Kreditkarten- oder Abrechnungsbetrug im Gesundheitswesen
- Optimierung der Transportlogistik
- Zeichen- und Spracherkennung, auch „Verarbeitung natürlicher Sprache“ (NLP) genannt
- Medizinische und Krankheitsbezogene Diagnostik
- Zielorientiertes Marketing.
- Finanzprognosen für Aktienpreise, Währungen, Optionen, Termingeschäfte, Insolvenzen und Anleihenbewertungen
- Robotersteuersysteme
- Prognosen zur Stromversorgung und Energiebedarf
- Prozesssteuerung und Qualitätskontrolle
- Identifikation chemischer Verbindungen
- Ökosystembewertung
- Bildverarbeitungssysteme zur Auswertung von Foto- und Video-Rohdaten, z. B. in der medizinischen Bildgebung, Robotik oder Gesichtserkennung
Unser erstes Ziel bei diesen neuronalen Netzen oder Modellen ist eine Genauigkeit, wie sie auch der Mensch erzielen könnte. Solange diese noch nicht erreicht ist, ist auch das Ende der Entwicklung noch nicht erreicht. Ivan Gomez Data Scientist and Consultant Zencos
Formen neuronaler Netze
Es gibt unterschiedliche Typen tiefer neuronaler Netzwerke – jedes mit seinen eigenen Vor- und Nachteilen je nach Verwendungszweck. Hier ein paar Beispiele:
- Convolutional Neural Networks/Künstliches neuronales Netz (CNNs oder ConvNets) enthalten fünf Arten von Schichten: Eingabeschicht, Convolutional Layer, Pooling Layer, Fully-connected Layer und Ausgabeschicht. Jede Schicht erfüllt einen bestimmten Zweck, beispielsweise Summierung, Konnektivität oder Aktivierung. CNNs haben zur Verbreitung von Bildklassifizierung und Objekterkennung beigetragen, finden aber auch auf anderen Gebieten wie Verarbeitung natürlicher Sprache und Vorhersagen Verwendung.
- Rekurrente (rückgekoppelte) neuronale Netze (RNNs) nutzen sequenzielle Informationen wie etwa Daten mit Zeitstempel von einem Sensorgerät oder Abfolgen von Begriffen in einem gesprochenen Satz. Im Unterschied zu herkömmlichen neuronalen Netzen sind die Eingaben in ein RNN nicht voneinander unabhängig und die Ausgabe der einzelnen Elemente hängt von den Berechnungen bei den vorgehenden Elementen ab. RNNs werden für Prognosen, Zeitreihenanwendungen, Stimmungsanalysen und sonstige Textanwendungen genutzt.
- Feedforward-Netze sind neuronale Netze, bei denen jedes Wahrnehmungselement in einer Schicht mit jedem anderen Wahrnehmungselement in der nächsten Schicht verbunden ist. Informationen werden nur in einer Richtung (vorwärts) von einer zur nächsten Schicht übermittelt. Es gibt keine Rückkopplungsschleifen.
- Autoencoder sind neuronale Netze zur Erzeugung von Abstraktionen, „Encoder“ genannt, die anhand eines vorgegebenen Sets von Eingaben erstellt werden. Autoencoder ähneln herkömmlichen neuronalen Netzen, versuchen jedoch, aus den Eingabedaten selbstständig Modelle zu bilden, und gelten daher als unüberwacht. Autoencoder beruhen auf einer Desensibilisierung für das Irrelevante und einer Sensibilisierung für das Relevante. Sie bestehen aus mehreren Schichten, wobei auf höheren Schichten (Schichten näher an Decoder-Schichten) weitere Abstraktionen formuliert werden. Diese Abstraktionen können dann von linearen oder nonlinearen Classifiern genutzt werden.
Neuronale Netze in der heutigen Welt
Neuronale Netze verändern die Art und Weise, wie Menschen und Organisationen mit Systemen interagieren, Probleme lösen, Entscheidungen treffen und Prognosen erstellen. Mehr über die Auswirkungen neuronaler Netze erfahren Sie im Folgenden.
Neuronale Netze für Bestandshaltungs-
maßnahmen
Eine passionierte Data Scientistin untersucht mithilfe neuronaler Netze Tuberkulose bei Elefanten. Hier erfahren Sie, wie ihre Forschungen dazu beitragen können, der Verbreitung von Tuberkulose entgegenzuwirken.
Modellierung neuronaler Netze
In diesem Kurs erlernen Sie die Auswahl einer geeigneten Architektur für neuronale Netze, die Ermittlung der passenden Trainingsmethode, die Implementierung von Modellen neuronaler Netze in verteilten Rechnerumgebungen und die Konstruktion angepasster neuronaler Netze mithilfe des NEURAL-Verfahrens.
Deep Learning mit SAS®
Sind Sie an einer eher technischen Übersicht und Anwendungsweisen bei Deep Learning interessiert? In diesem Whitepaper wird erläutert, wie SAS die Erstellung von Modellen tiefer neuronaler Netze unterstützt.
Wer arbeitet mit neuronalen Netzen?
Deep Learning-Systeme – und damit auch die neuronalen Netze als deren Grundlage – werden in zahlreichen Branchen und Geschäftsfeldern strategisch genutzt.
Life Sciences
Unternehmen aus dem Health and Life Science Bereich nutzen neuronale Netze für Vorhersagediagnostik, biomedizinische Bildgebung und Gesundheitsüberwachung.
Fertigungsindustrie
Energie- und Fertigungsunternehmen optimieren mithilfe neuronaler Netze ihre Lieferketten, automatisieren die Fehlererkennung und prognostizieren den Energiebedarf.
Banken
Banken nutzen neuronale Netze für Betrugserkennung, Kreditanalysen und die Automatisierung von Finanzberatungsdiensten.
Öffentliche Verwaltung
Im öffentlichen Sektor kommen neuronale Netze als Grundlage für Smart Cities, die Aufrechterhaltung der Sicherheit und die Gesichtserkennung zum Einsatz.
Einzelhandel
Der Einzelhandel verwendet neuronale Netze für Chatbot-Dialoge, zur Ausweitung und Vertiefung der Kundenkenntnis und für Netzwerkanalysen.
Mehr Informationen über Branchen, die diese Technologie nutzen
Neuronale Netze sind in der Lage, Anomalien zu erkennen. In Zukunft kann man sie beispielsweise einsetzen, um eine zweite ärztliche Meinung einzuholen – also zu prüfen, ob es sich bei einem Befund tatsächlich um Krebs handelt oder was die Ursache einer unerklärlichen Krankheit sein könnte. Zudem werden solche Zweitmeinungen schneller zur Verfügung stehen und genauer sein. Leigh Ann Herhold Data Scientist and Consultant Zencos
Modellieren neuronaler Netze
In diesem Video wird die Nutzung von SAS® Visual Data Mining und Machine Learning im Kontext neuronaler Netze erläutert. Im vorliegenden Beispiel geht es darum, welche Faktoren Menschen zum Besuch der Website eines IT-Unternehmens bzw. zum Herunterladen eines Whitepapers von dieser Website veranlassen.
Funktionsweise neuronaler Netze
Ein einfaches neuronales Netz besteht aus einer Eingabeschicht, einer Ausgabeschicht (Zielschicht) und einer verborgenen Zwischenschicht. Die Schichten sind über Verbindungen und Knoten miteinander verbunden, die ein Netz bilden – das neuronale Netz.
Als Vorbild für diese Knoten dienen die Neuronen des menschlichen Gehirns. Die Knoten imitieren das Verhalten von Neuronen. Das heißt, sie werden aktiviert, wenn ein ausreichend starker Stimulus (Input) auf sie einwirkt. Diese Aktivierung verbreitet sich im Netz und generiert eine Reaktion auf den Stimulus (Output). Die Verbindungen zwischen den künstlichen Neuronen funktionieren wie einfache Synapsen. Das heißt, sie ermöglichen die Signalübertragung von einem Neuron zum nächsten. Die Signale passieren die Schichten von der ersten Eingabe- bis zur letzten Ausgabeschicht und werden auf diesem Weg verarbeitet.
Um Anforderungen zu bearbeiten oder Probleme zu lösen, führen die Neuronen mathematische Berechnungen durch und ermitteln, ob genügend Informationen vorliegen, diese ans nächste Neuron weiterzuleiten. Einfacher ausgedrückt, lesen sie alle Daten ein und stellen fest, wo die am stärksten ausgeprägten Zusammenhänge bestehen. Im einfachsten Typ eines neuronales Netzes werden die eingehenden Daten aufsummiert. Überschreitet die Summe einen bestimmten Schwellenwert, „feuert“ das Neuron und aktiviert ein weiteres mit ihm verbundenes Neuron.
Ist die Anzahl verborgener Zwischenschichten in einem neuronalen Netz ausreichend hoch, spricht man von einem „tiefen neuronalen Netz“. Deep Learning-Architekturen stehen für den nächsten Entwicklungsschritt neuronaler Netze. Data Scientists können aus solchen neuralen Netzen eigene Deep Learning-Netze konstruieren, die zu maschinellem Lernen fähig sind und darauf trainiert werden können, bestimmte menschliche Fähigkeiten wie Spracherkennung, Bilderkennung oder Prognoseerstellung präzise nachzuahmen. Gleichermaßen bedeutsam ist die Tatsache, dass diese neuralen Netze (bzw. die Computer, in denen sie angesiedelt sind) selbstständig lernen können, Muster in den zahlreichen Verarbeitungsschichten zu erkennen.
Was bedeutet diese Definition in der Praxis? Die Daten gelangen über die Eingabeschicht ins neuronale Netz. Die Eingabeschicht kommuniziert mit den verborgenen Schichten. Die Verarbeitung findet in den verborgenen Schichten statt, und zwar mittels eines Systems gewichteter Verbindungen. Die Knoten in der verborgenen Schicht kombinieren die Daten aus der Eingabeschicht mit einem Set von Koeffizienten und weisen ihnen bestimmte Gewichtungen zu. Diese Werte aus Eingabedaten und Gewichtungen werden aufsummiert. Die Summe passiert die Aktivierungsfunktion eines Knotens, die ermittelt, wie weit ein Signal das Netz noch durchlaufen muss, um Einfluss auf die Ausgabe nehmen zu können. Die verborgenen Schichten sind mit der Ausgabeschicht verbunden, von wo die Ausgabedaten letztendlich abgerufen werden können.
Nächste Schritte
Erfahren Sie, welche Rolle neuronale Netze bei Artificial Intelligence spielen.
Speziell für neuronale Netze
SAS® Visual Data Mining and Machine Learning
Unterstützt End-to-End-Prozesse für Data Mining und maschinelles Lernen durch umfassende visuelle und Programmierschnittstellen zur Bearbeitung von Aufgaben aller Art im analytischen Lebenszyklus.
Literaturempfehlungen
- Article Analytics: A must-have tool for leading the fight on prescription and illicit drug addictionStates and MFCUs now have the analytics tools they need to change the trajectory of the opioid crisis by analyzing data and predicting trouble spots – whether in patients, prescribers, distributors or manufacturers. The OIG Toolkit with free SAS® programming code makes that possible.
- Article Three steps for conquering the last mile of analyticsPutting your analytical models into production can be the most difficult part of the analytics journey. It’s no surprise that this last mile of analytics – bringing models into deployment – is the hardest part of digital transformation initiatives for organizations to master, yet it’s the most crucial.
- Article A guide to machine learning algorithms and their applicationsDo you know the difference between supervised and unsupervised learning? How about the difference between decision trees and forests? Or when to use a support vector algorithm? Get all the answers here.