Datenmanagement
Was ist das und warum ist es wichtig
Datenmanagement beschreibt die Verwaltung von Daten als wertvolle Ressource zur Erschließung von Potenzialen einer Organisation. Ein effektives Datenmanagement erfordert eine Datenstrategie und zuverlässige Methoden für den Zugriff sowie die Integration, Bereinigung, Governance, Speicherung und Vorbereitung von Daten für AI und Analysen.
Datenmanagement im Zeitalter von AI
Seit Unternehmen Daten sammeln, müssen sie sie verwalten, um das Problem „Garbage in, Garbage out“ zu vermeiden. Ein gutes Datenmanagement trägt entscheidend zu vertrauenswürdigen, ethischen und unvoreingenommenen Ergebnissen bei. Dies ist besonders wichtig im Hinblick auf Aufgaben im Bereich künstliche Intelligenz und maschinelles Lernen sowie für Large Language Models (LLMs), die mit sehr großen Datensätzen trainiert werden, um die menschliche Sprache zu verstehen und zu generieren.
Was macht ein modernes Datenmanagement aus?
Ein modernes Datenmanagement wird von AI und maschinellem Lernen begleitet. Je weiter sich diese Technologien entwickeln, desto größer wird der Bedarf nach Datenzugriff, -qualität und -governance. In diesem Erklärvideo erfahren Sie den Zusammenhang zwischen einem modernen Datenmanagement und neuen Technologien und Abläufen wie etwa DataOps und AIOps. Außerdem lernen Sie, warum AI und Modelle für maschinelles Lernen auf vertrauenswürdige Daten angewiesen sind, damit Organisationen Risiken, Kosten und Produktivitätsrückgänge vermeiden können – dies gilt vor allem für hochregulierte Branchen mit strikten Compliance-Regularien.
Geschichte des Datenmanagements
Manche sagen, dass der Bedarf für Datenmanagement erstmals in den 1890er-Jahren mit mechanischen Lochkarten auftrat, die Informationen (Daten) auf einer dicken Karte aufzeichneten. Aber das Konzept des Datenmanagements wurde erst in den 1960er-Jahren breit diskutiert, als die Association of Data Processing Service Organizations (ADPSO) begann, Ratschläge zum Datenmanagement für Fachleute zu entwickeln.
Datenmanagement-Systeme wie wir sie heute kennen, setzten sich erst in den 1970er-Jahren durch. Diese Systeme waren strikt auf den Betrieb ausgerichtet. Sie bestanden aus Aufzeichnungen (Berichten) von Geschäftsabläufen zu einem bestimmten Zeitpunkt, und wurden einer relationalen Datenquelle entnommen, in der Informationen in Zeilen und Spalten, meist in einem Data Warehouse, gespeichert wurden. Standardabläufe und -technologien im Datenmanagement sind unter anderem:
- Stapelverarbeitung sowie Extract, Transform, Load (ETL).
- Strukturierte Abfrage-Sprache (SQL) und relationale Datenbankmanagementsysteme (RDBMS).
- Nicht nur SQL (NoSQL) und nicht-relationale Datenbanken.
- Enterprise Data Warehouses, Data Lakes und Data Fabrics.
- Datenföderation und Virtualisierung.
- Datenkataloge, Metadatenmanagement und Datenherkunft.
- Cloud Computing und Event Stream Processing (Daten-Streaming).
Heute können Unternehmen und IT-Abteilungen zusammenarbeiten, um die Art und Weise des Datenmanagements zu optimieren, bevor die Daten mit AI und generative AI (GenAI) genutzt werden. Data Engineers und Analysten arbeiten mit Data Scientists zusammen, um Daten zu verwalten und daraus Werte zu generieren.
Ein starker Fokus auf Daten: Die Grundlage für den Erfolg vonStudierenden und Universitäten
Wie viele andere war auch die University of North Texas (UNT) reich an Daten und arm an Erkenntnissen. Das lag an fundamentalen Problemen in den Bereichen Datenintegrität, Datenmanagement und Data Governance – und da die Daten in Silos gespeichert waren, war Enterprise Analytics schwierig. Erfahren Sie, wie der Einsatz von SAS-Datenmanagementsoftware an der UNT für einen ausschlaggebenden Wandel der Analysefähigkeiten sorgte – mit dem Resultat besserer Ergebnisse für die Studierenden und enormer Einsparungen.
Wer nutzt Datenmanagement?
Datenmanagement ist die treibende Kraft hinter den Prozessen erfolgreicher Unternehmen in allen Branchen. Mit mehr Daten und einem vereinfachten Zugriff auf Analysen können Sie mehr Möglichkeiten ergreifen, mehr Fragen stellen und mehr Probleme lösen. Erfahren Sie, wie Branchen weltweit ihre Ziele mit Datenmanagement verfolgen.
Mehr denn je benötigen Banken eine vertrauenswürdige Datengrundlage, um Datenschutz, Compliance und Digitalisierung zu meistern. Nur mit einem vollständigen, integrierten Überblick über all ihre Daten – und mit soliden Qualitäts-, Governance- und Datenschutz-Methoden – gewinnen Banken das Vertrauen ihrer Kunden und können ihre digitale Transformation vorantreiben.
Datenmanagement ist für jedes Unternehmen im Gesundheitswesen ein absolutes Must-Have. Die Branche muss Daten jeden Formats und aus verschiedenen Quellen – inklusive externer Daten – integrieren können und dabei Dopplungen erkennen, Probleme mit der Data Quality lösen und strikte Regularien und Compliance-Vorschriften zum Datenschutz einhalten.
Versicherungsgesellschaften arbeiten tagtäglich mit sehr großen Datenmengen – Kundendaten, sowie Daten aus Versicherungsangeboten, Policen, Forderungen und aus IOT-Geräten. Die Entwicklung guter versicherungsmathematischer Modelle und eine informierte Entscheidungsfindung über Prämiengestaltung, Rückstellungsbildung, Zahlung und mehr, baut auf zuverlässiges Datenmanagement zur Integration, Bereinigung und Governance von Versicherungsdaten.
In der Fertigungsindustrie ist Qualität ein Garant für Erfolg. Mit soliden Technologien für Datenmanagement und Datenqualität können Hersteller ihr Produktinventar effizient verwalten und sowohl strukturierte als auch unstrukturierte Daten aus verschiedenen Quellen integrieren, um einen umfassenden Überblick über ihre Leistung zu erhalten, bessere Resultate zu erzielen und gut informierte Geschäftsentscheidungen zu treffen.
Regionale und nationale Behörden sind für eine Bandbreite an Dienstleistungen und Programmen zuständig. Zuverlässige Datenmanagement-Technologien sind dabei hilfreich – von der Bekämpfung von Betrug und unzulässigen Zahlungen über den Bevölkerungsschutz bis zur Überwachung von Ergebnissen im Bereich der Bevölkerungsgesundheit, der wirtschaftlichen Entwicklung und von Smart-City-Initiativen.
Das Kundenerlebnis zu verstehen und den Erwartungen gerecht zu werden, erfordert einen präzisen, tagesaktuellen Überblick über alle Daten – egal ob im Streaming, in der Cloud, in einem Data Lake oder Data Warehouse gespeichert. Von Marketing, Handel bis zum Vertrieb – ein vertrauenswürdiges Datenmanagement ist die Grundlage, um die Kontrolle über die Einzelhandelsdaten zu haben.
Erfahren Sie mehr über Branchen, die diese Technologie nutzen
Datenmanagement ist auf AI und maschinelles Lernen angewiesen. Dies gilt jedoch umgekehrt genauso. Diese Technologien sind jetzt miteinander verknüpft, denn der Weg zur erfolgreichen AI ist im Kern mit einem modernen Datenmanagement verwoben. Dan Soceanu Senior Product Manager for AI and Data Management, SAS
Wie funktioniert Data Management
Seit Menschengedenken sammeln Unternehmen Daten und müssen diese entsprechend verwalten, um das Paradoxon "Garbage in, garbage out" zu vermeiden. Mit dem Anstieg der Datenmengen, -typen und -quellen wächst auch die Notwendigkeit, Daten in Echtzeit zu verarbeiten - und die Dringlichkeit, Daten gut zu verwalten, bleibt eine Top-Priorität für den Geschäftserfolg. Informieren Sie sich über einige der wichtigsten Data Management-Technologien.
Erweitertes Datenmanagement
Dieser Ansatz nutzt Techniken der künstlichen Intelligenz oder des maschinellen Lernens, um Prozesse wie Data Quality, Metadaten-Management und Data Integration selbstkonfigurierend und selbstoptimierend zu gestalten.
Erweitertes Datenmanagement kann zum Beispiel:
Eine Liste mit Vorschlägen zur Erhöhung der Datenqualität erstellen. Ihre Handlungen führen dann mit der Zeit zu verbesserten Ergebnissen.
Datenprofile erstellen und automatisch persönliche Informationen finden, die markiert werden können, um das Verhalten zu beeinflussen – z. B. nur bestimmten Benutzer:innen den Zugriff auf persönliche Daten in einer Tabelle erlauben.
Mithilfe von maschinellem Lernen Datentransformationen und anschließende Verbesserungen im Laufe der Zeit vorschlagen – dies geschieht über eine Suchmaschine, die Daten und Metadaten analysiert.
Empfehlungen für Benutzer:innen und für die nächstbesten Abläufe während des Datenaufbereitungsprozesses geben.
Mehr über die Funktionsweise von Datenmanagement
Datenmanagement für AI und maschinelles Lernen (ML)
Viele Geschäftsabläufe stützen sich auf AI, also dem Trainieren von Systemen auf die Übernahme menschlicher Arbeit durch Lernen und Automatisierung. AI- und ML-Techniken werden etwa oft bei der Kreditvergabe, der Erstellung medizinischer Diagnosen oder der Angebotsgenerierung im Einzelhandel genutzt. Mit AI und ML benötigen Sie gut verwaltete, verständliche und vertrauenswürdige Daten mehr denn je – denn wenn Algorithmen von mangelhaften Daten lernen und sich daran anpassen, vervielfältigen sich ihre Fehler schnell.
Datenmanagement für das IoT
Die Flut aus Daten, die Sensoren in Geräten des Internet of Things (IoT) generieren, wird oft als Streaming Data bezeichnet. Das Streaming von Daten, auch Event Stream Processing genannt, bedeutet Echtzeit-Datenanalyse im laufenden Betrieb. Dies geschieht durch die Anwendung von Logik auf die Daten, das Erkennen von Mustern in den Daten und das Filtern der Daten für verschiedene Verwendungszwecke, während sie in ein Unternehmen fließen. Betrugserkennung, Netzwerk-Überwachung, E-Commerce und Risikomanagement sind beliebte Anwendungsbereiche für solche Techniken.
Bidirektionales Metadatenmanagement
Bidirektionales Metadatenmanagement teilt und verbindet Metadaten zwischen verschiedenen Systemen. SAS hat sich beispielsweise durch seine Beteiligung am OPDi-Egeria-Projekt verpflichtet, Teil der offenen Metadaten-Community zu sein. Dieses Projekt unterstreicht die Notwendigkeit von Metadaten-Standards zur Förderung eines verantwortungsvollen Datenaustauschs über verschiedene Technologieumgebungen hinweg.
Data Fabric und die Semantic Layer
Der Begriff Data Fabric beschreibt die vielfältige Datenlandschaft einer Organisation – dort werden unzählige Datentypen mit den unterschiedlichsten Methoden verwaltet, verarbeitet, gespeichert und analysiert. Die Semantic Layer spielt eine wichtige Rolle in der Data Fabric. Ähnliche wie ein Unternehmensglossar ermöglicht die Semantic Layer die Verbindung von Daten mit in der gesamten Organisation genutzten, allgemein definierten Geschäftsbegriffen
Datenmanagement und Open-Source
Als „Open-Source“ bezeichnet man Computer-Programme oder Computing-Infrastrukturen, deren Quellcode allgemein verfügbar ist, sodass er von einer Nutzer-Community verwendet und modifiziert werden kann. Die Nutzung von Open-Source kann Entwicklungsprozesse beschleunigen und Kosten sparen. Außerdem schätzen Fachleute die Möglichkeit, in der von ihnen bevorzugten Programmiersprache und Umgebung zu arbeiten.
Datenföderation/Virtualisierung
Datenförderation ist eine spezielle Art der virtuellen Data Integration, über die Sie Einblick in kombinierte Daten von verschiedenen Quellen bekommen, ohne dass Sie den kombinierten Einblick verschieben oder an einem neuen Speicherort hinterlegen müssen. So können Sie sofort auf kombinierte Daten zugreifen, wenn Sie sie anfordern. Anders als ETL- und ELT-Tools, die nur eine Momentaufnahme anzeigen, generiert Datenförderation Ergebnisse auf Basis des Zustands der Datenquelle zum Zeitpunkt der Anforderung. So erhalten Sie einen schnelleren und potenziell genaueren Überblick über die Informationen.
Nächste Schritte
Lösungen für das Datenmanagement
Vertrauenswürdige Daten führen zu vertrauenswürdiger AI und Analytics – dies ist entscheidend für den Erfolg jedes Unternehmens. Unsere Datenmanagementlösungen bieten alle Funktionen, die Sie für den Zugriff, die Integration, die Bereinigung, die Governance und die Vorbereitung Ihrer Daten für Analysen benötigen – inklusive erweiterter Analytics wie künstliche Intelligenz und maschinelles Lernen.