Graphen auf Computerbildschirm.

Datenmanagement

Was ist das und warum ist es wichtig

Datenmanagement beschreibt die Verwaltung von Daten als wertvolle Ressource zur Erschließung von Potenzialen einer Organisation. Ein effektives Datenmanagement erfordert eine Datenstrategie und zuverlässige Methoden für den Zugriff sowie die Integration, Bereinigung, Governance, Speicherung und Vorbereitung von Daten für AI und Analysen.

Datenmanagement im Zeitalter von AI

Seit Unternehmen Daten sammeln, müssen sie sie verwalten, um das Problem „Garbage in, Garbage out“ zu vermeiden. Ein gutes Datenmanagement trägt entscheidend zu vertrauenswürdigen, ethischen und unvoreingenommenen Ergebnissen bei. Dies ist besonders wichtig im Hinblick auf Aufgaben im Bereich künstliche Intelligenz und maschinelles Lernen sowie für Large Language Models (LLMs), die mit sehr großen Datensätzen trainiert werden, um die menschliche Sprache zu verstehen und zu generieren.

Was macht ein modernes Datenmanagement aus?

Ein modernes Datenmanagement wird von AI und maschinellem Lernen begleitet. Je weiter sich diese Technologien entwickeln, desto größer wird der Bedarf nach Datenzugriff, -qualität und -governance. In diesem Erklärvideo erfahren Sie den Zusammenhang zwischen einem modernen Datenmanagement und neuen Technologien und Abläufen wie etwa DataOps und AIOps. Außerdem lernen Sie, warum AI und Modelle für maschinelles Lernen auf vertrauenswürdige Daten angewiesen sind, damit Organisationen Risiken, Kosten und Produktivitätsrückgänge vermeiden können – dies gilt vor allem für hochregulierte Branchen mit strikten Compliance-Regularien.

Video-Player wird geladen.

Aktueller Zeitpunkt 0:00

Dauer 0:00

Geladen: 0%

Streamtyp LIVE

Verbleibende Zeit 0:00

Geschichte des Datenmanagements

Manche sagen, dass der Bedarf für Datenmanagement erstmals in den 1890er-Jahren mit mechanischen Lochkarten auftrat, die Informationen (Daten) auf einer dicken Karte aufzeichneten. Aber das Konzept des Datenmanagements wurde erst in den 1960er-Jahren breit diskutiert, als die Association of Data Processing Service Organizations (ADPSO) begann, Ratschläge zum Datenmanagement für Fachleute zu entwickeln.

Datenmanagement-Systeme wie wir sie heute kennen, setzten sich erst in den 1970er-Jahren durch. Diese Systeme waren strikt auf den Betrieb ausgerichtet. Sie bestanden aus Aufzeichnungen (Berichten) von Geschäftsabläufen zu einem bestimmten Zeitpunkt, und wurden einer relationalen Datenquelle entnommen, in der Informationen in Zeilen und Spalten, meist in einem Data Warehouse, gespeichert wurden. Standardabläufe und -technologien im Datenmanagement sind unter anderem:

Stapelverarbeitung sowie Extract, Transform, Load (ETL).
Strukturierte Abfrage-Sprache (SQL) und relationale Datenbankmanagementsysteme (RDBMS).
Nicht nur SQL (NoSQL) und nicht-relationale Datenbanken.
Enterprise Data Warehouses, Data Lakes und Data Fabrics.
Datenföderation und Virtualisierung.
Datenkataloge, Metadatenmanagement und Datenherkunft.
Cloud Computing und Event Stream Processing (Daten-Streaming).

Heute können Unternehmen und IT-Abteilungen zusammenarbeiten, um die Art und Weise des Datenmanagements zu optimieren, bevor die Daten mit AI und generative AI (GenAI) genutzt werden. Data Engineers und Analysten arbeiten mit Data Scientists zusammen, um Daten zu verwalten und daraus Werte zu generieren.

Ein starker Fokus auf Daten: Die Grundlage für den Erfolg vonStudierenden und Universitäten

Wie viele andere war auch die University of North Texas (UNT) reich an Daten und arm an Erkenntnissen. Das lag an fundamentalen Problemen in den Bereichen Datenintegrität, Datenmanagement und Data Governance – und da die Daten in Silos gespeichert waren, war Enterprise Analytics schwierig. Erfahren Sie, wie der Einsatz von SAS-Datenmanagementsoftware an der UNT für einen ausschlaggebenden Wandel der Analysefähigkeiten sorgte – mit dem Resultat besserer Ergebnisse für die Studierenden und enormer Einsparungen.

Weitere Informationen University of North Texas uses data strategy to retain students

Zwei College-Student:innen arbeiten gemeinsam an einem Laptop.

Datenmanagement in der heutigen Welt

Um Ihre Daten zu verwalten, müssen Sie sich mit einer Vielzahl von Datenmanagementkonzepten, Technologien und Prozessen auseinandersetzen. Erfahren Sie von Datenexpert:innen, wie Sie diese Aufgabe meistern können.

Die Zukunft von Daten und AI

Rasante Innovation, wie im Bereich AI, erfordert eine solide Data Quality-Strategie. Erfahren Sie, wie Organisationen mit Data Quality den Erfolg ihrer AI-Vorhaben gewährleisten.

Blogbeitrag lesen Learn why data quality is essential for AI investments

Vom Datenmanagement zur AI

Maximieren Sie mit einem modernen Datenmanagement den wirtschaftlichen Nutzen von AI. Lernen Sie, wie Sie Ihr Unternehmen weiterentwickeln können, anstatt Zeit mit Rückfragen zu Ihren Daten zu verlieren.

White Paper herunterladen Discover how modern data management can help you boost the value of AI

Synthetische Daten und Datenmanagement

Synthetische Daten - die auf der Grundlage realer Daten algorithmisch generiert werden - helfen, Probleme im Zusammenhang mit Datenknappheit, Datenschutzbedenken, schlechter Qualität und Verzerrungen zu lösen. Dies wiederum wird die Datenverwaltung neu definieren und die Produktion von KI- und maschinellen Lernmodellen beschleunigen.

Artikel lesen Mit synthetischen Daten AI-Durchbrüche ermöglichen

Generative AI und Datenmanagement

Datenmanagement-Tools sind unerlässlich, um LLMs mit hochwertigen Daten und Aufforderungen zu versorgen – Daten, die überprüfbar und nachvollziehbar sind. Diese Tools schützen Ihre Nutzer:innen mit robusten Datenschutzfunktionen wie Datenminimierung, Anonymisierung und Verschlüsselung.

Wer nutzt Datenmanagement?

Datenmanagement ist die treibende Kraft hinter den Prozessen erfolgreicher Unternehmen in allen Branchen. Mit mehr Daten und einem vereinfachten Zugriff auf Analysen können Sie mehr Möglichkeiten ergreifen, mehr Fragen stellen und mehr Probleme lösen. Erfahren Sie, wie Branchen weltweit ihre Ziele mit Datenmanagement verfolgen.

Mehr denn je benötigen Banken eine vertrauenswürdige Datengrundlage, um Datenschutz, Compliance und Digitalisierung zu meistern. Nur mit einem vollständigen, integrierten Überblick über all ihre Daten – und mit soliden Qualitäts-, Governance- und Datenschutz-Methoden – gewinnen Banken das Vertrauen ihrer Kunden und können ihre digitale Transformation vorantreiben.

Gesundheitswesen

Datenmanagement ist für jedes Unternehmen im Gesundheitswesen ein absolutes Must-Have. Die Branche muss Daten jeden Formats und aus verschiedenen Quellen – inklusive externer Daten – integrieren können und dabei Dopplungen erkennen, Probleme mit der Data Quality lösen und strikte Regularien und Compliance-Vorschriften zum Datenschutz einhalten.

Versicherungsgesellschaften arbeiten tagtäglich mit sehr großen Datenmengen – Kundendaten, sowie Daten aus Versicherungsangeboten, Policen, Forderungen und aus IOT-Geräten. Die Entwicklung guter versicherungsmathematischer Modelle und eine informierte Entscheidungsfindung über Prämiengestaltung, Rückstellungsbildung, Zahlung und mehr, baut auf zuverlässiges Datenmanagement zur Integration, Bereinigung und Governance von Versicherungsdaten.

Fertigungsindustrie

In der Fertigungsindustrie ist Qualität ein Garant für Erfolg. Mit soliden Technologien für Datenmanagement und Datenqualität können Hersteller ihr Produktinventar effizient verwalten und sowohl strukturierte als auch unstrukturierte Daten aus verschiedenen Quellen integrieren, um einen umfassenden Überblick über ihre Leistung zu erhalten, bessere Resultate zu erzielen und gut informierte Geschäftsentscheidungen zu treffen.

Öffentliche Verwaltung

Regionale und nationale Behörden sind für eine Bandbreite an Dienstleistungen und Programmen zuständig. Zuverlässige Datenmanagement-Technologien sind dabei hilfreich – von der Bekämpfung von Betrug und unzulässigen Zahlungen über den Bevölkerungsschutz bis zur Überwachung von Ergebnissen im Bereich der Bevölkerungsgesundheit, der wirtschaftlichen Entwicklung und von Smart-City-Initiativen.

Einzelhandel & Konsumgüter

Das Kundenerlebnis zu verstehen und den Erwartungen gerecht zu werden, erfordert einen präzisen, tagesaktuellen Überblick über alle Daten – egal ob im Streaming, in der Cloud, in einem Data Lake oder Data Warehouse gespeichert. Von Marketing, Handel bis zum Vertrieb – ein vertrauenswürdiges Datenmanagement ist die Grundlage, um die Kontrolle über die Einzelhandelsdaten zu haben.

Erfahren Sie mehr über Branchen, die diese Technologie nutzen

Datenmanagement ist auf AI und maschinelles Lernen angewiesen. Dies gilt jedoch umgekehrt genauso. Diese Technologien sind jetzt miteinander verknüpft, denn der Weg zur erfolgreichen AI ist im Kern mit einem modernen Datenmanagement verwoben. Dan Soceanu Senior Product Manager for AI and Data Management, SAS

Wie funktioniert Data Management

Seit Menschengedenken sammeln Unternehmen Daten und müssen diese entsprechend verwalten, um das Paradoxon "Garbage in, garbage out" zu vermeiden. Mit dem Anstieg der Datenmengen, -typen und -quellen wächst auch die Notwendigkeit, Daten in Echtzeit zu verarbeiten - und die Dringlichkeit, Daten gut zu verwalten, bleibt eine Top-Priorität für den Geschäftserfolg. Informieren Sie sich über einige der wichtigsten Data Management-Technologien.

Datenzugriff bezeichnet das Zugreifen auf und das Abrufen von Informationen, ganz egal, wo diese gespeichert sind. Bestimmte Technologien wie Datenbanktreiber und Dokumentkonvertierer vereinfachen diese Prozesse und steigern die Effizienz. Business-Analyst:innen und Datenwissenschaftler:innen benötigen eine Bandbreite von Datenzugriffsfähigkeiten, um reibungslos mit Big Data in immer mehr Formaten und aus immer neuen Quellen und Strukturen zu arbeiten – und um zu erkennen, welche Daten am zuverlässigsten Resultate vorhersagen.

Warum ist es so wichtig?

Wichtige Daten sind an vielen verschiedenen Orten hinterlegt – in Textdateien, Videos, Datenbanken, E-Mails, Data Lakes, Sensoren und smarten Geräten, Social Media-Feeds und auf Websites. Mit einer guten Zugriffstechnologie können Sie nützliche Daten jeden Formats aus jedem Datenspeicherungsmechanismus extrahieren – so haben Sie mehr Zeit, mit iden Daten zu arbeiten, anstatt sie zu suchen.

Data Governance ist ein Geflecht aus Menschen, Regularien, Prozessen und Technologien, die definieren, wie Sie die Daten Ihrer Organisation verwalten. Eine Data Governance-Software ermöglicht es Ihnen, Regeln zur Umsetzung Ihrer Regularien aufzustellen – so vereinen Sie Ihre Daten- mit Ihrer Unternehmensstrategie. Ähnlich wie Governance beschreibt das Master-Datenmanagement die Erstellung eines einzigen, konsistenten Überblicks über entscheidende Geschäftsentitäten – etwa eine Person, ein Ort, ein Produkt, ein Zulieferer oder ein Unternehmen.

Warum ist es so wichtig?

Data Governance ist für jede Organisation entscheidend – weitere zentrale Governance-Typen sind AI Governance und Model Governance. Governance ist oft von der Notwendigkeit, Regularien einzuhalten geprägt, etwa das CECL, die GDPR oder der California Consumer Privacy Act (CCPA). Über Governance-Regularien bestimmen Sie, auf welche Daten Nutzer:innen zugreifen können, wer sie darüber hinaus verändern darf und wie mit Ausnahmen verfahren wird. Tools für die Data Governance helfen Ihnen, Regeln zu kontrollieren und zu verwalten, den Umgang damit zu verfolgen und Berichte für Audits zu erstellen.

Data Integration beschreibt einen Prozess, der verschiedene Datentypen zu einem Ergebnis zusammenführt. Mit Data Integration-Tools können Sie die Vorgehensweise dabei gestalten und automatisieren. ETL (Extract, Transform and Load) und ELT (Extract, Load and Transform) sind Beispiele für solche Tools.

Warum ist es so wichtig?

Data Integration erstellt vermengte Datenkombinationen, die beim Treffen von Entscheidungen nützlich sind. Integrierte Daten beinhalten Elemente mehrerer individueller Datensätze, können daher neue Erkenntnisse generieren und bei der Beantwortung entsprechender Fragen hilfreich sein.

Datenvorbereitung ist der Prozess der Vorbereitung von Daten für Analysen. Das beinhaltet die Kombination von Daten aus verschiedenen Quellen, ihre Bereinigung und Transformation. Wenn das über eine Self-Service-Schnittstelle durchgeführt wird, können Endanwender:innen mit sehr wenig Training auf benötigte Daten zugreifen und diese verändern – ohne die Unterstützung der IT-Abteilung.

Warum ist es so wichtig?

Gute Modelle basieren auf guter Datenvorbereitung. Aber diese Arbeit beansprucht viel Zeit. Gute Datenvorbereitungstools liefern blitzsaubere Daten und schaffen Mehrwert – so können Datenexpert:innen schnell auf Daten zugreifen und diese bereinigen, transformieren und für jeden analytischen Zweck strukturieren. Das Ergebnis: höhere Produktivität, bessere Entscheidungen, mehr Agilität.

Data Quality stellt sicher, dass Daten genau und für den gewünschten Zweck geeignet sind. Dieser Prozess beginnt mit dem Zugriff und zieht sich über verschiedene Integrationspunkte mit anderen Daten – inklusive dem letzten Punkt vor der Veröffentlichung bzw. Berichtserstellung.

Warum ist es so wichtig?

Mangelhafte Datenqualität kann zu kostspieligen Fehlern führen. Überholte, unzuverlässige, unvollständige oder für den jeweiligen Zweck unpassende Daten wird nicht vertraut – das kann in ihrer gesamten Organisation zu Problemen führen. Eine Data Quality-Lösung für automatisches und einheitliches Standardisieren, Verifizieren und Parsen reduziert solche Risiken.

Data Lakes und Data Warehouses können enorme Mengen von Big Data sicher speichern und sie bei der Erstellung von Vorhersage-Modellen, für das maschinelle Lernen, im Bereich AI und für andere Data Science-Anwendungen nutzbar machen.

Warum ist es so wichtig?

Ob eine Organisation ein traditionelles Data Warehouse, einen Data Lake oder ein Data Lakehouse nutzt – oder eine Kombination aus all dem – diese Systeme sind für die Verfügbarkeit und Nutzbarkeit von Geschäftsdaten entscheidend. Ein Data Lake kann neue Daten jeden Typs extrem schnell aufnehmen – und dabei Self-Service-Zugriff, Exploration und Visualisierung ermöglichen. So können Unternehmen neue Informationen schneller erkennen und entsprechend reagieren.

Mit einem Unternehmensglossar können Sie Datendefinitionen und -eigentümer:innen bestimmten, Workflows integrieren, Probleme melden und Data Lineage und Verbindungen visualisieren. Data Lineage verfolgt den Weg der Daten von ihrer Herkunft zu ihrem aktuellen Speicherort, indem bestimmte Details überwacht werden – technische und Geschäftsdaten sowie Metadaten (Daten über Daten).

Warum ist es so wichtig?

Indem diese Tools ineinandergreifen, stärken sie die Zusammenarbeit und stimmen den Geschäftsbetrieb und IT aufeinander ab. Wenn Sie bestimmte Probleme erkennen, können Sie schnell darauf reagieren, bevor sie ernste Konsequenzen nach sich ziehen. Außerdem können Sie mit diesen Tools Beziehungen zwischen Daten entdecken und Auswirkungsanalysen durchführen.

Erweitertes Datenmanagement

Dieser Ansatz nutzt Techniken der künstlichen Intelligenz oder des maschinellen Lernens, um Prozesse wie Data Quality, Metadaten-Management und Data Integration selbstkonfigurierend und selbstoptimierend zu gestalten.

Erweitertes Datenmanagement kann zum Beispiel:

Eine Liste mit Vorschlägen zur Erhöhung der Datenqualität erstellen. Ihre Handlungen führen dann mit der Zeit zu verbesserten Ergebnissen.

Datenprofile erstellen und automatisch persönliche Informationen finden, die markiert werden können, um das Verhalten zu beeinflussen – z. B. nur bestimmten Benutzer:innen den Zugriff auf persönliche Daten in einer Tabelle erlauben.

Mithilfe von maschinellem Lernen Datentransformationen und anschließende Verbesserungen im Laufe der Zeit vorschlagen – dies geschieht über eine Suchmaschine, die Daten und Metadaten analysiert.

Empfehlungen für Benutzer:innen und für die nächstbesten Abläufe während des Datenaufbereitungsprozesses geben.

Mehr über die Funktionsweise von Datenmanagement

Datenmanagement für AI und maschinelles Lernen (ML)

Viele Geschäftsabläufe stützen sich auf AI, also dem Trainieren von Systemen auf die Übernahme menschlicher Arbeit durch Lernen und Automatisierung. AI- und ML-Techniken werden etwa oft bei der Kreditvergabe, der Erstellung medizinischer Diagnosen oder der Angebotsgenerierung im Einzelhandel genutzt. Mit AI und ML benötigen Sie gut verwaltete, verständliche und vertrauenswürdige Daten mehr denn je – denn wenn Algorithmen von mangelhaften Daten lernen und sich daran anpassen, vervielfältigen sich ihre Fehler schnell.

Datenmanagement für das IoT

Die Flut aus Daten, die Sensoren in Geräten des Internet of Things (IoT) generieren, wird oft als Streaming Data bezeichnet. Das Streaming von Daten, auch Event Stream Processing genannt, bedeutet Echtzeit-Datenanalyse im laufenden Betrieb. Dies geschieht durch die Anwendung von Logik auf die Daten, das Erkennen von Mustern in den Daten und das Filtern der Daten für verschiedene Verwendungszwecke, während sie in ein Unternehmen fließen. Betrugserkennung, Netzwerk-Überwachung, E-Commerce und Risikomanagement sind beliebte Anwendungsbereiche für solche Techniken.

Bidirektionales Metadatenmanagement

Bidirektionales Metadatenmanagement teilt und verbindet Metadaten zwischen verschiedenen Systemen. SAS hat sich beispielsweise durch seine Beteiligung am OPDi-Egeria-Projekt verpflichtet, Teil der offenen Metadaten-Community zu sein. Dieses Projekt unterstreicht die Notwendigkeit von Metadaten-Standards zur Förderung eines verantwortungsvollen Datenaustauschs über verschiedene Technologieumgebungen hinweg.

Data Fabric und die Semantic Layer

Der Begriff Data Fabric beschreibt die vielfältige Datenlandschaft einer Organisation – dort werden unzählige Datentypen mit den unterschiedlichsten Methoden verwaltet, verarbeitet, gespeichert und analysiert. Die Semantic Layer spielt eine wichtige Rolle in der Data Fabric. Ähnliche wie ein Unternehmensglossar ermöglicht die Semantic Layer die Verbindung von Daten mit in der gesamten Organisation genutzten, allgemein definierten Geschäftsbegriffen

Datenmanagement und Open-Source

Als „Open-Source“ bezeichnet man Computer-Programme oder Computing-Infrastrukturen, deren Quellcode allgemein verfügbar ist, sodass er von einer Nutzer-Community verwendet und modifiziert werden kann. Die Nutzung von Open-Source kann Entwicklungsprozesse beschleunigen und Kosten sparen. Außerdem schätzen Fachleute die Möglichkeit, in der von ihnen bevorzugten Programmiersprache und Umgebung zu arbeiten.

Datenföderation/Virtualisierung

Datenförderation ist eine spezielle Art der virtuellen Data Integration, über die Sie Einblick in kombinierte Daten von verschiedenen Quellen bekommen, ohne dass Sie den kombinierten Einblick verschieben oder an einem neuen Speicherort hinterlegen müssen. So können Sie sofort auf kombinierte Daten zugreifen, wenn Sie sie anfordern. Anders als ETL- und ELT-Tools, die nur eine Momentaufnahme anzeigen, generiert Datenförderation Ergebnisse auf Basis des Zustands der Datenquelle zum Zeitpunkt der Anforderung. So erhalten Sie einen schnelleren und potenziell genaueren Überblick über die Informationen.

Nächste Schritte

Lösungen für das Datenmanagement

Vertrauenswürdige Daten führen zu vertrauenswürdiger AI und Analytics – dies ist entscheidend für den Erfolg jedes Unternehmens. Unsere Datenmanagementlösungen bieten alle Funktionen, die Sie für den Zugriff, die Integration, die Bereinigung, die Governance und die Vorbereitung Ihrer Daten für Analysen benötigen – inklusive erweiterter Analytics wie künstliche Intelligenz und maschinelles Lernen.

Erfahren Sie mehr über die Datenmanagementlösungen von SAS SAS Data Management solutions

SAS® Viya®: Leistung, Produktivität und Vertrauen

SAS Viya – VA-Daten- und AI-Plattform für Ihr gesamtes Unternehmen – unterstützt bei Zugriff, Verwaltung und Governance von Daten, um sicherzustellen, dass Daten korrekt, hochwertig und bereit für Analysen sind.

Erfahren Sie mehr und probieren Sie es kostenlos aus Get a free trial of SAS Viya, a data and AI platform

Screenshot eines Streaming-Berichts der SAS Viya Kundendatenplattform

Literaturempfehlungen

Kostenlos testen

Probieren Sie SAS® Viya® in unserer Testumgebung selbst aus.

Probieren Sie SAS Viya kostenlos aus

Preisanfrage

Starten Sie Ihre Zukunft in einer einzigen, erweiterbaren Umgebung.

Demo anfordern

Lernen Sie SAS Software mit einer Demo kennen, die auf Ihre Branche und Ihre Geschäftsanforderungen zugeschnitten ist.

Text hinzufügen

Kostenlose Schulungen

Holen Sie sich die Schulung, die Sie brauchen, um Ihre Investition in SAS optimal zu nutzen.

Text hinzufügen