Data Warehouse
Was das ist und warum man dies wissen sollte.
Ein Data Warehouse (oder Enterprise Data Warehouse) speichert große Datenmengen, die aus verschiedenen Quellen gesammelt und integriert werden. Da Unternehmen auf diese Daten für Analyse- oder Berichtszwecke angewiesen sind, müssen sie einheitlich formatiert und leicht zugänglich sein. Diese beiden Eigenschaften zeichnen Data Warehousing aus und machen es zu einem unverzichtbaren Tool für moderne Unternehmen.
Geschichte des Data Warehouse
In den 70er und 80er-Jahren nahmen die Datenmengen deutlich zu, deshalb benötigten Unternehmen eine einfache Methode, ihre Informationen zu speichern und darauf zuzugreifen. Der Informatiker Bill Inmon, der als Vater des Data Warehousing gilt, begann in den 70er-Jahren mit der Entwicklung des Konzepts und prägte den Begriff „Data Warehouse“. Er veröffentlichte 1992 das Buch Building the Data Warehouse, das seitdem als Referenzwerk für Data-Warehousing-Technologie gilt. Inmons Definition des Data Warehouse geht von einem „Top-Down“-Ansatz aus, bei dem zunächst ein Zentralspeicher eingerichtet wird und dann innerhalb dieses Speichers Data Marts erstellt werden, die bestimmte Teilmengen von Daten enthalten.
Ralph Kimball, ein weiterer Technologieexperte, der Mitte der 90er-Jahre The Data Warehouse Toolkit veröffentlichte, verfolgte mit seinem „Bottom-up“-Ansatz eine etwas andere Herangehensweise für das Data-Warehousing-Konzept, denn hier werden zunächst einzelne Data Marts entwickelt und später zu einem Data Warehouse zusammengeführt.
Data Warehousing ist nach wie vor relevant, entwickelt sich aber im Zuge der Veränderungen in der Branche für Cloud Computing und Real-Time Analytics weiter. Ein neues Tool zur Datenspeicherung, das einem Data Warehouse ähnelt, ist ein Data Lake, der durch bahnbrechende, kostengünstige Technologien wie Apache Hadoop entstanden ist. Data Lakes werden häufig in Verbindung mit einem unbeschränkten Datenstrom verwendet, der ohne Verarbeitung oder Erstellung von Schemata gespeichert wird.
Managen Sie Ihre Daten komplett lückenlos
Wie können Sie aus der Flut an Informationen in Ihrer Datenbank wertvollen Nutzen ziehen? Data Management-Experte Matthew Magne beschreibt, wie Sie Daten in Ihrem Data Lake streamen, bereinigen und davon Profile erstellen, um Erkenntnisse in Echtzeit zu gewinnen.
Warum sind Data Warehouses wichtig?
Daten sind für Unternehmen unerlässlich, um fundierte Entscheidungen treffen zu können. Aus diesem Grund sind Data Warehouses ebenso wichtig, denn sie speichern all diese Daten. Date Warehouses können beispielsweise:
- große Datenmengen in einer zentralen Datenbank und in einem Standardformat speichern.
- Daten aus vielen verschiedenen Quellen integrieren und standardisieren– so können Sie die Daten analysieren oder für die Berichterstellung nutzen.
- historische Aufzeichnungen verwalten, da sie Daten aus mehreren Monaten gar Jahren speichern können.
- Ihre Daten sichern, indem sie an einem zentralen Ort gespeichert werden. Nur denjenigen Zugang gewähren, die bestimmte Daten benötigen.
- einen schnelleren und einfachen Zugriff auf große Datenmengen gewähren, um schneller Geschäftsentscheidungen treffen zu können.
Data Warehousing heute
Ein Data Warehouse macht oft den bedeutenden Unterschied aus zwischen fundierten Entscheidungen und Datenchaos. Erfahren Sie hier, wie Data Warehouses unsere Welt prägen.
SAS® Data Management
Data stored in a data warehouse doesn’t deliver value unless it’s managed well. With data management technology from SAS, you can transform big data into big opportunity with data integration, data governance, event stream processing and data quality technologies.
Data Warehouses im Vergleich zu anderen Speichersystemen
Data Warehousing ist zwar eine gängige Lösung für die Speicherung von Daten, aber sicherlich nicht die einzige. Hier erfahren Sie, wie Data Warehouses im Vergleich zu ähnlichen Technologien abschneiden.
Data Warehouse
Speichert eine große Menge von Unternehmensdaten, oft historische Daten, die mehrere Themenbereiche umfassen.
|
Die Erstellung kann schwierig sein.
|
Großes Format.
|
Die Daten werden strukturiert und können für Analytics und das Reporting verwendet werden.
|
Data Mart
Speichert eine kleinere Datenmenge; typischerweise für einen einzelnen von einer Abteilung genutzten Themenkomplex, z. B. Marketing oder Vertrieb..
|
Schneller und einfacher zu erstellen als ein Data Warehouse.
|
Begrenzter Speicherplatz.
|
Die Daten werden strukturiert und können für Analytics und das Reporting verwendet werden.
|
Data Lake
Speichert eine große Menge von Rohdaten.
|
Die Daten bleiben unverändert, bis sie benötigt werden.
|
Ermöglicht den Nutzern die Suche nach kleineren, relevanteren und flexibleren Datensätzen.
|
Erfahren Sie mehr über Branchen, die diese Technologie nutzen
Wie funktioniert das?
Ein Data Warehouse basiert auf Daten, die aus internen und externen Quellen stammen. Diese Daten werden in der Regel in einem Data Warehouse durch einen Extraktions-, Transformations- und Ladeprozess (ETL-Prozess) gespeichert, bei dem Informationen aus der Quelle extrahiert, in hochwertige Daten umgewandelt und dann in ein Warehouse geladen werden. Unternehmen führen diesen Prozess regelmäßig durch, um ihre Daten zu aktualisieren und für den nächsten Schritt vorzubereiten.
Wenn ein Unternehmen bereit ist, seine Daten für Analytics oder für sein Reporting zu nutzen, verlagert sich der Schwerpunkt von Data Warehousing auf Business Intelligence-Tools. Technologien wie Visual Analytics und Data Exploration werden eingesetzt, um Unternehmen bei der Entscheidungsfindung mithilfe von Daten zu unterstützen.
Mehr zu diesem Thema
- Key questions to kick off your data analytics projectsThere’s no single blueprint for starting a data analytics project. Technology expert Phil Simon suggests these 10 questions as a guide.
- Was ist ein Data Lake und warum ist er wichtig?Ein Data Lake kann große Mengen an Rohdaten speichern. Er erlaubt den direkten Zugriff sowie eine einfache Darstellung/Analyse der Daten. SAS DE
- 5 data management best practices to help you do data rightFollow these 5 data management best practices to make sure your business data gives you great results from analytics.
- Data lineage: Making artificial intelligence smarterLear how data lineage plays a vital role in understanding data, making it a foundational principle of AI.