Data Warehouse – mehr als ein Datenlager

Unternehmen sammeln tagtäglich Tausende von Daten in operativen Systemen wie ERP, Warenwirtschaft oder Buchhaltung oder aus externen Datenquellen. Diese vergleich- und analysierbar zu machen, ist Aufgabe des Data Warehouses.

Wie viele operative Systeme laufen in Ihrem Business?

Um Daten in einem Business-Intelligence-System sinnvoll auswerten zu können, müssen sie erst einmal strukturiert und vergleichbar vorliegen. Generiert man sie jedoch in verschiedenen Subsystemen, wie das in fast allen Unternehmen der Fall ist, liegen sie unstrukturiert, in verschiedenen Formaten und an unterschiedlichen Orten vor – beispielsweise Kundendaten im CRM, Produktinformationen im ERP und Bilddateien aus Social Media. Darüber hinaus sind die dortigen Daten nicht immer vollständig oder gar fehlerfrei. Hier fehlen Felder, dort sind Duplikate vorhanden und da falsche Verknüpfungen angelegt. Eine Abfrage, die alle Daten umfasst, ist aufgrund dieser Heterogenität beinahe unmöglich – was wiederum eine BI-Analyse unmöglich macht. Dazu benötigt es einen zentralen Speicherplatz, ein sogenanntes Data Warehouse, das die Basis eines jeden BI-Systems ist. Dort werden Daten in verdichteter, transformierter und aggregierter Form gesammelt oder verknüpft, damit sie eine fundierte Grundlage für Managemententscheidungen sein können.

Die Merkmale eines Data Warehouse

Die zentrale Aufgabe eines Data Warehouse ist es also, die vereinheitlichten Datenmengen so darzustellen, dass sie analysiert werden können. Die Daten im Data Warehouse zeichnen sich deswegen durch vier typische Merkmale aus:

  1. Themenbezug

Data Warehouses sind stets nach bestimmten Themen geordnet, um den Informationsbedürfnissen des Managements zu entsprechen, z. B. nach Produkten, Märkten oder Regionen. Darin liegt der hauptsächliche Unterschied zu den prozessbezogenen Operativsystemen.

  1. Zeitraumbezug

Die Daten in Data Warehouses beziehen sich nicht auf einen Zeitpunkt, sondern auf abgesteckte Zeiträume (Tage, Wochen, Monate oder sogar Jahre), sodass man zu Analysezwecken beispielsweise Trends auslesen kann.

  1. Einheitlichkeit

Die überführten Daten liegen im Data Warehouse in einer vereinheitlichten Form vor. Dies unter anderem kann den Produktnamen (Vereinheitlichen von regional verschiedenen Produktnamen) oder Maße betreffen (z. B. Angabe in Metern vs. Zentimetern). So entsteht ein homogener, auswertbarer Datenbestand.

  1. Konsistenz

In einem Data Warehouse sind die Daten auf unbestimmte Zeit angelegt und werden nur in Ausnahmefällen gelöscht. Das ermöglicht langfristige Trendanalysen.

Zentrale und Außenstelle

Wie bei einem großen Unternehmen gibt es auch bei Data Warehouses Zentralen und Außenposten mit spezifischen Aufgaben. Die Zentrale eines Data Warehouse wird als Core bezeichnet. Sie zieht ihre Daten direkt aus den operativen Systemen und basiert auf einer relationalen Datenbank. Ein solches Core Data Warehouse umfasst riesige Datenmengen, was die Auslese umständlich und langwierig macht. Daher verwenden die verschiedenen Nutzergruppen im Unternehmen oft kleinere Datenlager, sogenannte Data Marts. Beispielsweise kann das Marketing eine eigene Data Mart mit allen für sie relevanten Produkt- und Kundeninformationen erhalten, die dann aufgrund der geringeren Datenmenge performanter ist.

Und wie kommen die Daten ins Lager?

Die Umwandlung der operativen Daten zu nutzbaren Datenbeständen kann ein umständlicher Prozess sein und stellt viele Unternehmen vor Herausforderungen. Diese sogenannten ETL-Prozesse betrachten wir daher in unserem nächsten Blogbeitrag ausführlicher.

By | 2018-04-06T17:07:46+00:00 6. April 2018|Categories: BI Know-how|