Data Solutions Design Patterns | Implementierung und Automatisierung

Wenn wir alles generieren können ...

Die Arbeit mit Daten kann komplex sein und oft ist die "richtige" Antwort für den jeweiligen Zweck das Ergebnis einer Reihe von Iterationen, bei denen Fachexperten (KMU) und Datenexperten zusammenarbeiten.

Dies ist von Natur aus ein iterativer Prozess. Selbst bei bestem Engagement und verfügbarem Wissen unterliegt das resultierende Datenmodell dem zunehmenden Verständnis, das mit der Arbeit mit Daten einhergeht.

Mit anderen Worten: Das Data Solution Modell ist nicht immer etwas, das man auf Anhieb richtig machen kann. In der Realität kann es lange dauern, bis sich ein Modell festigt, und in den heutigen schnelllebigen Umgebungen kann dies sogar nie eintreten.

Die Wahl der richtigen Design Patterns für Ihre Data Solution trägt dazu bei, dass sich die Lösung mit dem Unternehmen und der Technologie weiterentwickelt und die technischen Schulden laufend reduziert werden.

Diese Einstellung ermöglicht auch einige faszinierende Möglichkeiten, wie z. B. die Versionskontrolle des Datenmodells, der Design-Metadaten und ihrer Beziehungen - um die gesamte Datenlösung so darzustellen, wie sie zu einem bestimmten Zeitpunkt war - oder um verschiedene Datenmodelle für verschiedene Geschäftsbereiche zu ermöglichen.

Diese Idee, kombiniert mit der Möglichkeit, automatisch verschiedene Strukturen und Interpretationen von Daten sowie die Datenlogistik zu deren Befüllung oder Übermittlung bereitzustellen, nennen wir "Data Solution Virtualisierung".

Die Idee einer automatisierten virtuellen Data Solution entstand bei der Arbeit an der Verbesserung der Generierung von Data Warehouse Ladeprozessen. Es handelt sich gewissermaßen um eine Weiterentwicklung der ETL-Generierung. Die Kombination von Data Vault mit einer Persistent Staging Area (PSA) bietet zusätzliche Funktionalität, da sie es dem Entwickler ermöglicht, die gesamte Lösung oder Teile davon neu zu erstellen.

Die Möglichkeit, eine virtuelle Data Solution bereitzustellen, bietet mehrere Optionen. Das bedeutet nicht, dass Sie die gesamte Lösung virtualisieren müssen, aber Sie können auswählen, welcher Ansatz für das jeweilige Szenario am besten geeignet ist und Technologien und Modelle im Laufe der Zeit ändern.

Ermöglichen von direkten Datenverbindungen

Um Ideen wachsen zu lassen, brauchen Entwickler eine unmittelbare Verbindung zu dem, was sie gerade erschaffen. Das bedeutet, dass Sie als Entwickler in der Lage sein müssen, die Auswirkungen Ihrer Änderungen auf das, woran Sie gerade arbeiten, direkt zu sehen.

Das ist es, was die virtuelle Data Solution als Konzept und Denkweise ermöglichen soll: eine direkte Verbindung zu den Daten, um jede Art von Untersuchung zu unterstützen und Kreativität bei der Nutzung zu ermöglichen.

Bei der Virtualisierung von Data Warehousing geht es im Wesentlichen darum, dem Leitsatz zu folgen, eine direkte Verbindung zu den Daten herzustellen. Es geht darum, Wege zur Vereinfachung zu finden und weiterhin daran zu arbeiten, Barrieren bei der Bereitstellung von Daten und Informationen zu beseitigen. Es geht darum, Ideen zu ermöglichen, weil Daten für jede Art von Entdeckung oder Behauptung verfügbar gemacht werden können.

Ein virtuelles Data Warehouse

Virtuelles Data Warehousing ist die Möglichkeit, Daten direkt aus einem Rohdatenspeicher zu präsentieren, indem man Lademuster, Informationsmodelle und Architekturen des Data Warehouse nutzt. In vielen Data Warehouse-Lösungen gilt es bereits als Best Practice, Data Marts in ähnlicher Weise zu "virtualisieren". Das Virtuelle Data Warehouse geht diesen Ansatz noch einen Schritt weiter, indem es das gesamte Data Warehouse auf Basis der Rohdaten jederzeit (virtuell) umgestalten kann.

Erreicht wird diese Fähigkeit mit Hilfe eines historisierten Rohdatenspeichers, auch bekannt als Persistent Staging Area "PSA". Hier werden die ankommenden Daten durch Ermittlung des jeweiligen Deltas technisch komprimiert und können jederzeit vollständig wiederhergestellt werden. Diese Generierung dieser Prozesse kann allein auf Basis der technischen Metadaten vollständig automatisiert werden.

Nicht gleichzusetzen mit Datenvirtualisierung

Ein virtuelles Data Warehouse ist nicht dasselbe wie Datenvirtualisierung. Diese beiden Konzepte sind grundsätzlich unterschiedlich. Datenvirtualisierung ist nach den meisten Definitionen die Bereitstellung eines einheitlichen direkten Zugriffs auf Daten über viele "unterschiedliche" Datenspeicher hinweg. Es ist eine Möglichkeit, auf Daten zuzugreifen und sie zu kombinieren, ohne sie physisch in andere Umgebungen verschieben zu müssen. Die Datenvirtualisierung konzentriert sich jedoch nicht auf Lademuster sowie Datenarchitektur und -modellierung.

Das Virtuelle Data Warehouse hingegen ist ein flexibler und überschaubarer Ansatz zur Lösung von Themen der Datenintegration und Zeitabweichung mit Hilfe von Data-Warehouse-Konzepten, der im Wesentlichen ein definiertes Schema-on-Read bietet.

Anpassung der Datenplattform ohne zeitliche Begrenzung

Das virtuelle Data Warehouse wird durch die Kombination der Prinzipien der ETL-Generierung, hybrider Data Warehouse Modellierungskonzepte und eines Persistent Historical Data Store "PSA" ermöglicht. Es ist eine ideale Möglichkeit, direkten Bezug zwischen Rohdaten und Informationsbereitstellung für den Endanwender herzustellen, da Änderungen an den Metadaten und Modellen sofort in der Informationsbereitstellung abgebildet werden können. Das persitieren von Daten im Sinne eines traditionellen Data Warehouse ist jedoch immer noch eine Option und kann erforderlich sein, um die gewünschte Performance zu liefern. Der deterministische Charakter eines virtuellen Data Warehouse ermöglicht je nach Anforderung einen dynamischen Wechsel zwischen physischer und virtueller Struktur.

In vielen Fällen ändert sich dieser Mix aus physischen und virtuellen Objekten in den Data Warehouses im Laufe der Zeit. Ein guter Ansatz ist es, "virtuell zu starten" und zu persistieren wann und wo immer es notwendig oder sinnvoll ist.

Broschüre herunterladen

Data Solution Design Patterns

Implementierung und Automatisierung für ein flexibles Data Warehouse

Workshop mit Roelant Vos

"Für ein Data Warehouse haben wir keine Zeit!"

Was bietet Data Solution Automation?

Ihr Trainer

"Das Training ist klasse und jeden Cent wert. Ich kann das jeder/jedem nur weiterempfehlen!"

BERNHARD LAUBER, trivadis

"Thanks Roelant, I really enjoyed the course. So much content and lots of interesting discussions."

ANDREAS HAAS

"Der 3-Tages-Workshop hat meine Erwartungen übertroffen."

DANI SCHNIDER

Sie wollen ...

Voraussetzungen

Ist der Kurs für mich relevant?

Flexibles Design und Implementierung

Trainingsinhalte und Zeitplan

Tag 1

Tag 2

Tag 3

Praktischer Anteil

Benötigte Software

Weltweit verfügbar

Termine & Preise

Termine & Anmeldung

Gerne stehen wir bei weiteren Fragen zu Ihrer Verfügung:

info@dwhpatterns.com

Data Solution Design Patterns

Implementierung und Automatisierung für ein flexibles Data Warehouse

Workshop mit Roelant Vos

"Für ein Data Warehouse haben wir keine Zeit!"

Was bietet Data Solution Automation?

Ihr Trainer

"Das Training ist klasse und jeden Cent wert. Ich kann das jeder/jedem nur weiterempfehlen!"

BERNHARD LAUBER, trivadis

"Thanks Roelant, I really enjoyed the course. So much content and lots of interesting discussions."

ANDREAS HAAS

"Der 3-Tages-Workshop hat meine Erwartungen übertroffen."

DANI SCHNIDER

Sie wollen ...

Voraussetzungen

Ist der Kurs für mich relevant?

Flexibles Design und Implementierung

Trainingsinhalte und Zeitplan

Tag 1

Tag 2

Tag 3

Praktischer Anteil

Benötigte Software

Weltweit verfügbar

Termine & Preise

Termine & Anmeldung

Präsentiert von

IMPRESSUM

ALLGEMEINE INFORMATIONEN

Verantwortungsbereich

Abgrenzung

Keine Haftung

DATENSCHUTZ

Wer ist verantwortlich für die Datenverarbeitung?

Welche Daten werden erfasst, wofür und von wem?

Webserver

Nutzungsstatistik

Anmeldeformular

Welche Rechte hat der Nutzer?

Bildquellen

Gerne stehen wir bei weiteren Fragen zu Ihrer Verfügung:

info@dwhpatterns.com