Die meisten Unternehmen sprechen über „Data Governance“, als wäre das ein separates Programm, das in einem Gremium lebt. In der Realität zeigt sich Governance zuerst dort, wo Daten angefasst, verändert und umbenannt werden.
Und genau das ist Ihr ETL.
In diesem Artikel verwende ich „ETL“ so, wie es viele moderne Teams tun: als Sammelbegriff für jede Pipeline, die Daten bereinigt, transformiert, anreichert und neu formt für Reporting, Analytics, operative Prozesse oder Downstream-Produkte. Also nicht nur Daten von A nach B zu bewegen, sondern Rohdaten in geschäftliche Bedeutung zu übersetzen.
Wenn Sie eine einfache Definition möchten:
Data Governance in ETL ist die Gesamtheit der Entscheidungen und Kontrollen, die sicherstellen, dass Transformationen korrekt, nachvollziehbar, sicher und im Einklang mit der Art und Weise sind, wie das Business die Realität tatsächlich definiert.
Wenn das abstrakt klingt: gut. Denn ETL-Fehler sehen selten aus wie eine Fehlermeldung. Sie sehen aus wie selbstbewusste Dashboards, die still und leise falsch sind.
Warum Governance im ETL wichtiger ist als anderswo
Der Großteil des geschäftlichen Datenrisikos entsteht dort, wo Daten transformiert werden.
Quellsysteme haben häufig Constraints, Owner und eine klare operative Bedeutung. In dem Moment, in dem eine Pipeline beginnt zu bereinigen, zu mappen, zu joinen, zu filtern und Begriffe neu zu definieren, kann man unbeabsichtigt Folgendes erzeugen:
Kennzahlen, die nicht zu den Business-Definitionen passen
Daten, die konsistent wirken, aber semantisch falsch sind
neue Felder, die „da hinzugefügt werden, wo es gerade praktisch ist“
unkontrollierte Änderungen, die Reporting über die Zeit hinweg brechen
Daten, die sich nicht mehr sauber auditieren oder erklären lassen
Deshalb sieht man in vielen Unternehmen dasselbe Muster:
Das Business stellt eine einfache Frage. Die Antwort kommt schnell. Und eine Woche später bekommt dieselbe Frage eine andere Antwort, und niemand kann erklären, warum.
Das ist kein Tooling-Problem. Das ist ein Governance-Problem im ETL.
Die häufigsten Governance-Fehler im ETL
Entwickler haben zu viel Macht über Business-Bedeutung
„Wir brauchen eine neue Variable, also fügen wir sie einfach irgendwo hinzu.“
Das Problem ist nicht, dass Entwickler nachlässig sind. Das Problem ist, dass ETL zum Ort wird, an dem Business-Definitionen als Implementierungsdetails umgeschrieben werden.
Dann wird ein Feldname zu einem Versprechen, aber niemand prüft, ob dieses Versprechen zur Business-Erwartung passt.
Definitionen und Dokumentation fehlen oder sind inkonsistent
Wenn sich eine Kennzahl oder Entität auf mehrere Arten interpretieren lässt, dann wird das auch passieren.
Wenn Definitionen nicht dokumentiert und nicht „owned“ sind, entstehen Diskussionen wie:
„Verkaufte Artikel bedeutet verschickt.“
„Nein, es bedeutet in Rechnung gestellt.“
„Eigentlich bedeutet es vertraglich beschlossen.“
All das können valide Definitionen sein. Das Problem ist, sie alle gleich zu nennen.
Business und Engineering sind nicht end-to-end abgestimmt
Das ist der stille Killer. Beide Seiten gehen davon aus, dass sie dasselbe meinen.
Engineering baut etwas, das „Active customer“ heißt. Das Business feiert es. Und dann merkt jemand, dass ein Segment ausgeschlossen ist, das man eigentlich erwartet hatte.
Niemand wollte täuschen. Die Bedeutung wurde nie abgestimmt.



