Aleksander Fegel
12/03/2026

SAS zu Azure Databricks Migration: Warum Change Management über Erfolg oder Scheitern entscheidet

Du kannst eine Datenplattform technisch sauber migrieren und trotzdem scheitern. Nicht wegen Spark, nicht wegen Netzwerkregeln, nicht wegen fehlender Features, sondern weil niemand mehr weiß, wie Arbeit künftig wirklich erledigt wird. Genau deshalb ist die wichtigste Erkenntnis aus einer SAS zu Azure Databricks Migration nicht „wie wir Code übersetzt haben“, sondern: Migration ist ein Change-Projekt mit IT-Anteil, nicht umgekehrt. Wer das früh akzeptiert, spart Monate Reibung, vermeidet Schatten-IT und bekommt am Ende eine Plattform, die genutzt wird.

Was heißt das konkret, wenn du (oder dein Unternehmen) vor einer Modernisierung von SAS hin zu Azure Databricks stehst?

SAS zu Azure Databricks Migration ist ein Organisationsumbau, kein Tool-Wechsel

Viele Teams starten Migrationen mit einer technischen Checkliste: Zielarchitektur, Cluster-Setup, Datenanbindung, Security, CI/CD. Alles wichtig. Aber das Kernproblem liegt oft woanders: SAS ist in vielen Organisationen nicht nur ein Tool, sondern ein eingespieltes Betriebssystem für Reporting, Datenaufbereitung und Fachbereichslogik. Wenn du das ersetzt, ersetzt du Routinen, Verantwortlichkeiten und implizites Wissen.

Hier ist der Knackpunkt: In SAS-Setups sind Prozesse häufig stark personengebunden. In Databricks-Setups müssen sie reproduzierbar, versioniert und teamfähig werden. Das ist ein Kulturwechsel.

Was du deshalb früh klären solltest:

Wer „besitzt“ künftig Datenprodukte? Fachbereich, Data Team, Plattformteam?
Wie sehen Freigaben aus? Wer darf was produktiv setzen, wer reviewed?
Was ist das neue Standard-Artefakt? Notebook, Job, Pipeline, Delta Table, Dashboard?
Wie wird Wissen übertragen? Nicht als Dokument, sondern als Arbeitsweise (Pairing, Reviews, Standards).

Wenn du diese Fragen nicht beantwortest, passiert etwas Vorhersehbares: Teams bauen sich ihre eigenen Workarounds, weil der Weg über die neue Plattform zu langsam oder zu unklar ist. Dann hast du zwei Welten, doppelte Kosten und endlose Diskussionen über „warum Databricks nicht funktioniert“.

Der häufigste Fehler: 1:1-Übersetzung statt Zielbild

Eine SAS zu Azure Databricks Migration scheitert selten daran, dass man Logik nicht abbilden kann. Sie scheitert daran, dass man versucht, SAS exakt nachzubauen. Das wirkt am Anfang sicher, ist aber teuer und bremst die Modernisierung aus.

Ein besserer Ansatz: Definiere ein Zielbild pro Use Case, nicht pro SAS-Programm.

Statt „Wir migrieren 300 SAS-Jobs“:

Welche 20 Datenprodukte sind geschäftskritisch?
Welche SLAs brauchen sie (Laufzeit, Aktualität, Verfügbarkeit)?
Welche Datenqualität ist zwingend, welche ist „nice to have“?
Welche Teile sind historisch gewachsen und können entfallen?

Warum das zählt: Databricks ist stark, wenn du Datenprodukte als Pipelines denkst (Bronze, Silver, Gold), wenn du Versionierung und Tests etablierst, wenn du Observability ernst nimmst. Wenn du aber einfach nur bestehende SAS-Logik in einen neuen Ausführungsort kippst, nutzt du die Stärken nicht, zahlst aber die Komplexität.

Praktischer Schritt: Baue eine Migrationslandkarte mit drei Kategorien:

Rebuild: Neu bauen, weil es schneller und sauberer ist.
Refactor: Logik übernehmen, aber Struktur und Betrieb modernisieren.
Retire: Abschalten, weil niemand es wirklich braucht.

Allein die Kategorie „Retire“ finanziert oft einen Teil der Migration, weil sie Last reduziert, die seit Jahren mitgeschleppt wurde.

Governance, die Teams schneller macht (statt sie zu blockieren)

Bei Azure Databricks kommt schnell das Thema Governance auf: Zugriffsrechte, Datenklassifizierung, Audit, Mandantenfähigkeit. Viele Organisationen reagieren darauf mit maximaler Kontrolle. Ergebnis: Niemand kann arbeiten, alles dauert, und Fachbereiche verlieren Vertrauen.

Die bessere Logik: Governance muss den Standardweg schnell machen und Abweichungen sichtbar.

Dazu brauchst du:

Klare Namens- und Ordnerkonventionen (Workspaces, Repos, Jobs, Tabellen)
Rollenmodelle, die echte Arbeitsrollen abbilden (Entwicklung, Betrieb, Fachbereich, Auditor)
Standardisierte Datenzonen (z.B. Raw, Curated, Serving) mit definierten Regeln
Einheitliche Secrets- und Credential-Verwaltung (statt „jeder bastelt sich was“)
Automatisierte Provisionierung (Infrastructure as Code, Templates)

Wichtig: Governance ist nicht nur Security. Es ist auch Betriebsfähigkeit. Wenn du später nicht beantworten kannst „Welche Pipelines sind kritisch?“, „Welche Datenprodukte hängen wovon ab?“ oder „Was hat sich letzte Nacht geändert?“, wird jede Störung zur Krise.

Migration ohne Tests ist ein Glücksspiel (und wird politisch)

Technische Migrationen werden oft politisch, sobald die ersten Reports anders aussehen. Dann geht es nicht mehr um Fakten, sondern um Vertrauen. Und Vertrauen entsteht durch Nachweisbarkeit.

Wenn du von SAS nach Databricks migrierst, brauchst du eine Teststrategie, die nicht nur „läuft durch“ prüft, sondern fachliche Gleichheit dort, wo sie nötig ist.

Bewährte Bausteine:

Golden Datasets: Kleine, repräsentative Datenmengen mit erwarteten Ergebnissen
Reconciliation Checks: Summen, Counts, Verteilungen, Null-Raten, Duplikate
Toleranzregeln: Wo sind Abweichungen akzeptabel (z.B. Rundung), wo nicht?
Regression Tests für kritische Datenprodukte bei jeder Änderung
Datenqualitäts-Monitoring im Betrieb (nicht nur in der Migration)

Und jetzt der Punkt, den viele unterschätzen: Tests sind auch Change Management. Sie machen Diskussionen sachlich. Sie reduzieren Angst. Sie geben Teams die Freiheit, schneller zu refactoren, weil sie wissen, wenn etwas bricht.

Parallelbetrieb: Plane ihn ein, aber halte ihn kurz

Viele Migrationen laufen eine Zeit lang im Parallelbetrieb: SAS produziert weiterhin Ergebnisse, Databricks auch, man vergleicht und schaltet dann um. Das ist sinnvoll, aber gefährlich, wenn es kein Ende gibt.

Parallelbetrieb wird schnell zur Komfortzone:

Fachbereiche bleiben bei SAS, weil „das kennen wir“
Teams pflegen zwei Welten
Fehler werden nicht behoben, sondern umgangen („wir nehmen erstmal den SAS-Output“)

Deshalb brauchst du klare Regeln:

Cutover-Kriterien: Welche Tests müssen grün sein, welche Stakeholder müssen abnehmen?
Cutover-Datum: Ein Termin, der realistisch ist, aber verbindlich
Decommission-Plan: Was wird wann abgeschaltet, welche Abhängigkeiten gibt es?
Kommunikation: Wer wird wann informiert, was ändert sich im Alltag?

Wenn du den Parallelbetrieb nicht aktiv managst, bezahlt dein Unternehmen doppelt, und die Migration verliert Momentum.

Skill-Gap ist normal, aber du musst ihn operationalisieren

SAS-Teams sind oft stark in fachlicher Logik, Reporting und prozeduralem Denken. Databricks verlangt zusätzlich: verteiltes Rechnen, Data Engineering Standards, Git, Deployment, Monitoring, Kostenbewusstsein in der Cloud.

Das Problem ist nicht, dass Menschen das nicht lernen können. Das Problem ist, dass Organisationen Lernen als „Training“ planen, statt als Arbeitsmodus.

Was funktioniert besser:

Pairing: SAS-Expertise plus Databricks-Engineering zusammen an einem Datenprodukt
Code Reviews als Lerninstrument, nicht als Gatekeeping
Templates für Pipelines, Jobs, DQ-Checks, damit nicht alles neu erfunden wird
Definition of Done inklusive Tests, Logging, Dokumentation, Ownership
Enablement-Sprechstunden (wöchentlich), um Blocker schnell zu lösen

So entsteht Kompetenz im Flow der Migration. Und du vermeidest, dass Wissen in wenigen Köpfen hängen bleibt.

Kosten und Performance: Cloud-Realität früh sichtbar machen

In SAS-Welten ist Kostenwahrnehmung oft indirekt. In Azure Databricks ist sie direkt. Cluster kosten Geld, Jobs kosten Geld, ineffiziente Abfragen kosten Geld. Wenn du das erst am Ende anschaust, bekommst du die klassische Überraschung: „Warum ist das so teuer?“

Besser:

Kostenbudgets pro Domäne oder Datenprodukt definieren
Cluster-Policies festlegen (z.B. Auto-Termination, Instanztypen, Limits)
Job-Laufzeiten und Ressourcennutzung messen und regelmäßig optimieren
Caching und Datenlayout (z.B. Partitionierung, Z-Ordering) gezielt einsetzen
Delta Lake Best Practices nutzen (Compaction, Optimize, Vacuum mit Sinn)

Wichtig ist die Reihenfolge: Erst Transparenz, dann Optimierung. Wenn Teams ihre Kosten nicht sehen, können sie sie nicht beeinflussen.

Was du ab morgen anders machen solltest (konkret)

Wenn du eine SAS zu Azure Databricks Migration planst oder schon mittendrin bist, setze diese Schritte als nächste Prioritäten:

Schreibe ein Zielbild pro kritischem Datenprodukt (Output, SLA, Owner, Qualitätsregeln), nicht pro SAS-Job.
Baue eine Migrations-Triage: Rebuild, Refactor, Retire, und entscheide bewusst.
Etabliere eine minimale Governance, die den Standardweg schnell macht (Rollen, Zonen, Konventionen, Provisionierung).
Implementiere fachliche Vergleichstests (Golden Datasets plus Reconciliation), bevor du skalierst.
Plane den Cutover als Management-Entscheidung mit Kriterien, Datum und Decommission-Plan.
Mache Enablement zur Arbeitsform: Pairing, Reviews, Templates, klare Definition of Done.
Schaffe Kosten-Transparenz früh und setze Policies, bevor Wildwuchs entsteht.

Wenn du diese Punkte sauber aufsetzt, wird Databricks nicht nur „das neue SAS“. Es wird die Basis, auf der du Datenprodukte schneller bauen, stabiler betreiben und besser weiterentwickeln kannst.

Beratung & Umsetzung aus einer Hand

Im unverbindlichen Erstgespräch analysieren wir gemeinsam, ob der Lakehouse Ansatz Ihnen hilft und welches Potential für Data-Science & Künstliche Intelligenz in Ihrem Unternehmen steckt.
Als kleiner spezialisierter Dienstleister steht die Geschäftsführung bei jedem Projekt zu 100% dahinter.
Lernen Sie im Erstgespräch direkt unsere Geschäftsführung kennen. Keine Vorqualifizierung und Zeitverschwendung.
Bei Bedarf können wir gerne von Anfang an einen Architektur / Technologie-Experten hinzuziehen. Einfach bei der Terminbuchung anfragen.