Microsoft Fabric: Turbo für Ihre Datenanalyse mit OneLake Table Shortcuts und Query Acceleration

Microsoft Fabric: Beschleunigung Ihrer Datenanalysen mit OneLake Table Shortcuts und Query Acceleration

Die Herausforderungen der modernen Datenanalyse sind facettenreich: Datenquellen werden ständig vielfältiger, die Datenvolumen steigen exponentiell und gleichzeitig verlangen Unternehmen nach mehr Geschwindigkeit und Agilität in ihrer Datenstrategie. Für Unternehmen, die auf Microsoft Azure und speziell auf Microsoft Fabric setzen, gibt es seit kurzem eine Lösung, die diesen Herausforderungen entscheidend entgegenkommt: Die Query Acceleration für OneLake Table Shortcuts in Eventhouse ist nun allgemein verfügbar.

Was sind OneLake Table Shortcuts in Microsoft Fabric?

OneLake Shortcuts spielen in der Strategie von Microsoft Fabric, Daten einfacher miteinander zu verbinden und zu kombinieren, eine wichtige Rolle. Kurz gesagt sind OneLake Shortcuts Referenzen innerhalb einer Eventhouse-Umgebung, die sowohl auf interne Fabric-Komponenten als auch externe Datenquellen wie Databricks, Azure SQL oder Azure Cosmos DB verweisen können.

Bisher gab es jedoch einen Engpass: Die Performance von Abfragen über diese Shortcuts hinkte oft hinter der Performance von direkt ingestierten (eingespeisten) Daten in Eventhouses hinterher. Ursache dafür waren beispielsweise langwierige Netzwerkanfragen, fehlende Indizes und Verzögerungen durch zusätzlich notwendige Verarbeitungsschritte abseits der Eventhouse-Engine.

Wie verändert Query Acceleration das Spiel?

Die nun verfügbare Query Acceleration löst genau diese Engpass-Probleme effektiv auf. Daten, die via Shortcut aus OneLake abgefragt werden, werden dabei dynamisch indiziert und zwischen gespeichert (gecached). Das bedeutet konkret, dass Queries sogar auf großen Datenmengen, welche nicht direkt im Eventhouse gespeichert wurden, nun nahezu genauso performant ablaufen können wie native Eventhouse-Tabellen-Abfragen.

Eventhouse identifiziert dafür automatisch neue oder aktualisierte Daten in OneLake und kümmert sich eigenständig um Indizierung, Caching und entsprechende Optimierungen. Dabei ist keine aufwendige Verwaltung zusätzlicher Datenpipelines, Duplikation von Datensätzen oder manuelle Synchronisation notwendig.

Durch die Query Acceleration lassen sich unter bestimmten Voraussetzungen Performance-Steigerungen um das 50-fache und sogar mehr erzielen.

Spezielle Unterstützung für Delta Lake und Apache Iceberg

Ein besonderer Vorteil von Microsoft Fabric liegt darin, dass Accelerated OneLake Shortcuts nicht nur native Delta-Tabellen beschleunigen, sondern auch Apache Iceberg-Tabellen. Möglich ist dies dank der sogenannten Metadata-Virtualisierung innerhalb von OneLake. Dabei interpretiert OneLake Iceberg-Tabellen automatisch als Delta Lake Tabellen, indem passende Metadaten generiert werden. Somit können Unternehmen, die Apache Iceberg nutzen, ebenfalls problemlos von Performance-Gewinnen profitieren, ohne ihre bisherigen Strukturen tiefgreifend ändern zu müssen.

Praxisnahe Anwendungsszenarien für Unternehmen

Nicht nur in der Theorie, sondern vor allem in praxisnahen Unternehmenskontexten eröffnet sich eine neue Dimension der effizienten Datenanalyse:

  1. Schnelle Abfragen externer Datenquellen:
    Unternehmen, die Daten in Cloud-Speichern oder in unterschiedlichen Regionen lagern, profitieren enorm von der Möglichkeit, diese Daten jetzt ohne große Latenzzeiten performant abfragen zu können.
  2. Effizienter Mix von historischen und Echtzeitdaten:
    Besonders für industrielle IoT-Anwendungen und Real-Time Intelligence bietet sich die Möglichkeit, Streaming-Daten mit historischen Daten in OneLake nahtlos und mit optimaler Geschwindigkeit zu kombinieren.
  3. Dimensionale Daten optimal integrieren:
    Kleine, hochwertige Dimensionstabellen aus Systemen wie Azure Cosmos DB, Snowflake oder SQL-Datenbanken, die in OneLake gespiegelt werden, lassen sich jetzt besonders performant in Eventhouse-Abfragen für Joins und Anreicherungen nutzen.

Auch Siemens Healthineers bestätigt den Nutzen

Bereits in der Preview-Phase profitierten Unternehmen deutlich von Query Acceleration. Dr. Werner Zirkel von Siemens Healthineers hob beispielsweise hervor, wie effektiv und beeindruckend die Performance-Steigerung ist und betonte, dass die Innovation auch dabei hilft, die Lücke zwischen den Databricks-Teams und Fabric Real-Time Intelligence-Teams zu schließen.

Was sollte man beachten? Kosten und Verwaltung der Query Acceleration

Neben den starken Vorteilen müssen Unternehmen auch die zusätzlichen Kosten berücksichtigen, die durch Query Acceleration entstehen können. Beschleunigte Daten nutzen die „OneLake Premium Cache“-Ressourcen. Dadurch entstehen zusätzliche Abrechnungseinheiten in Ihrer Azure Fabric-Nutzung. Hinzu kommt ein gewisser Verbrauch von Kapazitätseinheiten (Capacity Units) aufgrund der Indizierungstätigkeiten. Microsoft bietet jedoch Kontrollmöglichkeiten für die beschleunigten Datenvolumen – zum Beispiel die Anpassung der Anzahl der Cache-Tage.

Alle relevanten Angaben lassen sich übersichtlich im Fabric Metrics Dashboard einsehen, sodass vollständige Transparenz und Kostenkontrolle gewährleistet ist.

Query Acceleration nutzen: Erste Schritte

Die Aktivierung der Query Acceleration erfolgt unkompliziert über wenige Klicks in der Fabric-Oberfläche beim Erstellen neuer Shortcuts:

  1. Wählen Sie die gewünschte Quelle aus (z.B. Microsoft OneLake).
  2. Selektieren Sie anschließend die betreffende Tabelle.
  3. Aktivieren Sie den Schalter „Accelerate“, bevor Sie den Shortcut erstellen.
  4. Anschließend können Sie direkt performante Abfragen nutzen (z.B. via external_table-Funktion).

Es ist üblicherweise mit einer kurzen Verzögerung zu rechnen, bis der initiale Index erstellt und die optimale Performance erreicht ist.

Fazit: Neue Maßstäbe in der Performanz und Agilität Ihrer Datenanalysen

Microsoft Fabrics neue Query Acceleration für OneLake Table Shortcuts bringt signifikante Performancegewinne, senkt gleichzeitig administrativen Aufwand und ermöglicht eine engere Integration verschiedener Plattformen und Datenformate. Dadurch wird Microsoft Fabric noch stärker als zentrale Plattform für Industrial AI, Data Engineering, Real-Time Intelligence und Cross-Plattform-Datenanalysen positioniert. Unternehmen, die bereits auf Azure und Databricks setzen, haben nun die Möglichkeit, den Wert ihrer Daten noch schneller und intuitiver zu maximieren.

Für Unternehmen, die auf Skalierbarkeit, Flexibilität und Performance setzen, ist jetzt der richtige Zeitpunkt, die Potenziale dieser Innovation zu erschließen und ihre Datenanalyselandschaft auf ein neues Niveau zu heben.

Beratung & Umsetzung aus einer Hand