Wie Databricks mit KI und Data Engineering die Suche nach Kundenreferenzen revolutioniert
Autor: Ailio GmbH Team | Veröffentlicht am: 2. März 2026
Einleitung: Das Problem mit Kundenstories
Im B2B-Sales-Alltag ist sie oft die wichtigste Frage: „Gibt es schon Kunden, die einen ähnlichen Anwendungsfall mit eurer Lösung erfolgreich umgesetzt haben?“ Die Suche nach passenden Kundenreferenzen jedoch ist mühsam, zeitaufwändig und selten wirklich systematisch gelöst – insbesondere, wenn relevante Stories über viele Kanäle, Plattformen und Formate verstreut sind. Die Folge: High-Value-Referenzen werden überbeansprucht, neue Use Cases bleiben unentdeckt und Marketing wie Vertrieb schöpfen das Potenzial von Kundenerfolgsgeschichten nicht aus.
Reffy: Ein smarter Ansatz zur Story-Discovery auf der Databricks-Plattform
Um dieses Problem zu lösen, hat Databricks eine innovative Anwendung namens Reffy entwickelt. Ziel war es, alle Kundenreferenzen über verschiedene Datenquellen hinweg zusammenzuführen, automatisiert zu analysieren und auffindbar zu machen – für mehr Relevanz, Effizienz und Wirkung im Sales- und Marketingprozess.
Über 1.800 Mitarbeiter:innen aus Vertrieb und Marketing haben Reffy in den ersten zwei Monaten genutzt und mehr als 7.500 gezielte Suchanfragen gestellt. Das Resultat: Schnellere Kampagnenumsetzung, konsistente Storytelling-Qualität und ein effizienter Einsatz wertvoller Kundenerfolge.
Architektur und Funktionsweise: Moderne Datenplattform trifft Agentic KI
Reffy vereint die Stärken verschiedener Databricks-Komponenten sowie moderner Large Language Models und RAG-Konzepte (Retrieval-Augmented Generation):
- Datenintegration & ETL: Über Python-basierte Webscraping-Lösungen werden Inhalte aus YouTube, LinkedIn, Medium und öffentlichen Databricks-Kundenstories automatisiert gesammelt. Interne Materialien (Slides, Docs) werden via Google Apps Scripts zentralisiert. Die gesammelten Geschichten werden mit Metadaten angereichert und landen in einer Delta Lake-Tabelle.
- Qualitätsbewertung durch KI: Ein KI-gestütztes Scoringmodell bewertet jede Story nach über 30 Kriterien: Welche Herausforderungen und Use Cases werden adressiert? Gibt es messbare Outcomes? Wie glaubwürdig ist die Story? Für Filter, Strukturierung und weiterer Analyse werden die Daten intensiv mit KI-Funktionen aufbereitet, etwa zur Extraktion von Branche, Produktbezug und Zitaten.
- Aufbereitung für KI-Retrieval: In einer „Gold-Tabelle“ werden nur die wertvollsten, gut bewerteten Stories abgelegt und zusammengefasst, bevor sie als Index in den leistungsfähigen Databricks Vector Search geschrieben werden. Dies ermöglicht hochperformante und semantisch präzise Suchen.
- Agentic KI für effizientes Storytelling: Mithilfe des DSPy-Frameworks wird eine KI-gestützte Agentenlösung entwickelt, die flexibel zwischen schlagwortbasierten Antworten und fundierten LLM-Antworten unterscheidet. Eine Nachreihung via Databricks-eigener Reranking-Technologie sorgt dafür, dass stets die besten Stories zur jeweiligen Anfrage geliefert werden.
- Moderne App-Architektur: Das Frontend basiert auf React, während das Backend mit FastAPI direkt auf die Databricks Python SDK zugreifen kann. Die Nutzung von Lakebase als Datenspeicher für Chatverläufe erlaubt schnelle Reads/Writes und ein sicheres, auditierbares Logging.
Monitoring, Insights und kontinuierliche Verbesserung
Mit Reffy wird nicht nur die Suche nach Kundenreferenzen smarter: Per Dashboard werden Nutzungsdaten, Suchverläufe und Antwortqualität kontinuierlich ausgewertet. Künstliche Intelligenz hilft zudem, Muster und Potenziallücken (z.B. fehlende Stories zu neuen Produkten oder Branchen) in Echtzeit zu erkennen. Die gesammelten Erkenntnisse fließen wieder in die Content-Pflege und Produktentwicklung zurück – ein durchgängiges Ökosystem aus Data Engineering, KI und Business Value.
Vorteile und Chancen für Unternehmen
- Effizienzsteigerung im Vertrieb und Marketing: Stories werden passgenau auffindbar, schnelle Reaktionszeiten werden möglich, und der manuelle Koordinationsaufwand sinkt drastisch.
- Qualitätsgesicherte Narrative: Dank strukturiertem Scoring und KI-Prüfung werden nur die besten, aktuellsten Geschichten genutzt – weniger „Flurfunk“, mehr belastbares Storytelling.
- Self-Service und Skalierbarkeit: Anwender können ohne tiefe technische Kenntnisse relevante Referenzen finden und direkt nutzbar machen – auch bei wachsenden Datenmengen und wachsenden Teams.
- Datenbasierte Content-Strategie: Über Monitoring und Analyse lassen sich Content-Lücken zielgerichtet schließen und gezielt neue Use Cases entwickeln.
- Kosteneffizienz: Die Lösung setzt auf vorhandene Databricks-Infrastruktur und ressourcenoptimierte KI-Komponenten, was die Betriebskosten reduziert.
Lehren und Best Practices für Industrial AI und Data Engineering
Das Reffy-Projekt zeigt beispielhaft, dass technologische Exzellenz und Organisation zusammengehören: Fachübergreifende Zusammenarbeit zwischen Data Engineering, Marketing, Vertrieb und PR ist essenziell für nachhaltigen Geschäftserfolg. Ebenso wichtig ist ein iteratives Vorgehen mit Fokus auf Datenqualität, Metadatenpflege und Monitoring: KI ohne saubere, reichhaltige Datenbasis bleibt wirkungslos – erst die Kombination führt zum echten Mehrwert.
Für Unternehmen im industriellen Kontext, die mit ähnlichen Herausforderungen rund um „Wissen im Fluss“, Kundenreferenzen, Use Cases oder internes Know-how kämpfen, liefert der Ansatz von Databricks Inspiration und Blaupause für eigene Lösungen.
Fazit
Mit Reffy demonstriert Databricks, wie moderne Datenplattformen, KI und ausgefeilte Engineering-Methoden Mitarbeiter produktiver machen, Wissen demokratisieren und die Qualität von Storytelling auf ein neues Niveau heben können. Der Business-Nutzen ist heute messbar; die Potenziale, Reffy durch APIs und Workflow-Integrationen weiterzuentwickeln, sind enorm. Wer die Möglichkeiten von Databricks, Azure oder Industrial AI gezielt nutzen möchte, kann hier viel lernen – und mit dem richtigen Partner eigene Innovationsprojekte schneller und wirkungsvoller umsetzen.
Ailio GmbH – Ihr Experte für Data Science, KI und Databricks-Lösungen im B2B und Industrial-Sektor