Eine Datenplattform, die jede Abfrage zusammenführt
Cloudflare hat am 28. Mai 2026 seine interne Datenplattform „Town Lake“ samt dem KI-Agenten „Skipper“ vorgestellt. Ziel: Der Zugang zur riesigen Dateninfrastruktur des Unternehmens soll sich nicht mehr auf Data-Engineers beschränken — Mitarbeitende sollen Daten in natürlicher Sprache abfragen können. Es ist ein lehrreiches Muster für jede Organisation, die KI-Datenanalyse demokratisieren will.
Der Kern ist eine einzige SQL-Abfrageschicht (Apache Trino) über bislang getrennte Systeme: Postgres, ClickHouse und Apache-Iceberg-Tabellen auf R2. Eine Abfrage, viele Quellen — ohne dass Nutzer wissen müssen, wo welche Daten liegen.
Die Bausteine von Town Lake
Was Daten- und Plattform-Teams wissen müssen:
- Query-Engine (Trino): eine SQL-Abfrage über Postgres, ClickHouse und Iceberg-Tabellen auf R2
- R2 Data Catalog: verwalteter Iceberg-Dienst mit Schema-Evolution und Time-Travel
- DataHub: zentraler Metadaten-Katalog für Tabellen, Spalten, Ownership und Lineage
- Lifeguard: dynamische Zugriffssteuerung der Berechtigungen
- Skimmer: PII-Erkennung über Workers AI zur automatischen Klassifizierung
- Transformer: ELT-Engine auf Basis von Workflows für Datentransformationen
Skipper: Natürliche Sprache statt 300 Zeilen SQL
Der Agent Skipper übersetzt Fragen in natürlicher Sprache in SQL, führt die Abfrage aus und liefert validierte Antworten. Er baut teilbare Dashboards und lässt sich über einen MCP-Server direkt in der IDE nutzen. Der Effekt auf die Praxis ist messbar: Komplexe Alt-Abfragen schrumpften von 200 bis 300 Zeilen auf fünf Zeilen.
Die Nutzung konzentriert sich dort, wo viele Fragen entstehen: 53 Prozent aller Abfragen betreffen Billing — 91.760 Abfragen von 324 Mitarbeitenden.
Governance: „Default-Closed“ als Prinzip
Sicherheitsseitig ist die Plattform standardmäßig geschlossen: Tabellen sind erst nach einem Review zugänglich. Sensible Spalten werden automatisch geschwärzt, der Zugriff auf PII erfordert ein explizites Opt-in pro Session samt vollständigem Audit-Log.
Genau dieser Punkt unterscheidet eine demokratisierte Datenplattform von einem Daten-Leck-Risiko: Breiter Zugang funktioniert nur, wenn Klassifizierung, Zugriffskontrolle und Protokollierung in die Architektur eingebaut sind — nicht nachträglich angeflanscht.
Fazit
Für Daten- und Plattform-Teams ist Town Lake eine konkrete Referenzarchitektur: eine Abfrageschicht über heterogene Quellen, ein KI-Agent als Zugang, Governance per Default. Wer KI-Datenanalyse im eigenen Haus öffnen will, sollte die Reihenfolge ernst nehmen — erst Katalog, Klassifizierung und Zugriffsmodell, dann der Natural-Language-Agent obendrauf. Andernfalls skaliert man Schatten-Abfragen statt Erkenntnissen.