Naver baut Video-KI aus echten Straßenfotos
Südkoreas Tech-Riese Naver hat eine Video-KI gebaut, die nicht auf synthetischen Daten trainiert wurde — sondern auf über einer Million echter Street-View-Aufnahmen aus Seoul.
Wie es funktioniert
Das "Seoul World Model" nutzt reale Stadtgeometrie als Trainingsgrundlage. Keine CGI-Welten, keine Game-Engines. Echte Straßen, echte Gebäude, echte Perspektiven. Die KI lernt, wie sich eine Kamerafahrt durch eine Stadt anfühlen muss — aus Daten, die Naver selbst gesammelt hat.
💡 Was das bedeutet
Die meisten Video-Weltmodelle kämpfen mit einem Problem: Sie halluzinieren Geometrie. Gebäude kippen, Straßen biegen sich, Physik ist optional. Naver geht den umgekehrten Weg — erst die echte Welt verstehen, dann generieren.
Der eigentliche Clou
Das Modell generalisiert auf fremde Städte. Ohne Finetuning. Trainiert auf Seoul, funktioniert anderswo. Das ist bemerkenswert, weil Stadtgeometrie sich weltweit ähnelt — Straßen, Kreuzungen, Fassaden folgen Mustern.
✅ Pro
- Trainiert auf echten Geodaten statt synthetischem Material
- Generalisiert ohne Finetuning auf unbekannte Städte
- Naver hat eigene Street-View-Daten — kein Google-Abhängigkeit
❌ Con
- Bisher ein Forschungsprojekt, kein Produkt
- Über eine Million Bilder nur aus Seoul — kultureller Bias möglich
- Kein großes Lab dahinter, das global Druck machen könnte
Zahlenbox
- 1 Mio.+** — Street-View-Aufnahmen als Trainingsbasis
- 0** — Finetuning-Schritte für neue Städte nötig
- Naver** — Südkoreas größter Internetkonzern (Marktführer vor Google im Land)