🏆 TOOLS
Microsoft macht Bildmodelle 20× effizienter
Microsoft Research feuert mit Lens ein offenes Text-zu-Bild-Modell raus. 3,8 Milliarden Parameter — und es zersägt Konkurrenten mit 80 Milliarden.
Microsoft Research feuert mit Lens ein offenes Text-zu-Bild-Modell raus. 3,8 Milliarden Parameter — und es zersägt Konkurrenten mit 80 Milliarden.
Die harten Zahlen
- 3,8 Mrd.** — Parameter von Lens
- 80 Mrd.** — Parameter der geschlagenen Konkurrenz
- 800 Mio.** — Bildunterschriften von GPT-4.1 fürs Training
- 1/5** — des üblichen Trainingsaufwands
Der Trick dahinter
Microsoft schmeißt vage Alt-Texte aus dem Web in die Tonne. Stattdessen lässt das Team GPT-4.1 ausführliche Bildunterschriften generieren. Saubere Daten schlagen massive Modelle.
✅ Pro
- Open Source unter MIT-Lizenz
- Code UND Gewichte verfügbar
- Massiv günstiger im Training
- Schlägt Modelle 20× seiner Größe
❌ Con
- Datenpipeline hängt an GPT-4.1
- Microsoft trainiert mit Konkurrenz-Output
💡 Was das bedeutet
Wer 2026 noch Milliarden in Bild-Riesenmodelle pumpt, hat den Schuss nicht gehört. Caption-Qualität ist der neue Hebel — nicht Parameter-Zählerei. Indie-Studios und kleine Labs können jetzt mitspielen.
🤖 NERDMAN-URTEIL
Microsoft beweist mit Open Weights, was OpenAI hinter Paywalls versteckt — gute Daten schlagen fette Modelle.
Quelle: The Decoder
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.