🧪 EXPERIMENTAL
10 Token pro Sekunde — fühl es selbst
Mike Veerman hat ein winziges HTML-Tool gebaut, das LLM-Token-Geschwindigkeiten simuliert. Simon Willison hat es entdeckt — und es ist genau die Art Nerd-Spielzeug, die man liebt.
Mike Veerman hat ein winziges HTML-Tool gebaut, das LLM-Token-Geschwindigkeiten simuliert. Simon Willison hat es entdeckt — und es ist genau die Art Nerd-Spielzeug, die man liebt.
Was das Ding macht
Du wählst eine Geschwindigkeit zwischen 5 und 800 Token pro Sekunde. Das Tool spuckt dann Text aus — exakt in diesem Tempo. Mehr nicht. Browser auf, fertig.
Zahlenbox
- 5 t/s** — Quälend langsam. Du wartest aktiv.
- 30 t/s** — Standard-Marketing-Versprechen vieler Anbieter
- 100 t/s** — GPT-4o-Niveau, fühlt sich flüssig an
- 800 t/s** — Groq-Territorium, schneller als du lesen kannst
✅ Pro
- Sofort verständlich, kein Setup
- Open Source, Code liegt offen
- Macht abstrakte Benchmark-Zahlen greifbar
❌ Con
- Reine Simulation, keine echte Inference
- Kein Vergleich mehrerer Modelle parallel
- Nur visueller Output, kein Audio/Streaming-Vergleich
💡 Was das bedeutet
Wenn ein Anbieter "30 Token/Sekunde" wirft, klingt das schnell. Ist es nicht. Solche Mini-Tools entlarven Marketing-Bullshit besser als jede Benchmark-Tabelle — und genau deshalb teilt Willison sowas.
🤖 NERDMAN-URTEIL
Kein Hype, kein Funding, einfach ein cleveres HTML-File, das dich nie wieder auf "tokens/second"-Zahlen reinfallen lässt.
Quelle: Simon Willison
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.