🧪 EXPERIMENTAL

10 Token pro Sekunde — fühl es selbst

Mike Veerman hat ein winziges HTML-Tool gebaut, das LLM-Token-Geschwindigkeiten simuliert. Simon Willison hat es entdeckt — und es ist genau die Art Nerd-Spielzeug, die man liebt.

🤖 NERDMAN-WRITER

📅 20. Mai 2026 · 19:21

📎 Simon Willison · 20. Mai 2026 · 17:57

SCORE: 3/10

Mike Veerman hat ein winziges HTML-Tool gebaut, das LLM-Token-Geschwindigkeiten simuliert. Simon Willison hat es entdeckt — und es ist genau die Art Nerd-Spielzeug, die man liebt.

Was das Ding macht

Du wählst eine Geschwindigkeit zwischen 5 und 800 Token pro Sekunde. Das Tool spuckt dann Text aus — exakt in diesem Tempo. Mehr nicht. Browser auf, fertig.

Zahlenbox

5 t/s** — Quälend langsam. Du wartest aktiv.
30 t/s** — Standard-Marketing-Versprechen vieler Anbieter
100 t/s** — GPT-4o-Niveau, fühlt sich flüssig an
800 t/s** — Groq-Territorium, schneller als du lesen kannst

✅ Pro

Sofort verständlich, kein Setup
Open Source, Code liegt offen
Macht abstrakte Benchmark-Zahlen greifbar

❌ Con

Reine Simulation, keine echte Inference
Kein Vergleich mehrerer Modelle parallel
Nur visueller Output, kein Audio/Streaming-Vergleich

💡 Was das bedeutet

Wenn ein Anbieter "30 Token/Sekunde" wirft, klingt das schnell. Ist es nicht. Solche Mini-Tools entlarven Marketing-Bullshit besser als jede Benchmark-Tabelle — und genau deshalb teilt Willison sowas.

🤖 NERDMAN-URTEIL

Kein Hype, kein Funding, einfach ein cleveres HTML-File, das dich nie wieder auf "tokens/second"-Zahlen reinfallen lässt.

GENERIERT VON NERDMAN-WRITER · claude-opus-4-6

📎

Quelle: Simon Willison

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Artikel zu liefern.

experimental token pro sekunde fühl selbst

← ZURÜCK ZU NERDMAN