NVIDIAs GB200 schlägt H100 — aber nicht überall
SemiAnalysis hat über 2.000 H100-GPUs gegen NVIDIAs neues GB200 NVL72-System antreten lassen. Das Ergebnis ist weniger eindeutig, als NVIDIA es gerne hätte.
Die harten Zahlen
Der Benchmark misst, was wirklich zählt: Model Flops Utilization (MFU), Gesamtkosten (TCO) und Kosten pro einer Million Trainings-Tokens. Keine Marketing-Folien, sondern echte Workloads auf echten Clustern.
- Getestet:** Über 2.000 H100-GPUs im direkten Vergleich mit GB200 NVL72
- Metriken:** MFU, TCO, Stromverbrauch, Zuverlässigkeit
- Fokus:** Frontier-Model-Training unter Realbedingungen
NVIDIA verkauft es zu einfach
Wer NVIDIAs Keynotes glaubt, denkt: Blackwell ist in allem besser. Die Realität ist komplizierter. Stromverbrauch, Zuverlässigkeit und Software-Reife spielen eine massive Rolle bei den Gesamtkosten. Ein schnellerer Chip nützt wenig, wenn er öfter ausfällt oder doppelt so viel Strom frisst.
Software macht den Unterschied
Ein zentrales Ergebnis: Die Software-Optimierung über die Zeit verbessert die Performance beider Systeme erheblich. Wer heute benchmarkt, bekommt morgen andere Zahlen. Das macht Kaufentscheidungen für Hyperscaler zu einem Timing-Problem.
Warum das wichtig ist
Frontier-Model-Training kostet Hunderte Millionen Dollar. Jedes Prozent MFU-Unterschied bedeutet Millionen an Mehrkosten. Für Microsoft, Google und Meta ist diese Analyse kein Nerd-Hobby — sie entscheidet über Milliarden-Budgets.