🏆 TOOLS
Google macht Gemini-API billiger — mit Haken
Google bringt zwei neue Preisstufen für die Gemini-API. Flex und Priority heißen die neuen Tiers — und Entwickler müssen sich jetzt entscheiden: Geld sparen oder Geschwindigkeit ...
Google bringt zwei neue Preisstufen für die Gemini-API. Flex und Priority heißen die neuen Tiers — und Entwickler müssen sich jetzt entscheiden: Geld sparen oder Geschwindigkeit kriegen.
Was sich ändert
Die Gemini-API bekommt ein Dreiklassen-System. Bisher gab es einen Tarif, jetzt sind es drei. Google will damit Entwickler ködern, die bisher wegen der Kosten gezögert haben.
⚖️ Die drei Tiers im Vergleich
- Priority:** Höchste Zuverlässigkeit, niedrigste Latenz — aber teuerster Tarif. Für Produktions-Apps, wo jede Millisekunde zählt.
- Standard:** Der bisherige Default. Bleibt wie gehabt.
- Flex:** Deutlich günstiger, dafür keine Latenz-Garantie. Requests werden abgearbeitet, wenn Kapazität frei ist.
✅ Pro
- Flex macht Batch-Jobs und Experimente billiger
- Entwickler können pro Request den Tier wählen
- Priority gibt SLA-Garantien für kritische Workloads
❌ Con
- Flex-Latenz ist unvorhersehbar — für Echtzeit-Apps unbrauchbar
- Noch ein Pricing-Modell mehr im API-Dschungel
- Klingt nach AWS-Spot-Instances — und die nerven auch
💡 Was das bedeutet
Google kopiert das bewährte Cloud-Playbook: Billig-Tier als Einstiegsdroge, Premium-Tier für zahlende Kunden. Für Hobby-Entwickler und Prototypen ist Flex ein guter Deal. Wer aber Production-Traffic drüber schickt, zahlt am Ende bei Priority mehr als vorher.
🤖 NERDMAN-URTEIL
Flex ist Googles Versuch, OpenAI die Bastler-Crowd abzujagen — clever, aber wer billig kauft, wartet halt.
Quelle: Google AI Blog
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.