OpenAI hat ein neues Mini-Modell vorgestellt. GPT-4o mini soll das günstigste kleine Modell auf dem Markt sein — und trotzdem ordentlich liefern.
Ein winziges Gemma-Modell mit nur 2 Milliarden Parametern erkennt Misalignment in fremden KI-Antworten. Es wurde nur auf Code trainiert — und urteilt trotzdem über allgemeine ...
OpenAI bringt o1-mini raus — ein kleineres Reasoning-Modell, das weniger kostet und trotzdem denken kann.
Fastino Labs hat GLiGuard veröffentlicht. Ein Mini-Modell für Safety-Checks, das große Brüder in die Tasche steckt. Und es ist kostenlos.
Ein winziger KI-David fordert die milliardenschweren Goliaths heraus. Zyphra AI hat ZAYA1-8B veröffentlicht – ein Mini-Modell, das auf AMD-Hardware trainiert wurde und auf ...
Nur 3 Milliarden aktive Parameter — und trotzdem auf Augenhöhe mit Modellen, die zehnmal so groß sind. Das Qwen-Team hat Qwen3.6-35B-A3B veröffentlicht, ein Open-Weight ...
Ein Fisch soll uns zeigen, wie Sprachmodelle wirklich ticken. GuppyLM ist ein bewusst winziges Language Model — gebaut nicht für Performance, sondern für Verständnis.
Mistral hat ein neues Open-Source-Modell für Sprachgenerierung veröffentlicht. Das Ding ist so klein, dass es auf einer Smartwatch oder einem Smartphone läuft.
Ein Open-Source-Speedrun jagt den schnellsten Trainings-Algorithmus für GPT-2-Niveau. Aktueller Rekord: 90 Sekunden auf 8 H100s.
Anthropic sagt: Unser Cybersecurity-Modell „Claude Mythos" ist zu gefährlich für die Öffentlichkeit. Klingt dramatisch. Ist es aber offenbar nicht.