🤖 AGENTS
Cohere lässt 218 Milliarden Parameter auf 2 GPUs los
Cohere hat Command A+ veröffentlicht. Ein Open-Source-Monster für Agenten-Workflows — und es läuft auf gerade mal zwei H100s.
Cohere hat Command A+ veröffentlicht. Ein Open-Source-Monster für Agenten-Workflows — und es läuft auf gerade mal zwei H100s.
Was Cohere da gebaut hat
Command A+ ist ein Sparse-MoE-Modell mit 218 Milliarden Parametern. Apache 2.0, frei nutzbar, kommerziell einsetzbar. Vier alte Command-Modelle wurden in einem zusammengeschmolzen.
Die harten Zahlen
- 218 Mrd.** — Gesamtparameter im MoE-Setup
- 2** — H100 GPUs reichen für den Betrieb
- 4** — Vorgängermodelle in einem vereint (A, Reasoning, Vision, Translate)
- Apache 2.0** — keine Lizenzfallen, kein Kleingedrucktes
Wofür das Ding gemacht ist
- Agentic Workflows:** der primäre Fokus, nicht Chitchat
- RAG:** Retrieval-Augmented Generation out of the box
- Multilingual:** echte Mehrsprachigkeit, nicht nur Englisch mit Akzent
- Multimodal:** Dokumente mit Bildern werden verstanden
- Reasoning:** logisches Denken statt Wahrscheinlichkeits-Roulette
💡 Was das bedeutet
Zwei H100s sind teuer, aber im Enterprise-Maßstab Peanuts. Wer bisher GPT-4 oder Claude für Agenten-Pipelines bezahlt hat, kann jetzt selbst hosten — ohne Token-Rechnung und ohne Daten an US-Anbieter zu schicken. Genau das wollen europäische Konzerne hören.
⚖️ Cohere vs. die Konkurrenz
- Lizenz:** Apache 2.0 schlägt OpenAI (closed) und Anthropic (closed) klar
- Größe:** 218B MoE spielt in der Liga von Llama 3.1 405B
- Hardware:** 2 H100s sind weniger als die meisten 200B+-Modelle brauchen
- Fokus:** explizit auf Agenten gebaut, nicht Allzweck-Chatbot
🤖 NERDMAN-URTEIL
Cohere positioniert sich als der Enterprise-Liebling für alle, die Open-Weight wollen ohne Meta-Drama — und das könnte tatsächlich funktionieren.
Quelle: MarkTechPost
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.