🏆 TOOLS
IBM verschenkt Multilingual-Embeddings mit 32K-Kontext
IBM haut sein neues Granite Embedding Multilingual R2 raus — Apache 2.0, frei nutzbar, kommerziell. Unter 100M Parametern, aber dickes Selbstbewusstsein beim Retrieval.
IBM haut sein neues Granite Embedding Multilingual R2 raus — Apache 2.0, frei nutzbar, kommerziell. Unter 100M Parametern, aber dickes Selbstbewusstsein beim Retrieval.
Was IBM da rausballert
Ein Embedding-Modell für mehrsprachige Suche, RAG und semantische Ähnlichkeit. Klein genug für lokales Deployment, groß genug für ernste Workloads. 32K Kontext — das ist die Ansage.
- Lizenz:** Apache 2.0 (kein Lizenz-Bullshit)
- Parameter:** unter 100M
- Kontext:** 32.000 Token
- Sprachen:** multilingual
- Plattform:** Hugging Face, Download sofort verfügbar
✅ Pro
- Kommerziell nutzbar ohne juristisches Kopfzerbrechen
- 32K Kontext in dieser Größenklasse selten
- Klein genug für günstige Infrastruktur
- Multilingual aus einem Modell statt drei
❌ Con
- Sub-100M heißt: kein Wunder-Reasoning
- Embeddings sind kein End-to-End-Stack — du baust das Drumherum selbst
- Benchmark-Wins sind Momentaufnahmen, die Konkurrenz schläft nicht
💡 Was das bedeutet
Wer RAG-Systeme baut und keine Lust auf OpenAI-Embedding-Kosten oder Cohere-Lock-in hat, hat hier eine ernste Open-Source-Option. Apache 2.0 macht es auch für Firmen safe, die auf Lizenzen achten müssen.
🤖 NERDMAN-URTEIL
IBM macht Open-Source ernster als die meisten Marketing-Slides der Konkurrenz — runterladen und ausprobieren statt diskutieren.
Quelle: Hugging Face Blog
War dieser Artikel hilfreich?
Dein Feedback hilft uns, bessere Artikel zu liefern.