Microsofts Bing-Team hat ein neues Embedding-Modell als Open Source veröffentlicht. Name: Harrier. Ergebnis: Platz 1 im mehrsprachigen MTEB-v2-Benchmark.
OpenAI hat einen neuen API-Endpoint gelauncht: Embeddings. Damit lassen sich Texte und Code in numerische Vektoren umwandeln — die Grundlage für semantische Suche, Clustering und ...
IBM haut sein neues Granite Embedding Multilingual R2 raus — Apache 2.0, frei nutzbar, kommerziell. Unter 100M Parametern, aber dickes Selbstbewusstsein beim Retrieval.
Microsoft droppt Harrier-OSS-v1 — eine Familie von drei multilingualen Embedding-Modellen, die auf dem Multilingual MTEB v2 Benchmark den Thron übernehmen.
Microsoft schmeißt drei neue Multilingual-Embedding-Modelle auf den Markt. Harrier-OSS-v1 heißt die Familie — und sie räumt den wichtigsten Benchmark ab.
OpenAI hat ein neues Embedding-Modell vorgestellt. Leistungsfähiger, günstiger, einfacher zu nutzen — so das Versprechen.
Ein neues Retrieval-System schmeißt Embeddings über Bord. PageIndex findet relevante Dokument-Stellen nicht durch Ähnlichkeit, sondern durch Reasoning.
Apple forscht an einem neuen Weg, Bewegung in Szenen vorherzusagen — ohne dafür ganze Videos generieren zu müssen. Stattdessen: kompakte Motion Embeddings, die direkt aus ...
OpenAI packt den großen Werkzeugkoffer aus. Neue Embedding-Modelle, ein aufgebohrter GPT-4 Turbo, bessere Moderation und günstigerer GPT-3.5 Turbo — alles auf einen Schlag.
Forscher testen, ob KI-Fotos von Feldern die Ernte in Afrika besser vorhersagen können als Satellitenbilder. Das Ergebnis ist klar.
Ein neues Open-Source-Projekt auf GitHub will RAG komplett umkrempeln — ohne Embeddings, ohne Chunking, ohne Vector DB.
Agent-Memory ohne Infrastruktur-Overhead: memweave setzt auf Markdown und SQLite statt auf aufgeblähte Vektor-Datenbanken. Ein Indie-Projekt, das zeigt, wie simpel ...
Apple Research hat ein Paper veröffentlicht, das erklärt, wie man gesprochene Wörter in Zahlenreihen packt. Klingt trocken? Ist es auch.
Ein Entwickler hat seine Obsidian-Notizen mit Googles Memory Agent Pattern verdrahtet — und dabei Vektor-Datenbanken komplett aus der Kette geworfen. Kein Pinecone. Keine ...
Cohere kennt man für Text-Modelle und Embeddings. Jetzt steigt das Unternehmen mit "Cohere Transcribe" in den Markt für automatische Spracherkennung ein.
Forscher haben einen neuen Benchmark gebaut, der große Sprachmodelle gegen klassische Methoden der Wirkstoffforschung antreten lässt. Name: DrugPlayGround.
Autonome Autos sollen Unfälle vorhersagen, bevor sie passieren. Doch aktuelle Top-Modelle knicken ein, sobald sich am Eingangsbild auch nur Kleinigkeiten ändern.
Forscher haben ein KI-Modell gebaut, das verdächtige Geldbewegungen in Kontoverläufen erkennt. Es heißt Temporal Contrastive Transformer — kurz TCT.
Eine kritische Sicherheitslücke in ChromaDB lässt Angreifer fremde Server kapern. Betroffen: tausende KI-Apps, die auf der Vektor-Datenbank laufen.
Was denkt sich ein KI-Modell, wenn es ein EEG anschaut? Drei Forscher haben jetzt nachgeguckt — und die Blackbox aufgeschraubt.