Ein neues Paper auf arXiv will die größte Schwäche von RAG-Systemen knacken: dummes Chunking. Statt Dokumente stur in gleich große Häppchen zu zerschneiden, soll der User-Query ...
Wer mit KI redet, will nicht warten. Salesforce AI Research hat ein neues Framework vorgestellt, das die Antwortzeit von sprachbasierten RAG-Systemen um das 316-Fache drückt.
Ein neues Retrieval-System schmeißt Embeddings über Bord. PageIndex findet relevante Dokument-Stellen nicht durch Ähnlichkeit, sondern durch Reasoning.
Große Context Windows lösen nicht alles. Chroma hat das kapiert und liefert jetzt Context-1 — ein eigenes 20B-Modell, das Retrieval komplett neu denkt.
NASA-Kreativchef David Rager spricht auf dem "Artist and the Machine"-Summit in New York über Markenkommunikation im Zeitalter generativer KI. Klingt nach Buzzword-Bingo, ist aber ...
Ein neues Open-Source-Projekt auf GitHub will RAG komplett umkrempeln — ohne Embeddings, ohne Chunking, ohne Vector DB.
Lange Context Windows lösen das Retrieval-Problem nicht. Chroma sagt: Wir brauchen ein eigenes Modell dafür — und liefert eins.
IBM haut sein neues Granite Embedding Multilingual R2 raus — Apache 2.0, frei nutzbar, kommerziell. Unter 100M Parametern, aber dickes Selbstbewusstsein beim Retrieval.
Vergessen Sie langweilige Chatbots. Jetzt kommt Kyohansha – ein KI-Avatar, der Sie in 60 Bildern pro Sekunde anschaut.
Forscher wollen Sprachmodellen beibringen, sich an frühere Denkwege zu erinnern. Klingt simpel. Ist es aber nicht.
Microsoft droppt Harrier-OSS-v1 — eine Familie von drei multilingualen Embedding-Modellen, die auf dem Multilingual MTEB v2 Benchmark den Thron übernehmen.
Microsoft schmeißt drei neue Multilingual-Embedding-Modelle auf den Markt. Harrier-OSS-v1 heißt die Familie — und sie räumt den wichtigsten Benchmark ab.
KI-Modelle können coden. Aber sie kennen ihre eigenen Updates nicht. Google hat jetzt einen simplen Fix dafür.
OpenAI schnappt sich Rockset, eine Echtzeit-Datenbank-Firma aus dem Silicon Valley. Der Deal zeigt: Das Rennen um KI wird nicht nur mit Modellen gewonnen, sondern mit ...
Ein Tutorial bei Towards AI erklärt, wie moderne militärische Aufklärung LLMs mit Knowledge Graphs und GNNs verschmilzt. Keine neue Demo, kein Release — aber ein Blick in die ...
Forscher zeigen: Wenn KI-Modelle während der Nutzung weiterlernen, lassen sich ihre Sicherheitsfilter knacken. Eine neue arXiv-Studie nennt drei konkrete Angriffsmethoden.
Die US-Cybersicherheitsbehörde CISA hat zwei kritische Schwachstellen in ihre Liste aktiv ausgenutzter Bugs aufgenommen. Eine davon trifft ausgerechnet Langflow — das beliebte ...
Cohere hat Command A+ veröffentlicht. Ein Open-Source-Monster für Agenten-Workflows — und es läuft auf gerade mal zwei H100s.
Eine kritische Sicherheitslücke in ChromaDB lässt Angreifer fremde Server kapern. Betroffen: tausende KI-Apps, die auf der Vektor-Datenbank laufen.
Sebastian Raschka ist zurück aus der Familienpause und liefert einen Überblick, der Engineers aufhorchen lässt. Open-Weight-Modelle schrauben gerade alle am gleichen Problem: ...