ChatGPT bekommt ein neues Bildmodell. "Images 2.0" soll detailliertere Bilder liefern und endlich Text richtig rendern können.
Vision-Language-Modelle liefern Top-Scores auf Englisch. Aber fragt man sie auf Hindi oder Tamil, wird's peinlich.
Ein neues Mini-Tool übersetzt normales Englisch in lupenreinen LinkedIn-Bullshit. Seit einem Monat online, bereits ein Internetliebling.
Interpretability-Forschung war bisher Lesen im Kaffeesatz. Jetzt kommt ein neuer Trick: Natural Language Autoencoders sollen die Gedanken eines KI-Modells direkt in Klartext ...
Vergessen Sie Python oder Bash. Jetzt schreiben Sie Ihre Skripte auf Englisch. Ein Hacker zeigt, wie.
Google hat ein neues Feature für seinen Browser vorgestellt: Skills in Chrome. Ab dem 14. April 2026 können Nutzer ihre meistgenutzten KI-Prompts als wiederverwendbare ...
Emotionen aus Sprache lesen — das können Maschinen längst. Aber bisher fast nur auf Englisch, Deutsch oder Chinesisch. Ein Forscherteam hat jetzt ein System gebaut, das auch ...
Forschende nutzen künstliche Intelligenz, um eines der ältesten kolonialen Probleme zu lösen. Jahrtausendealte Texte aus Mesopotamien waren bisher fast nur auf Englisch ...
Neuphonic wirft ein neues Text-to-Speech-Modell auf HuggingFace. Läuft lokal, frisst kaum Ressourcen — und kann sogar Deutsch.
Ein 13-Milliarden-Parameter-Modell, das nie vom Zweiten Weltkrieg gehört hat. Kein Witz — genau das haben Forscher um Nick Levine, David Duvenaud und Alec Radford gebaut.
Drei Forscher haben ein Sprachmodell gebaut, das nur Text von vor 1931 kennt. 13 Milliarden Parameter, trainiert auf 260 Milliarden Tokens — alles aus einer Zeit, als Radio noch ...
Forscher haben GPT-4, Claude und Co. auf indische YouTube-Videos losgelassen — und die Modelle sind krachend gescheitert. Die Aufgabe: Erkennen, ob jemand Kuhurin (Gomutra) ...
Nvidia hat ein neues multilinguales OCR-Modell vorgestellt — trainiert nicht mit echten Dokumenten, sondern mit synthetischen Daten. Nemotron OCR v2 heißt das Ding und landet ...
Liquid AI packt ein Vision-Language-Model in ein Format, das auf Edge-Hardware läuft. Das neue LFM2.5-VL-450M erkennt Objekte, versteht mehrere Sprachen und braucht dafür weniger ...
Microsoft droppt Harrier-OSS-v1 — eine Familie von drei multilingualen Embedding-Modellen, die auf dem Multilingual MTEB v2 Benchmark den Thron übernehmen.
Wer glaubt, GPT-5 und Claude Opus hätten eine feste Meinung, irrt. Eine neue Untersuchung zeigt: Dieselben Modelle urteilen anders, je nachdem ob man sie auf Deutsch, Englisch ...
Anthropic (Top-Lab) veröffentlicht technisches Statement zur Klärung eines früheren Vorfalls (Model-Misalignment). Artikel basiert auf deren offiziellem Blog-Post. + 2 für ...
Ein neues Tool verwandelt deinen Rechner in einen persönlichen Assistenten. Du sagst, was du willst – die KI führt es aus.
Google hat auf der Entwicklerkonferenz I/O 2024 einen neuen KI-Assistenten namens "Gemini Intelligence" für Android-Smartphones vorgestellt. Die KI soll direkt in das ...
Forscher haben eine Methode gebaut, die LLM-Aktivierungen in normalen Sätzen beschreibt. Unüberwacht. Ohne Labels. Ohne menschliches Zutun.