Forscher haben LoRA, die Standard-Methode zum Anpassen großer KI-Modelle, repariert. Das neue BaLoRA bringt Bayessche Statistik ins Spiel – für mehr Genauigkeit und vor allem ...
Apple-Forscher haben ein neues Rezept für bessere Bild-KI. Sie füttern ihr System mit Text, um die Unsicherheit beim Lernen zu killen.
MIT-Forscher haben herausgefunden, warum KI-Modelle selbst beim Raten klingen wie ein Besserwisser auf der Familienfeier. Und sie haben einen Fix gebaut.
Die EU will Kinder schützen, baut aber eine Tür mit Pappschloss. Experten haben die neue Altersverifikations-App "Sorglos-Paket" zerlegt.
Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...
Ein neues Paper aus dem Arxiv will LLM-Halluzinationen nicht wegtrainieren — sondern wegfiltern. Der Ansatz: Wenn das Modell sich unsicher ist, soll es einfach die Klappe halten.
Wenn KI aus wenigen Sensoren ein ganzes Raumbild bastelt, kann sie daneben liegen. Ein neues Paper zeigt: Das Netz kann lernen, wo es sich selbst nicht traut.
Ein LessWrong-Forscher wollte beweisen: Abliteration kostet kaum Leistung. Sein eigenes Experiment hat ihn widerlegt.
Ein neues Paper auf arXiv schlägt vor, Alignment nicht stur, sondern selektiv zur Inferenz-Zeit anzuwenden. Statt jedes Token zu kontrollieren, soll das Modell entscheiden: ...
Simon Willison hat datasette-agent 0.2a0 veröffentlicht. Das Tool unterbricht sich selbst — und fragt den User um Rat.
Anthropic-Mitarbeiter helfen dem US-Geheimdienst NSA, das neue KI-Modell Claude Mythos Preview für offensive Cyberoperationen zu nutzen. Das berichtet die Presse — und es stinkt ...
Ein Sicherheitsforscher hat Exploit-Code für eine Zero-Day-Lücke in Visual Studio Code veröffentlicht. Ein einziger Klick reicht — und der GitHub-Token gehört dem Angreifer.
Ehemalige Tesla-Mitarbeiter erheben schwere Vorwürfe gegen Elon Musk. Seine Versprechen zu den Robotaxis seien schlicht erfunden — die Autos können das nicht, was er behauptet.
Anthropic launcht am Donnerstag Claude Opus 4.8 — mit einem Feature, das die KI-Branche lange ignoriert hat: Ehrlichkeit.
Neues Paper auf arXiv prügelt auf eine beliebte Methode ein. CenterLoss kollabiert Features — und macht KI-Modelle blind für unbekannte Inputs.
Endlich Schluss mit Programmierern. Eine neue Vision will die Herrschaft der Entwickler brechen.
Instructure, der Gigant hinter der Lernplattform Canvas, hat mit den Erpressern von ShinyHunters einen Deal gemacht. Sie zahlen, damit gestohlene Nutzerdaten nicht im Netz landen.
Ein smarter Roboter-Rasenmäher ist mehr als ein Gärtner. Er ist ein Einfallstor für Kriminelle. Sicherheitsforscher warnen vor einem neuen Albtraum.
Das Internet Archive gründet eine Stiftung in St. Gallen. Ihr Ziel: Das digitale Gedächtnis der Menschheit für die Ewigkeit sichern – inklusive der KI-Ära.
Mozilla hat im April 423 Sicherheitslücken in Firefox gestopft. Vorher waren es etwa zwei Dutzend pro Monat. Der Grund: KI-gestütztes Bug-Hunting.