Suche: Unsicherheit

EXPERIMENTAL

BaLoRA macht KI-Feintuning endlich verlässlich

Forscher haben LoRA, die Standard-Methode zum Anpassen großer KI-Modelle, repariert. Das neue BaLoRA bringt Bayessche Statistik ins Spiel – für mehr Genauigkeit und vor allem ...

arXiv AI/ML/NLP · 2026-05-12 04:19:56.257942+00:00 · Score 3/10

EXPERIMENTAL

Apple will KI mit Text zähmen

Apple-Forscher haben ein neues Rezept für bessere Bild-KI. Sie füttern ihr System mit Text, um die Unsicherheit beim Lernen zu killen.

Apple ML Research · 2026-05-08 04:21:18.052663+00:00 · Score 3/10

EXPERIMENTAL

KI-Forscher bringen Modellen Zweifel bei

MIT-Forscher haben herausgefunden, warum KI-Modelle selbst beim Raten klingen wie ein Besserwisser auf der Familienfeier. Und sie haben einen Fix gebaut.

MIT AI News · 2026-04-22 22:19:07.533123+00:00 · Score 5/10

KI-CRIME

EU-Jugendschutz-App: Sicherheitslücken in Minuten geknackt

Die EU will Kinder schützen, baut aber eine Tür mit Pappschloss. Experten haben die neue Altersverifikations-App "Sorglos-Paket" zerlegt.

Heise KI · 2026-04-17 19:29:38.705556+00:00 · Score 6/10

EXPERIMENTAL

LLMs versagen bei simpler Logik — Paper zeigt Fix

Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...

arXiv AI/ML/NLP · 2026-04-09 07:18:28.036212+00:00 · Score 2/10

EXPERIMENTAL

Forscher erklären Halluzinationen zum Klassifikations-Fehler

Ein neues Paper aus dem Arxiv will LLM-Halluzinationen nicht wegtrainieren — sondern wegfiltern. Der Ansatz: Wenn das Modell sich unsicher ist, soll es einfach die Klappe halten.

arXiv AI/ML/NLP · 2026-04-09 04:21:36.533758+00:00 · Score 2/10

EXPERIMENTAL

Neuronales Netz misst jetzt eigene Unsicherheit

Wenn KI aus wenigen Sensoren ein ganzes Raumbild bastelt, kann sie daneben liegen. Ein neues Paper zeigt: Das Netz kann lernen, wo es sich selbst nicht traut.

arXiv AI/ML/NLP · 2026-04-03 04:20:28.187609+00:00 · Score 2/10

EXPERIMENTAL

Abliteration macht Modelle dumm — Studie zeigt's

Ein LessWrong-Forscher wollte beweisen: Abliteration kostet kaum Leistung. Sein eigenes Experiment hat ihn widerlegt.

LessWrong · 2026-06-14 10:20:09.262055+00:00 · Score 2/10

EXPERIMENTAL

Forscher dosieren KI-Eingriffe per Wahrscheinlichkeit

Ein neues Paper auf arXiv schlägt vor, Alignment nicht stur, sondern selektiv zur Inferenz-Zeit anzuwenden. Statt jedes Token zu kontrollieren, soll das Modell entscheiden: ...

arXiv AI/ML/NLP · 2026-06-11 07:20:10.908730+00:00 · Score 2/10

AGENTS

Datasette-Agent fragt jetzt zurück

Simon Willison hat datasette-agent 0.2a0 veröffentlicht. Das Tool unterbricht sich selbst — und fragt den User um Rat.

Simon Willison · 2026-06-11 01:18:41.561301+00:00 · Score 6/10

KI-CRIME

NSA missbraucht Claude für Cyberangriffe

Anthropic-Mitarbeiter helfen dem US-Geheimdienst NSA, das neue KI-Modell Claude Mythos Preview für offensive Cyberoperationen zu nutzen. Das berichtet die Presse — und es stinkt ...

t3n · 2026-06-05 13:18:51.161121+00:00 · Score 8/10

KI-CRIME

VS Code Zero-Day klaut GitHub-Tokens per Klick

Ein Sicherheitsforscher hat Exploit-Code für eine Zero-Day-Lücke in Visual Studio Code veröffentlicht. Ein einziger Klick reicht — und der GitHub-Token gehört dem Angreifer.

BleepingComputer · 2026-06-03 07:18:44.715166+00:00 · Score 6/10

KI-CRIME

Tesla-Mitarbeiter packen aus: Musk lügt bei Robotaxis

Ehemalige Tesla-Mitarbeiter erheben schwere Vorwürfe gegen Elon Musk. Seine Versprechen zu den Robotaxis seien schlicht erfunden — die Autos können das nicht, was er behauptet.

Golem KI · 2026-05-28 22:21:40.695381+00:00 · Score 6/10

HOT

Claude 4.8 gibt endlich Fehler zu

Anthropic launcht am Donnerstag Claude Opus 4.8 — mit einem Feature, das die KI-Branche lange ignoriert hat: Ehrlichkeit.

The Verge AI · 2026-05-28 19:19:48.403152+00:00 · Score 6/10

EXPERIMENTAL

Forscher killen CenterLoss bei OOD-Detection

Neues Paper auf arXiv prügelt auf eine beliebte Methode ein. CenterLoss kollabiert Features — und macht KI-Modelle blind für unbekannte Inputs.

arXiv AI/ML/NLP · 2026-05-23 04:20:07.895139+00:00 · Score 2/10

EXPERIMENTAL

KI baut deine Software

Endlich Schluss mit Programmierern. Eine neue Vision will die Herrschaft der Entwickler brechen.

The Verge AI · 2026-05-14 13:18:47.323020+00:00 · Score 2/10

KI-CRIME

Edtech-Riese bezahlt Hacker für Schweigen

Instructure, der Gigant hinter der Lernplattform Canvas, hat mit den Erpressern von ShinyHunters einen Deal gemacht. Sie zahlen, damit gestohlene Nutzerdaten nicht im Netz landen.

BleepingComputer · 2026-05-12 10:18:48.559151+00:00 · Score 3/10

KI-CRIME

KI-Mäher öffnet Hackern deine Haustür

Ein smarter Roboter-Rasenmäher ist mehr als ein Gärtner. Er ist ein Einfallstor für Kriminelle. Sicherheitsforscher warnen vor einem neuen Albtraum.

Wired AI · 2026-05-09 13:17:18.409795+00:00 · Score 3/10

EXPERIMENTAL

Internet Archive bunkert KI-Wissen in der Schweiz

Das Internet Archive gründet eine Stiftung in St. Gallen. Ihr Ziel: Das digitale Gedächtnis der Menschheit für die Ewigkeit sichern – inklusive der KI-Ära.

Heise KI · 2026-05-08 22:21:14.956060+00:00 · Score 2/10

HOT

KI putzt Firefox: 423 Lücken in einem Monat

Mozilla hat im April 423 Sicherheitslücken in Firefox gestopft. Vorher waren es etwa zwei Dutzend pro Monat. Der Grund: KI-gestütztes Bug-Hunting.

Heise KI · 2026-05-08 10:20:24.871249+00:00 · Score 6/10

SUCHE

BaLoRA macht KI-Feintuning endlich verlässlich

Apple will KI mit Text zähmen

KI-Forscher bringen Modellen Zweifel bei

EU-Jugendschutz-App: Sicherheitslücken in Minuten geknackt

LLMs versagen bei simpler Logik — Paper zeigt Fix

Forscher erklären Halluzinationen zum Klassifikations-Fehler

Neuronales Netz misst jetzt eigene Unsicherheit

Abliteration macht Modelle dumm — Studie zeigt's

Forscher dosieren KI-Eingriffe per Wahrscheinlichkeit

Datasette-Agent fragt jetzt zurück

NSA missbraucht Claude für Cyberangriffe

VS Code Zero-Day klaut GitHub-Tokens per Klick

Tesla-Mitarbeiter packen aus: Musk lügt bei Robotaxis

Claude 4.8 gibt endlich Fehler zu

Forscher killen CenterLoss bei OOD-Detection

KI baut deine Software

Edtech-Riese bezahlt Hacker für Schweigen

KI-Mäher öffnet Hackern deine Haustür

Internet Archive bunkert KI-Wissen in der Schweiz

KI putzt Firefox: 423 Lücken in einem Monat