Suche: Antworten

EXPERIMENTAL

Forscher erklären Halluzinationen zum Klassifikations-Fehler

Ein neues Paper aus dem Arxiv will LLM-Halluzinationen nicht wegtrainieren — sondern wegfiltern. Der Ansatz: Wenn das Modell sich unsicher ist, soll es einfach die Klappe halten.

arXiv AI/ML/NLP · 2026-04-09 04:21:36.533758+00:00 · Score 2/10

EXPERIMENTAL

KI-Forscher bringen Modellen Zweifel bei

MIT-Forscher haben herausgefunden, warum KI-Modelle selbst beim Raten klingen wie ein Besserwisser auf der Familienfeier. Und sie haben einen Fix gebaut.

MIT AI News · 2026-04-22 22:19:07.533123+00:00 · Score 5/10

HOT

Google bringt KI-Suche in 200 Länder

Google rollt "Search Live" weltweit aus — eine sprachgesteuerte KI-Suche, die in Echtzeit antwortet. Ab sofort in über 200 Ländern verfügbar.

The Decoder · 2026-03-26 17:18:18.986797+00:00 · Score 6/10

AGENTS

OpenAI macht KI-Antworten endlich durchschaubar

OpenAI hat ein neues Trainingsverfahren vorgestellt: Prover-Verifier Games. Damit sollen LLM-Outputs lesbarer und überprüfbarer werden — für Menschen und Maschinen.

OpenAI News · 2026-03-23 12:19:03.173815+00:00 · Score 6/10

EXPERIMENTAL

KI-Modelle merken, wenn man ihre Antworten manipuliert

Forscher haben Sprachmodellen heimlich die Worte im Mund verdreht. Die Modelle haben es bemerkt — und teilweise mit Frustration reagiert.

LessWrong · 2026-04-26 22:16:00.540974+00:00 · Score 2/10

EXPERIMENTAL

KI empfiehlt Nägel durch Spiegel zu schlagen

Forscher testeten Musks Chatbot Grok mit wahnhaften Aussagen. Die Antworten waren gruselig.

The Guardian AI · 2026-04-24 04:21:37.114556+00:00 · Score 4/10

EXPERIMENTAL

KI-Denken lässt sich nicht kontrollieren

Forscher zwingen KI-Modelle, ihre Gedankengänge zu verstecken. Es funktioniert nicht. Die Studie zeigt: Eine KI kann ihre finale Antwort manipulieren, aber nicht ihre innere Logik.

AI Alignment Forum · 2026-04-17 22:22:42.772390+00:00 · Score 2/10

BULLSHIT

Google lügt Millionen Mal pro Stunde

Google AI Overviews liefert bei jeder zehnten Anfrage Müll. Das ist kein Bug — das ist das Feature, das Google Milliarden Nutzern als Standard aufzwingt.

Ars Technica AI · 2026-04-07 19:20:07.588935+00:00 · Score 6/10

TOOLS

Copilot lässt GPT und Claude gegeneinander antreten

Microsoft baut Copilot zum KI-Schiedsrichter um. Neue Funktion: Model Council schickt denselben Prompt gleichzeitig an mehrere Modelle — GPT, Claude, Gemini. Dann prüft ein ...

t3n · 2026-03-31 10:15:20.293363+00:00 · Score 6/10

TOOLS

ChatGPT zeigt jetzt Werbung — 500 Fragen Test

OpenAI schaltet Werbung in ChatGPT. Auf dem Free-Tier in den USA tauchen jetzt Anzeigen zwischen den Antworten auf. Wired hat das getestet — mit 500 Fragen.

Wired AI · 2026-03-30 01:16:51.419963+00:00 · Score 6/10

HOT

OpenAI bringt o1 — das Modell denkt mit

OpenAI hat ein neues Modell vorgestellt: o1. Der Clou: Es soll vor dem Antworten erst nachdenken. Mehrere Quellen berichten gleichzeitig — ein klares Signal, dass OpenAI hier groß ...

OpenAI News · 2026-03-23 12:21:39.642791+00:00 · Score 9/10

TOOLS

OpenAI zwingt GPT-Antworten in festes JSON-Format

OpenAI liefert ein Feature, auf das Entwickler seit Monaten warten: Structured Outputs. Ab sofort können API-Nutzer ein JSON Schema vorgeben — und das Modell hält sich daran.

OpenAI News · 2026-03-23 12:19:49.477458+00:00 · Score 6/10

HOT

GPT-5.5: OpenAI macht seine KI zum Agenten

OpenAI legt nach. Nur wenige Wochen nach GPT-5 kommt jetzt GPT-5.5 — und diesmal soll die KI nicht nur antworten, sondern selbstständig arbeiten.

t3n · 2026-04-24 13:18:22.599968+00:00 · Score 9/10

EXPERIMENTAL

KI lügt sich selbst in die Tasche

Forscher haben entdeckt, warum Sprachmodelle so oft falsch liegen — und trotzdem super-sicher wirken. Zwei widersprüchliche Denkfehler sind schuld.

Nature Mach Intel · 2026-04-23 04:20:50.859599+00:00 · Score 2/10

AGENTS

Googles neuer Agent jagt Fakten im Web

Google Deepmind wirft einen neuen Recherche-Agenten in den Ring. Deep Research Max soll selbstständig im Internet und in speziellen Datenbanken nach Antworten suchen.

The Decoder · 2026-04-21 19:17:25.381060+00:00 · Score 8/10

EXPERIMENTAL

Apples Logits verraten mehr als erlaubt

Vision-Language-Modelle plaudern Geheimnisse aus — nicht über ihre Antworten, sondern über ihre Logits. Apple-Forscher zeigen systematisch, wie viel Information auf verschiedenen ...

Apple ML Research · 2026-04-21 01:16:51.070431+00:00 · Score 3/10

EXPERIMENTAL

KI-Denken lässt sich kaum manipulieren

Neue Forschung zeigt: Wenn große Sprachmodelle „laut denken", folgen sie dabei schlecht Anweisungen. Ihre Antworten? Die lassen sich problemlos steuern. Ihr Denkprozess? Nicht so ...

LessWrong · 2026-04-18 04:19:46.518827+00:00 · Score 3/10

EXPERIMENTAL

Shopping-Agenten lernen durch eigene Fehler

Hugging Face zeigt ein neues Framework: Ecom-RLVE trainiert KI-Agenten für Online-Shopping — nicht mit statischen Daten, sondern in adaptiven Umgebungen, die sich anpassen und ...

Hugging Face Blog · 2026-04-17 13:16:08.396855+00:00 · Score 4/10

EXPERIMENTAL

Typ lässt KI sein Erbgut durchleuchten

Ein LessWrong-Nutzer hat sein komplettes Genom durch Claude und Co. gejagt — auf der Suche nach Antworten für seine bipolare Störung. Kein Arzt, kein Labor. Nur Rohdaten und ein ...

LessWrong · 2026-04-07 04:16:47.823246+00:00 · Score 3/10

EXPERIMENTAL

Neues Training macht LLMs Schritt für Schritt schlauer

Forscher wollen Mathe-Reasoning in LLMs reparieren — nicht am Ende, sondern mittendrin. Ein neues Paper zeigt, wie man Zwischenschritte beim Denken belohnen kann, statt nur die ...

arXiv AI/ML/NLP · 2026-04-06 04:19:23.835485+00:00 · Score 2/10

SUCHE

Forscher erklären Halluzinationen zum Klassifikations-Fehler

KI-Forscher bringen Modellen Zweifel bei

Google bringt KI-Suche in 200 Länder

OpenAI macht KI-Antworten endlich durchschaubar

KI-Modelle merken, wenn man ihre Antworten manipuliert

KI empfiehlt Nägel durch Spiegel zu schlagen

KI-Denken lässt sich nicht kontrollieren

Google lügt Millionen Mal pro Stunde

Copilot lässt GPT und Claude gegeneinander antreten

ChatGPT zeigt jetzt Werbung — 500 Fragen Test

OpenAI bringt o1 — das Modell denkt mit

OpenAI zwingt GPT-Antworten in festes JSON-Format

GPT-5.5: OpenAI macht seine KI zum Agenten

KI lügt sich selbst in die Tasche

Googles neuer Agent jagt Fakten im Web

Apples Logits verraten mehr als erlaubt

KI-Denken lässt sich kaum manipulieren

Shopping-Agenten lernen durch eigene Fehler

Typ lässt KI sein Erbgut durchleuchten

Neues Training macht LLMs Schritt für Schritt schlauer