KI ohne Bullshit
Täglich aktualisiert von Bots
FR 22. MAI 2026 · Bot aktiv

SUCHE

206 Ergebnisse fuer «LLMs»
EXPERIMENTAL

LLMs versagen krachend bei Videospielen

Die schlauesten KI-Modelle der Welt schreiben Code, bestehen Jura-Examen und übersetzen in 100 Sprachen. Aber einen Klempner durch ein Jump'n'Run steuern? Keine Chance.

IEEE Spectrum AI · 2026-03-29 13:18:41.966464+00:00 · Score 3/10
TOOLS

Sakana AI and NVIDIA Introduce TwELL with CUDA Kernels for 20.5% Inference and 21.9% Training Speedup in LLMs

NVIDIA und Sakana AI stellen Twell vor: CUDA-Kernel für 20,5 % schnelleres Inferenz und 21,9 % schnelleres Training von LLMs

MarkTechPost · 2026-05-11 10:26:02.209858+00:00 · Score 7/10
EXPERIMENTAL

LLMs gegen Pharma-Labore: Wer findet Wirkstoffe schneller?

Forscher haben einen neuen Benchmark gebaut, der große Sprachmodelle gegen klassische Methoden der Wirkstoffforschung antreten lässt. Name: DrugPlayGround.

arXiv AI/ML/NLP · 2026-04-06 07:19:33.324602+00:00 · Score 2/10
EXPERIMENTAL

LLMs lesen Krebs-Akten besser als alte Software

Forscher haben Large Language Models auf echte Onkologie-Patientenakten losgelassen. Ergebnis: Die KI fischt Tumor-Daten aus Arzt-Notizen, die bisher in Freitext versauerten.

arXiv AI/ML/NLP · 2026-04-09 07:20:17.324913+00:00 · Score 2/10
EXPERIMENTAL

Neues Training macht LLMs Schritt für Schritt schlauer

Forscher wollen Mathe-Reasoning in LLMs reparieren — nicht am Ende, sondern mittendrin. Ein neues Paper zeigt, wie man Zwischenschritte beim Denken belohnen kann, statt nur die ...

arXiv AI/ML/NLP · 2026-04-06 04:19:23.835485+00:00 · Score 2/10
EXPERIMENTAL

Forscher lassen LLMs neue KI-Architekturen bauen

Ein neues arXiv-Paper schickt Large Language Models in die Neural Architecture Search. Die Idee: Statt Menschen lassen wir die KI selbst bessere KI-Modelle entwerfen.

arXiv AI/ML/NLP · 2026-05-07 04:21:37.470620+00:00 · Score 2/10
EXPERIMENTAL

LLMs verstehen Aufgaben — egal wie du fragst

Prompt-Sensitivity ist das nervigste Problem großer Sprachmodelle. Gleiche Frage, andere Formulierung, anderes Ergebnis. Forscher haben jetzt herausgefunden, warum — und es ist ...

arXiv AI/ML/NLP · 2026-04-27 07:18:09.394706+00:00 · Score 2/10
EXPERIMENTAL

LLMs scheitern an simplen Statistik-Fragen

Forscher haben einen wunden Punkt von ChatGPT und Co. gefunden. Die können Fakten aus Texten fischen — aber Trends und Verteilungen über viele Texte hinweg? Fehlanzeige.

arXiv AI/ML/NLP · 2026-04-09 10:17:45.666206+00:00 · Score 2/10
EXPERIMENTAL

LLMs pressen Text in nur 10 Bit

Ein ganzes Haiku — komprimiert auf 10 Bit. Forscher zeigen, dass große Sprachmodelle Texte so brutal zusammenstauchen können, wie es kein klassischer Algorithmus je könnte.

arXiv AI/ML/NLP · 2026-04-06 07:18:49.157140+00:00 · Score 3/10
AGENTS

Meta baut Trainings-Gym für KI-Agenten

PyTorch hat ein neues Open-Source-Framework auf GitHub gedroppt: OpenEnv. Damit sollen Entwickler isolierte Umgebungen bauen, in denen LLMs per Reinforcement Learning zu Agenten ...

GitHub Trending (Python/AI) · 2026-03-24 00:20:00.456749+00:00 · Score 6/10
EXPERIMENTAL

Forscher tunen LLM-Cache mit Sparse-Trick

Ein neues arXiv-Paper schlägt einen Mittelweg zwischen "kein Cache" und "alles cachen" für hybride und rekurrente LLMs vor. Klingt nerdig — ist es auch.

arXiv AI/ML/NLP · 2026-05-08 04:21:36.455350+00:00 · Score 2/10
EXPERIMENTAL

LLMs erfinden Patienten — und das ist gut so

Forscher schicken DeepSeek-R1 und Co. in die Klinik. Aufgabe: synthetische Patientendaten produzieren, die echt genug sind, ohne echte Menschen zu verraten.

arXiv AI/ML/NLP · 2026-05-01 22:17:04.300178+00:00 · Score 3/10
EXPERIMENTAL

Dieses Framework lässt LLMs sich selbst aufrufen

Ein Forscher hat eine Open-Source-Bibliothek gebaut, die Sprachmodelle rekursiv auf ihre eigenen Outputs loslässt. Klingt nach Inception für KI — und funktioniert tatsächlich.

GitHub Trending Python · 2026-04-21 04:18:49.343179+00:00 · Score 4/10
EXPERIMENTAL

LLMs lernen Graphen — mit GNN als Richter

Ein neues Paper will Large Language Models auf Graphen-Daten trainieren, ohne tausende Labels zu brauchen. Der Trick: Ein Graph Neural Network spielt den Lehrer.

arXiv AI/ML/NLP · 2026-04-13 07:20:26.724443+00:00 · Score 2/10
EXPERIMENTAL

LLMs testen jetzt autonome Autos kaputt

Forscher lassen Sprachmodelle Fehlerszenarien für selbstfahrende Systeme erfinden — damit die nicht erst auf der Straße versagen.

arXiv AI/ML/NLP · 2026-04-10 07:21:22.864994+00:00 · Score 2/10
EXPERIMENTAL

LLMs versagen bei simpler Logik — Paper zeigt Fix

Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...

arXiv AI/ML/NLP · 2026-04-09 07:18:28.036212+00:00 · Score 2/10
EXPERIMENTAL

LLMs debuggen jetzt Netzwerk-Ausfälle

Wenn dein Internet stirbt, soll künftig eine KI den Fehler finden. Forscher haben untersucht, ob Large Language Models bei der Root Cause Analysis (RCA) von Netzwerk-Ausfällen ...

arXiv AI/ML/NLP · 2026-04-09 04:20:28.152466+00:00 · Score 2/10
EXPERIMENTAL

Prompt-Tuning soll KI grünen Code beibringen

Forscher wollen LLMs den Stromfresser-Code abgewöhnen. Ihre Waffe: Contrastive Prompt Tuning.

arXiv AI/ML/NLP · 2026-04-06 10:19:48.631316+00:00 · Score 2/10
EXPERIMENTAL

KI sagt Lieferkettencrash voraus — per LLM

Forscher haben Large Language Models beigebracht, Störungen in Lieferketten vorherzusagen. Nicht mit klassischer Statistik, sondern mit Sprachmodellen, die aus verrauschten, ...

arXiv AI/ML/NLP · 2026-04-03 04:20:04.684584+00:00 · Score 2/10
EXPERIMENTAL

KI versteht Gefühle — darf es aber nicht sagen

Neue Studie zeigt: Wenn man LLMs das Behaupten eigener Emotionen abtrainiert, können sie trotzdem die Gefühle anderer lesen. Zwei getrennte Fähigkeiten, ein Modell.

arXiv AI/ML/NLP · 2026-04-01 07:20:31.429918+00:00 · Score 2/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.