Suche: Transformer

EXPERIMENTAL

Dieser Transformer ist ein ganzer Computer

Ein Entwickler hat ein funktionierendes Programm direkt in die Gewichte eines Transformers kompiliert. Kein Fine-Tuning, kein Training — pure Mathematik.

Towards Data Science · 2026-04-14 07:20:16.542798+00:00 · Score 3/10

EXPERIMENTAL

Transformer löst Sudoku nur mit Gedächtnis

Ein einzelner Transformer-Block, der sich selbst in Schleife aufruft — und trotzdem komplexe Rätsel knackt. Klingt nach Magie. Ist aber Mathe. Und ein Paper, das zeigt: Ohne ...

arXiv AI/ML/NLP · 2026-04-27 07:21:01.605377+00:00 · Score 2/10

EXPERIMENTAL

Transformer lernt Schritt für Schritt — per Zwang

Ein Forscher hat einen Transformer dazu gebracht, sequentielle Algorithmen Schicht für Schicht abzuarbeiten. Klingt simpel. Ist es nicht.

LessWrong · 2026-04-27 01:16:33.777864+00:00 · Score 2/10

EXPERIMENTAL

LSTM kehrt zurück — und will Transformer killen

Die alten Könige der KI-Architektur melden sich zurück. Forscher entstauben LSTM-Netzwerke und bringen sie mit xLSTM in Stellung gegen die Transformer.

TheSequence · 2026-05-05 13:27:20.844302+00:00 · Score 2/10

EXPERIMENTAL

Roboflow knackt Echtzeit-Objekterkennung mit RF-DETR

Roboflow hat ein neues Open-Source-Modell auf GitHub gedropt — und die Computer-Vision-Community dreht durch. RF-DETR ist ein Transformer-basierter Objektdetektor, der auf dem ...

GitHub Trending Python · 2026-04-26 04:15:55.415269+00:00 · Score 4/10

HOT

Transformer bekommt Konkurrenz: 5 neue Architekturen

Die Ära des Standard-LLM wackelt. Sebastian Raschka, einer der respektiertesten ML-Forscher überhaupt, hat die wichtigsten Alternativen zum klassischen Transformer-Decoder ...

Ahead of AI (Raschka) · 2026-03-22 01:22:17.989624+00:00 · Score 5/10

EXPERIMENTAL

Transformer und Diffusion sind dasselbe Ding

Ein Mathe-Paper behauptet: Attention in Transformern, Diffusion-Maps und magnetische Laplacians — alles nur Varianten derselben Markov-Geometrie. Klingt verrückt? Ist es auch.

arXiv AI/ML/NLP · 2026-04-14 04:20:20.615434+00:00 · Score 2/10

EXPERIMENTAL

Neuer Transformer jagt Banker-Betrüger

Forscher haben ein KI-Modell gebaut, das verdächtige Geldbewegungen in Kontoverläufen erkennt. Es heißt Temporal Contrastive Transformer — kurz TCT.

arXiv AI/ML/NLP · 2026-05-22 07:20:10.040750+00:00 · Score 2/10

EXPERIMENTAL

Forscher röntgen Transformer beim Lernen

Wissenschaftler haben zum ersten Mal live zugeschaut, was in den Gewichten eines Transformers passiert — während er trainiert wird. Nicht davor, nicht danach. Mittendrin.

arXiv AI/ML/NLP · 2026-04-28 07:17:24.946503+00:00 · Score 2/10

EXPERIMENTAL

Apple macht RNNs wieder groß

Totgesagte leben länger. Apple-Forscher haben einen Weg gefunden, Recurrent Neural Networks mit Milliarden Parametern zu trainieren — parallel statt sequenziell. Das war bisher ...

Apple ML Research · 2026-04-24 04:20:53.285223+00:00 · Score 5/10

EXPERIMENTAL

XOR braucht 2 Attention Heads — Beweis mit Schulmathe

Ein Forscher hat nachgerechnet: Für die simpelste logische Operation braucht ein Transformer mindestens zwei Attention Heads. Der Beweis? Überraschend einfach.

LessWrong · 2026-04-03 01:20:41.035555+00:00 · Score 2/10

EXPERIMENTAL

OpenAI ließ GPT Pixel statt Wörter fressen

OpenAI hat einen Transformer — ja, das Ding hinter ChatGPT — einfach auf rohe Pixel losgelassen. Ergebnis: Das Modell erzeugt Bilder, die Sinn ergeben. Ganz ohne Faltungsnetzwerke.

OpenAI News · 2026-03-22 21:20:30.967497+00:00 · Score 4/10

AGENTS

NVIDIA wirft 550B-Monster auf Agents

NVIDIA hat Nemotron 3 Ultra veröffentlicht — ein Open-Weight-Modell, das speziell für Agents gebaut ist, die stundenlang durchlaufen. Der Trick: Mixture-of-Experts plus ...

MarkTechPost · 2026-06-04 22:19:16.514473+00:00 · Score 8/10

EXPERIMENTAL

World Machine sagt die Zukunft voraus

Forscher haben ein Transformer-Modell gebaut, das nicht Texte oder Bilder generiert — sondern Zeitreihen. Klingt trocken, ist aber genau der Stoff, aus dem echte Weltmodelle ...

arXiv AI/ML/NLP · 2026-05-25 22:19:39.979208+00:00 · Score 2/10

EXPERIMENTAL

Forscher tricksen Transformer-Speicher mit 2-Level-Cache aus

Ein neues Paper auf arXiv will das größte Problem moderner LLMs lösen: Den explodierenden Speicherbedarf bei langem Kontext. Die Idee klaut beim Prozessor-Design.

arXiv AI/ML/NLP · 2026-05-25 13:20:14.583263+00:00 · Score 2/10

EXPERIMENTAL

China baut Transformers-Roboter für 573.000 Dollar

Ein chinesischer Roboterbauer hat einen bemannten Roboter vorgestellt, der sich wie ein Transformer von zwei auf vier Beine umstellen kann.

SCMP Tech · 2026-05-12 10:22:51.227855+00:00 · Score 6/10

EXPERIMENTAL

Forscher will KI-Gehirn mit Spielzeug-Sprache zerlegen

Ein Pivotal-Mentee-Bewerber will Transformer auf einer Mini-Sprache trainieren, um endlich zu verstehen, was im Inneren passiert. Klingt nerdig — ist es auch.

LessWrong · 2026-05-01 22:19:16.222920+00:00 · Score 2/10

EXPERIMENTAL

Transformer-KI soll Krebs-Studien retten

95 Prozent aller Krebsmedikamente scheitern in klinischen Studien. Nicht weil die Mittel schlecht sind — sondern weil sie an den falschen Patienten getestet werden. Das Startup ...

Latent Space · 2026-04-20 19:20:08.359337+00:00 · Score 4/10

EXPERIMENTAL

Chipmunk macht Bild-KI doppelt so schnell

Together AI hat ein neues Verfahren vorgestellt, das Diffusion Transformers ohne zusätzliches Training beschleunigt. Der Name: Chipmunk. Der Trick: dynamische, spaltenweise Sparse ...

Together AI Blog · 2026-03-23 15:21:50.985155+00:00 · Score 4/10

EXPERIMENTAL

OpenAI ließ KI Mozart und Beatles mixen

OpenAI stellte mit MuseNet ein Modell vor, das 4-Minuten-Stücke mit bis zu 10 Instrumenten komponiert. Von Country bis Klassik — alles aus einem Transformer.

OpenAI News · 2026-03-22 21:18:48.104218+00:00 · Score 5/10

SUCHE

Dieser Transformer ist ein ganzer Computer

Transformer löst Sudoku nur mit Gedächtnis

Transformer lernt Schritt für Schritt — per Zwang

LSTM kehrt zurück — und will Transformer killen

Roboflow knackt Echtzeit-Objekterkennung mit RF-DETR

Transformer bekommt Konkurrenz: 5 neue Architekturen

Transformer und Diffusion sind dasselbe Ding

Neuer Transformer jagt Banker-Betrüger

Forscher röntgen Transformer beim Lernen

Apple macht RNNs wieder groß

XOR braucht 2 Attention Heads — Beweis mit Schulmathe

OpenAI ließ GPT Pixel statt Wörter fressen

NVIDIA wirft 550B-Monster auf Agents

World Machine sagt die Zukunft voraus

Forscher tricksen Transformer-Speicher mit 2-Level-Cache aus

China baut Transformers-Roboter für 573.000 Dollar

Forscher will KI-Gehirn mit Spielzeug-Sprache zerlegen

Transformer-KI soll Krebs-Studien retten

Chipmunk macht Bild-KI doppelt so schnell

OpenAI ließ KI Mozart und Beatles mixen