Ein Entwickler hat ein funktionierendes Programm direkt in die Gewichte eines Transformers kompiliert. Kein Fine-Tuning, kein Training — pure Mathematik.
Ein einzelner Transformer-Block, der sich selbst in Schleife aufruft — und trotzdem komplexe Rätsel knackt. Klingt nach Magie. Ist aber Mathe. Und ein Paper, das zeigt: Ohne ...
Ein Forscher hat einen Transformer dazu gebracht, sequentielle Algorithmen Schicht für Schicht abzuarbeiten. Klingt simpel. Ist es nicht.
Die alten Könige der KI-Architektur melden sich zurück. Forscher entstauben LSTM-Netzwerke und bringen sie mit xLSTM in Stellung gegen die Transformer.
Roboflow hat ein neues Open-Source-Modell auf GitHub gedropt — und die Computer-Vision-Community dreht durch. RF-DETR ist ein Transformer-basierter Objektdetektor, der auf dem ...
Die Ära des Standard-LLM wackelt. Sebastian Raschka, einer der respektiertesten ML-Forscher überhaupt, hat die wichtigsten Alternativen zum klassischen Transformer-Decoder ...
Ein Mathe-Paper behauptet: Attention in Transformern, Diffusion-Maps und magnetische Laplacians — alles nur Varianten derselben Markov-Geometrie. Klingt verrückt? Ist es auch.
Forscher haben ein KI-Modell gebaut, das verdächtige Geldbewegungen in Kontoverläufen erkennt. Es heißt Temporal Contrastive Transformer — kurz TCT.
Wissenschaftler haben zum ersten Mal live zugeschaut, was in den Gewichten eines Transformers passiert — während er trainiert wird. Nicht davor, nicht danach. Mittendrin.
Totgesagte leben länger. Apple-Forscher haben einen Weg gefunden, Recurrent Neural Networks mit Milliarden Parametern zu trainieren — parallel statt sequenziell. Das war bisher ...
Ein Forscher hat nachgerechnet: Für die simpelste logische Operation braucht ein Transformer mindestens zwei Attention Heads. Der Beweis? Überraschend einfach.
OpenAI hat einen Transformer — ja, das Ding hinter ChatGPT — einfach auf rohe Pixel losgelassen. Ergebnis: Das Modell erzeugt Bilder, die Sinn ergeben. Ganz ohne Faltungsnetzwerke.
Ein chinesischer Roboterbauer hat einen bemannten Roboter vorgestellt, der sich wie ein Transformer von zwei auf vier Beine umstellen kann.
Ein Pivotal-Mentee-Bewerber will Transformer auf einer Mini-Sprache trainieren, um endlich zu verstehen, was im Inneren passiert. Klingt nerdig — ist es auch.
95 Prozent aller Krebsmedikamente scheitern in klinischen Studien. Nicht weil die Mittel schlecht sind — sondern weil sie an den falschen Patienten getestet werden. Das Startup ...
Together AI hat ein neues Verfahren vorgestellt, das Diffusion Transformers ohne zusätzliches Training beschleunigt. Der Name: Chipmunk. Der Trick: dynamische, spaltenweise Sparse ...
OpenAI stellte mit MuseNet ein Modell vor, das 4-Minuten-Stücke mit bis zu 10 Instrumenten komponiert. Von Country bis Klassik — alles aus einem Transformer.
Forscher haben mit SpecGP ein KI-Modell gebaut, das Massenspektren von Glykopeptiden vorhersagt. Klingt nach Nische — ist aber ein cleverer Move für die Bioinformatik.
Die Ära der nachvollziehbaren KI könnte bald enden. Schuld ist die nächste Trainings-Methode.
Forscher haben Diffusion-Transformer auf Materialdesign losgelassen — und das Ergebnis ist wild. Statt monatelang Strukturen durchzuprobieren, spuckt die KI maßgeschneiderte ...