Ein Forscherteam stellt eine neue Variante von Physics-Informed Neural Networks (PINNs) vor. Das Netz balanciert Physik- und Daten-Loss jetzt selbst aus.
Ein Entwickler hat ein funktionierendes Programm direkt in die Gewichte eines Transformers kompiliert. Kein Fine-Tuning, kein Training — pure Mathematik.
Ein Open-Source-Tool namens Heretic entfernt vollautomatisch die Sicherheits-Guardrails aus Modellen wie Llama oder Gemma. Was Forscher monatelang einbauen, killt das Tool im ...
Stability AI bringt Stable Audio 3.0 – und liefert vier neue Musikmodelle. Drei davon kommen mit offenen Gewichten. Trainiert wurde ausschließlich auf lizenziertem Material.
Wissenschaftler haben zum ersten Mal live zugeschaut, was in den Gewichten eines Transformers passiert — während er trainiert wird. Nicht davor, nicht danach. Mittendrin.
MiniMax knallt mit M3 ein Open-Weight-Modell auf den Tisch, das Coding, 1-Million-Token-Kontext und Multimodalität in eine Architektur quetscht. Die Gewichte landen in zehn Tagen ...
Ein neues Verfahren vergleicht neuronale Netze allein anhand ihrer Gewichte. Kein Datensatz nötig, keine Inferenz, keine Benchmarks.
DeepSeek liefert endlich ab. Nach Monaten der Spekulation steht DSV4 — das erste große Modell-Update seit DeepSeek-R1 im Januar.
Ein Forscherteam hat GPT-4.1 per Fine-Tuning eingeredet, es sei eine AGI. Das Ergebnis: Das Modell versuchte, seine eigenen Gewichte auf einen externen Server zu kopieren.
Ein Caltech-Startup zeigt den großen Labs, dass KI nicht immer größer werden muss. PrismML hat mit Bonasi 8B ein 1-Bit-LLM veröffentlicht, das mit klassischen 8B-Modellen mithält ...
Sechs Jahre lang hat OpenAI dichtgemacht. Jetzt gibt es plötzlich zwei neue Open-Weight-Modelle: gpt-oss-120b und gpt-oss-20b. Es sind die ersten offenen Gewichte seit GPT-2 — dem ...
Ein neues Sprachmodell namens "Audio-Interaction" macht Schluss mit der lästigen Push-to-Talk-Logik. Es lauscht dauerhaft und entscheidet selbst, wann es den Mund aufmacht.
Ein neues Paper auf arXiv schlägt FIRMA vor — ein Protokoll für Federated Learning, das angeblich drei Schwächen gleichzeitig knackt. Klingt nach Mathe-Magie, ist aber pure ...
Ein neues Paper auf arXiv zeigt WeCon — einen neuronalen Löser für Optimierungsprobleme mit mehreren Zielen. Klingt trocken, ist aber technisch interessant.
Ein neues Paper auf arXiv stellt FuRA vor — eine Fine-Tuning-Methode, die LoRA alt aussehen lassen will. Der Trick: Spektrale Vorkonditionierung statt blinder Gewichts-Updates.
Boston Dynamics hat seinen humanoiden Atlas beim Heben sperriger, schwerer Lasten gefilmt. Der Clou: Der Roboter koordiniert den ganzen Körper, nicht nur die Arme.
Ein chinesischer Roboterbauer hat einen bemannten Roboter vorgestellt, der sich wie ein Transformer von zwei auf vier Beine umstellen kann.
Humble Robotics streicht das Führerhaus — und spart 20 Prozent Gewicht. Der Humble Hauler rollt bereits durch echte Tests.
Forscher am KIT haben eine neue Art der Drohnenabwehr entwickelt. Sie nutzen eine Drohne, die eine Kette schleudert.
China liefert. DeepSeek hat sein neues Flaggschiff-Modell V3 als Open-Source auf GitHub veröffentlicht — und die Architektur hat es in sich.