Ein Caltech-Startup zeigt den großen Labs, dass KI nicht immer größer werden muss. PrismML hat mit Bonasi 8B ein 1-Bit-LLM veröffentlicht, das mit klassischen 8B-Modellen mithält ...
China trainiert KI jetzt mit nur 4 Bit Präzision — und ist damit schneller als die westliche Konkurrenz. Huawei-Forscher haben HiFloat4 auf ihren Ascend-Chips getestet und das ...
Ein Spin-off der Caltech will die KI-Welt auf den Kopf stellen — mit nur einem Bit pro Parameter. PrismML hat Bonasi 8B veröffentlicht, ein 1-Bit-LLM, das mit klassischen ...
Ein ganzes Haiku — komprimiert auf 10 Bit. Forscher zeigen, dass große Sprachmodelle Texte so brutal zusammenstauchen können, wie es kein klassischer Algorithmus je könnte.
Nvidia hat eine neue Pretraining-Methode vorgestellt: KI-Modelle lernen jetzt in nur 4 Bit statt der üblichen 8. Validiert wurde das Ganze an einem 12-Milliarden-Parameter-Monster ...
Forscher schlagen vor, den Speicher-Killer von LLMs mit Rate-Distortion-Theorie zu komprimieren. Klingt nach Nerd-Kram. Ist auch Nerd-Kram.
Maurycy Zalewski hostet eine echte Website auf einem 8-Bit-Microcontroller für einen Dollar. Kein Server, keine Cloud, kein Bullshit.
Microsoft hat VibeVoice veröffentlicht — ein Speech-to-Text-Modell mit eingebauter Speaker Diarization. MIT-lizenziert. Und Simon Willison hat es gerade erst entdeckt, obwohl das ...
Sicherheitsforscher haben einen Weg gefunden, über Nvidia-Grafikkarten komplette Systeme zu übernehmen. Der Angriff heißt „GPUBreach" und nutzt eine altbekannte Technik auf neuer ...
Ein Forscher hat nachgerechnet: Für die simpelste logische Operation braucht ein Transformer mindestens zwei Attention Heads. Der Beweis? Überraschend einfach.
Forscher haben eine Tetris-Engine gebaut, die so schnell simuliert, dass herkömmliche Implementierungen daneben aussehen wie ein Game Boy von 1989. Das Ziel: Reinforcement ...
Wie macht man ein 70-Milliarden-Parameter-Modell klein genug für den Laptop? Sam Rose zeigt es — mit dem vielleicht besten interaktiven Essay des Jahres.
Während Washington eine Blockade gegen Kuba vorbereitete, saßen chinesische Hacker längst in den Servern der kubanischen Botschaft. Klassische Cyber-Spionage auf höchstem Level — ...
Ein Mitarbeiter der Regierungs-Spyware-Firma Trenchant hat heimlich Hacking-Tools an ein russisches Unternehmen verkauft. Von dort gelangten die Werkzeuge offenbar direkt in die ...
Ein Startup behauptet, eine komplette CPU nur durch KI entworfen zu haben. Kein menschlicher Chip-Designer hat Hand angelegt — nur ein agentenbasiertes System.
Die Venture-Firma Eclipse hat zwei neue Fonds geschlossen. Gesamtvolumen: 1,3 Milliarden Dollar. Ziel: Die nächste Generation physischer Industrien — Robotik, Fertigung, Energie.
Forscher haben einen neuen Angriffsvektor entdeckt, der über den Arbeitsspeicher von Grafikkarten komplette Systeme übernehmen kann. Der Name: GPUBreach. Die Methode: ...
Neuronale Netze sind faul. Eine neue Studie zeigt jetzt mathematisch, warum Deep Learning systematisch die einfachsten Muster lernt — und komplexe ignoriert.
Google Research hat einen Kompressionsalgorithmus vorgestellt, der den Speicherhunger großer Sprachmodelle drastisch reduziert. Der Name: TurboQuant.
Ein 48K-Rechner aus den 80ern steuert eine Mondlandung. Zumindest in der Simulation.