Die teure Erinnerung großer Sprachmodelle frisst Unmengen an RAM. Jetzt haben Forscher einen Algorithmus entwickelt, der diesen Speicher fast ohne Qualitätsverlust um 75% ...
Ein neues Open-Source-Projekt macht Balkonkraftwerke schlau. Das System analysiert Wetterdaten, kennt deinen Stromtarif und entscheidet selbst, wann der Speicher lädt — und wann ...
Der südkoreanische Chip-Riese SK Hynix erwägt einen US-Börsengang. Volumen: bis zu 14 Milliarden Dollar. Ziel: mehr Fabriken, mehr Chips, Ende der Speicher-Knappheit.
Ein neues Paper auf arXiv stellt MP-ISMoE vor — ein System, das Transfer Learning effizienter machen soll. Klingt trocken? Ist es auch. Aber die Idee dahinter ist clever.
Samsungs Chip-Sparte fährt einen historischen Gewinnsprung ein. Schuld ist der KI-Hunger der Tech-Riesen — und ein massiver Speicher-Engpass.
Google hat ein neues Feature für seinen Browser vorgestellt: Skills in Chrome. Ab dem 14. April 2026 können Nutzer ihre meistgenutzten KI-Prompts als wiederverwendbare ...
Google baut den Browser zur KI-Werkbank um. Mit "Skills in Chrome" lassen sich bewährte Prompts speichern, teilen und mit einem Klick wiederverwenden.
Forscher haben einen neuen Angriffsvektor entdeckt, der über den Arbeitsspeicher von Grafikkarten komplette Systeme übernehmen kann. Der Name: GPUBreach. Die Methode: ...
Ein neues Research-Paper von Google reicht aus, um Milliarden an Börsenwert zu vernichten. Alphabet hat einen Algorithmus veröffentlicht, der KI-Speicher deutlich effizienter ...
Google Research hat einen Kompressionsalgorithmus vorgestellt, der den Speicherhunger großer Sprachmodelle drastisch reduziert. Der Name: TurboQuant.
Ein Computervirus namens fast16.sys treibt seit über zwei Jahrzehnten sein Unwesen — und manipuliert gezielt Hochpräzisions-Berechnungen. Jack Clark hat den Fall in seinem ...
Sebastian Raschka ist zurück aus der Familienpause und liefert einen Überblick, der Engineers aufhorchen lässt. Open-Weight-Modelle schrauben gerade alle am gleichen Problem: ...
Forscher haben ein Mixture-of-Experts-Modell so trainiert, dass es drei Viertel seiner Experten verliert — und trotzdem fast volle Leistung bringt. Das Ding heißt EMO. Und es ...
Eine chinesische Firma stellt einen Neutralatom-Quantencomputer vor — und nennt das Ding "Dual-Core". Der Marketing-Begriff ist Quatsch, die Technik dahinter aber nicht.
Betrüger pressen Glasgewebe in DDR5-Riegel und verkaufen den Schrott als echten Speicher. Erste Fälle aus Japan zeigen: Der Riegel sieht aus wie RAM, ist aber tot.
NVIDIA und Sakana AI stellen Twell vor: CUDA-Kernel für 20,5 % schnelleres Inferenz und 21,9 % schnelleres Training von LLMs
Ein neues Paper auf arXiv präsentiert "LKV" — eine Methode, die den größten Engpass langer Kontexte angeht: den KV-Cache.
Forscher schlagen vor, den Speicher-Killer von LLMs mit Rate-Distortion-Theorie zu komprimieren. Klingt nach Nerd-Kram. Ist auch Nerd-Kram.
AMD schickt eine neue PCIe-Karte ins Rennen. Sie soll KI-Berechnungen direkt in normale Server bringen.
Ihr lasst KI eure persönlichen Podcasts basteln? Dieses neue Kommandozeilen-Tool spielt sie direkt in eure Spotify-Bibliothek ein.