EXPERIMENTAL
KV-Cache-Kompression knackt die Shannon-Grenze
Forscher haben eine neue Methode gefunden, den KV-Cache von Transformern zu schrumpfen — und zwar über das bisherige theoretische Limit hinaus.
arXiv AI/ML/NLP
· 2026-04-20 07:16:55.795006+00:00
· Score 4/10