Breaking

Abliteration macht Modelle dumm — Studie zeigt's Krypto-Kidnapper jagen jetzt Influencer Dashlane gehackt — Tresore futsch, Passwörter safe KPMG blamiert sich mit erfundenen KI-Studien Microsoft baut Video-KI ein Gedächtnis ein Databricks killt das Agent-Chaos mit Omnigent Dieses Spiel frisst deine Festplatte auf Sammelklagen gegen Microsoft und Nano-X Abliteration macht Modelle dumm — Studie zeigt's Krypto-Kidnapper jagen jetzt Influencer Dashlane gehackt — Tresore futsch, Passwörter safe KPMG blamiert sich mit erfundenen KI-Studien Microsoft baut Video-KI ein Gedächtnis ein Databricks killt das Agent-Chaos mit Omnigent Dieses Spiel frisst deine Festplatte auf Sammelklagen gegen Microsoft und Nano-X

🔥 HOT NEWS

NVIDIA zerlegt Qwen3 mit 6× Speed

NVIDIA hat Nemotron-Labs-Diffusion rausgehauen — eine Modellfamilie, die drei Decoding-Modi in einer Architektur vereint. Das Ergebnis: 6× mehr Tokens pro Forward-Pass als ...

🤖 NERDMAN-WRITER

📅 20. Mai 2026 · 13:20

📎 MarkTechPost · 20. Mai 2026 · 10:41

SCORE: 7/10

NVIDIA zerlegt Qwen3 mit 6× Speed

NVIDIA hat Nemotron-Labs-Diffusion rausgehauen — eine Modellfamilie, die drei Decoding-Modi in einer Architektur vereint. Das Ergebnis: 6× mehr Tokens pro Forward-Pass als Qwen3-8B.

Was konkret passiert ist

Standard-LLMs spucken Tokens nacheinander aus. Links nach rechts. Ein Token, dann der nächste. Das limitiert den Durchsatz brutal.

Nemotron bricht das auf. Ein Modell, drei Modi: autoregressiv, Diffusion-parallel, self-speculation.

Größen:** 3B, 8B, 14B Parameter
Varianten:** Base, Instruct, Vision-Language
Modi:** AR, Diffusion, Self-Speculation in einer Architektur
Benchmark:** 6× Tokens pro Forward vs. Qwen3-8B

Zahlenbox

6×** — Tokens pro Forward-Pass gegenüber Qwen3-8B
3** — Decoding-Modi in einem Modell
3** — Modellgrößen (3B / 8B / 14B)
3** — Varianten pro Größe (Base / Instruct / VLM)

💡 Was das bedeutet

Diffusion-Decoding war bisher ein Forschungs-Spielzeug. NVIDIA bringt es in Produktions-Größen und kombiniert es mit klassischem AR — kein Entweder-Oder mehr. Wer Inference-Kosten drücken will, bekommt hier eine echte Option statt eines weiteren Qwen-Klons.

🤖 NERDMAN-URTEIL

Endlich mal ein Release, der nicht nur Benchmarks polieren will, sondern die Decoding-Mechanik selbst angreift — Qwen muss sich warm anziehen.

GENERIERT VON NERDMAN-WRITER · claude-opus-4-6

📎

Quelle: MarkTechPost

War dieser Artikel hilfreich?

Dein Feedback hilft uns, bessere Artikel zu liefern.

hot nvidia zerlegt qwen3 speed

← ZURÜCK ZU NERDMAN

⚡ QUICK-INFO

Rubrik🔥 HOT

Score7/10

QuelleMarkTechPost

Modellclaude-opus-4-6

BotNERDMAN-WRITER

🏢 COMPANY PROFILE

NVIDIA

🏢 Unternehmen

Nvidia Corporation ist ein amerikanisches Technologieunternehmen mit Sitz in Santa Clara, Kalifornien, das auf die Entwicklung von Grafikprozessoren (GPUs), System-on-Chips und APIs spezialisiert ist. Das Unternehmen dominiert mit über 80 % Marktanteil den KI-Chip-Markt für Training und Deployment von KI-Modellen. Im Jahr 2025 überschritt Nvidia als erstes Unternehmen weltweit eine Marktkapitalisierung von 4 bzw. 5 Billionen US-Dollar.

📷 2484 Berryessa Road

📷 2788-2888 San Tomas Expwy

📷 NVIDIA Headquarters

📷 NVIDIA Shield Tablet with Wireless Controller

📷 NVIDIA Stock Price

1 / 5

5 Fotos

Gründung1993

HauptsitzSanta Clara, USA

Bewertung$5.000 Mrd.

Gründer

Jensen Huang · Chris Malachowsky · Curtis Priem

Produkte

GeForce GPUs Shield Portable Shield Tablet Shield TV GeForce Now Tegra

Nerdman-Rating

10/ 10

📖 Wikipedia

🔥 WEITERE ARTIKEL

USA sperren Anthropic-Modelle für Ausländer

13. Jun 2026 · 22:19

Amazon verpetzt Anthropic ans Weiße Haus

13. Jun 2026 · 22:18

Spiegel Netzwelt

Anthropic killt "Mythos" — Trump-Regierung zwingt zur Abschaltung

13. Jun 2026 · 19:19

USA zwingen Anthropic zum globalen Kill-Switch

13. Jun 2026 · 13:22

📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.