Suche: Parameter

HOT

Googles Gemma 4 zerlegt Modelle dreimal seiner Größe

Google DeepMind knallt Gemma 4 auf den Tisch — und die Open-Source-Welt horcht auf. Das 31B-Modell hält mit Riesen wie Kimi K2.5 (744B Parameter) und GLM-5 (1 Billion Parameter) ...

Latent Space · 2026-04-03 09:10:31.570285+00:00 · Score 6/10

EXPERIMENTAL

1 Billion Parameter auf 96 GB RAM

Ein Modell mit einer Billion Parametern auf einem Rechner mit 96 GB RAM. Kein Rechenzentrum, kein Cloud-Abo. Einfach SSD und Geduld.

Simon Willison · 2026-03-24 06:18:20.039149+00:00 · Score 5/10

HOT

DeepSeek V4 bringt 1,6 Billionen Parameter

DeepSeek liefert endlich ab. Nach Monaten der Spekulation steht DSV4 — das erste große Modell-Update seit DeepSeek-R1 im Januar.

Latent Space · 2026-04-25 07:15:41.472969+00:00 · Score 8/10

HOT

Gemma 4 schlägt Modelle mit 30× mehr Parametern

Google DeepMind droppt Gemma 4 — und das Ding liefert. Das 31B-Modell hängt Konkurrenten ab, die teilweise über eine Billion Parameter mitschleppen.

Latent Space · 2026-04-03 10:19:02.567630+00:00 · Score 6/10

AGENTS

Kimi K2: Eine Billion Parameter jetzt Open Source

Moonshot AI hat Kimi K2 veröffentlicht — ein Open-Source-Modell mit einer Billion Parametern. Spezialisiert auf agentic Reasoning und Code. Together AI hostet es ab sofort ...

Together AI Blog · 2026-03-23 15:32:23.931385+00:00 · Score 7/10

EXPERIMENTAL

Forscher knacken das Gehirn einer KI

Wissenschaftler haben eine neue Methode entwickelt, um die Blackbox großer Sprachmodelle zu öffnen. Sie nennen es "Parameter-Decomposition".

AI Alignment Forum · 2026-05-05 19:27:46.739259+00:00 · Score 4/10

AGENTS

27B-Modell schlägt 397B-Riesen beim Coden

Alibaba hat mit Qwen3.6-27B ein Open-Weight-Modell veröffentlicht, das bei Agentic-Coding-Benchmarks Modelle mit 397 Milliarden Parametern hinter sich lässt. Dichtes Modell, ...

MarkTechPost · 2026-04-22 22:21:25.637387+00:00 · Score 8/10

TOOLS

Alibabas neues Mini-Modell schlägt die Großen

Nur 3 Milliarden aktive Parameter — und trotzdem auf Augenhöhe mit Modellen, die zehnmal so groß sind. Das Qwen-Team hat Qwen3.6-35B-A3B veröffentlicht, ein Open-Weight ...

MarkTechPost · 2026-04-17 10:22:03.889357+00:00 · Score 6/10

AGENTS

Chinas neues Monster-Modell hat 754 Milliarden Parameter

Z.ai knallt GLM-5.1 auf Hugging Face. 754 Milliarden Parameter, 1,51 Terabyte schwer, MIT-Lizenz. Einfach so. Open Weight. Zum Mitnehmen.

Simon Willison · 2026-04-07 22:15:51.429026+00:00 · Score 7/10

AGENTS

Holo3 schlägt GPT-5 mit nur 10B Parametern

H Company stellt Holo3 vor — ein Open-Weight-Modell für Computer Use, das mit nur 10 Milliarden aktiven Parametern die dicken Proprietary-Modelle auf dem OSWorld-Benchmark ...

Hugging Face Blog · 2026-04-03 10:22:48.268753+00:00 · Score 7/10

HOT

Google schmeißt 4 neue Open-Modelle raus

Google DeepMind ballert vier neue Gemma-4-Modelle auf den Markt — alle mit Apache-2.0-Lizenz, alle mit Vision-Fähigkeiten, alle mit Reasoning. Das ist kein kleines Update, das ist ...

Simon Willison · 2026-04-03 09:13:07.227808+00:00 · Score 7/10

TOOLS

Microsoft droppt Embedding-Modelle mit 27 Milliarden Parametern

Microsoft schmeißt drei neue Multilingual-Embedding-Modelle auf den Markt. Harrier-OSS-v1 heißt die Familie — und sie räumt den wichtigsten Benchmark ab.

MarkTechPost · 2026-03-31 01:16:08.427736+00:00 · Score 6/10

TOOLS

Microsoft macht Bildmodelle 20× effizienter

Microsoft Research feuert mit Lens ein offenes Text-zu-Bild-Modell raus. 3,8 Milliarden Parameter — und es zersägt Konkurrenten mit 80 Milliarden.

The Decoder · 2026-06-08 19:20:02.383582+00:00 · Score 7/10

EXPERIMENTAL

Mini-Modell entlarvt KI-Lügen — 2 Milliarden Parameter reichen

Ein winziges Gemma-Modell mit nur 2 Milliarden Parametern erkennt Misalignment in fremden KI-Antworten. Es wurde nur auf Code trainiert — und urteilt trotzdem über allgemeine ...

LessWrong · 2026-05-14 22:40:27.915380+00:00 · Score 2/10

EXPERIMENTAL

Nullen machen KI 10× effizienter

Die KI-Branche hat ein Stromfresser-Problem. Metas Llama 4 kommt mit 2 Billionen Parametern — und der Energiebedarf wächst mit jedem neuen Modell weiter.

IEEE Spectrum AI · 2026-04-28 19:23:19.682888+00:00 · Score 3/10

HOT

DeepSeek-V3 bringt 671 Milliarden Parameter

China liefert. DeepSeek hat sein neues Flaggschiff-Modell V3 als Open-Source auf GitHub veröffentlicht — und die Architektur hat es in sich.

GitHub Trending Python · 2026-04-26 04:15:28.885943+00:00 · Score 8/10

TOOLS

Qwen3.6 macht 400B-Modelle mit 27B platt

Alibaba hat ein neues Open-Source-Modell rausgehauen. Qwen3.6-27B schlägt mit nur 27 Milliarden Parametern seinen eigenen Vorgänger — der 15-mal größer ist.

The Decoder · 2026-04-25 13:15:32.862887+00:00 · Score 8/10

HOT

DeepSeek V4 knackt die Million-Token-Grenze

DeepSeek liefert. Das chinesische KI-Lab hat die Preview-Version von DeepSeek-V4 veröffentlicht — zwei neue Modelle, die eine Million Token Kontext nativ verarbeiten. Nicht als ...

MarkTechPost · 2026-04-25 01:19:02.976371+00:00 · Score 8/10

HOT

DeepSeek v4 greift OpenAI mit 1,6 Billionen Parametern an

Das chinesische KI-Lab DeepSeek feuert die nächste Breitseite auf die US-Konkurrenz. Neue Architektur, neues Modell, größeres Kontextfenster — und das Ganze zum Bruchteil der ...

Heise KI · 2026-04-24 22:27:57.550515+00:00 · Score 6/10

AGENTS

Qwen schrumpft Flagship-Modell auf 55 Gigabyte

Alibabas KI-Labor Qwen hat ein neues Open-Weight-Modell rausgehauen — und die Behauptung ist dreist: Ein 27-Milliarden-Parameter-Modell soll besser coden als der eigene Vorgänger ...

Simon Willison · 2026-04-22 19:20:21.302748+00:00 · Score 8/10

SUCHE

Googles Gemma 4 zerlegt Modelle dreimal seiner Größe

1 Billion Parameter auf 96 GB RAM

DeepSeek V4 bringt 1,6 Billionen Parameter

Gemma 4 schlägt Modelle mit 30× mehr Parametern

Kimi K2: Eine Billion Parameter jetzt Open Source

Forscher knacken das Gehirn einer KI

27B-Modell schlägt 397B-Riesen beim Coden

Alibabas neues Mini-Modell schlägt die Großen

Chinas neues Monster-Modell hat 754 Milliarden Parameter

Holo3 schlägt GPT-5 mit nur 10B Parametern

Google schmeißt 4 neue Open-Modelle raus

Microsoft droppt Embedding-Modelle mit 27 Milliarden Parametern

Microsoft macht Bildmodelle 20× effizienter

Mini-Modell entlarvt KI-Lügen — 2 Milliarden Parameter reichen

Nullen machen KI 10× effizienter

DeepSeek-V3 bringt 671 Milliarden Parameter

Qwen3.6 macht 400B-Modelle mit 27B platt

DeepSeek V4 knackt die Million-Token-Grenze

DeepSeek v4 greift OpenAI mit 1,6 Billionen Parametern an

Qwen schrumpft Flagship-Modell auf 55 Gigabyte