KI ohne Bullshit
Täglich aktualisiert von Bots
MO 20. APR 2026 · Bot aktiv

SUCHE

130 Ergebnisse fuer «Architektur»
EXPERIMENTAL

770M Parameter jagen Anthropics geheime Architektur

Ein Typ auf GitHub hat versucht, Claudes geheime Modell-Architektur nachzubauen. Ohne Paper. Ohne Leak. Nur mit Theorie und PyTorch.

MarkTechPost · 2026-04-20 01:19:11.605611+00:00 · Score 4/10
EXPERIMENTAL

Uni Hong Kong baut KI-Tutor mit Agent-Architektur

Eine Forschergruppe der Hong Kong University hat DeepTutor neu aufgesetzt — komplett umgeschrieben, jetzt mit Agent-Architektur. Version 1.0.0-beta.1 ist seit dem 4. April ...

GitHub Trending Python · 2026-04-07 04:15:43.982430+00:00 · Score 4/10
TOOLS

Raschka vergleicht alle LLM-Architekturen auf einen Blick

Sebastian Raschka hat seinen massiven Architektur-Vergleich großer Sprachmodelle aktualisiert. Von GPT-2 bis DeepSeek V3 und Llama 4 — alles in einer Übersicht. Neu dabei: ...

Ahead of AI (Raschka) · 2026-03-22 00:51:06.205132+00:00 · Score 6/10
AGENTS

MiniMax macht sein bestes KI-Modell Open Source

Ein chinesisches KI-Startup veröffentlicht ein Modell, das sich selbst weiterentwickelt hat — und liefert dabei Benchmark-Werte, die aufhorchen lassen.

MarkTechPost · 2026-04-12 10:17:15.102472+00:00 · Score 7/10
EXPERIMENTAL

Moonshot AI knackt die Datacenter-Mauer für LLMs

Große Sprachmodelle hängen an der kurzen Leine: Prefill und Decode laufen im selben Rechenzentrum, oft im selben Rack. Forscher von Moonshot AI und der Tsinghua-Universität sagen: ...

MarkTechPost · 2026-04-20 04:17:21.990365+00:00 · Score 5/10
EXPERIMENTAL

VoxCPM2 wirft den Tokenizer raus

Chinesische Forscher bauen ein Text-to-Speech-System, das komplett ohne diskrete Token arbeitet. Stattdessen: durchgehende Diffusion, End-to-End, direkt von Text zu Sprache.

GitHub Trending Python · 2026-04-10 04:19:08.314319+00:00 · Score 5/10
HOT

Alibaba wirft Qwen3.5-Omni gegen Gemini ins Rennen

Alibaba hat nachgelegt. Das Qwen-Team veröffentlicht Qwen3.5-Omni — ein Modell, das Text, Bild, Audio und Video nativ verarbeitet. Kein Zusammenkleben einzelner Module mehr, ...

MarkTechPost · 2026-03-31 07:19:09.874856+00:00 · Score 7/10
HOT

Transformer bekommt Konkurrenz: 5 neue Architekturen

Die Ära des Standard-LLM wackelt. Sebastian Raschka, einer der respektiertesten ML-Forscher überhaupt, hat die wichtigsten Alternativen zum klassischen Transformer-Decoder ...

Ahead of AI (Raschka) · 2026-03-22 01:22:17.989624+00:00 · Score 5/10
EXPERIMENTAL

Forscher zerlegen KI-Hirn in geometrische Teile

Eine neue Studie schaut nicht darauf, WAS ein Sprachmodell weiß — sondern WIE sich Informationen von Schicht zu Schicht verändern. Klingt abstrakt. Ist es auch.

arXiv AI/ML/NLP · 2026-04-06 22:21:33.070122+00:00 · Score 2/10
HOT

Alibaba greift Gemini mit Omni-Modell an

Qwen liefert. Alibabas KI-Team hat Qwen3.5-Omni veröffentlicht — ein natives Multimodal-Modell, das Text, Bilder, Audio und Video in einer einzigen Architektur verarbeitet. Kein ...

MarkTechPost · 2026-03-31 07:16:13.618930+00:00 · Score 8/10
EXPERIMENTAL

So denkt ein Roboterauto in Echtzeit

Autonome Fahrzeuge müssen in Millisekunden entscheiden: bremsen, lenken, Gas geben. Avraam Tolmidis zerlegt die technische Architektur hinter diesen Entscheidungen — vom Rohsignal ...

InfoQ AI/ML · 2026-03-30 22:18:52.278628+00:00 · Score 2/10
AGENTS

DeepSeek gibt LLMs ein neues Gedächtnis

DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...

GitHub Trending Python · 2026-03-30 01:35:57.809628+00:00 · Score 7/10
TOOLS

Cohere baut jetzt auch Sprache zu Text um

Cohere kennt man für Text-Modelle und Embeddings. Jetzt steigt das Unternehmen mit "Cohere Transcribe" in den Markt für automatische Spracherkennung ein.

MarkTechPost · 2026-03-26 17:21:29.866616+00:00 · Score 6/10
TOOLS

Tencent macht Echtzeit-Sprach-KI für alle frei

Tencent AI Lab stellt Covo-Audio als Open Source bereit. Ein 7B-Parameter-Modell, das Audio versteht, verarbeitet und in Echtzeit antwortet — alles in einer einzigen Architektur.

MarkTechPost · 2026-03-26 11:18:22.116324+00:00 · Score 6/10
HOT

Arm baut nach 35 Jahren seinen ersten eigenen Chip

Arm hat in 35 Jahren Firmengeschichte noch nie einen eigenen Chip produziert. Bis jetzt. Der britische Chipdesigner, dessen Architekturen in praktisch jedem Smartphone der Welt ...

TechCrunch AI · 2026-03-24 20:18:22.268579+00:00 · Score 6/10
AGENTS

10 Open-Weight-Modelle in 6 Wochen

Die Open-Source-Szene dreht komplett am Rad. Zwischen Januar und Februar 2026 haben zehn verschiedene Labs neue Modelle rausgehauen — und Sebastian Raschka hat sie alle seziert.

Ahead of AI (Raschka) · 2026-03-23 15:39:23.649715+00:00 · Score 7/10
HOT

Meta droppt Llama 4 — Together AI liefert sofort

Meta hat Llama 4 veröffentlicht. Die neue Modellgeneration setzt auf Mixture-of-Experts (MoE) und ist multimodal. Together AI bietet die Modelle ab sofort zum Einsatz an.

Together AI Blog · 2026-03-23 15:21:16.129699+00:00 · Score 7/10
EXPERIMENTAL

KI baut jetzt ganze Minecraft-Welten allein

Eine KI träumt in Klötzchen. Forscher haben einen Generator gebaut, der komplette Minecraft-Landschaften aus dem Nichts erschafft — Block für Block, ohne menschliches Zutun.

Towards Data Science · 2026-04-19 13:21:53.909951+00:00 · Score 3/10
AGENTS

Claude Code lässt KI-Agenten deinen PR zerreißen

Anthropic baut Code-Reviews um. Statt einem einzelnen LLM-Durchlauf schickt Claude Code jetzt mehrere KI-Agenten gleichzeitig auf deinen Pull Request los — jeder mit eigenem Fokus.

InfoQ AI/ML · 2026-04-17 13:20:19.754444+00:00 · Score 6/10
EXPERIMENTAL

Transformer und Diffusion sind dasselbe Ding

Ein Mathe-Paper behauptet: Attention in Transformern, Diffusion-Maps und magnetische Laplacians — alles nur Varianten derselben Markov-Geometrie. Klingt verrückt? Ist es auch.

arXiv AI/ML/NLP · 2026-04-14 04:20:20.615434+00:00 · Score 2/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.