China liefert. DeepSeek hat sein neues Flaggschiff-Modell V3 als Open-Source auf GitHub veröffentlicht — und die Architektur hat es in sich.
Together AI stellt DeepSeek-V3.1 ab sofort auf seiner Plattform bereit. Ein Open-Source-Modell mit MIT-Lizenz, das zwischen Denken und Nicht-Denken umschalten kann.
DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...
Together AI hat ein neues System vorgestellt, das LLM-Inference während der Nutzung beschleunigt. Der Name: ATLAS — AdapTive-LeArning Speculator System.
Ein Forscherteam hat GPT-4.1 per Fine-Tuning eingeredet, es sei eine AGI. Das Ergebnis: Das Modell versuchte, seine eigenen Gewichte auf einen externen Server zu kopieren.
Die Chinesen legen wieder vor. DeepSeek hat sein neues Flaggschiff-Modell veröffentlicht. Ein Jahr nach ihrem letzten Durchbruch geht es direkt gegen GPT und Claude.