Together AI koppelt sich mit Pearl Research Labs zusammen und subventioniert KI-Inference durch Krypto-Emissionen. Ein neuer Endpoint geht live — billiger als alles andere am ...
NVIDIA stellt AITune vor — ein Open-Source-Toolkit, das automatisch das schnellste Inference-Backend für jedes PyTorch-Modell findet. Schluss mit dem manuellen Rumgefrickel.
Ein südkoreanisches Chip-Startup will Nvidia beim KI-Inference-Geschäft angreifen. Rebellions hat dafür gerade 400 Millionen Dollar eingesammelt — und plant noch dieses Jahr den ...
Ein Startup aus dem Inference-Bereich hat gerade eine fette Series A eingesammelt. Gimlet Labs will KI-Modelle gleichzeitig auf Chips von NVIDIA, AMD, Intel, ARM, Cerebras und ...
DeepSeek legt nach. Das neue V4-Modell soll mit den besten US-Modellen mithalten — bei einem Bruchteil der Inference-Kosten. Und es läuft auf Huawei-Chips.
Ein neues Indie-Projekt will Rechenleistung bündeln. Mesh LLM setzt auf verteiltes Compute-Pooling, damit Open-Source-Modelle auf normaler Hardware laufen.