Hugging Face hat ml-intern veröffentlicht — einen Open-Source-Agenten, der den kompletten Post-Training-Workflow für Large Language Models übernimmt. Von Literaturrecherche bis ...
Ein Open-Source-Speedrun jagt den schnellsten Trainings-Algorithmus für GPT-2-Niveau. Aktueller Rekord: 90 Sekunden auf 8 H100s.
Zuckerberg räumt auf. Meta streicht rund 700 Stellen und pumpt das frei werdende Geld direkt in Rechenzentren, LLM-Training und AI-Talente.
Ein neues Paper will Large Language Models auf Graphen-Daten trainieren, ohne tausende Labels zu brauchen. Der Trick: Ein Graph Neural Network spielt den Lehrer.
Schluss mit Cloud-Abhängigkeit. Unsloth Studio ist eine neue Web-Oberfläche, die Open-Source-Modelle wie Qwen3.5, Gemma 4 und DeepSeek direkt auf dem eigenen Rechner trainiert und ...
Forscher zeigen: Sprachmodelle können sich ohne Lehrer verbessern. Nur mit Fragen ohne Lösungen.
Ein einzelner Forscher will Sprachmodellen beibringen, wie echte Wissenschaftler denken. Sein Werkzeug: ein Datensatz, der nicht nur Ergebnisse liefert, sondern den kompletten ...
David Silver hat Google DeepMind verlassen und sofort abgeräumt. Seine neue Firma Ineffable Intelligence startet mit einer Bewertung von 5,1 Milliarden Dollar — noch bevor ...
Ein Anime-Streaming-Dienst mit Millionen Fans weltweit hat ein massives Datenleck. Crunchyroll untersucht einen Breach, bei dem Angreifer persönliche Daten von rund 6,8 Millionen ...