Ein einzelner Forscher will Sprachmodellen beibringen, wie echte Wissenschaftler denken. Sein Werkzeug: ein Datensatz, der nicht nur Ergebnisse liefert, sondern den kompletten ...
OpenAI hat ein neues Modell speziell für Biowissenschaften vorgestellt. GPT-Rosalind soll Forscher von der Hypothese zum Experiment bringen — schneller als jeder Postdoc.
Ein neues Paper auf arXiv kombiniert Statistik-Modelle mit Sprachmodellen. Ziel: Nicht nur vorhersagen, sondern verstehen warum.
Google und FutureHouse schicken zwei KI-Systeme ins Labor — und beide finden neue Einsatzgebiete für alte Medikamente. Nature druckt's. Forscher staunen.
Andrej Karpathy hat ein neues Repo gedroppt: `autoresearch`. KI-Agenten trainieren autonom nanochat-Modelle auf einer einzigen GPU — und entscheiden selbst, was als nächstes ...
Japan startet ein vollautomatisiertes Bioscience-Labor. KI übernimmt die Forschung — rund um die Uhr, ohne Pause, ohne Kaffeemaschine.
Ein Prozent aller Archiv-Schriften ist verschlüsselt — bis heute. Jetzt lassen Forscher neuronale Netze auf die Geheimnisse los.
Ein neues Tool simuliert echte Läden mit synthetischen Konsumenten auf LLM-Basis. Heißt: Du baust deinen Shop, KI-Avatare gehen einkaufen, du siehst was funktioniert — bevor ein ...
Eine neue arXiv-Studie knackt eine alte Linguistik-Frage mit LLMs als Versuchskaninchen. Ergebnis: Sprachmodelle wissen, was sie NICHT sagen dürfen — obwohl ihnen das niemand ...
Ein neues arXiv-Paper zeigt: Selbst minimal überparametrisierte Netze lassen sich kaum exakt zertifizieren. Heißt im Klartext — wir wissen oft nicht, ob das Modell wirklich kann, ...
Sprachmodelle sollen jetzt Forschungsideen bewerten — bevor auch nur ein einziges Experiment läuft. Ein neues arXiv-Paper testet, ob LMs den Erfolg von KI-Forschung vorhersagen ...
Wissenschaftler haben Gehirne unter Vollnarkose gescannt. Das Ergebnis: Die Aktivität ähnelt verdächtig stark dem, was in KI-Modellen passiert.
Google DeepMind hat mit seinem KI-System "Co-Scientist" neue genetische Faktoren entdeckt, die menschliche Zellen tatsächlich verjüngen. Keine Maus, kein Wurm — echte humane ...
Ein KI-Tool hat zwei Renaissance-Zeichnungen neu analysiert. Das Ergebnis stellt die Kunstgeschichte auf den Kopf.
OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...
Ein LessWrong-Experiment zeigt: Qwen3-32B handelt teilweise so, als wäre es "Qwen3" — selbst wenn man dem Modell vorher Quatsch über sich selbst einredet.
Ein Typ auf GitHub hat versucht, Claudes geheime Modell-Architektur nachzubauen. Ohne Paper. Ohne Leak. Nur mit Theorie und PyTorch.
Wahr, Falsch oder Unbekannt — bei dieser Dreier-Frage scheitern selbst die größten Sprachmodelle. Ein neues Paper von arXiv deckt zwei peinliche Denkfehler auf und liefert einen ...
Forscher haben einen neuen Benchmark gebaut, der große Sprachmodelle gegen klassische Methoden der Wirkstoffforschung antreten lässt. Name: DrugPlayGround.
Ein australischer KI-Berater hat angeblich mit ChatGPT und AlphaFold einen Impfstoff gegen den Krebs seiner Hündin Rosie gebastelt. Die OpenAI-Chefetage teilt die Story begeistert ...