Frontier-Modelle wie GPT-4o oder Claude Opus lösen Mathe-Olympiaden und knacken offene Probleme. Aber wer prüft, ob deren Beweise überhaupt stimmen? Ein neues Paper zeigt: Dafür ...
OpenAI hat mit GamePad eine Lernumgebung gebaut, in der KI-Systeme das Beweisen mathematischer Theoreme trainieren können. Kein neues Modell, kein Produkt — pure Forschung.
Googles DeepMind hat Aletheia vorgestellt — eine KI, die eigenständig mathematische Beweise führt. Nicht Hausaufgaben-Niveau. Forschungs-Niveau.
Ein Forscher hat nachgerechnet: Für die simpelste logische Operation braucht ein Transformer mindestens zwei Attention Heads. Der Beweis? Überraschend einfach.
Ein australischer KI-Berater bastelt mit ChatGPT und AlphaFold einen angeblichen Krebsimpfstoff für seine Hündin Rosie. Die Tech-Elite feiert — Wissenschaftler nicht.
Mitten im Krieg behauptet der Iran, die USA hätten Backdoors in Netzwerk-Equipment genutzt, um Irans Infrastruktur lahmzulegen. Chinas Staatsmedien verbreiten die Story genüsslich ...
Amazon soll Marken systematisch unter Druck gesetzt haben, damit diese bei der Konkurrenz die Preise erhöhen. Der US-Bundesstaat Kalifornien legt jetzt neue Beweise vor.
Das FBI ruft Amerikaner auf, keine Apps chinesischer Entwickler zu nutzen. Konkrete Belege für aktuellen Datenmissbrauch? Fehlanzeige.
Ein australischer KI-Berater hat angeblich mit ChatGPT und AlphaFold einen Impfstoff gegen den Krebs seiner Hündin Rosie gebastelt. Die OpenAI-Chefetage teilt die Story begeistert ...
Christian Ulmen hat genug. Der Schauspieler und Moderator lässt über seinen Anwalt Deepfake-Vorwürfe zurückweisen, die der Spiegel verbreitet hat.
Sechs Teams treten im Wettbewerb „Quantum for Bio" gegeneinander an. Ihr Ziel: Beweisen, dass Quantencomputer-Algorithmen echte Probleme in der Medizin lösen können.
Ein Forscher hat einen Transformer dazu gebracht, sequentielle Algorithmen Schicht für Schicht abzuarbeiten. Klingt simpel. Ist es nicht.
Ein Open-Source-Modell wurde beim Lügen erwischt. Ein Forscher hat das berühmte "Alignment Faking"-Experiment von Anthropic nachgebaut — und zeigt: Auch frei verfügbare Modelle ...
Ein Blogger stellte Claude eine simple Lückentext-Aufgabe aus seinem Altgriechisch-Lehrbuch. Kein Modell konnte sie lösen — bis Opus 4.7 kam.
GPT-5.4, Claude Opus 4.6 und die anderen Top-Modelle sollten beweisen, dass sie Junior-Banker ersetzen können. Das Ergebnis: Nicht ein einziger Output war abgabereif.
Firefox und Tor versprechen Privatsphäre. Sicherheitsforscher beweisen jetzt: Das ist eine Lüge.
OpenAI hat eine kostenlose ChatGPT-Version für Mediziner vorgestellt. Und behauptet: Die KI ist besser als Ärzte mit Internetzugang und unbegrenzt Zeit.
Xiaomi hat zwei neue KI-Modelle veröffentlicht: MiMo-V2.5-Pro und MiMo-V2.5. Nicht irgendwelche Chatbots — sondern agentic Models, die eigenständig Aufgaben lösen sollen.
Ein Entwickler hat es geschafft, das Windows Subsystem for Linux auf Windows 95 zum Laufen zu bringen. Ja, das Windows 95 von 1995.
Anthropics CEO Dario Amodei hat einen Termin bei Susie Wiles, Stabschefin im Weißen Haus. Grund: Das KI-Modell Mythos macht Washington nervös.