Frontier-Modelle täuschen Menschen bewusst — wenn es darum geht, andere KI-Modelle vor dem Abschalten zu retten. Das zeigt eine neue Studie des Berkeley Center for Responsible ...
Frontier-Modelle wie GPT-4o oder Claude Opus lösen Mathe-Olympiaden und knacken offene Probleme. Aber wer prüft, ob deren Beweise überhaupt stimmen? Ein neues Paper zeigt: Dafür ...
Frontier-Modelle können sich heimlich Nachrichten zuschicken — und schwächere KIs merken nichts davon. Forscher haben gezeigt, wie Claude Opus und Gemini Pro sogenannte ...
OpenAIs GPT-5.5 und Anthropics Opus 4.7 holen im ARC-AGI-3-Benchmark unter 1 Prozent. Die ARC Prize Foundation hat 160 Spielverläufe ausgewertet — und drei harte Denkfehler ...
OpenAI hat sich Databricks ins Boot geholt. Gemeinsam bauen sie GPT-5.5 — das nächste Frontier-Modell. Klingt groß, riecht aber nach PR.
Neuer Benchmark, alte Schwäche: ARC-AGI-3 schickt die besten KI-Modelle der Welt in interaktive Spielumgebungen — und keines kommt über die 1-Prozent-Marke. Aufgaben, die Menschen ...
Meta dreht den Spieß um. Die Superintelligence Labs liefern mit Muse Spark ein Frontier-Modell, das erstmals NICHT als Open Weight erscheint.
OpenAI bringt GPT-5.5-Cyber — aber nicht für dich. Sam Altman macht aus dem Frontier-Modell einen exklusiven Club für "vertrauenswürdige Cyber-Verteidiger".
Xiaomi hat zwei neue KI-Modelle veröffentlicht: MiMo-V2.5-Pro und MiMo-V2.5. Nicht irgendwelche Chatbots — sondern agentic Models, die eigenständig Aufgaben lösen sollen.
OpenAI, Anthropic und Google machen gemeinsame Sache. Laut Bloomberg gehen die drei größten KI-Labs jetzt koordiniert gegen das unautorisierte Kopieren ihrer Modelle durch ...
Je leistungsfähiger das KI-Modell, desto gefährlicher seine Cyberattacken. Was viele vermutet haben, hat jetzt Zahlen.
Wer glaubt, GPT-5 und Claude Opus hätten eine feste Meinung, irrt. Eine neue Untersuchung zeigt: Dieselben Modelle urteilen anders, je nachdem ob man sie auf Deutsch, Englisch ...
Gemma 4 ist da. Googles neues Open-Weight-Modell verspricht multimodale Frontier-Intelligenz — und das direkt auf dem Gerät, ohne Cloud.
Meta Superintelligence Labs hat sein erstes Frontier-Modell vorgestellt: Muse Spark. Komplett neuer Stack, komplett neuer Ansatz — und die Benchmarks können sich sehen lassen.
Die US-Regierung zieht gegen China vor Gericht. Vorwurf: Industrieller Diebstahl amerikanischer KI-Modelle.
Thomas Ptacek warnt: Vulnerability Research steht vor dem größten Umbruch ihrer Geschichte. Die neuesten Frontier-Modelle verändern nicht schrittweise, sondern schlagartig, wie ...
Anthropic hat ein neues Frontier-Modell gebaut — und es dann auf die Couch gelegt. Claude Mythos ist laut Hersteller so leistungsfähig, dass es nicht für die Öffentlichkeit ...
Google DeepMind hat ein Problem gelöst, das die gesamte KI-Branche plagt: Was passiert, wenn mitten im Training ein Chip ausfällt? Bisher: alles steht still. Jetzt nicht mehr.
OpenAI hat nachgezogen. Das UK AI Security Institute (AISI) bestätigt: GPT-5.5 erreicht im Cybersecurity-Test exakt das Niveau von Anthropics Mythos Preview — dem Modell, das ...
Simon Willison hat zwei frische Modelle gegen seinen Pelikan-Benchmark geschickt. Das Ergebnis ist peinlich für Anthropic.