OpenAI hat ein neues Bildmodell vorgestellt. Es soll endlich Charts und Diagramme richtig verstehen.
Forscher haben ein Problem entdeckt: KI-Modelle können einzelne Diagramme lesen — aber zwei nebeneinander vergleichen? Fehlanzeige. ChartDiff soll das ändern.
Können VLMs ein komplexes Diagramm anschauen und den Code dafür ausspucken? Ein neues Paper sagt: Lasst uns das endlich sauber messen.
14 führende KI-Modelle sollten komplexe Visualisierungen aus realen Datensätzen erzeugen. Das Ergebnis: selbst die Besten verlieren fast die Hälfte ihrer Leistung.
Wissenschaftliche Papers behaupten viel — und belegen es mit Grafiken, Tabellen, Diagrammen. Aber checkt die KI auch wirklich, ob Bild und Behauptung zusammenpassen? Ein neuer ...
Simon Willison hat `datasette-agent-charts 0.1a1` veröffentlicht. Das Plugin lässt KI-Agenten Diagramme direkt aus SQL-Daten zaubern — mit Farbe, Tooltips und ohne ...
Google Gemini kann jetzt interaktive Visualisierungen direkt im Chat erzeugen. Diagramme, Karten, Dashboards — alles ohne externes Tool. Claude von Anthropic konnte das schon ...
Simon Willison hat ein neues Mini-Tool veröffentlicht. Es rendert Markdown — mit Spezial-Behandlung für SVG in Code-Blöcken.
Simon Willison veröffentlicht datasette-agent-charts 0.1a2 — ein Mini-Update für sein Agent-Plugin. Neu: Unter jedem generierten Chart sitzt jetzt ein "View SQL query"-Button.
Drei Jahre Bastelei, jetzt knallt's: Simon Willisons LLM-Library und Datasette verschmelzen zum Datasette Agent — einem AI-Assistant, der mit deinen Daten quatscht.
Richard Socher hat 650 Millionen Dollar eingesammelt. Sein Ziel: Eine KI bauen, die sich selbst erforscht und immer weiter verbessert.
Interpretability-Forschung war bisher Lesen im Kaffeesatz. Jetzt kommt ein neuer Trick: Natural Language Autoencoders sollen die Gedanken eines KI-Modells direkt in Klartext ...
Confluence kann jetzt Bilder malen und Agenten anschleppen. Atlassian hat sein Wiki-Tool mit visuellen KI-Features und Drittanbieter-Agenten aufgerüstet.
Ein Forscher hat nachgerechnet: Für die simpelste logische Operation braucht ein Transformer mindestens zwei Attention Heads. Der Beweis? Überraschend einfach.
OpenAI hat die System Card zu GPT-4V veröffentlicht. Das Modell kann jetzt Bilder verstehen — und OpenAI zeigt, wo die Grenzen liegen.