Databricks kassiert Klage wegen 196.000 Raubkopien
Eine Sammelklage gegen Databricks geht in die nächste Runde. Buchautoren werfen dem Daten-Riesen vor, ein LLM gekauft zu haben, das mit geklauten Büchern trainiert wurde.
Was konkret passiert ist
Databricks übernahm ein Sprachmodell, dessen Trainingsdaten laut Klägern eine Datenbank mit piratierten Büchern enthielten. Der Richter weist die Klage nicht ab — im Gegenteil, er fordert immer mehr Details. Die Autoren sprechen von potenziell "außergewöhnlichen" Schadensersatzforderungen.
- 196.000** — Anzahl der Buchtitel in der fraglichen Datenbank
- Class Action** — Sammelklage, jeder betroffene Autor kann sich anschließen
- "Extraordinary damages"** — Wortlaut der Kläger zur Schadenshöhe
💡 Was das bedeutet
Wer ein KI-Modell kauft, kauft auch dessen Trainingssünden mit. Databricks dachte vermutlich, mit dem Zukauf sei man auf der sicheren Seite — der Richter sieht das anders. Für jede Firma, die fertige Modelle integriert, ist das ein Warnschuss: Die Herkunft der Trainingsdaten wird zur juristischen Zeitbombe.
Pro / Con für die Kläger
#### Pro
- Richter lässt Klage nicht fallen
- 196.000 Titel = riesiger Pool potenzieller Mit-Kläger
- Präzedenzfälle gegen andere KI-Firmen wachsen
#### Con
- Beweisführung bei LLM-Trainingsdaten technisch schwierig
- Databricks hat tiefe Taschen für lange Verfahren
- US-Copyright-Recht im KI-Kontext noch ungeklärt