Das Training generativer Künstlicher Intelligenz verschlingt gigantische Datenmengen, doch die rechtlichen Grundlagen sind hochgradig umstritten. Nun beschäftigt diese fundamentale Frage erstmals das höchste deutsche Zivilgericht. Wir blicken auf ein wegweisendes Verfahren, das die Zukunft der Tech-Branche und die Rechte von Kreativen maßgeblich prägen wird.

Die rasante Entwicklung von KI-Modellen wie ChatGPT, Midjourney oder Stable Diffusion beruht darauf, dass Algorithmen mit Milliarden von Bildern und Texten aus dem Internet gefüttert werden. Bisher geschah dies in einer juristischen Grauzone. Nun muss der Bundesgerichtshof (BGH) in Karlsruhe Farbe bekennen. Am 3. September 2026 entscheidet der unter anderem für das Urheberrecht zuständige I. Zivilsenat darüber, ob das massenhafte Herunterladen von geschützten Fotografien zur Erstellung von KI-Trainingsdaten das Urheberrecht der Fotografen verletzt. Der Fall hat immense Sprengkraft, da er die Kernfrage berührt, wer im Zeitalter der Künstlichen Intelligenz von der Verwertung digitaler Kunst profitiert. (BGH, Vorankündigung v. 20.05.2026 – Az. I ZR 281/25)

Ein deutscher Verein im Visier eines Fotografen

Der konkrete Rechtsstreit entzündete sich an der Arbeit eines deutschen, gemeinnützigen Vereins. Dieser hat es sich zur Aufgabe gemacht, die wissenschaftliche Forschung und Bildung im Bereich der Künstlichen Intelligenz zu fördern. Zu diesem Zweck stellte der Verein einen gigantischen, öffentlich und kostenfrei zugänglichen Datensatz bereit, der aus sage und schreibe 5,85 Milliarden Bild-Text-Paaren besteht. Dieser Datensatz enthält zwar nicht die Bilder selbst, wohl aber die exakten Webadressen sowie detaillierte Beschreibungen der Bildinhalte.

Um diesen riesigen Datenpool aufzubauen, nutzte der Verein in der zweiten Jahreshälfte 2021 eine findige Methode. Er griff auf ein bestehendes Datenverzeichnis aus den USA zurück und programmierte eine Software, die sämtliche dort gelisteten Bild-URLs automatisch ansteuerte und die dazugehörigen Bilder aus dem Internet herunterlud. Auf den Servern des Vereins glich ein Software-Algorithmus ab, ob das heruntergeladene Bild tatsächlich zur hinterlegten Textbeschreibung passte. War das der Fall, flossen die Metadaten in den neuen Megadatensatz ein; das Bild selbst wurde wieder gelöscht. Bei diesem digitalen Beutezug geriet auch das Vorschaubild eines professionellen Fotografen in die Fänge der Software, welches auf der Plattform einer Bildagentur platziert war. Da die Agentur automatisierte Downloads ausdrücklich untersagt hatte, sieht der Fotograf seine Rechte verletzt und klagte auf Unterlassung.

Die gesetzlichen Schranken und das sogenannte Text und Data Mining

In der juristischen Praxis geht es hierbei um die Auslegung von zwei recht neuen Vorschriften im Urheberrechtsgesetz (UrhG): dem sogenannten Text und Data Mining nach § 44b UrhG und der wissenschaftlichen Forschungsfreiheit nach § 60d UrhG. Wir sehen in diesen Vorschriften den Versuch des Gesetzgebers, den technologischen Fortschritt nicht durch starre Urheberrechte abzuwürgen, solange bestimmte Spielregeln eingehalten werden.

Das Text und Data Mining erlaubt die automatisierte Analyse von digitalen Werken, um Muster, Trends und Korrelationen zu gewinnen. Der Knackpunkt liegt jedoch im Detail. Nach § 44b Abs. 3 UrhG ist eine solche Nutzung nur dann zulässig, wenn der Rechteinhaber sich diese nicht ausdrücklich vorbehalten hat. Bei Webseiten muss dieser Vorbehalt zudem in einer „maschinenlesbaren Form“ – also etwa im Code der Seite oder über eine spezielle Datei wie die robots.txt – hinterlegt sein. Die Bildagentur hatte das Verbot in diesem Fall jedoch lediglich in natürlicher, menschlicher Sprache formuliert.

Soforthilfe vom Anwalt

Sie brauchen rechtliche Beratung? Rufen Sie uns an für eine kostenlose Ersteinschätzung oder nutzen Sie unser Kontaktformular.

Hamburger Gerichte sehen KI-Datensätze im Recht

Die bisherigen Instanzen, das Landgericht Hamburg (LG Hamburg, Urt. v. 27.09.2024 – Az. 310 O 227/23) sowie das Oberlandesgericht Hamburg (OLG Hamburg, Urt. v. 10.12.2025 – Az. 5 U 104/24), wiesen die Klage des Fotografen ab. Wir teilen die Auffassung der Vorinstanzen, dass das reine Herunterladen zum Zweck des Bild-Text-Abgleichs eine Vervielfältigung im Sinne des Gesetzes darstellt. Allerdings griffen nach Ansicht der Hamburger Richter die urheberrechtlichen Ausnahmen.

Das OLG Hamburg stellte klar, dass der Abgleich von Bild und Beschreibung eine Informationsgewinnung im Sinne des Text und Data Minings darstellt. Da der Fotograf nicht nachweisen konnte, dass der Nutzungsvorbehalt im Jahr 2021 für Maschinen auslesbar war, war der Download legal. Zudem profitierte der Verein von dem Privileg für Forschungsorganisationen. Da er gemeinnützig agiert und das Projekt als Open-Source-Modell für jedermann zur Verfügung stellt, ist die Nutzung auch zu wissenschaftlichen Zwecken nach § 60d UrhG gerechtfertigt. Dass am Ende auch kommerzielle KI-Anbieter wie OpenAI oder Midjourney diese Daten nutzen, ändert an der wissenschaftlichen Natur der Erstellung nichts.

Kompetente Beratung im Urheber- und Medienrecht

Das Urheberrecht steht durch den rasanten Siegeszug der Künstlichen Intelligenz vor den größten Herausforderungen seiner Geschichte. Die Grenzen zwischen erlaubter Inspiration, technischer Analyse und dreister Urheberrechtsverletzung verschwimmen zusehends. Egal ob Sie als Fotograf, Künstler oder Autor Ihre Werke vor unbefugtem KI-Training schützen wollen, oder ob Sie als Softwareentwickler und Unternehmer rechtssichere KI-Modelle aufbauen möchten – wir stehen Ihnen als verlässlicher Partner zur Seite. Wir analysieren Ihre Webauftritte auf maschinenlesbare Nutzungsvorbehalte und vertreten Ihre Interessen sowohl bei der Durchsetzung von Ansprüchen als auch bei der Abwehr unberechtigter Abmahnungen. Melden Sie sich jederzeit bei uns für eine fundierte und zukunftssichere Beratung.

hekem