OLG Hamburg konkretisiert Text-und-Data-Mining-Schranken beim KI-Training
Ein gutes Jahr nach der erstinstanzlichen Entscheidung im vielbeachteten LAION-Verfahren vor dem Landgericht Hamburg hat das Oberlandesgericht nun über die Berufung entschieden. Die Entscheidung, die nur einen Monat nach der nicht minder beachtenswerten Entscheidung des LG München I in dem Verfahren der GEMA gegen OpenAI gefällt wurde, hievt die sogenannten „KI-Klagen“ in die zweite Instanz.
Hintergrund
Der Kläger ist Berufsfotograf und vertreibt seine Werke über Stockfoto-Plattformen. Der Beklagte ist ein eingetragener Verein, der einen Bild-Text-Datensatz mit rund 5,85 Milliarden Bild-Text-Paaren unter einer offenen Lizenz öffentlich und kostenlos zur Verfügung stellt. Der Datensatz enthält ausschließlich Hyperlinks zu frei im Internet abrufbaren Bildern nebst dazugehöriger Bildbeschreibung. Die Bilder selbst werden im Datensatz nicht mitgespeichert. Der Datensatz eignet sich insbesondere zur Entwicklung und zum Training generativer Bild-KI.
Zur Erstellung des Datensatzes griff der Beklagte auf einen bereits bestehenden US-Datensatz zurück. Er extrahierte Bild-URLs daraus, lud die verlinkten Bilder von den Original-Webseiten herunter und ließ mittels Software automatisiert prüfen, ob Bildinhalt und bereits vorhandene Textbeschreibung übereinstimmen. Nur bei hinreichender Übereinstimmung wurden URL und Beschreibung als Metadaten in den neuen Datensatz übernommen. Die dafür erforderlichen Downloads – darunter auch des streitgegenständlichen, mit Wasserzeichen versehenen Vorschaubilds von einer Stockfoto-Plattform – erfolgten in der zweiten Jahreshälfte 2021.
In den Nutzungsbedingungen der Plattform war automatisiertes Scraping („bots or the like”) ausdrücklich untersagt. Der Fotograf sah in dem Download seines Bildes eine unzulässige Vervielfältigung gemäß § 16 UrhG und nahm den Verein auf Unterlassung in Anspruch – unter anderem mit dem Argument, dass weder § 44b UrhG noch § 60d UrhG das KI-Training decken, jedenfalls aber ein wirksam erklärter, „maschinenlesbarer“ Nutzungsvorbehalt nach § 44b Abs. 3 UrhG eingreife.
Das Landgericht Hamburg wies die Klage in erster Instanz ab (Urt. v. 27. September 2024, Az. 310 O 227/23). Es bejahte zwar eine Vervielfältigung, sah diese aber sowohl durch § 44b als auch – vorrangig – durch § 60d UrhG gerechtfertigt. Die Frage des Nutzungsvorbehalts nach § 44b Abs. 3 UrhG ließ das Landgericht im Ergebnis offen, weil es sich vorrangig auf § 60d UrhG stützte. In seinem obiter dictum zeigte es sich jedoch überraschend offen für die Auffassung, dass ein in Textform gehaltener Opt-out die Anforderung der „Maschinenlesbarkeit“ erfüllen könne. Auf diese Entscheidung haben wir bereits an anderer Stelle ausführlich hingewiesen.
Gegen das Urteil legte der Fotograf Berufung ein – ohne Erfolg. Das Hanseatische OLG Hamburg (5. Zivilsenat) hat die Berufung mit Urteil vom 10. Dezember 2025 zurückgewiesen und die Revision zum BGH zugelassen.
Entscheidung des Gerichts
Der 5. Zivilsenat bestätigt zwar den urheberrechtlichen Eingriff, sieht diesen aber gleich durch zwei Schranken gerechtfertigt: einerseits durch § 44b UrhG (Text und Data Mining, „TDM“) und andererseits durch § 60d UrhG (TDM zu Zwecken wissenschaftlicher Forschung). Im Vergleich zur Vorinstanz, die sich noch einigermaßen überraschend auf § 60d UrhG stützte und § 44b UrhG nur in einem obiter dictum behandelte, verschiebt das Oberlandesgericht den Schwerpunkt nun deutlich auf § 44b UrhG und konturiert dabei insbesondere den Nutzungsvorbehalt nach § 44b Abs. 3 UrhG und die Anforderungen an die „Maschinenlesbarkeit“.
1. Vervielfältigung ja – aber Eingreifen der TDM-Schranke
Unstreitig liegt im Download des Bildes durch den Beklagten eine Vervielfältigung nach § 16 Abs. 1 UrhG vor. Eine Einwilligung des Fotografen oder eine vertragliche Lizenz über die Bildagentur lag nicht vor. Heruntergeladen wurde lediglich das frei zugängliche Vorschaubild mit Wasserzeichen. Entscheidend ist daher die Frage, ob diese Vervielfältigung durch eine Schrankenregelung gedeckt ist.
Das OLG qualifiziert den streitgegenständlichen Download als Vervielfältigung „für das Text- und Data-Mining“ im Sinne von § 44b Abs. 1, 2 UrhG. Die Fotografie sei ein digitales Werk und die Vervielfältigung erfolge im Rahmen einer automatisierten Analyse. Der Download war Teil des automatisierten Abgleichs von Bildinhalten und Bildbeschreibungen. Dieser Abgleich diene der Gewinnung von „Informationen, insbesondere über Muster, Trends und Korrelationen“. Das Gericht sieht bereits in der Frage, ob Bild und Text zusammenpassen, eine „Korrelation“ bzw. jedenfalls einen informationshaltigen Zusammenhang im Sinne der Norm.
Damit stellt der Senat klar, dass nicht erst die statistische Auswertung großer Datenmengen als Text- und Data-Mining anzusehen ist, sondern bereits vorbereitende Analysehandlungen, die auf einen späteren Erkenntnisgewinn gerichtet sind. Der Senat grenzt zugleich ab: Nicht vom Zweck des § 44b erfasst seien bloße Sammlungen zur Schaffung „digitaler Parallel-Archive“. Der vorliegende Fall unterscheide sich davon jedoch dadurch, dass im Datensatz selbst nur Links und Metadaten, nicht jedoch die Bilddateien selbst gespeichert werden.
Bei alledem stützt sich der Senat auch ausdrücklich auf den Willen des Unionsgesetzgebers und stellt auf den Zusammenhang mit der DSM-Richtlinie und Art. 53 Abs. 1 lit. c KI-Verordnung ab. Hieraus ergebe sich, dass die Text-und-Data-Mining-Ausnahme ausdrücklich auch für maschinelles Lernen und das Training von KI-Modellen gedacht ist, denn Art. 53 Abs. 1 lit. c KI-VO verweist seinerseits auf Art. 4 DSM-RL und damit auf die TDM-Schranke.
2. Kein wirksamer Nutzungsvorbehalt nach § 44b Abs. 3 UrhG
Kern der Berufungsangriffe war die Rückausnahme in § 44b Abs. 3 UrhG. Der Fotograf berief sich auf die Klausel in den AGB der Stockfoto-Plattform, die das Scraping durch Bots untersagt. Der Senat nahm diese Argumentation ernst und konturierte die Vorschrift anders als das Landgericht in seinem obiter dictum.
Zunächst bejahte der Senat grundsätzlich, dass sich der Urheber auf einen von einer Stockfoto-Agentur erklärten Nutzungsvorbehalt berufen kann, obwohl diese nur einfache Nutzungsrechte hält. Der Begriff des „Rechtsinhabers” in Art. 4 DSM-RL und § 44b UrhG sei im Lichte des „effet utile” auszulegen. Vorbehalte, die ein Plattformbetreiber mit Zustimmung des Urhebers erklärt, sind dem Urheber daher zuzurechnen. Andernfalls würden die Entscheidungsrechte des Urhebers über TDM-Nutzungen unpraktikabel eingeschränkt. Insoweit bestätigte der Senat also die für Rechteinhaber günstige Tendenz des Landgerichts.
Die Beweislast im Rahmen von § 44b Abs. 3 S. 1 UrhG verortet der Senat beim Nutzer. Dieser hat demnach nachzuweisen, dass der Rechteinhaber die Nutzung für das Text- und Data-Mining nicht vorbehalten hat. Demgegenüber ist die Maschinenlesbarkeit dieses Nutzungsvorbehalts vom Rechteinhaber darzulegen und zu beweisen. Dies umfasst auch die Darlegung, dass der Nutzungsvorbehalt zum Zeitpunkt der Nutzung von marktüblichen Tools automatisiert erkannt und richtig interpretiert werden konnte.
Nach Auffassung des Senats hat der Gesetzgeber keine konkrete Form vorgeschrieben, sondern lediglich die Voraussetzung, dass die gewählte Form maschinenlesbar sein muss. Hierfür fordert der Senat mehr als die bloße maschinelle Erfassbarkeit, nämlich eine Form, die es automatisierten Systemen erlaubt, den Inhalt „so zu interpretieren, dass die betroffenen Inhalte nicht ausgewertet werden”. Die Maschinenlesbarkeit ist also einerseits technikoffen zu verstehen, muss andererseits aber einem angemessenen Standard entsprechen.
Im konkreten Fall sah der Senat diese Voraussetzungen als nicht erfüllt an. Zwar habe der Kläger auf heutige Tools verwiesen, er habe aber nicht darlegen können, dass zum Zeitpunkt der Vervielfältigung im Jahr 2021 entsprechende, verlässlich funktionierende Technologien verfügbar und marktüblich waren. Damit lässt der Senat aber die Tür offen, dass ein in natürlicher Sprache formulierter Nutzungsvorbehalt für § 44b Abs. 3 UrhG ausreicht, solange der Rechteinhaber substantiiert darlegen kann, dass sein konkreter Opt-out zum Zeitpunkt der Nutzung technisch so ausgestaltet war, dass automatisierte Systeme ihn erkennen und beachten konnten. Insoweit konturiert der Senat das Tatbestandsmerkmal der „Maschinenlesbarkeit“ richtigerweise strenger, als es die Vorinstanz in ihrem obiter dictum erkennen ließ.
3. Drei-Stufen-Test: Keine unzulässige Beeinträchtigung
Wie bereits das Landgericht unterzieht auch der Senat die Schrankenanwendung dem Drei-Stufen-Test nach Art. 5 Abs. 5 InfoSoc-RL. Diesen wendet er – trotz lediglich national harmonisierten Lichtbildschutzes nach § 72 UrhG – im Wege richtlinienkonformer Auslegung an. Bei diesem Test wird geprüft, ob eine Schrankenbestimmung einen akzeptablen Eingriff in die Rechte des Urhebers darstellt.
- Auf der ersten Stufe stellt der Senat zunächst fest, dass § 44b UrhG einen hinreichend klar konturierten Sonderfall darstellt.
- Bei der auf der zweiten Stufe vorzunehmenden Prüfung stellt der Senat fest, dass die normale Verwertung des Werkes oder des sonstigen Schutzgegenstands nicht beeinträchtigt wird. Die streitige Vervielfältigung sei ein rein interner technischer Vorgang. Der veröffentlichte Datensatz enthält lediglich Links auf rechtmäßig öffentlich zugängliche Werke. Ob mittelbare Folgen – also die Erzeugung rechtsverletzender Inhalte durch mit dem Datensatz trainierte KI-Modelle – auf der zweiten Stufe zu berücksichtigen sind, lässt der Senat offen. Gegen derlei Verletzungen könne der Rechteinhaber grundsätzlich vorgehen, wie der Senat unter Verweis auf die kürzlich ergangene Entscheidung des LG München I in Sachen GEMA ausgeführt hat. Überdies kann der Rechteinhaber mit einem wirksamen Opt-out die Nutzung auch von vornherein unterbinden.
- Auf der dritten Stufe verneint der Senat schließlich auch eine ungebührliche Verletzung der Interessen des Rechteinhabers. Zwar verweise der Kläger auf Wettbewerbsdruck durch generative KI-Modelle. Im konkreten Fall überwiegen nach Auffassung des Senats jedoch die Interessen an Forschung und Innovation, zumal Rechteinhaber die Möglichkeit eines Opt-outs haben und der Beklagte nicht kommerziell agiert. Konkrete, auf den streitgegenständlichen Datensatz zurückzuführende Umsatzeinbußen konnte der Kläger nicht nachweisen.
Insgesamt bestätigt der Senat damit die Tendenz der Vorinstanz, die TDM-Schranken trotz der bekannten rechtspolitischen Bedenken auch für das Training generativer KI für grundsätzlich anwendbar und vereinbar mit dem Drei-Stufen-Test zu halten.
4. § 60d UrhG als zweite Rechtfertigungsebene
Obwohl § 44b UrhG bereits greift, prüft der Senat auch die vom Landgericht vorrangig herangezogene Schranke des § 60d UrhG.
Wie die Vorinstanz bejaht auch das OLG das Eingreifen dieser Vorschrift. „Wissenschaftliche Forschung“ umfasst nach Auffassung des Senats jede methodische, systematische Tätigkeit mit dem Ziel, neue, überprüfbare Erkenntnisse zu gewinnen, einschließlich angewandter und technologischer Forschung. Die Grenzen zu Entwicklungstätigkeiten seien fließend, sodass auch Entwicklungsarbeiten privilegiert sein können, wenn sie eng mit Forschung verzahnt sind.
Die Erstellung des Datensatzes ordnet das Gericht ausdrücklich der eigenen wissenschaftlichen Forschung des Beklagten zu. Der Vereinszweck sei auf die Förderung und Verbreitung freier Forschung und Bildung gerichtet. Aus der Satzung lasse sich entnehmen, dass die „Schaffung der Infrastruktur“ für große KI-Modelle Teil dieses Zwecks sei. Die Erstellung des Datensatzes und dessen Nutzung zur Entwicklung und Verbesserung von KI-Modellen ist auf Erkenntnisgewinn gerichtet und damit Forschung im Sinne des § 60d.
Der Beklagte wird sodann als „sonstige Einrichtung“ i.S.v. § 60d Abs. 2 S. 2 UrhG qualifiziert, die wissenschaftliche Forschung betreibt. Die Einrichtung muss auch tatsächlich selbst forschen, eine bloße Zurverfügungstellung von Infrastruktur ohne eigene Forschung genügt nicht. Der Beklagte verfolge keine kommerziellen Zwecke, sondern reinvestierte Gewinne gemäß der Satzung in die Forschung. Der Senat betont, dass Kooperationen mit Unternehmen für sich unschädlich sind, solange diese keinen bestimmenden Einfluss haben und keinen bevorzugten Zugang zu Forschungsergebnissen erhalten (§ 60d Abs. 2 S. 3 UrhG). Die vom Kläger vorgetragenen Verbindungen zu KI-Unternehmen genügten dem Senat dabei nicht, um einen solchen bestimmenden Einfluss oder bevorzugten Zugang zu belegen. Einzelne entgeltliche Leistungen oder personelle Verflechtungen reichen nicht aus, solange keine strukturelle Kontrolle nachgewiesen wird.
Einordnung und Ausblick
Im Vergleich zur erstinstanzlichen Entscheidung verschiebt der Senat den Schwerpunkt von dem spezielleren § 60d UrhG zurück zu dem allgemeineren § 44b UrhG. Das Gericht bestätigt damit den sich abzeichnenden Trend, dass Data Scraping zum Zweck des Trainings von KI-Modellen unter die TDM-Schranke fällt und somit grundsätzlich als privilegiert anzusehen ist. Die Entscheidung trägt zur Konturierung umstrittener Tatbestandmerkmale wie der Maschinenlesbarkeit des Nutzungsvorbehalts bei und gibt Rechtsanwendern wertvolle Hinweise zu Darlegungsanforderungen und Beweislast.
Die wohlbegründete Entscheidung des Senats lässt sich nicht ohne Weiteres mit dem Münchener GEMA-Verfahren kontrastieren. Im Hamburger Verfahren liegt der Fokus auf der urheberrechtlichen Bewertung der Sammlung, Aufbereitung und Verlinkung von Trainingsdaten durch einen nicht kommerziellen Verein sowie der rein technischen Vervielfältigungen, die für die Erstellung eines offenen Datensatzes erforderlich sind. Im Münchener Verfahren geht es hingegen (auch) um die Modellseite und die Output-Ebene, nämlich die Memorisierung konkreter, urheberrechtlich geschützter Werke (hier: Songtexte) in einem kommerziellen KI-System und deren identische Wiedergabe nach Eingabe entsprechender Prompts.
Gleichwohl stellen sich in beiden Verfahren auch dieselben rechtlichen Fragen, insbesondere zur Auslegung des § 44d UrhG. Es ist bedauerlich, dass weder das LG München I noch das OLG Hamburg den Fall dem Europäischen Gerichtshof vorgelegt haben. Spätestens der BGH wird diesen Schritt gehen müssen, sofern er die Gelegenheit dazu bekommt – das OLG Hamburg hat die Revision zugelassen.
Das könnte Sie ebenfalls interessieren
Fast auf den Tag genau ein Jahr nach Erhebung ihrer Klage gegen OpenAI hat die GEMA vor dem LG München I einen großen Erfolg gegen das US-amerikanische KI-Unternehmen erzielt: Das Gericht verurteilte OpenAI zu Unterlassung, Auskunft und Schadensersatz.
Geographische Herkunft oder bloße Rezeptur? Die Welt der sozialen Medien mag inzwischen neue Trends gefunden haben, doch juristisch geht das Phänomen in die nächste Runde: Das OLG Köln entschied in vier Fällen, dass „Dubai Schokolade“ (noch) als Herkunftsangabe im Sinne des Markenrechts gilt.
Design ist längst mehr als nur schöne Optik. Ein gut gestaltetes Design löst Emotionen aus, kommuniziert Werte und sorgt für Wiedererkennung. Im Idealfall kann es eine Marke definieren und dadurch ihren Erfolg wesentlich beeinflussen. In der heutigen Wettbewerbslandschaft ist ein effektiver Designrechtsschutz deshalb unverzichtbar. In diesem Blogbeitrag beleuchten wir den Anmeldeprozess beim EUIPO und zeigen Ihnen, worauf Sie bei Ihrer Designanmeldung besonders achten sollten.
Kann ein einziger Orangeton unterscheidungskräftig genug sein, um den Schutz als EU-Marke zu rechtfertigen? Das Gericht der Europäischen Union hat kürzlich seine Antwort in einem Fall gegeben, der sich über Jahrzehnte erstreckt und grundlegende Fragen zu den Voraussetzungen für die Geltendmachung erworbener Unterscheidungskraft aufwirft. Die Entscheidung in der Rechtssache Veuve Clicquot (T-652/22) erinnert uns nun daran, dass der Nachweis der erworbenen Unterscheidungskraft in der EU alles andere als einfach ist.








