Disclaimer: ich habe diesen Text ursprünglich am Wochenende in Vorbereitung einer bevorstehenden Ankündigung der Änderung des Wahrnehmungsvertrages krank geschrieben und wollte ihn eigentlich noch bearbeiten, bevor ich ihn veröffentliche. Da ich nicht ganz so schnell mit dem Newsletter der VG Wort gerechnet habe und die Diskussion jetzt aber so hochkocht, habe ich mich entschlossen, ihn unbearbeitet freizugeben. Ich bitte daher, nicht jedes Wort auf die Goldwaage zu legen.
Zweiter Disclaimer: Ich bin seit 2019 Mitglied des Verwaltungsrats der VG Wort und begleite die Diskussion daher schon seit Monaten intern, habe Fragen gestellt und versucht, die Vor- und Nachteile mit zu durchdenken. Auch auf der Mitgliederversammlung der VG Wort wurde dazu eine intensive Debatte geführt. Der Beschluss für diese Lizenzen erging am 1.6.2024. Bitte unbedingt auch die FAQ der VG Wort lesen!
Dritter Disclaimer: Der Raubzug der großen generativen KI-Modell-Entwickler an urheberrechtlich geschützten Werken hat mit dieser KI-Lizenz der VG Wort keinen unmittelbaren Zusammenhang. Auch meine Kollegin im Verwaltungsrat, Nina George, hat sich dazu ebenfalls geäußert. Hier meine Erläuterung:
2019 traten umfangreiche Änderungen im europäischen Urheberrecht in Kraft, das dazu geführt hat, dass in Deutschland § 44b des UrhG zu Text- und Data-Mining (auch liebevoll TDM genannt) so formuliert wurde: „Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.“
Urheber*innen oder Lizenzinhaber*innen können der Verwendung der Werke mittels eines sogenannten „Nutzungsvorbehalts“ (oft auch Opt-Out genannt) widersprechen, allerdings nur, wenn es sich nicht um ein Text und Data Mining für wissenschaftliche Zwecke handelt. Bei wissenschaftlichem TDM ist wegen § 60d UrhG ein Nutzungsvorbehalt nicht möglich, die Werke können ohnehin ohne Zustimmung der Rechteinhaber*innen verwendet werden.
Wichtig: Die Paragraphen zum TDM werden in Europa als nachträgliche Legitimierung herangezogen, wenn es darum geht, generative KI zu trainieren und die Legalität des Verwendens von Werken von Künstler*innen zu behaupten, ohne jene um Erlaubnis zu fragen oder zu vergüten. Heißt: ChatGPT und Co. nehmen sich alles, was im Internet veröffentlicht ist und verwenden diese Werke für ihre Zwecke, ohne dafür zu bezahlen..
Befürworter*innen berufen sich darauf, dass das Training generativer KI in der technischen Beschreibung im TDM-Paragraphen ja so „mitgemeint“ gewesen sei. (Dass die Gesetzgeber*innen in Brüssel die lange diskutierte EU-Richtlinie 2019 zum Urheberrecht noch nicht ahnen konnten, dass 2022 der Durchbruch mit KI erfolgen würde … geschenkt.)
Erstens: Alle gängigen Urheber*innenverbände, der Börsenverein des Deutschen Buchhandels und die VG Wort widersprechen dieser Lesart. Heißt: Wir sind der Meinung, es handelt sich bei dem Vorgang des Trainings von generativer KI nicht oder jedenfalls nicht nur um TDM, sondern um andere und weitergehende Nutzungsarten. Auch und gerade die VG Wort hat ein Interesse daran, dass Urheber*innen vergütet werden, und will das über eine kollektive Wahrnehmung der Rechte ihrer Mitglieder erreichen.
Eine Studie der Initiative Urheberrecht; unter anderem vom Verband deutscher Schriftsteller*innen und der VG Wort mit finanziert bzw. initialisiert – hat festgestellt, dass es sich beim Training von KI nicht um TDM handelt und dass das Training von Modellen anhand urheberrechtlich geschützter Werke etliche Urheberrechtsverstöße darstellt. Heißt: Die VG Wort kämpft hier für das Urheberrecht und gegen die großen KI-Hersteller an der Seite der Urhebenden und Verlage, beide Gruppen räumen ihr im Wahrnehmungsvertrag Rechte ein.
Zweitens sind wir Urheber*innenverbände der Meinung, es müssen a) Urheber*innen/Lizenznehmer*innen gefragt werden, bevor geschützte Werke zum Training von generativer KI verwendet werden, b) die verwendeten Werke müssen von den Anbietern transparent gemacht werden, c) die Rechteinhaber*innen müssen angemessen vergütet werden und d) Produkte, also Texte und Bilder o.ä., die mit generativer KI erstellt werden, müssen als solche gekennzeichnet werden. Siehe auch: Verband deutscher Schriftsteller*innen in Verdi Kunst und Kultur bzw. Initiative Urheberrecht zu KI.
Die VG Wort unterstützt den Anspruch der Urheber*innen und Lizenznehmer*innen an ihren Werken mit Hinblick auf generative KI vollständig! Auch die Änderung des Wahrnehmungsvertrags durch die VG Wort soll diesen Anspruch unterstützen. Wer sich näher mit der Position der VG Wort beschäftigen möchte, lese bitte einen Beitrag von Dr. Robert Staats, dem Geschäftsführer der VG Wort, aus dem Juli in der Politik & Kultur. Er ist meines Erachtens einer der einflussreichsten Befürworter einer neuen Regelung zum Schutz der Werke von Urheber*innen gegenüber Modellanbietern wie ChatGPT et al.
Darin stellt er fest, dass das Urheberrecht Reformbedarf hat: „Wie kann sichergestellt werden, dass Urheberinnen und Urheber oder andere Rechtsinhaber (wieder) über die Nutzung ihrer Werke im Zusammenhang mit KI frei entscheiden können? Wie kann ein rechtssicherer und maschinenlesbarer Vorbehalt gegen die Nutzung von Werken für Text und Data Mining eingelegt werden? Wie kann eine angemessene Vergütung sichergestellt werden?„. Dieser Beitrag wurde im Juli veröffentlicht, kurz nachdem die Mitgliederversammlung der VG Wort nach intensiver Debatte (!) der Regelung zugestimmt hat.
Als Mitglied des Verwaltungsrats der VG Wort kann ich zunächst sagen: die neue Regelung soll ausschließlich für das firmeninterne Training und Verwendung einer unternehmenseigenen generativen KI dienen. Zielgruppe der Lizenz ist z.B. ein Pharmaunternehmen, das anhand von wissenschaftlicher Literatur eine generative KI trainieren möchte. Standesämter. Firmenintern heißt auch: nicht zur Veröffentlichung bestimmt.
Auch für mich ist es ein seltsames Gefühl, zuzustimmen, dass die eigenen Werke zum Training für generative KI verwendet werden dürfen – aber hier sind a) und c) sowie hoffentlich d) unseres Forderungskatalogs erfüllt: wir werden um Zustimmung gebeten und es erfolgt eine Vergütung. Ich würde mir wünschen, dass die Transparenz der Trainingsdaten auch durchgeführt wird, aber das kann ich natürlich nicht bewerten. Wie hoch eine Vergütung sein wird, hängt natürlich a) vom Markt, und b) vom Wert der Lizenzen ab – also wie „gut“ die Werke und wie viele Werke es sind, die hier in die unternehmensinternen KI-Modelle eingespeist werden.
Unterstellt wird, dass Firmen ein berechtigtes Interesse an solchen juristisch einwandfrei lizensierten Werken für das Training von generativer KI besitzen. Denn dem Anspruch von ChatGPT und Co wird ja von Seiten der Rechteinhaber*innen immer vehementer widersprochen. Hier auf der richtigen Seite zu stehen und rechtssicher zu agieren, ist von Vorteil. Denn wenn das durchgeklagt wird und festgestellt wird: nein, die TDM-Ausnahme ist tatsächlich nicht anwendbar, aber alle haben sich darauf verlassen, die Werke der Urheber*innen verwenden zu können, stehen die Firmen im Regen und müssen sich auf drastische Nachzahlungen und Schadensersatzklagen einstellen. Unterstellt wird auch, dass eher wissenschaftliche Werke angefragt werden, als belletristische.
Anspruch auf Vergütung festigen: Die VG Wort versucht mit ihrem Ansatz, den Anspruch auf Vergütung von Urheber*innen und Lizenznehmer*innen mit den KI-Lizenzen zu festigen. Die VG Wort könnte hier durch das Geschäftsmodell auch belegen, *dass* uns Geld abhanden kommt, wenn KI an unseren Daten trainiert wird. Das kann helfen, einen Anspruch für Urheber*innen zu unterstützen. Das heißt, meines Erachtens haben wir ein Interesse daran, dass diese KI-Lizenzen gut funktionieren.
Ich werde also der neuen Regelung zur Verwendung meiner Werke nicht widersprechen, auch weil ich möchte, dass die VG Wort-Unternehmenslizenzen funktionieren. Damit der legitime Anspruch von Urheber*innen auf die Lizensierung und Vergütung ihrer Werke im Training von KI endlich durchgesetzt wird. Ob da eine relevante Summe Geldes fließt, kann ich natürlich genauso wenig prophezeien, wie irgend jemand sonst.
Schlussendlich aber kann und sollte jede*r selbst entscheiden, ob die eigenen Werke hier freigegeben werden. Dafür sind wir im Verwaltungsrat eingetreten. Zu bedenken ist: wenn die Werke einmal in einer generativen KI einer Firma „enthalten“ sind, kann man sie nicht wieder „herausnehmen“. Generative KI kann nach heutigem Wissenstand nicht wieder „verlernen“, was sie einmal gelernt hat. Ein folgender Widerspruch gilt dann erst für das neue Werk ab dem Widerspruchszeitpunkt.
Nachtrag: Natürlich kann die VG Wort mit eurer Einwilligung nur die *legale* Nutzung der Werke in firmeninternen generativen KI regeln. Sie kann nicht die *illegale* Nutzung durch ChatGPT und Co verhindern. Leider.