Disclaimer: ich habe diesen Text ursprünglich am Wochenende in Vorbereitung einer bevorstehenden Ankündigung der Änderung des Wahrnehmungsvertrages krank geschrieben und wollte ihn eigentlich noch bearbeiten, bevor ich ihn veröffentliche. Da ich nicht ganz so schnell mit dem Newsletter der VG Wort gerechnet habe und die Diskussion jetzt aber so hochkocht, habe ich mich entschlossen, ihn unbearbeitet freizugeben. Ich bitte daher, nicht jedes Wort auf die Goldwaage zu legen.
Zweiter Disclaimer: Ich bin seit 2019 Mitglied des Verwaltungsrats der VG Wort und begleite die Diskussion daher schon seit Monaten intern, habe Fragen gestellt und versucht, die Vor- und Nachteile mit zu durchdenken. Auch auf der Mitgliederversammlung der VG Wort wurde dazu eine intensive Debatte geführt. Der Beschluss für diese Lizenzen erging am 1.6.2024. Bitte unbedingt auch die FAQ der VG Wort lesen!
Dritter Disclaimer: Der Raubzug der großen generativen KI-Modell-Entwickler an urheberrechtlich geschützten Werken hat mit dieser KI-Lizenz der VG Wort keinen unmittelbaren Zusammenhang. Auch meine Kollegin im Verwaltungsrat, Nina George, hat sich dazu ebenfalls geäußert. Hier meine Erläuterung:
2019 traten umfangreiche Änderungen im europäischen Urheberrecht in Kraft, das dazu geführt hat, dass in Deutschland § 44b des UrhG zu Text- und Data-Mining (auch liebevoll TDM genannt) so formuliert wurde: „Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.“
Urheber*innen oder Lizenzinhaber*innen können der Verwendung der Werke mittels eines sogenannten „Nutzungsvorbehalts“ (oft auch Opt-Out genannt) widersprechen, allerdings nur, wenn es sich nicht um ein Text und Data Mining für wissenschaftliche Zwecke handelt. Bei wissenschaftlichem TDM ist wegen § 60d UrhG ein Nutzungsvorbehalt nicht möglich, die Werke können ohnehin ohne Zustimmung der Rechteinhaber*innen verwendet werden.
Wichtig: Die Paragraphen zum TDM werden in Europa als nachträgliche Legitimierung herangezogen, wenn es darum geht, generative KI zu trainieren und die Legalität des Verwendens von Werken von Künstler*innen zu behaupten, ohne jene um Erlaubnis zu fragen oder zu vergüten. Heißt: ChatGPT und Co. nehmen sich alles, was im Internet veröffentlicht ist und verwenden diese Werke für ihre Zwecke, ohne dafür zu bezahlen..
Befürworter*innen berufen sich darauf, dass das Training generativer KI in der technischen Beschreibung im TDM-Paragraphen ja so „mitgemeint“ gewesen sei. (Dass die Gesetzgeber*innen in Brüssel die lange diskutierte EU-Richtlinie 2019 zum Urheberrecht noch nicht ahnen konnten, dass 2022 der Durchbruch mit KI erfolgen würde … geschenkt.)
Erstens: Alle gängigen Urheber*innenverbände, der Börsenverein des Deutschen Buchhandels und die VG Wort widersprechen dieser Lesart. Heißt: Wir sind der Meinung, es handelt sich bei dem Vorgang des Trainings von generativer KI nicht oder jedenfalls nicht nur um TDM, sondern um andere und weitergehende Nutzungsarten. Auch und gerade die VG Wort hat ein Interesse daran, dass Urheber*innen vergütet werden, und will das über eine kollektive Wahrnehmung der Rechte ihrer Mitglieder erreichen.
Eine Studie der Initiative Urheberrecht; unter anderem vom Verband deutscher Schriftsteller*innen und der VG Wort mit finanziert bzw. initialisiert – hat festgestellt, dass es sich beim Training von KI nicht um TDM handelt und dass das Training von Modellen anhand urheberrechtlich geschützter Werke etliche Urheberrechtsverstöße darstellt. Heißt: Die VG Wort kämpft hier für das Urheberrecht und gegen die großen KI-Hersteller an der Seite der Urhebenden und Verlage, beide Gruppen räumen ihr im Wahrnehmungsvertrag Rechte ein.
Zweitens sind wir Urheber*innenverbände der Meinung, es müssen a) Urheber*innen/Lizenznehmer*innen gefragt werden, bevor geschützte Werke zum Training von generativer KI verwendet werden, b) die verwendeten Werke müssen von den Anbietern transparent gemacht werden, c) die Rechteinhaber*innen müssen angemessen vergütet werden und d) Produkte, also Texte und Bilder o.ä., die mit generativer KI erstellt werden, müssen als solche gekennzeichnet werden. Siehe auch: Verband deutscher Schriftsteller*innen in Verdi Kunst und Kultur bzw. Initiative Urheberrecht zu KI.
Die VG Wort unterstützt den Anspruch der Urheber*innen und Lizenznehmer*innen an ihren Werken mit Hinblick auf generative KI vollständig! Auch die Änderung des Wahrnehmungsvertrags durch die VG Wort soll diesen Anspruch unterstützen. Wer sich näher mit der Position der VG Wort beschäftigen möchte, lese bitte einen Beitrag von Dr. Robert Staats, dem Geschäftsführer der VG Wort, aus dem Juli in der Politik & Kultur. Er ist meines Erachtens einer der einflussreichsten Befürworter einer neuen Regelung zum Schutz der Werke von Urheber*innen gegenüber Modellanbietern wie ChatGPT et al.
Darin stellt er fest, dass das Urheberrecht Reformbedarf hat: „Wie kann sichergestellt werden, dass Urheberinnen und Urheber oder andere Rechtsinhaber (wieder) über die Nutzung ihrer Werke im Zusammenhang mit KI frei entscheiden können? Wie kann ein rechtssicherer und maschinenlesbarer Vorbehalt gegen die Nutzung von Werken für Text und Data Mining eingelegt werden? Wie kann eine angemessene Vergütung sichergestellt werden?„. Dieser Beitrag wurde im Juli veröffentlicht, kurz nachdem die Mitgliederversammlung der VG Wort nach intensiver Debatte (!) der Regelung zugestimmt hat.
Als Mitglied des Verwaltungsrats der VG Wort kann ich zunächst sagen: die neue Regelung soll ausschließlich für das firmeninterne Training und Verwendung einer unternehmenseigenen generativen KI dienen. Zielgruppe der Lizenz ist z.B. ein Pharmaunternehmen, das anhand von wissenschaftlicher Literatur eine generative KI trainieren möchte. Standesämter. Firmenintern heißt auch: nicht zur Veröffentlichung bestimmt.
Auch für mich ist es ein seltsames Gefühl, zuzustimmen, dass die eigenen Werke zum Training für generative KI verwendet werden dürfen – aber hier sind a) und c) sowie hoffentlich d) unseres Forderungskatalogs erfüllt: wir werden um Zustimmung gebeten und es erfolgt eine Vergütung. Ich würde mir wünschen, dass die Transparenz der Trainingsdaten auch durchgeführt wird, aber das kann ich natürlich nicht bewerten. Wie hoch eine Vergütung sein wird, hängt natürlich a) vom Markt, und b) vom Wert der Lizenzen ab – also wie „gut“ die Werke und wie viele Werke es sind, die hier in die unternehmensinternen KI-Modelle eingespeist werden.
Unterstellt wird, dass Firmen ein berechtigtes Interesse an solchen juristisch einwandfrei lizensierten Werken für das Training von generativer KI besitzen. Denn dem Anspruch von ChatGPT und Co wird ja von Seiten der Rechteinhaber*innen immer vehementer widersprochen. Hier auf der richtigen Seite zu stehen und rechtssicher zu agieren, ist von Vorteil. Denn wenn das durchgeklagt wird und festgestellt wird: nein, die TDM-Ausnahme ist tatsächlich nicht anwendbar, aber alle haben sich darauf verlassen, die Werke der Urheber*innen verwenden zu können, stehen die Firmen im Regen und müssen sich auf drastische Nachzahlungen und Schadensersatzklagen einstellen. Unterstellt wird auch, dass eher wissenschaftliche Werke angefragt werden, als belletristische.
Anspruch auf Vergütung festigen: Die VG Wort versucht mit ihrem Ansatz, den Anspruch auf Vergütung von Urheber*innen und Lizenznehmer*innen mit den KI-Lizenzen zu festigen. Die VG Wort könnte hier durch das Geschäftsmodell auch belegen, *dass* uns Geld abhanden kommt, wenn KI an unseren Daten trainiert wird. Das kann helfen, einen Anspruch für Urheber*innen zu unterstützen. Das heißt, meines Erachtens haben wir ein Interesse daran, dass diese KI-Lizenzen gut funktionieren.
Ich werde also der neuen Regelung zur Verwendung meiner Werke nicht widersprechen, auch weil ich möchte, dass die VG Wort-Unternehmenslizenzen funktionieren. Damit der legitime Anspruch von Urheber*innen auf die Lizensierung und Vergütung ihrer Werke im Training von KI endlich durchgesetzt wird. Ob da eine relevante Summe Geldes fließt, kann ich natürlich genauso wenig prophezeien, wie irgend jemand sonst.
Schlussendlich aber kann und sollte jede*r selbst entscheiden, ob die eigenen Werke hier freigegeben werden. Dafür sind wir im Verwaltungsrat eingetreten. Zu bedenken ist: wenn die Werke einmal in einer generativen KI einer Firma „enthalten“ sind, kann man sie nicht wieder „herausnehmen“. Generative KI kann nach heutigem Wissenstand nicht wieder „verlernen“, was sie einmal gelernt hat. Ein folgender Widerspruch gilt dann erst für das neue Werk ab dem Widerspruchszeitpunkt.
Nachtrag: Natürlich kann die VG Wort mit eurer Einwilligung nur die *legale* Nutzung der Werke in firmeninternen generativen KI regeln. Sie kann nicht die *illegale* Nutzung durch ChatGPT und Co verhindern. Leider.
Wenn ich das richtig verstehe, verleiht die VG Wort dem bislang üblichen illegalen Abschöpfen einen legalen Anstrich, der weit davon entfernt ist, was ich persönlich mir unter Schutz des Eigentums vorstelle. Man möge mich bitte nicht falsch verstehen, auch ich als BI (B für biologisch) lese und verarbeite die Werke derjenigen, die vor mir da waren und erschaffe (hoffentlich) etwas Neues, auch ohne den von mir verwendeten Quellen monatliche Gebühren zu entrichten. Aber einer KI fehlt dieser kreative Aspekt gänzlich, im Prinzip plagiiert es nur einzelne Fragmente. Zugegeben, das ist so schlimm noch nicht, da können sogar richtig gute Sachen bei rauskommen.
Allerdings reden wir hier nicht von einzelnen Individuen, die auf die sie umgebende Welt reagieren, je nach Talent neue Ausdrucksformen finden, auf die Welt zurückwirken und dafür (mit Glück einigermaßen ausreichend) bezahlt werden, sondern von Unternehmen (großen und solchen, die mit KI groß werden wollen), die massenhaft die Leistungen anderer abschöpfen, um damit viel bis sehr viel Geld zu verdienen. Sonst würden sie es nicht machen. Unterm Strich werde ich als Autor degradiert, indem ich als Ressource gesehen werde, die eigenständig Wissen verwaltet, prozessiert, umgestaltet und erweitert und sich dabei bequemerweise auch noch selbst Kranken- und Rentenkasse bezahlt. Und jetzt soll ich für diese Vorleistung eine kleine einmalige Lizenzzahlung erhalten, damit dieser Betrug nicht mehr wie einer aussieht und die ich auch noch mit allen anderen Kreativen teilen muss? Durch einen Beschluss, der noch nicht einmal ein Opt-in beinhaltet und nahezu durchgehend schwammig gehalten ist? Wo bitte, soll das denn enden? Ist die Angelegenheit überhaupt vernünftig durchdacht worden? Denkt doch bitte mal darüber nach, wo eine Entwicklung wie die aktuelle enden wird, statt sie zu beschleunigen. Irgendwann wird der Kreis sich schließen, namentlich, wenn genügend Wissen auf diese Weise angehäuft worden und KI derart präsent ist, dass ein Kreativer bei der Recherche für ein neues Thema nicht mehr seine Kollegen unterstütze, sondern Hintergrundwissen aus KI-gesteuerten Suchmaschinen oder anderen Datenbanken bezieht und seinerseits nach Abschluss der Arbeiten und einer Veröffentlichung ebenfalls wieder genau diese Datenbanken füttert. Aber keine Bange, er kriegt ja drei Euro fuffzig von der VG Wort.
Aus meiner Sicht handelt die VG Wort kurzsichtig und hilft am Ende des Tages nur dabei mit, Geld und Ressourcen von unten nach oben zu schaufeln. Statt das Übel bei der Wurzel zu packen und Widerstand zu leisten und politisch auf Gesetzesänderungen zum Schutz der Kreativen hinzuarbeiten, wirft man ihnen etwas Kleingeld in den Hut mit der Begründung, das sei immer noch besser, als ständig beklaut zu werden. Was für eine Logik. Und das Schlimmste: Ich werde nicht widersprechen, weil ich tatsächlich jeden Cent brauche – und so geht es vielen anderen auch. Aber man sollte sich wenigstens kein X für ein U vormachen.
Lieber Uller Bessin,
das haben Sie glaube ich missverstanden. „Wenn ich das richtig verstehe, verleiht die VG Wort dem bislang üblichen illegalen Abschöpfen einen legalen Anstrich, der weit davon entfernt ist, was ich persönlich mir unter Schutz des Eigentums vorstelle.“
Nein, das tut die VG Wort explizit nicht. Diese unternehmensinternen KI-Lizenzen haben nichts mit Open AI oder anderen LLMs zu tun. Sie erteilen auch nicht rückwirkend oder nachträglich eine Legitimierung. Im Gegenteil soll hier mit diesen (neuen und unternehmensintern zu verwendenden) generativen KI-Modellen gezeigt werden, dass Open AI und Co die Werke, die sie in ihre LLMs eingespeist haben, hätten lizensieren müssen!
Und was den grundlegenden Raub unserer Werke für das Training von KI-Modellen angeht, da bin ich völlig auf Ihrer Seite. Es darf nicht sein, dass Werke von Urheber*innen ungefragt, intransparent, unvergütet und nicht als KI-Resultat gekennzeichnet in die Modelle einfließen. Das ist Bruch des Urheberrechts im ganz großen Stil.
Aber ein X wird Ihnen hier nicht für ein U vorgemacht.
Herzliche Grüße,
Lena Falkenhagen
Uller Bessin,
Sie sprechen mir mit jedem Wort aus der Seele –
genauso sehe ich das auch!
Liebe Lena Falkenhagen,
vielen Dank für diese interessanten Einblicke ins Werden der neuen Regelung. Damit wäre immerhin geklärt, dass die Motive und Absichten die richtigen waren.
Bleibt die Frage, warum man dann einen juristisch so schlampigen, interpretationsfähigen, zum Rechtsmissbrauch einladenden Text daraus gemacht hat, weshalb man von „Unternehmen“ spricht, von „Organisationen“. Jeder und jede kann sich damit ermächtigt fühlen, nach dem betreffenden Paragraphen zu handeln. Auch die Frage, wie man verhindert, dass aus „interner Nutzung“ irgendwann doch externe wird (nämlich gar nicht, weil man’s nicht kann), wird nicht beantwortet. Zur Verfolgung von Rechtsverstößen wird auch nichts gesagt. Die Autor:innen in eine gute Position zu bringen, gegen solche Rechtsverstöße vorzugehen, ist naiv: Wer würde den privat persönlich gegen Open AI klagen (die übrigens auch „gemeinnützig“ gestartet sind und erst jetzt plötzlich nicht mehr gemeinnützig sein wollen)?
Ein Widerspruch muss m.E. nicht bedeuten, dass man Regelungen zum Thema für die VG Wort unmöglich macht, sondern dass man die Juristen der VG Wort zwingt, sich noch einmal selbst anzusehen, was sie da verfasst haben, und zu prüfen, ob die Ziele, die man eigentlich verfolgt, damit erreichbar sein können.
Meiner Meinung nach können sie’s mit dem vorliegenden neuen Text nicht. Es wird das Gegenteil bewirkt. Und das ist ein Schaden, der sich nicht wieder reparieren lässt.
Alles Gute!
Thomas Montasser
Lieber Herr Montasser,
vielen Dank für Ihren Kommentar. Ich finde den Austausch fruchtbar. Kurz inhaltlich: niemand muss gegen Open AI klagen, denn was die VG Wort ja nicht tut und will, und auch gar nicht kann ist: rückwirkend die Lizenz für bereits geschehene Verstöße gegen das Urheberrecht erteilen. Es geht hier nicht um alle generativen KI, die bislang erstellt wurden. Es geht um die Lizensierung für das Training neuer, unternehmensinterner generativer KI-Modelle, die eventuell erstellt werden. (Ich weiß nicht, ob Sie das missverstanden haben, aber bei einigen Beiträgen im Netz hatte ich den Eindruck, dass da eine Vermischung stattfindet.)
Zweitens möchte ich darauf hinweisen, dass es eben möglicherweise teilweise um Unternehmen (Pharmaunternehmen?) und Organisationen oder Behörden geht, so dass eine Schärfung des Begriffs hier nicht möglich ist. Überhaupt ist ja noch gar nicht bekannt, ob und wer denn an solchen Angeboten interessiert ist, und wie und ob sich diese Lizenzpakete dann auch durch die VG Wort monetarisieren lassen. Ich verstehe hier jede Vorsicht, denn das ist im merkel’schen Sinne echtes Neuland. Darin beruht allerdings auch die Vagheit mancher Formulierung: man weiß es noch nicht genau.
Darüber, dass die Kommunikation hier nicht optimal lief, müssen wir glaube ich nicht sprechen. Der Beschluss der Mitgliederversammlung erging aber bereits am 1. Juni, das Thema wurde in der Presse aufgearbeitet. Ich weiß, dass enthebt die VG Wort hier nicht zu versuchen, ihre Wahrnehmungsberechtigten abzuholen.
Vielen Dank für den Austausch!
Herzlich, Lena Falkenhagen
„Generative KI kann nach heutigem Wissenstand nicht wieder ‚verlernen‘, was sie einmal gelernt hat.“
Das stimmt, sofern es um ein einmal trainiertes Modell geht. Sobald es um ein neues Modell geht, wirkt natürlich bei deren Training die aktuelle Rechtesituation – was bei unternehmensinterner KI auch den nachträglichen Entzug der Wahrnehmung der Lizensierungsrechte durch die VG Wort betrifft.
Wenn allerdings in den Unternehmen nur externe Foundationmodels für interne Nutzung fine-getunet („nachtrainiert“) werden sollten mit den lizensierten Daten, dann steckt ein Werk u.U. sowohl illegal im Basismodell (wegen Berufung auf TDM) wie legal im fine-getuneten. All diese Feinheiten werden sich erst in der Praxis zeigen.
Alles weiterhin höchstkompliziert – und die Rechtslage wird uns noch auf Jahre und Jahrzehnte beschäftigen.
Hauptsache am Ende gibt es eine angemessene Vergütung für alle Urheber.
Seine Werke von der Nutzung (unabh. von der VG Wort-Vetragsänderung) grundsätzlich auszuschließen, würde einen wiederum langfristig mglw. auch von späteren Vergütungen ausschließen.
Lieber Jens Olaf Koch,
vielen Dank für den Beitrag. Ja. Es bleibt kompliziert. Ich bin auch höchst unzufrieden mit der Gesamtsituation. Die VG Wort versucht hier, neben der juristischen Klärung der Situation auch ganz pragmatisch einen Weg zu bahnen. Ich hoffe für uns, dass hier ein Anfang gemacht wird.
Herzliche Grüße,
Lena Falkenhagen
Liebe Frau Falkenhagen,
trotz all der vorgebrachten Argumente steht meine Entscheidung: ich habe gegen die Nutzungsfreigabe durch die VG Wort optiert.
Insgesamt scheint es mir die Reaktion der VG Wort eh etwas zu spät. Seit rund anderthalb Jahren verzeichne ich auf meiner Webseite mit Blog, also sehr viel Text, den ich versuchte doppelt legal gegen Raubkopie zu sichern (einmal per Software die Kopieren unterbinden soll, aber nur für unbedarfte Gemüter tut, sowie durch klare Hinweise auf den gültigen Urheberrechtsschutz) eine enorme Zunahme an Zugriffen durch Bots. Bei näherer Analyse erwiesen sich diese als KI-Trainigs-Bots. Daher griff ich zu einer simplen wie harten Methode. Mein Admin begrenzte die Anzahl der Zugriffe pro Minute drastisch. Damit sind Bots ausgebremst. Zudem setzt der Admin sämtliche KI-Bots auf eine Schwarze Liste, was deren Ips zuverlässig und für immer blockiert. Bedauerlicherweise nutzen diese Bots verschiedene VPN Anbieter und damit jede Menge Ips, die ebenfalls von meinen eigentlichen Lesern genutzt werden. Damit kommt es nun, wegen der KI-Trainings-Bots immer öfter zu Situationen, in denen wohlmeinende Leser und Interessenten geblockt werden. Nur wenige haben den Mut, sich an den Admin zu wenden, damit er individuell Ips entblocken kann.
So etwas sollte nicht nötig sein. Dennoch bleibe ich dabei: bevor ich, zudem mit Billigung durch die VG Wort, meine im Internet stehenden Texte für KI pauschal freigebe, bleibe ich erst einmal bei dieser Handgestrickten Lösung und meiner Ablehnung der Freigabe durch die VG Wort.
Freundliche und kollegiale Grüße
Frederik D. Tunnat
Danke für diese Rückmeldung! Das ist sehr interessant.
Und ich bin völlig bei Ihnen: ich halte es für eine unzumutbare Umkehrung des Urheberrechtsprinzips, dass wir unsere Werke vor Missbrauch selbst absichern müssen.
Liebe Frau Falkenhagen,
genauso sehe ich das auch, darum viel Glück bei dem Versuch, etwas gegen diese Umkehrung zu unternehmen. Da ich ebenfalls schon lange skeptisch gegenüber dem Umgang mit Urheberrechten im Internet bin, steht auf meiner Webseite nur das Notwendigste. Ich fürchte, sonst wäre ich mehr mit technischen Dingen beschäftig, als mit Literatur.
Herzliche Grüße
Mark Behrens
Vielen Dank für den Kommentar! Ich verstehe Ihre Vorsicht. Aber dass es inzwischen dazu gekommen ist, dass man lieber gar nicht am Diskurs teilnimmt, weil die Texte sonst zweckentfremdet werden, ist eine Umkehrung des urheberrechtlichen Prinzips.
Liebe Frau Falkenhagen,
nein, gar nicht am Diskurs teilzunehmen, geht nicht, klar. Das tue ich ja gelegentlich (wie mit diesem Kommentar) und es ist ja auch nicht so, dass auf meiner Website gar nichts stünde.
Herzliche Grüße
Mark Behrens