Die EU hat ein Template für Trainingsdaten für Anbieter von GPAI-Modellen veröffentlicht. Der nachfolgende Beitrag ist eine Ergänzung zu Randnummer 323 des Skripts „Grundwissen KI-Recht“. Darin wird vertiefend dargestellt, wie das Template rechtlich einzuordnen ist: Als Standard der Veröffentlichungspflicht i.S.v. Art. 53 (1) d) EU AI Act.
Wie ist der Kontext im Skript?
In Randnummer 323 geht es um einen Fall, in dem ein StartUp als Anbieter* eines KI-Systems vom Anbieter eines GPAI-Modells Einblick in die Trainingsdaten verlangt. Diesen Anspruch hat der Anbieter des GPAI-Modells mit Hinweis auf seine Vertragsklauseln abgelehnt.
Art. 53 (1) b) i.V.m. Anhang XII?
Diese Ansprüche bestehen zwar dem Grunde nach, sind aber im Hinblick auf Trainingsdaten sehr schwammig, da Anhang XII 2. c) anders als Anhang XI u.a. aufgrund der Formulierung „gegebenenfalls“ im Hinblick auf die verwendeten Daten nicht genau präzisiert, in welchem Umfang der Anspruch besteht. Schon hier könnte das Template eine Rolle spielen.
Die EU verweist in ihrer Publikation des Templates ausdrücklich auf Art. 53 (1) d) EU AI Act. Dies ist die allgemeine Pflicht zur Veröffentlichung der Trainingsdaten. Der Haken: Diese Veröffentlichungspflicht besteht nur gegenüber den Aufsichtsbehörden – sie ist kein individueller Anspruch nachgelagerter Anbieter. Wie im Fall unter Randnummer 323 beschrieben besteht daher grds. kein Anspruch von F auf die Inhalte, die entsprechend dem Template veröffentlicht werden müssten.
Verletzung der Veröffentlichungspflicht?
Pflichtverletzungen bei Nichtveröffentlichung der Trainingsdaten können somit nur von der Marktaufsichtsbehörde geahndet werden. F bleibt auch nach Veröffentlichung des Templates durch die EU lediglich ein Recht auf Beschwerde nach Art. 85, 87 EU AI Act. Damit ist aber kein Anspruch auf Marktaufsicht verbunden.
Was ist im Template darzulegen?
Die EU verweist explizit auf Erwägungsgrund 107. Darin heißt es:
(107) Um die Transparenz in Bezug auf die beim Vortraining und Training von KI-Modellen mit allgemeinem Verwendungszweck verwendeten Daten, einschließlich urheberrechtlich geschützter Texte und Daten, zu erhöhen, ist es angemessen, dass die Anbieter solcher Modelle eine hinreichend detaillierte Zusammenfassung der für das Training des KI-Modells mit allgemeinem Verwendungszweck verwendeten Inhalte erstellen und veröffentlichen. Unter gebührender Berücksichtigung der Notwendigkeit, Geschäftsgeheimnisse und vertrauliche Geschäftsinformationen zu schützen, sollte der Umfang dieser Zusammenfassung allgemein weitreichend und nicht technisch detailliert sein …
Das Template umfaßt hauptsächlich drei Elemente:
- Allgemeine Informationen
- Liste der Datenquellen
- Relevante Aspekte der Datenverarbeitung
Hinsichtlich der allgemeinen Informationen verlangt das Template Angaben zur Identifizierung des Anbieters und des Modells sowie Informationen zu den Modalitäten und den allgemeinen Merkmalen der Trainingsdaten.
In Bezug auf die Liste der Datenquellen verlangt das Template die Offenlegung der wichtigsten Trainings-Datensätze. Darüber hinaus ist ein umfassender narrativer Bericht über die verwendeten Online-Daten erforderlich sowie eine Beschreibung aller weiteren Datenquellen zur Gewährleistung der Vollständigkeit.
Hinsichtlich der Datenverarbeitung fordert das Template die Offenlegung von Datenverarbeitungsaspekten, um Parteien mit berechtigten Interessen nach Unionsrecht die Wahrnehmung ihrer Rechte zu ermöglichen. Das gilt u.a. in Bezug auf das Urheberrecht oder die Entfernung illegaler Inhalte, die andernfalls in großem Maßstab reproduziert und verbreitet werden könnten.
Unterschied zu Anhang XI/XII?
Die Informationen, die mit dem Template nach Art. 53 (1) d) EU AI Act veröffentlicht werden, unterliegen in keiner Form der Geheimhaltung. Sie sind frei zugänglich und enthalten keine Geheimnisse, die gem. Art. 78 (1) EU AI Act vertraulich zu behandeln wären.
Informationen gemäß Anhang XI haben einen deutlich detaillierteren Umfang und können somit auch Informationen beinhalten, die der Vertraulichkeit nach Art. 78 EU AI Act unterliegen. Das Template regelt lediglich die Anforderungen für eine angemessene Information Richtung Öffentlichkeit.
Art. 53 (1) b) EU AI Act i.V.m. Anhang XII gewähren zwar Transparenzrechte für nachgelagerte Anbieter gegenüber den Anbietern von GPAI-Modellen. Im Hinblick auf den Umfang reichen diese Rechte im Fall von Trainingsdaten jedoch kaum über die Angaben im Template hinaus. 2 c) ist hier insbesondere durch die Formulierung „gegebenenfalls“ sehr schwammig. Allerdings ist hier beim Austausch von Information auf Basis von Anhang XII die Verschwiegenheitspflicht nach Art. 78 EU AI Act zu beachten. Ggf. sind Beschwerden nach Art. 85, 87 EU AI Act möglich.
Fazit:
Es handelt sich um ein Template im Sinne von Art. 53 (1) d) EU AI Act. Bei den nachzuweisenden Inhalten gemäß Anhang XI/XII handelt es sich um wesentlich unterschiedliche Instrumente.
Ergänzung zum Skript „Grundwissen-KI-Recht“ zu Randnummer 323
Inhalte des Beitrags, u.a.:
- Template für Trainingsdaten i.S.v. Art. 53 (1) d) EU AI Act
- Abgrenzung zu Anhang XI und Anhang XII
- Vertraulichkeit nach Art. 78 EU AI Act
* Aus Gründen der besseren Lesbarkeit wird im Text die männliche Form verwendet, die weibliche Form ist selbstverständlich immer mit eingeschlossen.
