Tekst- og datamining efter ophavsretsloven
Den nye § 11b i ophavsretsloven, der implementerer dele af DSM-direktivet, giver adgang til at foretage eksemplarfremstilling ved tekst- og datamining, når der er lovlig adgang til værkerne, og rettighedshaver ikke udtrykkeligt har fravalgt brugen. Bestemmelsen er en undtagelse fra det almindelige krav om forudgående samtykke og er derfor snæver i sit formål: at muliggøre analytisk udtræk af mønstre i data uden at åbne for egentlig udnyttelse af værkerne.
Træning af AI-systemer indebærer typisk reproduktion af beskyttet materiale som led i modellernes læringsproces. TDM-begrebet omfatter sådanne tekniske kopier, men kun inden for rammerne af § 11b. Bestemmelsen flytter i praksis udgangspunktet for en del dataanvendelser, men efterlader centrale spørgsmål om rækkevidde og betingelser uafklarede.
Opt-out og lovligt forlæg i praksis
Lovlig adgang er en forudsætning: adgangen må bero på de faktiske vilkår for brugen, herunder eventuelle licensaftaler og tekniske adgangsbetingelser. Hvor grænsen går mellem åbent tilgængeligt indhold og indhold bag adgangskrav, der ikke må crawles, afhænger af konkrete vilkår og tekniske foranstaltninger. Kravet afspejler også ophavsretslovens generelle princip om lovligt forlæg.
Rettighedshavere kan fravælge TDM ved et udtrykkeligt forbehold afgivet på passende vis. Ifølge forarbejderne peger standarden mod maskinlæsbare løsninger, fx i metadata, website- eller tjenestevilkår samt kontraktuelle forbehold. I praksis ses både standardklausuler og brug af robots.txt. En praktisk udfordring er at sikre, at samarbejdspartnere og tredjeparter respekterer opt-out på rettighedshavers vegne, hvilket kræver styring af forsyningskæden og aftaleretlige mekanismer.
Konsekvenser og opbevaringsbegrænsning
Manglende opfyldelse af betingelserne for TDM kan føre til ophavsretlig krænkelse som følge af ulovlig eksemplarfremstilling. Sanktioner kan blandt andet bestå i forbud, erstatning og vederlag, afhængigt af krænkelsens karakter og tabets opgørelse. Vurderingen vil typisk være bevisintensiv og bero på dokumentation for datakilder og adgangsforhold.
§ 11b, stk. 3, pålægger desuden en opbevaringsbegrænsning: de eksemplarer, der skabes til TDM, må ikke opbevares længere end nødvendigt for miningen. Det forudsætter klare slettepolitikker, logning og intern kontrol, så opbevaring, deling og genbrug af datasæt ikke går ud over undtagelsens formål.
AI-forordningen og mulig IPR-disclosure
EU’s foreslåede AI-forordning opstiller krav til både udbydere og brugere, herunder transparens og tilstrækkelige garantier mod ulovligt indhold. Forslaget kan læses på EUR-Lex her.
Europa-Parlamentets forhandlingsposition indeholder en mulig IPR disclosure obligation i artikel 28b, stk. 4, litra c: udbydere af visse AI-systemer skal offentliggøre resuméer af ophavsretligt beskyttede træningsdata. Hensigten er at lette rettighedshaveres kontrol med dataanvendelsen, men der er usikkerhed om format, detaljeringsgrad og offentliggørelse. Udfordringen forstærkes af, at Danmark ikke har et registreringssystem for ophavsrettigheder. Bestemmelsen er endnu ikke endeligt vedtaget; Parlamentets version kan læses her.