AI-robot peker mot et symbol for lovparagraf på 3D bakgrunn

Skapende kunstig intelligens vs. opphavsrett

Årsskiftet 2022/2023 satte selskapet OpenAI kunstig intelligens («KI»/«AI») virkelig på agendaen, med sin tjeneste ChatGPT. Kunstig intelligens bringer med seg både utfordringer og muligheter, og mange har sikkert fått med seg alt fra dommedagsprofetier til store lovnader om teknologiens potensiale.

Hvilken betydning KI kommer til å få for menneskeheten generelt, kan nok ikke vi hos Patentstyret svare på. Det vi imidlertid kan si noe om er hvilken betydning kunstig intelligens vil kunne få for immaterielle rettigheter. 

Det er særlig generativ KI som har fått fokus i KI-bølgen som har skylt over verden den siste tiden. Generativ KI er kunstig intelligens som kan produsere nytt, originalt innhold – som tekst, bilder og musikk. En slik KI-modell greier dette fordi den er eksponert for store mengder data relatert til oppgaven den er designet for, som tekst- eller bildeproduksjon, og den er programmert til å finne mønstre og relasjoner i dataene.

Disse mønstrene og sammenhengene som den har lært kan den anvende igjen når det kommer til generering av nytt innhold. En tjeneste som ChatGPT er for eksempel trent på enorme mengder med tekst, og har av all denne teksten lært seg mønstre og sammenhenger i menneskelig språk, og kan dermed formulere seg på en svært menneskeaktig måte. 

Nesten alt materiale som en slik KI er trent opp på, er beskyttet av opphavsrett, og materialet KI-en igjen produserer, er materiale som tradisjonelt sett har kvalifisert for opphavsrettslig beskyttelse. 

Krenker det opphavsrett å trene opp generativ KI på opphavsrettsbeskyttet materiale? 

Trening av KI-modeller, som vi så vidt tok for oss innledningsvis, involverer noe som heter «tekst- og datautvinning», eller «text and data mining» – ofte forkortet til «TDM». Dette er et paraplybegrep som refererer til den automatiske prosessen hvor store sett med tekst og data analyseres for å oppdage mønstre og sammenhenger. Når TDM-prosessen er utført, kan KI-modellen anvende det den har lært, for å generere nytt materiale.  

Når man utfører TDM vil det ofte være et uunngåelig steg i prosessen at det skjer en form for kopiering av materialet man ønsker å utvinne fra. I prinsippet krenker derfor slik utvinning opphavsrett. Men, poenget med tekst- og datautvinning er imidlertid ikke å kopiere dette materialet, bare å hente ut ideer og fakta som ligger bak. Opphavsrett er ikke ment å gi vern til og beskytte ideer og fakta. Derfor er det kanskje noe paradoksalt at man krenker opphavsrett når man utfører tekst- og datautvinning.  

Det tok ikke lang tid fra generativ KI begynte å skape overskrifter, til dens bruk av opphavsrettsbeskyttet materiale begynte å skape stor debatt. På den ene siden har du de som mener opphavspersoner bør kompenseres for bruken av verk i KI-trening. Og på andre siden har du de som mener at man mer fritt bør kunne utføre TDM og trening av KI på opphavsrettsbeskyttet materiale, siden formålet egentlig bare er å hente ut rene ideer og fakta, som i seg selv ikke er ment å være beskyttet. 

Ettersom TDM i utgangspunktet krenker opphavsrett, men ikke har som formål å kopiere, har EU funnet det nødvendig å komme med noen særregler som regulerer akkurat dette. Disse reglene vil ha betydning for trening av KI på materiale beskyttet av opphavsrett. 

Ny EU/EØS-lovgivning 

Et EU-direktiv om opphavsrett i den digitale sfære fra 2019, kalt digitalmarkedsdirektivet, inneholder regler knyttet til TDM i direktivets artikkel 3 og 4. Siden man benytter TDM-teknikker for å trene opp generativ KI, vil disse reglene være av stor betydning når det kommer til lovligheten av å trene opp KI på opphavsrettsbeskyttet materiale. Dette direktivet vil om kort tid gjennomføres i norsk lovgivning – antakelig i løpet av 2024.  

Reglene i dette EU-direktivet inneholder en begrensning i opphavsretten, slik at tekst- og datautvinning som utgangspunkt blir lovlig. Etter artikkel 3 i direktivet vil forskningsinstitusjoner fritt kunne utøve tekst- og datautvinning i alt av opphavsrettsbeskyttet materiale. Artikkel 4 sier at andre aktører, som for eksempel kommersielle virksomheter, kan utføre tekst- og datautvinning i alt av opphavsrettsbeskyttet materiale, så lenge opphavspersonen(e) ikke har inntatt en eksplisitt reservasjon mot dette.  

Opphavspersoner får altså en mulighet til å reservere seg mot at deres verk skal benyttes i TDM i en rekke tilfeller, og derfor også i trening av generativ KI. En utfordring her er imidlertid at man foreløpig ikke har noen felles omforente føringer som sier hvordan en slik reservasjon skal se ut. Siden slike reservasjoner i utgangspunktet kan fremgå på mange ulike måter, vil det være en utfordring for KI-modellene som trenes på opphavsrettslig materiale å fange opp reservasjonene. Det er dermed en risiko for at KI ved en feil trenes opp på materiale det ikke er tillatt å trene på. Om man får slike føringer for reservasjon på plass, og hvordan de vil se ut, vil tiden vise.  

EU-landene har nylig også kommet til politisk enighet om utkastet til helt egen KI-lov (forordning) kalt «Artificial Intelligence Act», eller «AI Act». Denne forordningen, som tidligst trer i kraft i 2025, er ment å være et harmonisert rammeverk med felles regler og sikkerhetstiltak for utvikling og bruk av kunstig intelligens på en rekke områder.  

Når det kommer til opphavsrett, ser det ut til at AI Act vil fastslå at KI-tilbydere må respektere rettighetshaveres mulighet til å reservere seg mot tekst- og datautvinning etter digitalmarkedsdirektivet fra 2019, og dermed også mot KI-trening. Det at TDM-reglene fra 2019 får betydning for KI-trening har lenge vært antatt, men dette ser altså ut til å ville fremgå eksplisitt av AI Act. Videre stilles det i AI Act krav om at KI-tilbydere må synliggjøre hvilket opphavsrettsbeskyttet materiale som har blitt brukt i KI-treningen. På denne måten vil opphavspersoner få mulighet til å vite når deres verk brukes i trening av KI, og man vil i så fall kunne ta et informert valg om man ønsker å reservere seg mot TDM som et ledd i KI-trening ved senere anledninger. 

Vi mener at disse nye reglene fra EU kan bidra til å skape tydeligere rammer når det kommer til forholdet mellom trening av KI og opphavsrett.  

Får noen opphavsrett til det generativ KI skaper? 

Vi har nå sett på trening av generativ KI og om dette krenker opphavsrett. En annen side av samme sak er om materialet som skapes av KI får opphavsrett. 

Generativ KI kan skape verk som typisk faller innenfor de kategoriene av verk som beskyttes av opphavsrett, slik som tekst, musikk og billedkunst. Men vil noen få en enerett i form av opphavsrett til disse verkene – og hvem skulle i så fall fått denne eneretten? 

Kan KI-en selv få opphavsrett til det den skaper? 

Siden det tross alt er KI-en som skaper verket, er det kanskje mest naturlig å først spørre om selve KI-modellen kan få opphavsrett til verkene den skaper. Åndsverkloven § 2 stiller krav til at det må ha skjedd en «individuell skapende åndsinnsats» for at noen skal få opphavsrett i et verk. Dette kravet gir inntrykk av at opphavsrett ikke gjelder for verk som er skapt av maskiner. Selv om de omtales som å ha «intelligens», er jo KI-er egentlig bare avanserte dataprogrammer. I norsk juridisk teori ser det også ut til å være enighet om at det er kun mennesker som kan skape åndsverk. Man kan nok derfor trygt konkludere med at en KI-modell ikke selv kan få opphavsrett. 

Kan den som har utviklet KI-en få opphavsrett til det den skaper? 

Et annet spørsmål er om den som har utviklet KI-en skal få opphavsrett. Men de som har utviklet selve KI-modellen har jo egentlig bare programmert en god algoritme. Ut over det har de ingen nærmere kjennskap til de konkrete verkene som KI-modellen vil produsere. Som nevnt, må det ha skjedd en «individuell skapende åndsinnsats» for at noen skal få opphavsrett. Om man kan si at utviklerne av en tjeneste som ChatGPT har utøvd en slik innsats i hvert enkelt av de millionene av tekster som tjenesten genererer daglig, blir nok å trekke det for langt. 

Får den som bruker en KI til å skape verk opphavsrett? 

Et tredje spørsmål man kan stille i forbindelse med opphavsrett til KI-generert materiale, er om den som bruker KI kan få opphavsrett. I noen tilfeller vil bare et par tastetrykk fra brukeren generere verk. Dette kan åpenbart ikke sies å være en «individuell skapende åndsinnsats». Men hva hvis brukeren av en KI er særdeles spesifikk i hva hen bestiller fra KI-en, er helt bevisst på hvilket sluttresultat hen ønsker, og egentlig bruker KI-en mer som et kunstnerisk redskap enn en endestasjon? Kan dette begrunne en rettighet? Her kan det nok være rom for tvil i enkelte tilfeller. 

Humanoid AI robot maler en komposisjon på et lerret i studio
Humanoid AI robot maler en komposisjon på et lerret i studio

Kan innholdsgenerende KI krenke opphavsrett? 

Nå har vi sett at generativ KI, etter å ha blitt trent opp på tusenvis av allerede eksisterende verk, har lært seg å generere egne, nye verk. Men hva skjer hvis generativ KI produserer noe som er identisk eller ligner i stor grad på noe som allerede eksisterer og er beskyttet av opphavsrett? 

Det er, som vi har sett, ikke slik at det KI produserer er et resultat av «klipp og lim». Generativ KI har lært seg bakenforliggende mønstre som finnes i eksisterende verk, og bruker dette til å produsere noe helt nytt. For eksempel er ChatGPT blitt så god på å skjønne systemet i menneskelig språk, at den har lært seg å generere nye setninger helt på egenhånd. 

Dersom en slik KI skaper noe som ligner på et annet åndsverk, men det er tale om en form for verk hvor man har få kreative valgmuligheter for å komme frem til det endelige resultatet, kan KI-verket kanskje være å anse som en tilfeldig dobbeltfrembringelse. En dobbeltfrembringelse er et verk som er identisk eller svært likt et annet, men som har blitt skapt helt uavhengig av det andre. Dersom det faktisk er tale om en slik dobbeltfrembringelse, vil det ikke utgjøre en krenkelse av opphavsrett. 

Men dersom en KI reproduserer noe som inngår som en del av treningsmaterialet, og det i tillegg har vært et stort rom for valgmuligheter, skal det nok en del til for å bevise at det ikke har skjedd en krenkelse av opphavsretten her. 

Veien videre – veien blir til mens man går 

En av de største utfordringene når det kommer til samspillet mellom lovregulering og teknologi, er at teknologien utvikler seg mye raskere enn det er mulig å vedta nye lover. Men med både EU-reglene om tekst- og datautvinning fra 2019, og den kommende AI Act, har man nå tatt viktige steg for å ruste seg for utfordringene mellom generativ KI og opphavsrett. Det er imidlertid fortsatt mye som er uavklart, og noe av veien må nok bli til mens man går.  

Dette var også tilfellet da internett ble allemannseie for noen tiår siden. Dette skapte store opphavsrettslige spørsmål og utfordringer, slik KI-eksplosjonen har gjort i dag. Dette ble løst både gjennom anvendelse av eksisterende regelverk og gjennom særskilte tilpasninger der det var behov. 

Til orientering er Kulturdepartementet fagdepartement for opphavsrett i Norge. Men hos Patentstyret følger vi naturligvis med på utviklingen og forholdet mellom opphavsrett og KI, som kompetansesenter for immaterielle rettigheter. 

Relaterte artikler