
Skapende kunstig intelligens vs. opphavsrett
Hvilken betydning KI kommer til å få for menneskeheten generelt, kan nok ikke vi hos Patentstyret svare på. Det vi imidlertid kan si noe om er hvilken betydning kunstig intelligens vil kunne få for immaterielle rettigheter.
Det er særlig generativ KI som har fått fokus i KI-bølgen som har skylt over verden det siste året. Generativ KI er kunstig intelligens som kan produsere nytt, originalt innhold – som tekst, bilder og musikk. En slik KI-modell greier dette fordi den er eksponert for store mengder data relatert til oppgaven den er designet for, som tekst- eller bildeproduksjon, og den er programmert til å finne mønstre og relasjoner i dataene. Disse mønstrene og sammenhengene som den har lært kan den anvende igjen når det kommer til generering av nytt innhold. En tjeneste som ChatGPT er for eksempel trent på enorme mengder med tekst, og har av all denne teksten lært seg mønstre og sammenhenger i menneskelig språk, og kan dermed formulere seg på en svært menneskeaktig måte.
Nesten alt materiale som en slik KI er trent opp på, er beskyttet av opphavsrett, og materialet KI-en igjen produserer, er materiale som tradisjonelt sett har kvalifisert for opphavsrettslig beskyttelse.
KI reiser dermed flere utfordringer knyttet til opphavsrett, og i denne artikkelen vil vi ta for oss følgende spørsmål:
- Vil generativ KI krenke opphavsrett hvis den trenes opp på opphavsrettsbeskyttet materiale?
- Får noen opphavsrett til det materialet som generativ KI skaper?
- Kan materialet som generativ KI skaper krenke opphavsrett?
Krenker det opphavsrett å trene opp generativ KI på opphavsrettsbeskyttet materiale?
Trening av KI-modeller, som vi så vidt tok for oss innledningsvis, er en omfattende og komplisert prosess. Et steg i denne prosessen, av flere, involverer noe som heter «tekst- og datautvinning», eller «text and data mining» – ofte forkortet til «TDM». Dette er et paraplybegrep som refererer til den automatiske prosessen hvor store sett med tekst og data analyseres for å oppdage mønstre og sammenhenger. KI modellen kan anvende disse mønstrene og sammenhengene den lærer, når den senere skal generere nytt materiale.
Når man utfører TDM vil det ofte være et uunngåelig steg i prosessen at det skjer en form for kopiering av materialet man ønsker å utvinne fra. I prinsippet krenker derfor slik utvinning opphavsrett. Men, poenget med tekst- og datautvinning er imidlertid ikke å kopiere dette materialet, bare å hente ut ideer og fakta som ligger bak. Opphavsrett er ikke ment å gi vern til og beskytte ideer og fakta. Derfor er det kanskje noe paradoksalt at man krenker opphavsrett når man utfører tekst- og datautvinning.
Selv om vi kanskje er i den spede begynnelse hva gjelder generativ KI, har dens bruk av opphavsrettslig materiale allerede skapt mye debatt. Særlig internasjonalt, men også i Norge. Noen mener opphavspersoner bør kompenseres for bruken av verk i KI-trening. Andre mener at man mer fritt bør kunne utføre TDM og trening av KI på opphavsrettsbeskyttet materiale, siden man egentlig kun henter ut rene ideer og fakta, som i seg selv ikke er ment å være beskyttet.
Ettersom formålet med TDM ikke er å kopiere, har det også kommet noen regler fra EU om akkurat dette, som setter begrensninger i opphavspersoners anledning til å nekte TDM. Disse reglene kan muligens ha betydning for trening av KI på materiale beskyttet av opphavsrett.

Ny EU/EØS-lovgivning
Et EU-direktiv om opphavsrett i den digitale sfære fra 2019, kalt digitalmarkedsdirektivet, inneholder regler knyttet til TDM i direktivets artikkel 3 og 4. Reglene er ikke eksplisitt myntet på trening av KI, da TDM også kan brukes til en rekke andre formål. Men siden man benytter TDM-teknikker for å trene opp generativ KI, kan det være at disse reglene vil få betydning når det kommer til lovligheten av å trene opp KI på opphavsrettsbeskyttet materiale. Det er derfor viktig å få en formell avklaring på om reglene vil omfatte trening av KI eller ikke. Dette direktivet vil om kort tid gjennomføres i norsk lovgivning – antakelig i løpet av 2023 eller 2024.
Reglene i dette EU-direktivet inneholder en begrensning i opphavsretten, slik at tekst- og datautvinning som utgangspunkt blir lovlig. Etter artikkel 3 i direktivet vil forskningsinstitusjoner fritt kunne utøve tekst- og datautvinning i alt av opphavsrettsbeskyttet materiale. Artikkel 4 sier at andre aktører, som for eksempel kommersielle virksomheter, kan utføre tekst- og datautvinning i alt av opphavsrettsbeskyttet materiale, så lenge opphavspersonen(e) ikke har inntatt en eksplisitt reservasjon mot dette.
Reglene gir altså opphavspersoner en adgang til å reservere seg mot at deres verk skal benyttes i TDM i en rekke tilfeller. En utfordring her er imidlertid at man foreløpig ikke har noen felles omforente føringer som sier hvordan en slik reservasjon skal se ut. Siden slike reservasjoner i utgangspunktet kan fremgå på mange ulike måter, kan det være at TDM-programmene ikke fanger opp reservasjonene. Det er dermed en risiko for at TDM-programmene (og også AI-modellene) utfører TDM i materiale man ikke er tiltatt å gjøre det på. Om man får slike føringer for reservasjon på plass, og hvordan de vil se ut, vil tiden vise.
EU er også i sluttfasen av arbeidet med en egen KI-lov, kalt «Artificial Intelligence Act», eller «AI Act». Dette er ment å være et harmonisert rammeverk med felles regler og sikkerhetstiltak for utvikling og bruk av kunstig intelligens på en rekke områder. Når det kommer til opphavsrett, vil AI Act stille krav om å synliggjøre hvilket opphavsrettsbeskyttet materiale man har brukt i KI-trening. På denne måten vil opphavspersoner få mulighet til å vite når deres verk brukes i trening av KI. Man vil i så fall kunne ta et informert valg om man ønsker å reservere seg mot TDM som et ledd i KI-trening. Men ut over kravet om synliggjøring tar ikke AI Act stilling til opphavsrettslige utfordringer.

Får noen opphavsrett til det generativ KI skaper?
Vi har nå sett på trening av generativ KI og om dette krenker opphavsrett. En annen side av samme sak er om materialet som skapes av KI får opphavsrett.
Generativ KI kan skape verk som typisk faller innenfor de kategoriene av verk som beskyttes av opphavsrett, slik som tekst, musikk og billedkunst. Men vil noen få en enerett i form av opphavsrett til disse verkene – og hvem skulle i så fall fått denne eneretten?
Kan KI-en selv få opphavsrett til det den skaper?
Siden det tross alt er KI-en som skaper verket, er det kanskje mest naturlig å først spørre om selve KI-modellen kan få opphavsrett til verkene den skaper. Åndsverkloven § 2 stiller krav til at det må ha skjedd en «individuell skapende åndsinnsats» for at noen skal få opphavsrett i et verk. Dette kravet gir inntrykk av at opphavsrett ikke gjelder for verk som er skapt av maskiner. Selv om de omtales som å ha «intelligens», er jo KI-er egentlig bare avanserte dataprogrammer. I norsk juridisk teori ser det også ut til å være enighet om at det er kun mennesker som kan skape åndsverk. Man kan nok derfor trygt konkludere med at en KI-modell ikke selv kan få opphavsrett.
Kan den som har utviklet KI-en få opphavsrett til det den skaper?
Et annet spørsmål er om den som har utviklet KI-en skal få opphavsrett. Men de som har utviklet selve KI-modellen har jo egentlig bare programmert en god algoritme. Ut over det har de ingen nærmere kjennskap til de konkrete verkene som KI-modellen vil produsere. Som nevnt, må det ha skjedd en «individuell skapende åndsinnsats» for at noen skal få opphavsrett. Om man kan si at utviklerne av en tjeneste som ChatGPT har utøvd en slik innsats i hvert enkelt av de millionene av tekster som tjenesten genererer daglig, blir nok å trekke det for langt.
Får den som bruker en KI til å skape verk opphavsrett?
Et tredje spørsmål man kan stille i forbindelse med opphavsrett til KI-generert materiale, er om den som bruker KI kan få opphavsrett. I noen tilfeller vil bare et par tastetrykk fra brukeren generere verk. Dette kan åpenbart ikke sies å være en «individuell skapende åndsinnsats». Men hva hvis brukeren av en KI er særdeles spesifikk i hva hen bestiller fra KI-en, er helt bevisst på hvilket sluttresultat hen ønsker, og egentlig bruker KI-en mer som et kunstnerisk redskap enn en endestasjon? Kan dette begrunne en rettighet? Her kan det nok være rom for tvil i enkelte tilfeller.

Kan innholdsgenerende KI krenke opphavsrett?
Nå har vi sett at generativ KI, etter å ha blitt trent opp på tusenvis av allerede eksisterende verk, har lært seg å generere egne, nye verk. Men hva skjer hvis generativ KI produserer noe som er identisk eller ligner i stor grad på noe som allerede eksisterer og er beskyttet av opphavsrett?
Det er, som vi har sett, ikke slik at det KI produserer er et resultat av «klipp og lim». Generativ KI har lært seg bakenforliggende mønstre som finnes i eksisterende verk, og bruker dette til å produsere noe helt nytt. For eksempel er ChatGPT blitt så god på å skjønne systemet i menneskelig språk, at den har lært seg å generere nye setninger helt på egenhånd.
Dersom en slik KI skaper noe som ligner på et annet åndsverk, men det er tale om en form for verk hvor man har få kreative valgmuligheter for å komme frem til det endelige resultatet, kan KI-verket kanskje være å anse som en tilfeldig dobbeltfrembringelse. En dobbeltfrembringelse er et verk som er identisk eller svært likt et annet, men som har blitt skapt helt uavhengig av det andre. Dersom det faktisk er tale om en slik dobbeltfrembringelse, vil det ikke utgjøre en krenkelse av opphavsrett.
Men dersom en KI reproduserer noe som inngår som en del av treningsmaterialet, og det i tillegg har vært et stort rom for valgmuligheter, skal det nok en del til for å bevise at det ikke har skjedd en krenkelse av opphavsretten her.
Veien videre – ingen vet hvor den kunstig intelligente haren hopper
En av de største utfordringene når det kommer til samspillet mellom lovregulering og teknologi, er at teknologien utvikler seg mye raskere enn det er mulig å vedta nye lover. EU-reglene om tekst- og datautvinning kom i 2019, og reglene var heller ikke direkte myntet på KI, selv om mange så for seg at de kunne bli relevante her. Den videre utviklingen av KI var, og er fortsatt, vanskelig å forutse.
Som tidligere nevnt er EU i sluttfasen med sin «AI Act», men verken opphavsrett eller generativ KI er i hovedfokus her. Foruten kravet om synliggjøring av hvilket opphavsrettsbeskyttet materiale som er brukt i KI-trening, er opphavsrett ikke regulert. Det er imidlertid antatt at det vil komme mer EU-regulering på dette området etterhvert. Ingen vet hvor den kunstig intelligente haren hopper, og det blir interessant å følge med videre på den teknologiske og den rettslige utviklingen, og samspillet her.
Til orientering er Kulturdepartementet fagdepartement for opphavsrett i Norge. Men hos Patentstyret følger vi naturligvis med på utviklingen og forholdet mellom opphavsrett og AI, som kompetansesenter for immaterielle rettigheter.