
Negli ultimi giorni si sono verificati alcuni fatti che in qualche modo rendono più profondo il solco che separa Stati Uniti e Unione Europea in materia di rapporti tra AI generativa e copyright.
Da una parte abbiamo gli States, paese di common law, ove un ruolo primario di indirizzo è svolto dalle decisioni delle corti.
Dall’altra abbiamo l’Europa, dove la guida è in questo momento affidata al legislatore UE, all’AI Act ed alle varie fonti che da esso promanano. È della scorsa settimana la notizia della pubblicazione da parte della Commissione Europea del modello (“template for the public summary of training content for General Purpose AI Models”) di sintesi delle fonti utilizzate per l’addestramento dei sistemi di intelligenza artificiale: in base alle relative linee guida, mediante tale documento dovrà essere rivelato il contenuto che ha costituito la base dell’addestramento. Sebbene i contorni siano ancora da definire, tutto sembra andare, insomma, nella direzione di un riconoscimento di diritti, anche di sfruttamento economico, in capo i titolari del copyright.
In senso opposto sembrano andare gli Stati Uniti dove il presidente Trump ha commentato negativamente l’assenza di una disciplina dei profili copyright nel contesto dell’”American AI Action Plan”, programma appena varato per vincere la partita mondiale dell’Intelligenza Artificiale: Trump derides copyright and state rules in AI Action Plan launch – POLITICO.
Per il vero gli Stati Uniti, patria dei primi sistemi AI generativa, stanno facendo scuola con i molteplici casi pendenti (DAIL – the Database of AI Litigation – Ethical Tech Initiative). E alcune di queste controversie hanno creato i presupposti per il raggiungimento di accordi economici tra piattaforme AI e titolari dei diritti, basati sulla licenza di contenuti riguardo agli archivi, credits e links riguardo alle fonti citate e supporto tecnologico alle aziende dell’industria culturale.
Molto interessante il caso B. (B. et al. v. Anthropic PBC), deciso in via cautelare il 23 giugno 2025, perché ci aiuta a capire un po’ meglio in che modo i sistemi AI utilizzano i contenuti protetti dal diritto d’autore.
Il caso B. et al. v. Anthropic PBC
La recente decisione della Corte distrettuale degli Stati Uniti per la California settentrionale si candida a diventare un riferimento importante sul rapporto tra intelligenza artificiale generativa e diritto d’autore. La Corte ha riconosciuto, in quel contesto, l’applicabilità del principio del fair use all’utilizzo di opere protette per l’addestramento di modelli linguistici di grandi dimensioni (LLM).
Tuttavia, la questione resta aperta, trattandosi di un giudizio sommario. E, come spesso accade con le sentenze se non ci si limita a leggere il titolo delle news ma si legge l’intero provvedimento, la Corte californiana ha emesso un provvedimento meno sovversivo di quanto sembri.
I diversi tipi di utilizzo di opere protette dal copyright
La causa è stata promossa da tre autori – A.B., C.G. e K.W.J. – contro Anthropic PBC, sviluppatrice del modello Claude. Oggetto del contendere era l’utilizzo, da parte dell’azienda, di milioni di libri protetti da copyright per la costruzione di una libreria digitale centrale, comprendente sia opere acquistate e digitalizzate, sia testi ottenuti da fonti pirata.
Uno dei motivi di interesse di questa pronuncia è l’analiticità dell’esame che essa conduce in ordine alle varie tipologie di utilizzo dei contenuti. L’altro espetto degno di nota è che il modello Claude è dotato di un filtro che impedisce di avere un output in violazione al diritto d’autore: il risultato del lavoro di questo modello non potrà mai essere identico ad un brano di un’opera con cui è stato addestrato.
Con la conseguenza che l’intero accertamento giudiziale è incentrato sull’addestramento dell’AI. Il giudice ha distinto con attenzione le diverse ipotesi, valutate una per una ai sensi della Sezione 107 del Copyright Act:
– Addestramento con opere lecitamente acquisite: la Corte ha ritenuto lecito, in quanto trasformativo, l’utilizzo di opere protette acquistate per l’addestramento del modello Claude. Il processo di addestramento non era volto alla riproduzione o distribuzione delle opere originali, ma a estrarne strutture statistiche necessarie per la generazione di nuovo testo, in modo autonomo e creativo. Il fatto che Claude non producesse output riconducibili direttamente ai testi originali — unito all’implementazione di filtri preventivi su input e output per evitare violazioni — ha giocato un ruolo centrale nella valutazione di legittimità.
– Digitalizzazione di libri cartacei legalmente acquistati: anche la conversione di opere acquistate in formato fisico è stata considerata un caso di fair use. La finalità era limitata alla gestione interna — archiviazione e consultazione — senza finalità di distribuzione o sfruttamento commerciale. La distruzione delle copie fisiche dopo la scansione ha rafforzato l’argomento secondo cui non si trattava di una duplicazione indebita.
– Utilizzo di copie piratate: di segno opposto la valutazione sull’inserimento nella libreria centrale di opere ottenute da siti non autorizzati. Nonostante la successiva rinuncia al loro impiego per l’addestramento, la Corte ha qualificato tale condotta come violazione irrimediabile dei diritti degli autori, escludendo ogni applicabilità del fair use. Il semplice fatto di detenere copie piratate — per scopi anche solo potenziali — è stato ritenuto lesivo del diritto d’autore.
Fair use americano e eccezioni e limitazioni al diritto d’autore nell’UE: modelli a confronto
La decisione va letta alla luce delle peculiarità del principio del fair use, proprio dei sistemi di common law. Esso consente, in via eccezionale e da valutare caso per caso, l’utilizzo di opere protette senza previa autorizzazione del titolare, qualora l’uso soddisfi determinati criteri, tra cui: lo scopo (ad es. educativo o trasformativo), la natura dell’opera, l’entità dell’utilizzo e l’effetto sul mercato dell’opera originale.
Anche in questo caso la Corte non ha saputo fare a meno di evocare un refrain ricorrente negli Stati Uniti: “tutti leggono testi, poi scrivono nuovi testi. Potrebbero dover pagare per mettere le mani su un testo in primo luogo. Ma far pagare qualcuno specificamente per l’uso di un libro ogni volta che lo leggono, ogni volta che lo richiamano dalla memoria, ogni volta che in seguito vi attingono quando scrivono nuove cose in nuovi modi sarebbe impensabile. Per secoli, abbiamo letto e riletto libri. Abbiamo ammirato, memorizzato e interiorizzato i loro temi travolgenti, i loro punti sostanziali e le loro soluzioni stilistiche a problemi di scrittura ricorrenti.”
Ma se negli States il piacere della lettura è diventato una esimente, in Europa potremmo raggiungere le stesse conclusioni?
Nell’ordinamento europeo le eccezioni al diritto d’autore sono tassative e di stretta interpretazione, costituendo deroghe al principio generale della riserva dei diritti.
L’articolo 4 della Direttiva (UE) 2019/790 sul diritto d’autore nel mercato unico digitale ha introdotto, come noto, l’eccezione per le attività generalizzata di text and data mining (TDM), permettendo la riproduzione e l’estrazione di opere legittimamente accessibili, purché non sia stata esercitata una riserva da parte dei titolari con modalità leggibili dalla macchina (“opt-out”).
L’intento della Direttiva è favorire l’innovazione e la ricerca, ma l’eccezione resta circoscritta: consente la creazione di copie funzionali alla fase analitica del TDM, finalizzata a estrarre informazioni o tendenze, ma non autorizza l’uso creativo delle opere per la generazione di contenuti assimilabili a quelli originari.
A differenza dell’eccezione obbligatoria per TDM prevista dall’articolo 3, a beneficio delle organizzazioni di ricerca e le istituzioni del patrimonio culturale e limitata a scopi di ricerca scientifica, l’eccezione di TDM prevista dall’articolo 4 non ha restrizioni in termini di beneficiari o scopi e quindi, ricorrendone le condizioni, include usi commerciali. Questa previsione è richiamata dall’AI Act (art. 53, par. 1, lett. c) nell’imporre ai fornitori di modelli di AI per finalità generali l’obbligo di individuare e verificare l’esercizio dell’opt-out, e rappresenta quindi la soluzione proposta dal legislatore UE per la disciplina dell’addestramento dei modelli di AI generativa.
Fino ad oggi però abbiamo assistito ad una grande corsa all’opt out, con riserva dei diritti sui contenuti onde evitare l’addestramento non autorizzato. Ma si tende a trascurare la circostanza che l’eccezione per il TDM debba essere in ogni caso letta e applicata alla luce del cosiddetto Three-Step Test (“3ST”), previsto dalla Convenzione di Berna (cui hanno aderito anche gli Stati Uniti) oltre a tutti i paesi EU, secondo cui le eccezioni sono ammesse solo se:
1 riguardano casi specifici;
2 non interferiscono con lo sfruttamento normale dell’opera;
3 non arrecano un pregiudizio irragionevole ai legittimi interessi del titolare.
Il diritto d’autore, come sappiamo, ha lo scopo precipuo di bilanciare l’interesse pubblico alla conoscenza con quello dei creatori di opere e degli altri soggetti che la legge ha inteso tutelare. In questa chiave vanno lette le limitazioni al diritto e le eccezioni che consentono le libere utilizzazioni delle opere. E naturalmente nel determinare l’ambito di applicazione delle limitazioni ed eccezioni, il Three-Step Test non dovrebbe prendere in considerazione solo gli interessi dei titolari del diritto d’autore ma anche di quei soggetti che intendono generare altre opere a partire da quelle preesistenti.
Profili applicativi dell’eccezione TDM e compatibilità con il Three-Step Test
L’eccezione europea di TDM è stata oggetto di critiche sotto vari profili, in particolare per la sua compatibilità con il 3ST e per l’efficacia dell’opt-out. L’assenza di standard tecnici condivisi per l’espressione della riserva in forma leggibile da macchina genera incertezza, rendendo difficile tanto per i titolari esercitare il proprio diritto, quanto per gli sviluppatori accertare la liceità dell’uso. Questo scenario potrebbe disincentivare l’innovazione in Europa, favorendo attori già dominanti e scoraggiando l’ingresso di nuove imprese. Allo stesso tempo, l’assenza di un sistema chiaro di remunerazione limita le prospettive di ritorno economico per autori, artisti ed industria culturale.
Dal punto di vista della compatibilità con il 3ST, si è osservato anche che l’addestramento dell’AI generativa, a differenza del TDM analitico, produce contenuti che possono sostituire le opere originali, interferendo con il loro sfruttamento normale.
La dottrina e l’industria dei contenuti hanno più volte osservato che questo tipo di utilizzo va oltre il perimetro dell’eccezione, poiché non si configura come “caso speciale” ma genera un pregiudizio non giustificato e altera il mercato di riferimento.
Inoltre, l’idea che “il diritto di leggere implichi il diritto di estrarre” (“reading is mining”) è ritenuta una semplificazione opportunistica: l’addestramento generativo si spinge oltre l’acquisizione di conoscenze, replicando anche elementi stilistici e strutturali che possono essere oggetto di protezione, in quanto afferenti alla forma espressiva di un’opera, fino ai casi limite dell’integrale riproducibilità dell’opera stessa.
L’art. 53, par. 1, lett. c) dell’AI Act impone il rispetto del diritto d’autore nell’addestramento dei modelli di AI general-purpose, richiamando le norme sul TDM ma ciò non legittima automaticamente l’applicazione della relativa eccezione.
Il Codice di Buone Pratiche e il Modello di sintesi dei contenuti utilizzati in sede di training
E veniamo alle più recenti novità sul fronte UE: come anticipato, il 24 luglio la Commissione UE ha pubblicato il Modello di sintesi dei contenuti utilizzati per l’addestramento dei modelli di IA per finalità generali (general purpose AI – “GPAI”), (https://digital-strategy.ec.europa.eu/en/library/explanatory-notice-and-template-public-summary-training-content-general-purpose-ai-models) previsto dall’art. 53(1)(d) AI Act.
Il documento segue di pochi giorni la pubblicazione lo scorso 10 luglio della versione definitiva del Codice di buone pratiche previsto dall’art. 56 AI Act con riferimento ai GPAI ed ai GPAI con rischio sistemico. Entrambi i documenti si completano con le linee guida della Commissione UE del 18 luglio volte a delimitare l’ambito di applicazione della normativa specifica sui GPAI che entrerà in vigore il prossimo 2 agosto.
Il Codice di buone pratiche – messo a punto da 13 esperti indipendenti dopo aver sentito oltre 1.000 attori del settore – individua una serie di linee guida a cui i fornitori di GPAI dovranno attenersi nei due anni che intercorrono tra l’entrata in vigore dei primi obblighi imposti dall’AI Act (agosto 2025) e l’adozione degli standard (agosto 2027). Una volta approvato dagli Stati membri e dalla Commissione, il Codice di buone pratiche offrirà ai fornitori di GPAI che lo sottoscriveranno volontariamente, la possibilità di dimostrare la conformità alle obbligazioni pertinenti dell’AI Act: i sottoscrittori godranno infatti di un onere della prova meno gravoso e di maggiori certezze giuridiche rispetto ai provider che sceglieranno modalità alternative di compliance. Una sezione ad hoc del Codice è dedicata al copyright ed individua una serie di misure concrete a carico dei fornitori di GPAI per adempiere all’obbligo di rispettare la normativa europea in materia di diritti d’autore e diritti connessi e, in particolare, al fine di individuare e rispettare l’opt-out dei titolari dei diritti.
Il Modello di sintesi fornisce istruzioni precise e un template standard che i fornitori di GPAI dovranno utilizzare per redigere un pubblico sommario, sufficientemente dettagliato ma di respiro ampio e generale, dei dati utilizzati nelle fasi di pre-addestramento e addestramento dei loro modelli, in conformità all’art. 53(1)(d) AI Act. L’obiettivo è aumentare la trasparenza sull’origine dei dati, inclusi quelli protetti da copyright, consentendo così a titolari di diritti di conoscere i contenuti su cui si basano questi modelli e di far valere i propri diritti in modo più efficace.
Il Modello si articola in sezioni che richiedono informazioni su dataset pubblici e privati, contenuti raccolti online tramite scraping, dati generati dagli utenti o artificialmente, e misure adottate per il rispetto dei diritti d’autore e la rimozione di contenuti illegali, in particolare per il riconoscimento ed il rispetto dell’opt-out. Pur imponendo un obbligo di trasparenza, il documento bilancia tale esigenza con la tutela dei segreti commerciali e delle informazioni riservate del provider. I fornitori di GPAI dovranno pubblicare il sommario al momento dell’immissione del modello sul mercato UE a partire dal 2 agosto 2025.
Riflessioni conclusive
Dopo l’addestramento selvaggio della prima ora, sia negli Stati Uniti che in EU si porrà maggiore attenzione al tema del copyright, giungendo ad un assetto più bilanciato degli interessi, grazie anche alle corti americane ed alle regole europee.
Saranno siglati molti accordi per lo sfruttamento degli archivi. E da questa parte dell’oceano, l’utilizzo del template sopra nominato assicurerà maggiore trasparenza. Mentre nelle controversie dovrà essere svolta una valutazione, caso per caso, del tipo di utilizzo delle opere effettuato in sede di addestramento e della possibilità che sia effettuato un “utilizzo trasformativo” dell’opera, tale da escludere che ciò avvenga a danno di o in concorrenza con l’opera originale.
Ma presto, come già accade con il l’AI Act, il DMA ed il DSA anche le regole europee del copyright diventeranno parte di un più ampio fronte del conflitto economico e geopolitico che tiene luogo tra l’UE ed il suo storico alleato dall’altra parte dell’Oceano Atlantico.
Nel risoluto processo di deregulation posto in essere da Trump, le regole, anche quelle del copyright, riducono la competitività delle aziende che innovano negli US e sono un freno nella battaglia per la supremazia nell’AI.
Riferimenti normativi:
Art. 4 Direttiva UE 2019/790
Copyright © – Riproduzione riservata
***** l’articolo pubblicato è ritenuto affidabile e di qualità*****
Visita il sito e gli articoli pubblicati cliccando sul seguente link