22 Agosto 2025
Fornitori di AI per finalità generali, come funziona il template Ue


La Commissione EU ha pubblicato il modello per consentire ai fornitori di AI per finalità generali (GPAI) di sintetizzare in un riepilogo i contenuti utilizzati per l’addestramento della piattaforma. Secondo la Commissione, questo modello è un modo semplice, uniforme ed efficace per i fornitori di aumentare la trasparenza in linea con la legge sull’IA, anche rendendo pubblica tale sintesi. 

La sintesi pubblica dovrebbe fornire una panoramica completa dei dati utilizzati per l’addestramento, elencare le principali raccolte di dati e fornire informazioni sulle altre fonti utilizzate. Questo template dovrebbe inoltre aiutare le parti che hanno interessi legittimi, come i titolari dei diritti d’autore, nell’esercizio dei loro diritti ai sensi del diritto dell’Ue. 

Aste immobiliari

 il tuo prossimo grande affare ti aspetta!

 

Il considerando dell’AI ACT e la trasparenza.

Il Considerando 107 riguardo al riepilogo stabilisce che: “Questo riepilogo dovrebbe essere generalmente esaustivo nella sua portata, piuttosto che tecnicamente dettagliato, per facilitare le parti con interessi legittimi, inclusi i titolari dei diritti d’autore, nell’esercizio e nell’applicazione dei propri diritti ai sensi del diritto dell’Unione, ad esempio elencando le principali raccolte o insiemi di dati utilizzati per l’addestramento del modello, come grandi database privati o pubblici o archivi di dati, e fornendo una spiegazione narrativa sulle altre fonti di dati utilizzate.”

Come funziona il modello per i fornitori di AI per finalità generali

Rispetto ad un primo draft che è circolato il modello pubblicato contiene delle modifiche che sembrano essere state apportate con l’intento di bilanciare la trasparenza con i “segreti commerciali e le informazioni aziendali riservate”. Onestamente gli obblighi non sono molto chiari. Nel draft preliminare, un fornitore era obbligato ad “elencare” ogni “dataset privato non accessibile pubblicamente di terze parti” se rappresentava “oltre il 5% dei dati complessivi in questa categoria”.

Nel template finale molte cose sono cambiate e non in meglio. La categoria ora riguarda i dataset “ottenuti da terze parti”, non “di terze parti”, probabilmente perché “di” implicava la proprietà dei dataset. Quando un dataset è “concesso in licenza commerciale da titolari dei diritti o dai loro rappresentanti” non sembra esserci alcun obbligo di elencarlo. A questo punto dovrebbe essere implicito verificare se i “titolari dei diritti o i loro rappresentanti” possiedano tutti i diritti rilevanti, ma questo potrebbe essere molto complicato per molte raccolte di opere protette da copyright. Ad esempio, i diritti su programmi TV e film possono essere suddivisi tra molte parti.

Come gestire i dataset

Il template affronta poi i “dataset privati ottenuti da altre terze parti” (cioè non “concessi in licenza commerciale da titolari dei diritti o dai loro rappresentanti”?). Diversamente dal progetto iniziale, il documento li suddivide in dataset “pubblicamente noti” e “non pubblicamente noti”. “Pubblicamente noti” non è spiegato. Cos’è un “dataset privato non disponibile pubblicamente” che è “pubblicamente noto”? Forse uno pubblicizzato pubblicamente, ad esempio tramite una pagina web o un articolo, ma non liberamente utilizzabile.

Contributi e agevolazioni

per le imprese

 

Il fornitore deve elencare i dataset privati “pubblicamente noti” che non sono stati concessi in licenza commerciale da titolari dei diritti o dai loro rappresentanti, ma solo quelli “principali”. “Principali” non è definito (ad esempio, non c’è un equivalente esplicito della soglia del 5% nel Sommario preliminare). (“Principali” compare anche nel Considerando 107, quindi potrebbe essere necessaria un’interpretazione normativa.)

Per quanto attiene ai dataset privati che sono “non pubblicamente noti”, il Fornitore deve fornire “una descrizione generale del loro contenuto”. Nel draft preliminare sembrava che il Fornitore dovesse elencare ogni dataset (sopra la soglia del 5%) e, per ciascuno, fornire un identificatore univoco/link o una “descrizione narrativa”. Ora, siamo passati al 3 % e non è chiaro se sia richiesta una “descrizione generale” per ciascun dataset o per l’intera categoria di questi dataset ed in ogni caso i siti pirata dai quali le maggiori piattaforme di AI hanno attinto i contenuti sicuramente ricadono sotto il 3%.

I vantaggi del nuovo template

In ogni caso, pur con tutte le riserve, possiamo guardare ad alcuni risvolti positivi. La maggior parte delle aziende di IA non ha rispettato le normative comunitarie nell’addestramento dei propri modelli di IA di uso generale, trincerandosi dietro affermazioni come:

“Sono stati utilizzati dati disponibili pubblicamente”,

“i dati utilizzati erano già lì”,

“lo fanno tutti”.

Con l’adozione del modello, vediamo sicuramente un cambiamento significativo nel livello di trasparenza che sarà richiesto (e legalmente obbligatorio) alle aziende di IA, e potrebbe portare a modifiche sostanziali nella conformità al diritto d’autore e alla protezione dei dati, soprattutto perché le aziende non potranno più essere volutamente vaghe per evitare controlli.

Sarà ora compito della Commissione e degli organi di vigilanza, stimolati dalle segnalazioni dei titolari dei diritti, applicare queste regole sul campo.

Dilazioni debiti fiscali

Assistenza fiscale

 



Source link

***** l’articolo pubblicato è ritenuto affidabile e di qualità*****

Visita il sito e gli articoli pubblicati cliccando sul seguente link

Source link

Sconto crediti fiscali

Finanziamenti e contributi