La Commissione UE ha pubblicato tre studi, in tema di trasparenza di contenuti generati dall’intelligenza artificiale, sulle possibili soluzioni tecniche per l’identificazione e il riconoscimento dei contenuti generati dall’intelligenza artificiale (IA), volti a sostenere e orientare l’elaborazione del codice di condotta sull’identificazione e l’etichettatura dei contenuti generati dall’intelligenza artificiale.
Questi studi esaminano lo stato dell’arte di tali soluzioni tecniche, in diverse modalità, ovvero:
- contenuti testuali
- audio
- visivi (immagini/video).
Più in particolare, gli studi sono:
- Soluzioni tecniche per la marcatura e l’individuazione di contenuti audio generati dall’IA nel contesto dell’art. 50 dell’AI Act; il rapporto:
- esamina i principali meccanismi di marcatura e rilevamento audio
- propone una serie di criteri di valutazione in linea con i requisiti dell’AI Act
- valuta gli approcci all’avanguardia alla luce di tali criteri
- individua le loro principali carenze e lacune tecniche
- delinea le linee strategiche per la ricerca e la standardizzazione future.
Il rapporto distingue tra marcatura, rilevamento e identificazione, termini spesso usati in modo intercambiabile ma che svolgono ruoli distinti:
-
- la marcatura si riferisce all’inserimento o all’allegato intenzionale di informazioni che segnalano la generazione da parte dell’IA (ad esempio, metadati o filigrane)
- il rilevamento comporta la verifica della presenza o dell’eventuale alterazione di tali marcature
- l’identificazione si spinge oltre, mirando a dedurre l’origine del contenuto — come il modello generativo utilizzato — anche quando non esiste alcun contrassegno esplicito.
- Soluzioni tecniche per la marcatura di contenuti di immagini e video generati dall’IA; il documento:
- illustra lo stato dell’arte delle tecnologie di marcatura e rilevamento, compresi gli approcci basati sui metadati quali le credenziali di contenuto, le firme crittografiche, le filigrane digitali e le tecniche di fingerprinting. Tali soluzioni vengono esaminate nel rapporto sia dal punto di vista della ricerca accademica che delle applicazioni industriali, con esempi illustrativi della loro efficacia, affidabilità e implementazione pratica
- valuta queste soluzioni rispetto ai requisiti fondamentali stabiliti nell’AI Act in termini di trasparenza: è richiesto che i risultati del sistema di IA generativa siano contrassegnati in un formato leggibile da una macchina e individuabili come generati o manipolati artificialmente. Inoltre, le soluzioni tecniche devono essere efficaci, interoperabili, robuste e affidabili nella misura in cui ciò sia tecnicamente fattibile, tenendo conto dei gruppi vulnerabili a causa dell’età o della disabilità. L’analisi rileva che, sebbene diverse tecniche si dimostrino promettenti in termini di robustezza e scalabilità, nessuna fornisce una soluzione completa in tutti i contesti: i compromessi tra efficacia, interoperabilità, tutela della privacy, accessibilità e costi di implementazione sono identificati come considerazioni critiche
- Soluzioni tecniche per la marcatura e l’individuazione di contenuti testuali generati dall’IA nel contesto dell’art. 50, par. 2, dell’AI Act: l’attenzione è rivolta alle tecniche di marcatura e rilevamento dei testi generati dai modelli e dai sistemi di IA generativa, che spesso si basano sull’uso di modelli linguistici di grandi dimensioni. Le tecniche disponibili sono classificate in cinque categorie e per ciascuna si descrive il funzionamento, se ne illustrano i limiti e le possibili strategie di mitigazione:
- watermarking
- marcatura strutturale
- metadati
- registrazione e rilevamento di testi generati dall’IA
Vengono quindi mappate le proprietà desiderabili delle diverse tecniche ai requisiti stabiliti negli artt. 50, par. 2 e 50, par. 5 dell’AI Act, ovvero efficacia, robustezza, affidabilità, accessibilità e interoperabilità, definendoli come:
-
- efficacia: la misura in cui una tecnica è in grado di distinguere i testi generati dall’IA da quelli scritti dall’uomo
- robustezza: La maturità di una tecnica e la sua resistenza alla modifica
- affidabilità: la coerenza con cui una tecnica esegue la marcatura in diversi scenari (ad esempio, la generazione di testi per scopi e ambiti diversi) e la difficoltà di apprendere e falsificare il contrassegno
- accessibilità: la facilità con cui le parti interessate possono verificare una tecnica e interpretare correttamente le sue risposte e il suo funzionamento
- interoperabilità: la fattibilità di un approccio di rilevamento unificato che sia indipendente dal fornitore e dalla tecnologia.
Gli studi valutano le tecniche esistenti ed emergenti, la loro potenziale efficacia, i limiti e l’applicabilità pratica: il lavoro contribuisce a garantire che le discussioni sulla marcatura e l’individuazione siano fondate sugli ultimi sviluppi tecnici e tengano conto delle caratteristiche specifiche dei diversi tipi di contenuti generati dall’IA.

