Questo articolo è stato pubblicato da questo sito
Google ha diffuso ufficialmente il suo strumento progettato per rilevare testi generati da intelligenze artificiali attraverso un watermark che ne certifica l’origine. Il sistema è una delle ramificazioni del tool chiamato SynthID diffuso in modo open-source e pensato anche per individuare in modo rigoroso contenuti multimediali creati da AI come immagini, video e anche file audio. Lo strumento sfruttabile liberamente lavora con i testi in modo differente rispetto alle filigrane che possono essere apposte per esempio alle immagini, perché passa attraverso un’analisi approfondita e precisa della sequenza delle parole di una frase.
Lo scopo del progetto SynthID è quello di integrare il watermark nei contenuti generati da AI in modo invisibile agli occhi degli utenti, senza quindi compromettere o perturbare il file originario, ma rendendo la filigrana digitale subito rilevabile in modo rapido e affidabile. La novità riguarda i testi scritti dalle intelligenze artificiali, che sono una delle funzioni più utilizzate grazie per esempio ai chatbot messi a disposizione da tutti i big player del segmento come ChatGPT o CoPilot e ormai integrate dai sistemi operativi mobile e desktop fino ad app o servizi vari.
Come funziona il watermark di SynthID
Qui sotto c’è un video diffuso sulla pagina X di Google DeepMind, ovvero la divisione che ha lavorato a SynthID e che l’ha diffusa in modo open-source sul portale HuggingFace e si può così osservare in modo semplificato come lavora lo strumento. SynthID si basa sul fatto che i modelli AI compongono le frasi dopo aver compreso una richiesta, scegliendo token ovvero in questo caso le parole, uno dopo l’altro come mattoncini per erigere una costruzione. Il comportamento delle AI è prevedibile dal tool, che si basa sui dati storici e sulle percentuali di scelta per assegnare un punteggio di probabilità che una frase sia generata da un’AI piuttosto che da un umano.
X content
This content can also be viewed on the site it originates from.
Esempio: la frase inizia con “Il mio frutto tropicale preferito è” e SynthID passa in rassegna le scelte più probabili da parte delle AI per completare e ampliare la frase, in questo caso “il mango e la banana”. “Questo modello di punteggi viene confrontato con il modello di punteggi previsto per il testo con e senza watermark, aiutando SynthID a rilevare se uno strumento di intelligenza artificiale ha generato il testo o se potrebbe provenire da altre fonti”, spiega Google sul blog ufficiale. Va da sé che lo strumento non è accurato al 100% soprattutto sulle frasi molto brevi, mentre per le risposte secche (“Qual è la capitale della Spagna?”) non può avere la certezza che sia una AI o un umano ad aver scritto.