Attualità

Se l’Intelligenza Artificiale apre le porte (e le voci) dall’aldilà

di Eleonora Ciaffoloni -


La perdita di un familiare, di una persona cara e fraterna, rappresenta nella vita di ognuno di noi un evento devastante e difficile da accettare. C’è chi cerca conforto nella preghiera, chi nei ricordi guardando tra le foto e ripercorrendo nella mente tutti i bei momenti vissuti insieme. La tecnologia, su questo, ci ha aiutato molto negli ultimi anni, grazie a immagini e video che possiamo riprodurre all’infinito per cercare una sorta di vicinanza.

E oggi, si può fare ancora di più: si può “parlare” con i morti. O meglio, si può, grazie all’intelligenza artificiale, clonare le voci di persone defunte e risentirne le parole come in una vera e propria conversazione. Lo ha fatto un tecnico, esperto di informatica, che ha utilizzato una applicazione – Instant Voice Cloning di Eleven Labs – che clona voci umane con campioni audio di almeno 60 secondi, grazie a tecniche avanzate di deep learning.

Risentire le voci dei cari con l’intelligenza artificiale: come fare

Clonare o far rivivere la voce “umana” di un defunto potrebbe apparire a molti una mancanza di rispetto. Tuttavia, in questo caso, si tratta non solo di una soluzione personale e della scelta di un figlio nei confronti del defunto padre, ma anche e soprattutto di una passione per la tecnologia utilizzata in virtù del consenso informato del defunto.

E così, attraverso gli strumenti dell’intelligenza artificiale, il tecnico ha potuto far tornare in vita la voce del padre. L’applicazione è di Eleven Labs che, ha spiegato nel suo racconto, è un’azienda che si occupa di tecnologie di sintesi vocale basate sull’intelligenza artificiale. La loro applicazione consente di generare voci artificiali realistiche e di clonare voci umane. Ma come funziona? Questa permette di replicare voci umane attraverso un campione audio della lunghezza minima di 60 secondi. Le tecniche avanzate di deep learning sviluppate da Eleven Labs prendono le mosse da dataset di registrazioni vocali e dalla rappresentazione vettoriale delle caratteristiche della voce, come timbro, intonazione e ritmo.

Il processo di clonazione è iniziato con l’estrazione e la pulizia di un campione audio tramite Audacity – trasformando un file in Mp4 -, successivamente caricato su Eleven Labs per creare il modello vocale. La qualità del risultato dipende dalla qualità del campione audio, con la possibilità di migliorare la coerenza, la somiglianza e lo stile della voce tramite varie impostazioni.

Eleven Labs consente di generare audio pronunciando qualsiasi testo, utilizzabile tramite API per integrazioni avanzate. Tuttavia, come avverte l’esperto, l’uso di voci clonate può influenzare il processo di lutto, peggiorando lo stato d’animo o talvolta creando una sorta di confusione emotiva. Pertanto, quanto descritto in questo articolo non intende, né può e né deve essere considerato un invito a seguire lo stesso comportamento.


Torna alle notizie in home