Nuovi assistenti vocali, Intelligenza Artificiale, IoT e machine learning danno una nuova vita alle nostre vecchie voci. Il web ne approfitta. Siamo sicuri che la tecnologia sia soltanto un bene per l’umanità?

In un mondo che va sempre più veloce, stiamo cercando di abbandonare la manualità per dar spazio all’oralità, donando una nuova vita agli oggetti che ci circondano. Quando parliamo di comandare le cose con la nostra sola voce, molte di noi penseranno subito ad Alexa o Siri, ma sappiate che non sono le ultime tecnologie disponibili oggi e di nuove ne stanno nascendo.
Ma cosa ci preserva il futuro e come potranno influire negativamente sulla nostra esistenza?

Le moderne tecnologie del web si stanno orientando verso un processo di alfabetizzazione dei dispositivi a comandi vocali, a sfavore della scrittura. Basti pensare ai podcast, ai voice game che negli ultimissimi anni stanno spopolando. Complice anche la pandemia, che ha reso sempre più necessaria la comunicazione verbale a distanza, per innescare una più veloce operatività.

I fruitori più avvezzi a questa tecnologia sono senza dubbio i giovani e giovanissimi che utilizzano audio game attraverso console prive di schermi, come Yoto, o attraverso piattaforme tipo Volley che si interfacciano a smartphone e smart speaker, narrando storie e proponendo giochi interattivi.

Insomma, nell’era che verrà, la radio pare proprio avere la meglio sulla tv.
Quali sono però gli scenari che andranno a configurarsi?

Il fenomeno del Deepfake

Se cerchiamo la definizione di deepfake su Wikipedia leggiamo “Il deepfake (parola coniata nel 2017) è una tecnica per la sintesi dell'immagine umana basata sull'intelligenza artificiale, usata per combinare e sovrapporre immagini e video esistenti con video o immagini originali, tramite una tecnica di apprendimento automatico, conosciuta come rete antagonista generativa. È stata anche usata per creare falsi video pornografici ritraenti celebrità e per il revenge porn, ma può anche essere usato per creare fake news, bufale e truffe, per compiere atti di cyberbullismo o altri crimini informatici di varia natura oppure per satira.”.

Come puoi vedere, nonostante la tecnologia sia recentissima, soprattutto in questa prima fase non è certamente stata utilizzata per attività benefiche e in poco tempo hanno ha mietuto non poche vittime sul web.

Abbiamo deciso di scrivere questo articolo sul Deep fake perché crediamo che i tempi siano maturi affinché gli utenti comprendano che le conseguenze derivabili da queste tecnologie sono molteplici e purtroppo incontrollabili e, nella stragrande maggioranza dei casi forniamo inconsapevolmente ai malintenzionati, gli strumenti giusti.

Da tempo si parla di navigazione e oggi più che mai il tema della sicurezza sui social network diventa cruciale.

Deep voice fake: i lati oscuri della tecnologia

Se qualche attimo fa abbiamo compreso le potenzialità e la pericolosità del deepfake quando associato ad immagini e video, ora l’Intelligenza Artificiale ha fatto passi da gigante e con le moderne tecniche è già oggi possibile analizzare e riprodurre una voce sintetica di una persona, senza errori, replicando fedelmente un timbro, la cadenza e l’intonazione dopo solamente un breve periodo di apprendimento.

Con il deep fake audio, le voci umane vengono imitate in modo quasi perfetto, con un risultato impressionante, tale da rendere la voce clonata, quasi indistinguibile dall’originale. Uno dei principali problemi legati al deep voice fake è che le tecnologie e i software sono facilmente accessibili online.

I software più conosciuti di deep voice fake

Il primo software degno di nota quando si parla di deel fake voice è senza dubbio Descript, un sistema di text to speech, che alla base non utilizza un comune loquendo, ma utilizza la nostra stessa voce per generare frasi complete. Il software si configura leggendo alcune frasi random, e dopo pochi attimi ci rendiamo conto che il nostro clone è indistinguibile. Fortunatamente non è possibile sottoporgli altre tipologie di tracce vocali, quindi solo chi è fisicamente presente davanti al pc e pronuncia le frasi dettate dal sistema, si allinea e può essere riprodotto.

Il secondo generatore vocale che può essere facilmente scaricato dalla rete è ResembleAI, il software permette di replicare un messaggio in più lingue, tra cui anche l’italiano. ResembleAI è facilmente integrabile con Alexa ed altre app che prevedono un assistente vocale e, come dice il nome stesso, è tutto realizzato sfruttando l’intelligenza artificiale. Un generatore vocale molto potente che replica timbri basati sull’età, il carattere, alle quali è possibile aggiungere anche alcune tonalità emotive.

Visto il crescente successo delle tecnologie di sintetizzazione voice, realizzate principalmente per supportare gli help desk e fornire servizi più velocemente accessibili agli utenti, Resemble ha integrato un sistema chiamato GPT-3 che rende la sintesi vocale ancora più dinamica e reale. Il problema principale è che sta divenendo così reale da trasformarsi in uno strumento per veicolare bufale, tema non superficiale per l’azienda Resemble e che ha fatto sapere, attraverso la sua pagina ufficiale, che ha realizzato una sezione etica specifica, con le modalità con cui intendono combattere questo fenomeno.

Con il deep voice fake oggi, possiamo ridonare una vita alle persone che non sono più presenti nella nostra vita, basti pensare a Tonino Accolla, il doppiatore italiano di Homer Simpson, oggi sostituito, dopo un lungo lavoro di ricerca dell’uomo perfetto, da Lopez, ma un domani non troppo lontano il problema non esisterà più.

Forse non tutte lo sanno, ma oggi già Edna è stata doppiata da un deep voice fake e quando la vocalità emozionale sarà definitivamente risolta, non esisteranno più limiti e magari un domani potrebbe perfino essere una tecnologia utile per aiutare a superare le perdite dei propri cari.

Una tecnologia tanto straordinaria quanto pericolosa e sta soltanto a noi utilizzarla e proteggerla nel modo più giusto. A tal proposito condivido un video andato in onda su Striscia la Notizia in cui quello che accade con il Deep voice fake ha dell’incredibile e vi consiglio di guardarlo a partire dal minuto 2:00
Ecco il link: Video Striscia la Notizia sul Deep Voice Fake.

Se hai trovato questo articolo utile e interessante ti chiediamo di condividerlo sui social che preferisci, ci darai una mano a rendere un servizio più accessibile e gratuito per tutti e avrai reso con un semplice gesto, il web un posto migliore.

Leggi anche...

Redattore

https://www.leinews.it/immagini_soggetti/30-09-2021/1632986553-95-.jpg