Voco, il “Photoshop della voce” per manipolare le frasi

Naviga SWZ: Home Page » Tech
News del 09 Novembre 16 Autore: Stefano Fossati
Adobe ha presentato Project Voco, un software di editing vocale che promette di diventare il “Photoshop della voce”. Di applicazioni di audio editing, nel catalogo Adobe, ce ne sono (o ce ne sono state) diverse, da Audition a Soundbooth, ma Voco presenta una funzionalità molto più avanzata: la possibilità, partendo da una registrazione vocale, di modificarla facilmente includendovi parole o frase che lo speaker non ha mai pronunciato, senza che gli ascoltatori possano accorgersi del “trucco”.



Nell’evento dimostrativo a San Diego, la software house americana ha mostrato le potenzialità dell’applicazione registrando la voce di un uomo che diceva “E ho baciato i miei cani e mia moglie” e quindi modificando la frase in “E ho baciato Jordan tre volte”. Un’operazione che ha richiesto pochi secondi: l’operatore ha semplicemente riscritto alcune parole all’interno della trascrizione della frase originaria operata dal software, dopodiché ha premuto un tasto e Voco ha sintetizzato la voce originale per manipolare la registrazione. Per rendere possibile l´elaborazione, Voco deve registrare almeno 20 minuti di parlato dello speaker "originale".

Voco è attualmente ancora in fase di sviluppo: secondo Adobe, potrebbe consentire ad esempio di correggere errori all’interno di podcast o audiolibri senza la necessità di richiamare lo speaker per registrare nuovamente le parti da modificare, con conseguente risparmio sui costi di produzione. Tuttavia molti osservatori esprimono più di una preoccupazione di fronte a questa tecnologia, tanto sul piano etico quanto su quello della sicurezza. Un programma come Voco consentirebbe infatti di snaturare con estrema facilità dichiarazioni e testimonianze, magari rilevanti a fini legali o economici, introducendo fra le registrazioni audio gli stessi problemi che Photoshop ha determinato nel mondo della fotografia, rendendo veloce e accessibile a chiunque una possibilità – l’editing di immagini – che un tempo richiedeva tempi e professionalità elevati.

In ambito sicurezza, il rischio è quello di facilitare la manipolazione dei sistemi utilizzati da alcune banche e aziende per identificare l’utente nelle comunicazioni telefoniche attraverso il riconoscimento della sua voce, anche se – notano gli esperti – gli sviluppatori di tali sistemi da tempo tengono conto della possibilità dell’introduzione di una tecnologia come quella appena presentata da Adobe.

Quest’ultima, peraltro, sottolinea che Voco è al momento soltanto una demo, pensata per mostrare una delle tante possibili applicazioni della nuova tecnologia di sintesi vocale: non è detto che possa essere commercializzata in futuro in questa stessa forma. Nel caso, tuttavia, Adobe assicura che saranno adottate misure per evitare i rischi di manipolazioni non riconoscibili dall’ascoltatore.

Lo scorso settembre la divisione DeepMind di Google, che si occupa dello sviluppo e delle applicazioni dell’omonima intelligenza artificiale, aveva mostrato un sistema simile chiamato WaveNet, specificando però che richiedeva una potenza di calcolo troppo elevata per poterne ipotizzare un’applicazione in ambito consumer nel breve periodo.

La Community di SWZone.it

La community con le risposte che cerchi ! Partecipa é gratis !
Iscrizione ForumIscriviti al Forum

Newsletter

Vuoi ricevere tutti gli aggiornamenti di SWZone direttamente via mail ?
Iscrizione NewsletterIscriviti alla Newsletter

NOTIZIE CORRELATE