OpenAI Svela un Motore Vocale che Può Imitare le Voci Umane

OpenAI, la società dietro il popolare ChatGPT, ha annunciato Voice Engine, un nuovo modello di intelligenza artificiale per il testo-parlato che può creare voci sintetiche basandosi su un frammento audio registrato di 15 secondi.

La tecnologia, sviluppata alla fine del 2022, ha il potenziale per offrire numerosi vantaggi, come l’assistenza alla lettura, la portata globale per i creatori e opzioni di discorso personalizzate per gli individui non verbali.

Tuttavia, nonostante i vantaggi potenziali, OpenAI ha deciso di anteprima la tecnologia ma di non rilasciarla in modo generalizzato in questo momento a causa delle preoccupazioni per un possibile uso improprio.

La società inizialmente aveva pianificato di lanciare un programma pilota per gli sviluppatori per registrarsi all’API di Voice Engine all’inizio di questo mese ma ha ridotto le sue ambizioni dopo aver considerato le implicazioni etiche.

In una dichiarazione, OpenAI ha affermato: “Abbiamo scelto di mostrare in anteprima ma non rilasciare ampiamente questa tecnologia in questo momento. Speriamo che questa anteprima di Voice Engine sia da stimolo sia per sottolinearne il potenziale sia per motivare la necessità di migliorare la resilienza della società contro le sfide portate dai modelli generativi sempre più convincenti.”

La società sta testando la tecnologia con società partner selezionate dall’anno scorso, richiedendo loro di accettare termini d’uso che proibiscono l’impersonificazione senza consenso e impongono un consenso informato dalle persone le cui voci vengono clonate.

OpenAI ha anche implementato un watermark in ogni esempio vocale per assistere nel tracciare l’origine di ogni voce generata dal suo modello di Voice Engine.

Per affrontare i rischi potenziali associati alla tecnologia di clonazione vocale, OpenAI ha fornito tre raccomandazioni per la società da adottare: la progressiva eliminazione dell’autenticazione vocale per i conti bancari, l’istruzione del pubblico sulla possibilità di contenuti ingannevoli generati da AI e l’accelerazione dello sviluppo di tecniche per tracciare l’origine dei contenuti audio.

La società enfatizza la necessità di un approccio cauto e informato al rilascio più esteso della tecnologia della voce sintetica.

“Speriamo di avviare un dialogo sul rilascio responsabile di voci sintetiche e su come la società possa adattarsi a queste nuove capacità,” ha dichiarato OpenAI. “Basandoci su queste conversazioni e sui risultati di questi test in piccola scala, prenderemo una decisione più informata su se e come distribuire questa tecnologia su vasta scala.”

Mentre lo sviluppo della tecnologia di clonazione vocale continua a progredire, è cruciale per società come OpenAI valutare i rischi potenziali e le implicazioni etiche lavorando per sfruttare i benefici per la società.