Il progetto di intelligenza artificiale di Google si è notevolmente migliorato grazie alla tecnologia WaveNet
DeepMind, l’azienda parte del circolo di Google specializzata in progetti di Intelligenza Artificiale, avvicina sempre di più le macchine all’uomo. Lo fa sfruttando WaveNet, una nuova tecnologia informatica che consente a una macchina di parlare in maniera quasi naturale in due lingue: inglese e mandarino. Con una tecnica del genere, spiega il team, gli automi possono raggiungere prestazioni del 50% migliori di quelle delle altre tecnologie di riproduzione vocale. Nella pratica, WaveNet è un modello generativo di onde audio in formato RAW che, unito al software AI, riduce notevolmente in gap con l’interazione umana.
Come funziona
“Per quanto riguarda l’inglese e il cinese, il text-to-speech di Google rappresenta attualmente la scelta migliore a livello globale – dice Big G – averli migliorati con un singolo modello ci rende maggiormente soddisfatti”. Nei test condotti dai ricercatori, WaveNet ha raggiunto risultati importanti e davvero inattesi. Dove il linguaggio di comprensione umana arriva a 4.55 (inglese) e 4.21 (mandarino), il software giunge rispettivamente a 4.21 e 4.08, davvero di poco sotto le performance umane. Dove potremo arrivare? “Permettere alle persone di interagire con le macchine in maniera semplice è un sogno di lunga durata per l’informatica. L’abilità dei computer di comprendere il linguaggio naturale si è evoluta prepotentemente nel corso degli ultimi anni grazie alle reti neurali digitali”. Secondo DeepMind, WaveNet può anche imparare a suonare strumenti, imitando pianisti e artisti vari, dando vita a composizioni uniche e quanto mai apprezzabili. Il prossimo Schubert sarà fatto di viti e bulloni?